对pytorch中Tensor的剖析

不是python层面Tensor的剖析，是C层面的剖析。

看pytorch下lib库中的TH好一阵子了，TH也是torch7下面的一个重要的库。

可以在torch的github上看到相关文档。看了半天才发现pytorch借鉴了很多torch7的东西。

pytorch大量借鉴了torch7下面lua写的东西并且做了更好的设计和优化。

https://github.com/torch/torch7/tree/master/doc

pytorch中的Tensor是在TH中实现的。TH = torch

TH中先实现了一个THStorage，再在THStorage的基础上实现了THTensor。

THStorage定义如下，定义在TH/generic/THStorage.h中

 typedef struct THStorage

 {

     real *data;

     ptrdiff_t size;

     int refcount;

     char flag;

     THAllocator *allocator;

     void *allocatorContext;

     struct THStorage *view;

 } THStorage;

这些成员里重点关注*data和size就可以了。

real *data中的real会在预编译的时候替换成预先设计的数据类型，比如int,float,byte等。

比如 int a[3] = {1,2,3}，data是数组a的地址，对应的size是3，不是sizeof(a)。

所以*data指向的是一段连续内存。是一维的！

讲Tensor前先回顾下数组在内存中的排列方式。参看《C和指针》8.2节相关内容。

比如 int a[3][6]; 内存中的存储顺序为：

00 01 02 03 04 05 10 11 12 13 14 15 20 21 22 23 24 25

是连续存储的。存储顺序按照最右边的下标率先变化。

然后数组a是2维的，nDimension = 2。dimension从0开始算起。

size(a) = {3,6}
[3] 是 dimension 0 size[0] = 3
[6] 是 dimension 1 size[1] = 6
nDimension = 2

THTensor定义如下，定义在TH/generic/THTensor.h中

 typedef struct THTensor

 {

     int64_t *size;   // 注意是指针

     int64_t *stride; // 注意是指针

     int nDimension;

     // Note: storage->size may be greater than the recorded size

     // of a tensor

     THStorage *storage;

     ptrdiff_t storageOffset;

     int refcount;

     char flag;

 } THTensor;

比如

z = torch.Tensor(2,3,4) // 新建一个张量，size为 2,3,4

size(z) = {2,3,4}
[2] 是 dimension 0 size[0] = 2
[3] 是 dimension 1 size[1] = 3
[4] 是 dimension 2 size[2] = 4
nDimension = 3

THStorage只管理内存，是一维的。

THTensor通过size和nDimension将THStorage管理的一维内存映射成逻辑上的多维张量，

底层还是一维的。但是注意，代表某个Tensor的底层内存是一维的但是未必是连续的！

把Tensor按照数组来理解好了。

Tensor a[3][6] 裁剪（narrow函数）得到一个 Tensor b[3][4]，在内存中就是

Tensor a:

Tensor b:       x  x      x  x      x  x

narrow函数并不会真正创建一个新的Tensor，Tensor b还是指向Tensor a的那段内存。

所以Tensor b在内存上就不是连续的了。

那么怎么体现Tensor在内存中是连续的呢？就靠THTensor结构体中的

size,stride,nDimension共同判断了。

pytorch的Tensor有个 contiguous 函数，C层面也有一个对应的函数：

int THTensor_(isContiguous)(const THTensor *self)

判断 Tensor 在内存中是否连续。定义在 TH/generic/THTensor.c 中。

 int THTensor_(isContiguous)(const THTensor *self)

 {

   int64_t z = ;

   int d;

   for(d = self->nDimension-; d >= ; d--)

   {

     if(self->size[d] != )

     {

       if(self->stride[d] == z)

         z *= self->size[d]; // 如果是连续的，应该在这循环完然后跳到下面return 1

       else

         return ;

     }

   }

   return ;

 }

把Tensor a[3][6] 作为这个函数的参数：

size[0] = 3 size[1] = 6 nDimension = 2 z =1
d = 1 if size(1) = 6 != 1 if stride[1] == 1 z = z*size(d)=6
d = 0 if size(0) = 3 != 1 if stride[0] == 6 z = z*size(d)=6*3 = 18
因此，对于连续存储的a
stride = {6,1}
size = {3,6}

再举一个Tensor c[2][3][4]的例子，如果c是连续存储的，则：

stride = {12,4,1}
size = { 2,3,4} // 2所对应的stride就是 右边的数相乘(3x4)， 3所对应的stride就是右边的数相乘(4)

stride(i)返回第i维的长度。stride又被翻译成步长。

比如第0维，就是[2]所在的维度，Tensor c[ i ][ j ][ k ]跟Tensor c[ i+1 ][ j ][ k ]

在连续内存上就距离12个元素的距离。

对于内存连续的stride，计算方式就是相应的size数右边的数相乘。

所以不连续呢？

对于a[3][6]

stride = {6,1}
size = {3,6}

对于从a中裁剪出来的b[3][4]

stride = {6,1}
size = {3,4}

stride和size符合不了 右边的数相乘 的计算方法，所以就不连续了。

所以一段连续的一维内存，可以根据size和stride 解释成 逻辑上变化万千，内存上是否连续 的张量。

比如24个元素，可以解释成 4 x 6 的2维张量，也可以解释成 2 x 3 x 4 的3维张量。

THTensor中的 storageOffset 就是说要从 THStorage 的第几个元素开始解释了。

连续的内存能给程序并行化和最优化算法提供很大的便利。

其实写这篇博客是为了给理解 TH 中的 TH_TENSOR_APPLY2 等宏打基础。

这个宏就像是在C中实现了broadcast。

2017年12月11日01:00:22

最近意识到，用 H x W x C 和 C x H x W 哪个来装图像更好，取决于矩阵在内存中是行存储还是

列存储，这个会影响内存读取速度，进而影响算法用时。

后来意识到，这就是个cache-friendly的问题，大部分对程序性能的要求还上升不到要研究算法复杂度

这个地步，常规优化的话注意下缓存友好等问题就好了，再优化就要靠更专业团队写的库或者榨干硬件了。

看了下numpy的文档，怪不得说pytorch是numpy的gpu版本。。。

后来又看了下opencv的mat的数据结构，原来矩阵库都是一毛一样的。。。

对pytorch中Tensor的剖析的更多相关文章

pytorch中tensor数据和numpy数据转换中注意的一个问题
转载自:(pytorch中tensor数据和numpy数据转换中注意的一个问题)[https://blog.csdn.net/nihate/article/details/82791277] 在pyt ...
[Pytorch]Pytorch中tensor常用语法
原文地址:https://zhuanlan.zhihu.com/p/31494491 上次我总结了在PyTorch中建立随机数Tensor的多种方法的区别. 这次我把常用的Tensor的数学运算总结到 ...
pytorch中tensor张量数据基础入门
pytorch张量数据类型入门1.对于pytorch的深度学习框架,其基本的数据类型属于张量数据类型,即Tensor数据类型,对于python里面的int,float,int array,flaot ...
pytorch中tensor的属性类型转换形状变换转置最大值
import torch import numpy as np a = torch.tensor([[[1]]]) #只有一个数据的时候,获取其数值 print(a.item()) #tensor转化 ...
pytorch中tensor张量的创建
import torch import numpy as np print(torch.tensor([1,2,3])) print(torch.tensor(np.arange(15).reshap ...
Pytorch 中 tensor的维度拼接
torch.stack() 和 torch.cat() 都可以按照指定的维度进行拼接,但是两者也有区别,torch.satck() 是增加新的维度进行堆叠,即其维度拼接后会增加一个维度:而torch. ...
pytorch 中的数据类型,tensor的创建
pytorch中的数据类型 import torch a=torch.randn(2,3) b=a.type() print(b) #检验是否是该数据类型 print(isinstance(a,tor ...
pytorch之dataloader深入剖析
PyTorch学习笔记(6)——DataLoader源代码剖析 - dataloader本质是一个可迭代对象,使用iter()访问,不能使用next()访问: - 使用iter(dataloader) ...
PyTorch官方中文文档：PyTorch中文文档
PyTorch中文文档 PyTorch是使用GPU和CPU优化的深度学习张量库. 说明自动求导机制 CUDA语义扩展PyTorch 多进程最佳实践序列化语义 Package参考 torch to ...

随机推荐

Django框架（三）
六.Django的视图层视图函数一个视图函数,简称视图,是一个简单的Python 函数,它接受Web请求并且返回Web响应.响应可以是一张网页的HTML内容,一个重定向,一个404错误,一个XML ...
Mac安装brew（遇到的坑）
1.安装方法: 网上都会有命令行输入 /usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/i ...
Component(组件)
1.Component是一个模板的控制类用于处理应用和逻辑页面的视图部分. 2.Component时Angular2应用最基础的建筑砖块. 3.任何一个Component都是NgModule的一部分, ...
day37-多进程多线程二-锁
Lock组件当我们用多进程来读写文件的时候,如果一个进程是写文件,一个进程是读文件,如果两个文件同时进行,肯定是不行的,必须是文件写结束以后,才可以进行读操作.或者是多个进程在共享一些资源的时候,同 ...
管理商品demo
1.写一个管理商品的程序# 1.商品存在文件里面# 2.添加商品的时候,商品存在的就不能添加了,数量只能是大于0的整数,价格可以是小数.整数,但是只能是大于0的# 商品名称# 商品价格# 商品数量# ...
1091 N-自守数
如果某个数 K 的平方乘以 N 以后,结果的末尾几位数等于 K,那么就称这个数为“N-自守数”.例如 3×922=25392,而 25392 的末尾两位正好是 92,所以 92 是一个 3-自守 ...
sql将服务器名称换成本地IP
安装sql后服务器名称默认为电脑的名称,而想要换成习惯用的本地ip也是可以的. 将配置管理中的MSSQLSEVER协议中的TCP/IP启用,并且打开其属性,找到IP地址,添加本地IP,并设置成启用,然 ...
My SQL随记 001 常用名词/结构化语言
DBMS (Database Management System) 字段/域(列名或者列头如:姓名身高性别为字段) 姓名身高性别小周周 157 女记录(一行数据如:小周周 157 女 ) ...
NOIP2011提高组选择客栈
原题题目描述丽江河边有n 家很有特色的客栈,客栈按照其位置顺序从 1 到n 编号.每家客栈都按照某一种色调进行装饰(总共 k 种,用整数 0 ~ k-1 表示),且每家客栈都设有一家咖啡店,每家咖 ...
C++取反交换两个数的值
int a = 1; int b = 2; cout << "a: "<< a << endl; cout << "b: ...

对pytorch中Tensor的剖析

对pytorch中Tensor的剖析的更多相关文章

随机推荐

热门专题