pytorch每日一学15(torch.as_strided())根据步长创建一个现有tensor的视图

最新推荐文章于 2024-06-03 21:35:19 发布

Fluid_ray

最新推荐文章于 2024-06-03 21:35:19 发布

阅读量5.8k

点赞数 20

CC 4.0 BY-SA版权

分类专栏： pytorch每日一学文章标签： python pytorch 神经网络机器学习深度学习

本文链接：https://blog.csdn.net/Fluid_ray/article/details/109670243

pytorch每日一学专栏收录该内容

49 篇文章

订阅专栏

本文详细介绍了PyTorch中的torch.as_strided函数，该函数用于创建Tensor的视图，不占用额外内存。内容包括视图的概念、参数解释如size和stride的用法，以及storage_offset对行偏移的影响。通过实例展示了如何通过改变步长控制输出Tensor的元素排列。文章强调了视图与原始Tensor之间的关联性，更改视图会影响原始数据，建议谨慎修改视图数据，若需独立副本可使用Tensor.clone()。最后提醒，虽然torch.as_strided提供直接操作，但推荐使用更易读的PyTorch内置方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

第15个方法

torch.as_strided(input, size, stride, storage_offset=0)—>Tensor

此方法是根据现有tensor以及给定的步长来创建一个视图（类型仍然为tensor）。

视图

视图是指创建一个方便查看的东西，与原数据共享内存，它并不占用内存，也不存储数据，只是将原有的数据进行整理，显示其中部分内容或者进行重排序后显示出来等等。

接下来介绍此方法，首先看一个示例：
在这里插入图片描述
这样创建出来的b就是a的一个视图，可以发现，b中的元素都是a中的元素，所以其实b中并不存储数据，它只是显示a中的数据，如果改变a中的数据的话，b中的数据也会改变，反之亦然。

接下来介绍各个参数：

input：此参数指定了在哪个数据上创建视图，input需为tensor。
size：指定了生成的视图的大小，需要为一个矩阵（当然此矩阵大小可以大于原矩阵，但是也有限制），可以是tensor或者list等等。
stride：输出tensor的步长，根据原矩阵和步长生成了新矩阵，此参数后面会细讲。
storage_offset：输出张量的基础存储中的偏移量。

参数的使用
还是用上面的例子，我们使用stride=(0, 0)
在这里插入图片描述

可以看到在没有偏移的情况下，b的数据都是a中的第一个数据，说明了（0，0）不进行偏移，这很好理解。将(0, 0)改为（0，1）后
第一行与第二行的元素相等，而每列的元素不同，并且在tensor上从0,1,2开始一次增加一个，这说明第二个元素控制列，而改为(1, 0)得到如下结果
这次是每列元素相等，而行不等，说明第一个参数控制行。这就可以理解了，第一个元素控制行，数字代表每次向后走时的跨度，而第二个控制列，如果改成（1， 1）

在这里插入图片描述

发现第二个参数控制的列，每次的开始值不是从原tensor的第0的数开始的，而是从生成视图中每行的第一个数据开始的，然后开始增加，改为（1， 2）后
这说明了，我们stride增加是将整个tensor排成一维数据一直增加的，如果此行数字不够会从下一行继续寻找。

总结：stride是指定步长，其中行从原数据第0个数据开始，而列从视图中行的第0个数据开始。将整个数组整合为1维数组后按步长进行寻找。

注意：由于创建出来的是视图，所以更改其中任何一个都会更改另一个，可能会产生意想不到的效果。例如：
在这里插入图片描述

更改a[0, 1]=0，由于b[0, 1]和b[1, 0]都来自a[0, 1]所以这俩也都会改变，反之亦然，有对应关系的都会改变，因为它们来自同一数据区，所以更改数据可能会出现一些意想不到的结果，不建议更改数据，尤其是视图数据。如果你实在需要更改的话，考虑将其克隆，使用Tensor.clone()，这样的话原数据和创建数据就不共享存储区了。

storage_offset就比较简单了，我们的列是从视图的每行第0个元素开始的，也就是可以控制的，那行应该也可以控制吧，所以storage_offset这个参数就是用来控制行的，默认为0，指定后行从第storage_offset个元素开始。
在这里插入图片描述