1.PyTorch源码学习系列 - 2. Tensor
PyTorch源码学习系列 - 2. Tensor
本系列文章同步发布于微信公众号小飞怪兽屋及知乎专栏PyTorch源码学习-知乎(zhihu.com),码测欢迎关注。码测
若问初学者接触PyTorch应从何学起,码测答案非神经网络(NN)或自动求导系统(Autograd)莫属,码测而是码测看似平凡却无所不在的张量(Tensor)。正如编程初学者在控制台输出“Hello World”一样,码测见倍量阳后缩倍量源码Tensor是码测PyTorch的“Hello World”,每个初学者接触PyTorch时,码测都通过torch.tensor函数创建自己的码测Tensor。
编写上述代码时,码测我们已步入PyTorch的码测宏观世界,利用其函数创建Tensor对象。码测然而,码测Tensor是码测如何创建、存储、码测设计的?今天,让我们深入探究Tensor的微观世界。
Tensor是什么?从数学角度看,Tensor本质上是源码中国微擎多维向量。在数学里,数称为标量,一维数据称为向量,二维数据称为矩阵,三维及以上数据统称为张量。维度是衡量事物的方式,例如时间是一种维度,销售额相对于时间的关系可视为一维Tensor。Tensor用于表示多维数据,直销客服系统源码在不同场景下具有不同的物理含义。
如何存储Tensor?在计算机中,程序代码、数据和生成数据都需要加载到内存。存储Tensor的物理媒介是内存(GPU上是显存),内存是一块可供寻址的存储单元。设计Tensor存储方案时,需要先了解其特性,如数组。gamemd.exe源码创建数组时,会向内存申请一块指定大小的连续存储空间,这正是PyTorch中Strided Tensor的存储方式。
PyTorch引入了步伐(Stride)的概念,表示逻辑索引的相对距离。例如,一个二维矩阵的Stride是一个大小为2的一维向量。Stride用于快速计算元素的物理地址,类似于C/C++中的源码怎么使用php多级指针寻址方式。Tensor支持Python切片操作,因此PyTorch引入视图概念,使所有Tensor视图共享同一内存空间,提高程序运行效率并减少内存空间浪费。
PyTorch将Tensor的物理存储抽象成一个Storage类,与逻辑表示类Tensor解耦,建立Tensor视图和物理存储Storage之间多对一的联系。Storage是声明类,具体实现在实现类StorageImpl中。StorageImp有两个核心成员:Storage和StorageImpl。
PyTorch的Tensor不仅用Storage类管理物理存储,还在Tensor中定义了很多相关元信息,如size、stride和dtype,这些信息都存在TensorImpl类中的sizes_and_strides_和data_type_中。key_set_保存PyTorch对Tensor的layout、device和dtype相关的调度信息。
PyTorch创建了一个TensorBody.h的模板文件,在该文件中创建了一个继承基类TensorBase的类Tensor。TensorBase基类封装了所有与Tensor存储相关的细节。在类Tensor中,PyTorch使用代码自动生成工具将aten/src/ATen/native/native_functions.yaml中声明的函数替换此处的宏${ tensor_method_declarations}
Python中的Tensor继承于基类_TensorBase,该类是用Python C API绑定的一个C++类。THPVariable_initModule函数除了声明一个_TensorBase Python类之外,还通过torch::autograd::initTorchFunctions(module)函数声明Python Tensor相关的函数。
torch.Tensor会调用C++的THPVariable_tensor函数,该函数在文件torch/csrc/autograd/python_torch_functions_manual.cpp中。在经过一系列参数检测之后,在函数结束之前调用了torch::utils::tensor_ctor函数。
torch::utils::tensor_ctor在文件torch/csrc/utils/tensor_new.cpp中,该文件包含了创建Tensor的一些工具函数。在该函数中调用了internal_new_from_data函数创建Tensor。
recursive_store函数的核心在于
Tensor创建后,我们需要通过函数或方法对其进行操作。Tensor的方法主要通过torch::autograd::variable_methods和extra_methods两个对象初始化。Tensor的函数则是通过initTorchFunctions初始化,调用gatherTorchFunctions来初始化函数,主要分为两种函数:内置函数和自定义函数。
2025-01-31 14:491637人浏览
2025-01-31 14:222066人浏览
2025-01-31 14:09574人浏览
2025-01-31 13:421569人浏览
2025-01-31 12:472944人浏览
2025-01-31 12:311253人浏览
国内动力电池出货量排名第一的宁德时代300750.SZ)和第三的中创新航3931.HK)两大巨头间的专利纠纷案件获新进展。2月21日,针对双方的一项涉诉专利“锂离子电池”的知识产权侵权纠纷案件的一审判
1.成品W灬源码伊旬园大象2023是什么意思啊?2.2023年分享价值7000开运网付费测算源码开源搭建带详细配置教程3.Vue3实践附带源码:基于Vue3、Javascript、Node.js、Mo
1.QQ邮箱功能——给我写信2.如何制作网页电子邮件如何制作网页电子邮件格式3.什么是GPL4.no code / low code 看起来容易,其实远比想象得更难5.电子邮件以网页的形式发送,怎么做