Java工程师如何理解张量？

刚接触 AI 和 PyTorch，理解 “张量 (Tensor)” 是入门关键。

简单来说，可将 PyTorch 中的张量 (Tensor) 理解为 Java 中的多维数组，但它比普通的 Java 数组强大得多，尤其在 AI 和深度学习领域。

1 张量（Tensor） VS Java 数组/列表

Java 数组 (Array) / 列表 (List): Java常用数组和列表来存储数据，例如 int[], double[][], List<String>, ArrayList<Integer> 等。它们可以存储一系列相同类型的数据。
PyTorch 张量 (Tensor):

张量本质上也是用来存储数值数据的，就像 Java 的数组一样，它可以是：
- 标量 (Scalar): 一个单独的数字，类似于 Java 中的 int, float, double 等基本数据类型。例如： 5, 3.14, -10。
- 向量 (Vector): 一维数组，类似于 Java 中的 int[] 或 List<Integer>。例如： [1, 2, 3], [2.5, 3.5, 4.0]。
- 矩阵 (Matrix):
  
  二维数组，类似于 Java 中的
```
int[][]
```
  或
```
List<List<Integer>>
```
  如：
```
[[1, 2],
 [3, 4]]
```
- 更高维度的数组: 张量可以是三维、四维甚至更高维度的数组，这在深度学习中非常常见，用来表示更复杂的数据结构。

张量是多维数组的泛化。它是一个可以表示标量、向量、矩阵以及更高维度数据的数学对象。在 PyTorch 中，张量是其核心数据结构，用于表示神经网络的输入、输出和参数。

张量的维度也称为轴 (axis) 或秩 (rank)。它决定了张量可以表示的数据的结构。

0 维张量 (标量):

只有一个数值，维度为 0。

scalar_tensor = torch.tensor(5)
print(scalar_tensor.ndim)  # 输出维度: 0

1 维张量 (向量):

一列或一行数值，维度为 1。

vector_tensor = torch.tensor([1, 2, 3])
print(vector_tensor.ndim)  # 输出维度: 1
print(vector_tensor.shape) # 输出形状: torch.Size([3])

2 维张量 (矩阵):

行和列组成的表格，维度为 2。

matrix_tensor = torch.tensor([[1, 2], [3, 4]])
print(matrix_tensor.ndim)  # 输出维度: 2
print(matrix_tensor.shape) # 输出形状: torch.Size([2, 2])

就像 Java 中有 int, float, double 等数据类型一样，PyTorch 张量也有不同的数据类型，如：

代码示例中看到的 dtype=torch.long, dtype=torch.double, dtype=torch.float 就是指定张量的数据类型。选择合适的数据类型对于性能和精度至关重要。

这是 PyTorch 张量最核心的优势！ 普通的 Java 数组和列表主要在 CPU 上进行运算，而 PyTorch 张量可以轻松地转移到 GPU 上进行加速运算。

GPU (图形处理器) 特别擅长并行计算，而神经网络的训练和推理包含大量的矩阵运算，非常适合 GPU 并行加速。使用 GPU 可以大幅度提升深度学习模型的训练和推理速度。

代码示例中看到的 .to(device) 方法和 torch.device("cuda") 就是用来将张量转移到 GPU 上的。

在深度学习中，张量几乎无处不在：

神经网络的权重 (Weights) 和偏置 (Biases): 模型的参数通常用张量表示。
输入数据 (Images, Text, Audio 等): 输入数据被转换成张量喂给神经网络。例如，图像可以表示为 3 维张量 (高度 x 宽度 x 颜色通道)。
神经网络的中间层输出 (Activations): 每一层神经网络的输出也是张量。
梯度 (Gradients): 在反向传播过程中计算的梯度也是张量，用于更新模型的参数。

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！

本文由博客一文多发平台 OpenWrite 发布！

posted @ 2025-02-09 21:31 公众号-JavaEdge 阅读(120) 评论(0) 收藏举报

刷新页面返回顶部