02 2023 档案
摘要:输出是一个元组类型的数据 ,包含四部分, last hidden state shape是(batch_size, sequence_length, hidden_size),hidden_size=768,它是模型最后一层的隐藏状态 pooler_output:shape是(batch_size,
阅读全文
摘要:CUDA是一个并行计算平台和编程模型,能够使得使用GPU进行通用计算变得简单和优雅。Nvidia官方提供的CUDA 库是一个完整的工具安装包,其中提供了 Nvidia驱动程序、开发 CUDA 程序相关的开发工具包等可供安装的选项。 Nvidia CUDA Nvidia安装的cuda是一个完整的cud
阅读全文
摘要:import torch.nn as nn torch.nn.Sigmoid() 一、sigmoid介绍 sigmoid是激活函数的一种,它会将样本值映射到0到1之间。 sigmoid的公式如下: 二、sigmoid的应用 代码: im
阅读全文