摘要:
由于原始的地址设置了登陆权限,所以,选择 huggingface 的 mnist 数据集使用。 数据装载 首先到 hf 网站下载相关数据集,地址是 ylecun/mnist, 然后在安装 hf 设计的数据集加载套件 datasets 工具包。 用 huggingface提供的工具下载到本地目录 hu 阅读全文
摘要:
Parquet格式解释及词解 Parquet,中文通常翻译为帕奎或帕凯,是一种高效的列式存储格式。 为什么叫Parquet? Parquet这个词源自法语,指的是一种镶木地板。这种地板是由许多小块木块拼凑而成的,每个木块代表一个数据列。这种比喻形象地说明了Parquet格式的存储方式。 Parque 阅读全文
摘要:
来源 The MNIST dataset consists of 70,000 28x28 black-and-white images of handwritten digits extracted from two NIST databases. A data point comprises a 阅读全文
摘要:
来源句子: mingpt/trainer.py is (GPT-independent) PyTorch boilerplate code that trains the model. boilerplate 在这里的中文意思是「样板代码」 详细解释 boilerplate:这个英文单词源自法律文件 阅读全文