huggingface下载的.arrow数据集读取与使用说明
huggingface下载的.arrow数据集读取与使用说明
from datasets import load_from_disk
from datasets import load_dataset
dataset_cnn = load_dataset("ccdv/cnn_dailymail",
'3.0.0',
cache_dir="./data")
print("dataset['test']: ", dataset_cnn["test"][0])