Loading

摘要: 文件格式,一行一个json,每行代表corpus中的一个文件。 from multiprocessing import Manager from datasets import load_dataset manager = Manager() corpus_dataset = load_datase 阅读全文
posted @ 2022-11-05 15:56 戴墨镜的长颈鹿 阅读(41) 评论(0) 推荐(0) 编辑