摘要: 1. 语料下载:https://dumps.wikimedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz2 【中文维基百科语料】 2. 语料处理 (1)提取数据集的文本 下载的数据集无法直接使用,需要提取出文本信息。 安装python 阅读全文
posted @ 2024-05-19 11:52 映辉 阅读(64) 评论(0) 推荐(0) 编辑