Fork me on GitHub
摘要: 1、对语料进行分析 基本目录如下: 其中train存放的是训练集,answer存放的是测试集,具体看下train中的文件: 下面有20个文件夹,对应着20个类,我们继续看下其中的文件,以C3-Art为例: 每一篇都对应着一个txt文件,编码格式是gb18030.utf8文件夹下的是utf-8编码格式 阅读全文
posted @ 2020-10-08 19:45 西西嘛呦 阅读(5250) 评论(11) 推荐(4) 编辑