摘要: 作业任务: 使用98年人民日报语料库进行中文分词训练及测试。 作业输入: 98年人民日报语料库(1998 01 105 带音.txt),用80%的数据作为训练集,20%的数据作为验证集。 运行环境: Jupyter Notebook, Python3 作业方法: 实现了前向匹配算法的分词功能。 源码 阅读全文
posted @ 2019-07-27 20:09 Yanqiang 阅读(619) 评论(0) 推荐(0) 编辑