摘要: 一、GitHub链接:https://github.com/linjiazhi147/031802119 二:代码思路: : 1.读入文本进行处理,去除标点,jieba分词,其中jieba的内容原理是加载字典, 生成trie树,给定待分词的句子, 使用正则获取连续的 中文字符和英文字符, 切分成 短 阅读全文
posted @ 2020-09-17 22:56 林佳志 阅读(194) 评论(0) 推荐(0) 编辑