2020年3月23日

中文分词&词向量化

摘要: NLP: 1.分词(代表:jieba) 2.向量化(包括字符向量化、词向量化、拼音向量化、词性向量化等,代表:word2vec,glove) 3.进一步分析 一、jieba “结巴”中文分词:做最好的 Python 中文分词组件,参考资料 特点 支持四种分词模式: 精确模式,试图将句子最精确地切开, 阅读全文

posted @ 2020-03-23 15:06 静静的白桦林_andy 阅读(1041) 评论(0) 推荐(0) 编辑

导航