摘要: 一、数据: word2vec训练数据格式说明:对于文本文件,基本格式是一行一句话,需要分好词。 (1)如果按字级别训练,将汉字分隔开就行。按字分割: line_str = line.replace(" ", "") cn = " ".join(line_str) (2)按词分割 方法有很多,jieb 阅读全文
posted @ 2021-05-24 10:17 jasonzhangxianrong 阅读(315) 评论(0) 推荐(0) 编辑