Fork me on GitHub

04 2017 档案

摘要:下面是测试结果: 阅读全文
posted @ 2017-04-12 23:35 石头木 阅读(9512) 评论(0) 推荐(0) 编辑
摘要:一.下载中文维基百科数据https://dumps.wikimedia.org/zhwiki/并使用gensim中的wikicorpus解析提取xml中的内容 二.利用opencc繁体转简体 三.利用jieba对转换后的文本进行分词,去停词 四.利用gensim中的word2vec训练分词后的文本 阅读全文
posted @ 2017-04-12 23:15 石头木 阅读(8386) 评论(0) 推荐(2) 编辑

点击右上角即可分享
微信分享提示