2016年9月19日

自己动手做聊天机器人 二十九-重磅:近1GB的三千万聊天语料供出

摘要: Reference: http://www.shareditor.com/blogshow/?blogId=112 经过半个月的倾力打造,建设好的聊天语料库包含三千多万条简体中文高质量聊天语料,近1G的纯文本数据。此语料库全部基于2万部影视剧字幕,经由爬取、分类、解压、语言识别、编码识别、编码转换、 阅读全文

posted @ 2016-09-19 09:59 alex.shu 阅读(9811) 评论(2) 推荐(0) 编辑

导航