摘要: 10.1 分词问题: ('钱收错了,怎么办?\n' '钱收错了 怎么办' ('钱什么时候到账?\n' '钱 什么时候 到账' 因为使用了hmm模型,会自动识别新词 ('配方卡支持吗?\n' '配方 卡 支持' '寄养卡怎么弄?(购物卡)\n' '寄养 卡 怎么弄 购物 卡' 添加自定义词库 ('那手 阅读全文
posted @ 2018-11-01 16:30 yjy888 阅读(118) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2018-11-01 16:28 yjy888 阅读(11) 评论(1) 推荐(0) 编辑
摘要: 测试文件在result下面, 1、word2vec还需要丰富训练数据,去噪音,加入博客,新增加预处理的方法。 2、建立评估准确率和召回率的机制 3、去除停用词是不是去多了,增加原文打印的结果 4、原文521条,最终应跑出(521*520)/2对 阅读全文
posted @ 2018-11-01 08:50 yjy888 阅读(187) 评论(0) 推荐(0) 编辑