2017年6月9日

机器人--寒暄库(4)

摘要: 目前智能QA系统都是基于seq2seq模型来开发(如google),seq2seq模型基于one-hot的词嵌入,每个词用一个数字代替不足以表示词与词之间的关系,word2vec通过多维向量来做词嵌入,能够表示出词之间的关系,比如:男-女≈王子-公主。基于seq2seq的思想,利用多维词向量来实现模型,预期会有更高的准确性。(~~说人话:就是把每个汉字按照一定的规则转换为一个多维矩阵表示,联系... 阅读全文

posted @ 2017-06-09 21:51 LeLe.xu 阅读(1314) 评论(0) 推荐(0) 编辑

机器学习--如何将NLP应用到深度学习(3)

摘要: 数据收集以后,我们下面接着要干的事情是如何将文本转换为神经网络能够识别的东西。 词向量 作为自然语言,只有被数学化才能够被计算机认识和计算。数学化的方法有很多,最简单的方法是为每个词分配一个编号,这种方法已经有多种应用,但是依然存在一个缺点:不能表示词与词的关系。 词向量是这样的一种向量[2.1, -3.31, 83.37, 93.0, -18.2, ……],每一个词对应一个向量,词... 阅读全文

posted @ 2017-06-09 21:50 LeLe.xu 阅读(1246) 评论(0) 推荐(0) 编辑

机器人--寒暄库(数据准备2)

摘要: 上次说了机器人的寒暄库需要基于seq2seq模型来做训练,训练的前提是我们准备好了足够的数据。 这次来说一下数据准备工作。 数据的来源一般分为内部已有的积累数据,另一个就是互联网数据,比如百度。。。百度几乎就是互联网的一个镜像。内部积累的文本数据有限,远不如网络数据丰富。so我们就要考虑怎么获取到网络文本数据了,可能你已经猜到了,那就是爬虫。 python的scrapy是一个快速,高层次的屏幕抓取... 阅读全文

posted @ 2017-06-09 21:49 LeLe.xu 阅读(727) 评论(0) 推荐(0) 编辑

机器人--推荐系统(1)

摘要: 430的目标是完成机器人的推荐系统,提高机器人回答问题的准确率,关于过程碰到的问题以及解决方案与大家分享一下,(请轻喷!) 那么这个推荐系统到底应该怎么做呢? 最开始的第一个思路是 根据用户 进入到ERP的模块 推荐该模块下的相关问题。其实就是根据用户的轨迹来推荐问题,这是一个思路但是不太完整。因为很有可能用户就从ERP的桌面就进入了机器人,但他实际要咨询的是销售系统的相关知识,那么此时的推荐就不... 阅读全文

posted @ 2017-06-09 21:48 LeLe.xu 阅读(603) 评论(0) 推荐(0) 编辑

导航