摘要: 词向量: 将词语"嵌入"到一个N维空间,使得词语相近的词语放到相近的位置。 机器翻译类不类似于矩阵的变换? 谷歌出品的一个工具Word2Vec,用于入门。 句向量?段向量?文档向量? 很多事情向量化,可以解决很多问题。 传统的one-hot 编码的原来是,有多少个字就有多少个维度. 科[1,0,0, 阅读全文
posted @ 2017-04-02 14:13 醉清风-- 阅读(141) 评论(0) 推荐(0) 编辑
摘要: 有监督学习:类似一个拟合过程,对(x,y)来训练,x是特征,y是标签。 无监督学习:类似一个聚类的过程,从大量自己学到的数据的规律,一般用于特征提取,输入和输出都是数据本身。 自编码器(无监督,一种端到端的处理方案):数据的特征应该由数据本身决定,会提取不同图片中相同的特征.控制中间的节点,丢弃无用 阅读全文
posted @ 2017-04-02 11:28 醉清风-- 阅读(116) 评论(0) 推荐(0) 编辑
摘要: 朴素贝叶斯公式:求A在B条件下的概率,可以转换为B在A条件下的概率。 Hmm隐马尔科夫:每个输出状态仅仅由当前时刻的输入状态激活;状态之间的转移,仅仅取决于前一时刻的状态。 动态规划:只考虑前后的转移,只需要找首尾还有中间的关系,每一步就是求一小步的最优。分词,词性标注,输入法, OCR ,纠错,语 阅读全文
posted @ 2017-04-02 11:21 醉清风-- 阅读(133) 评论(0) 推荐(0) 编辑