NLP和感知机

最近在看Hanlp作者的一本书，讲到了感知机，这里简单说下。

感知机本质就是一个线性函数，很像一个神经网络里的一个神经元。不同点是神经元有一个激活函数，而感知机就是通过结果的正负来做二分类。

感知机的损失函数，或者说惩罚函数，就是对于误分类的样本，希望他们的感知结果的绝对值总和越小越好。

选择这个惩罚函数的原因是”它是可导的”，可以梯度下降到的一个极小值。

完成感知机的训练后，用感知机的感知结果和，用它代替HMM模型中的概率距离和，还是用维特比算法求最小路径，就能得到正确的分词结果。

感知机的特征怎么提取？

根据隐马尔可夫模型（HMM），特征分成状态特征和转移特征。

B=begin 词首

E=end 词尾

M=middle 词中

S=singel 单字成词

参考：https://blog.csdn.net/m0_37490039/article/details/79660929

posted @ 2021-01-07 11:59 爱知菜阅读(17) 评论(0) 编辑收藏举报

刷新页面返回顶部