NLP和感知机

最近在看Hanlp作者的一本书,讲到了感知机,这里简单说下。

感知机本质就是一个线性函数,很像一个神经网络里的一个神经元。不同点是神经元有一个激活函数,而感知机就是通过结果的正负来做二分类。

感知机的损失函数,或者说惩罚函数,就是对于误分类的样本,希望他们的感知结果的绝对值总和越小越好。

选择这个惩罚函数的原因是”它是可导的”,可以梯度下降到的一个极小值。

 

完成感知机的训练后,用感知机的感知结果和,用它代替HMM模型中的概率距离和,还是用维特比算法求最小路径,就能得到正确的分词结果。

 

感知机的特征怎么提取?

根据隐马尔可夫模型(HMM),特征分成状态特征和转移特征。

B=begin 词首

E=end 词尾

M=middle 词中

S=singel 单字成词

 

参考:https://blog.csdn.net/m0_37490039/article/details/79660929

 

posted @ 2021-01-07 11:59  爱知菜  阅读(17)  评论(0编辑  收藏  举报