NLP和感知机
最近在看Hanlp作者的一本书,讲到了感知机,这里简单说下。
感知机本质就是一个线性函数,很像一个神经网络里的一个神经元。不同点是神经元有一个激活函数,而感知机就是通过结果的正负来做二分类。
感知机的损失函数,或者说惩罚函数,就是对于误分类的样本,希望他们的感知结果的绝对值总和越小越好。
选择这个惩罚函数的原因是”它是可导的”,可以梯度下降到的一个极小值。
完成感知机的训练后,用感知机的感知结果和,用它代替HMM模型中的概率距离和,还是用维特比算法求最小路径,就能得到正确的分词结果。
感知机的特征怎么提取?
根据隐马尔可夫模型(HMM),特征分成状态特征和转移特征。
B=begin 词首
E=end 词尾
M=middle 词中
S=singel 单字成词
参考:https://blog.csdn.net/m0_37490039/article/details/79660929