利用 word2vec 训练的字向量进行中文分词
最近针对之前发表的一篇博文《Deep Learning 在中文分词和词性标注任务中的应用》中的算法做了一个 C 语言的实现,感觉效果还不错。本文主要是将我在程序实现过程中的一些数学细节整理出来,借此优化一下自己的代码,也希望为对此感兴趣的朋友提供点参考。文中重点介绍训练算法中的模型参数计算,以及 Viterbi 解码算法。
相关链接:
《Deep Learning 在中文分词和词性标注任务中的应用》
《Deep Learning for Chinese Word Segmentation and POS tagging》
《UFLDL 教程学习笔记(一)神经网络》
《HMM 自学教程(六)维特比算法》
《为什么我们喜欢用 sigmoid 这类 S 型非线性变换?》
《Deep Learning for Chinese Word Segmentation and POS tagging》
《UFLDL 教程学习笔记(一)神经网络》
《HMM 自学教程(六)维特比算法》
《为什么我们喜欢用 sigmoid 这类 S 型非线性变换?》