随笔 - 909 文章 - 0 评论 - 16 阅读 - 60万

利用 word2vec 训练的字向量进行中文分词

        最近针对之前发表的一篇博文《Deep Learning 在中文分词和词性标注任务中的应用》中的算法做了一个 C 语言的实现，感觉效果还不错。本文主要是将我在程序实现过程中的一些数学细节整理出来，借此优化一下自己的代码，也希望为对此感兴趣的朋友提供点参考。文中重点介绍训练算法中的模型参数计算，以及 Viterbi 解码算法。

相关链接：

《Deep Learning 在中文分词和词性标注任务中的应用》
《Deep Learning for Chinese Word Segmentation and POS tagging》
《UFLDL 教程学习笔记（一）神经网络》
《HMM 自学教程（六）维特比算法》
《为什么我们喜欢用 sigmoid 这类 S 型非线性变换?》

作者: peghoty

出处: http://blog.csdn.net/itplus/article/details/17122431

欢迎转载/分享, 但请务必声明文章出处.

posted on 2013-12-05 11:50 我的小人生阅读(1282) 评论(2) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· 10年+ .NET Coder 心语，封装的思维：从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热？
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列：向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用

阅读排行：
· 10年+ .NET Coder 心语 ── 封装的思维：从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源！
· 字符编码：从基础到乱码解决

昵称：我的小人生
园龄： 14年6个月
粉丝： 30
关注： 0

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:在java中高效的计数器
您好，想请教您这个高效计数器如何保证线程安全呢
--zzxzxn
2. Re:GDB错误：Cannot find bounds of current function
汇编的话，使用si
--impwang
3. Re:Ubuntu + Win7 双系统重装win7后进入不了Ubuntu
请问fedora下可以用吗
--张秋池
4. Re:NIO与普通IO文件读写性能对比
我一个243 MB (254,888,590 字节) 的zip 文件的测试结果是： nio copy lasts: 1863normal copy lasts: 1092如果单独测试3次，结果分别是：...
--Ideasex
5. Re:OpenGL ES2学习笔记（6）-- Line Strip和Line Loop
赞
--皮斯卡略夫