会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
莫山
曾经是C#探索者
博客园
首页
新随笔
联系
订阅
管理
2007年2月25日
具有字典验证的记事本
摘要: 最近想建立一个拼音化汉语文字的词典库,但着手起来才发现并不是那么容易。不光是分词技术的问题,重要的是难以找到一个重音少而又比较全面的词库(包括保留的单字的词)。 由于单音的词基本确定,因此紧接着的比较关键且已经比较成熟的双字以上的词成为重点,问题在于如何走好下一步,即优化双字的词。参考了在线的字典、词典,以及古汉语字词典,发现汉语确实是一个复杂的东西。要想做些什么,还得下一翻功夫不可,恐怕也得...
阅读全文
posted @ 2007-02-25 21:49 Mossan
阅读(558)
评论(0)
推荐(0)
编辑