会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
OldLiu's .NET Life
我就是单纯的小程序员~~~
2007年1月17日
简单实现中文分词中的常用字过滤
摘要: 首先感谢兽族的荣耀朋友的文章简单编写的中文分词程序 ,我开始接触搜索引擎这个领域以及写这篇随笔都离不开他的精彩文章的帮助:) 下面切入正题。 名词:分析器(Analyzer),词单元(Tokens),高亮(Highlight)。 实现背景: 当在搜索引擎文本框中写入源词时,分析器(Analyzer)会将源词拆分成多组词单元(Tokens)。之...
阅读全文
posted @ 2007-01-17 10:34 老刘.
阅读(1385)
评论(0)
推荐(0)
编辑
导航
博客园
首页
新随笔
联系
订阅
管理
公告