摘要: 中科院软件所2005年11月 上面说过,经过分析得出百度的分词系统采用双向最大匹配分词,但是后来发现推理过程中存在一个漏洞,而且推导出来的百度分词算法步骤还是过于繁琐,所以进一步进行分析,看看是否前面的推导有错误. 那么以前的分析有什么漏洞呢?我们推导百度分词有反向最大匹配的依据是百度将"北京华烟云"分词为,从这里看好像采用了反向最大匹配,因为正向最大匹配的结果应该是,但是由此就推论说百度采用了双... 阅读全文
posted @ 2005-11-28 21:14 小墨的童鞋 阅读(1088) 评论(0) 推荐(0) 编辑
摘要: 中科院软件所 张俊林2005年11月 拼写检查错误提示是搜索引擎都具备的一个功能,也就是说用户提交查询给搜索引擎,搜索引擎检查看是否用户输入的拼写有错误,对于中文用户来说一般造成的错误是输入法造成的错误.那么我们就来分析看看百度是怎么实现这一功能的. 我们分析拼写检查系统关注以下几个问题: (1)系统如何判断用户的输入是有可能发生错误的查询呢? (2)如果判断是可能错误的查询输入,... 阅读全文
posted @ 2005-11-28 21:11 小墨的童鞋 阅读(1790) 评论(1) 推荐(0) 编辑
摘要: 中科院软件所 张俊林2005年11月 随着搜索经济的崛起,人们开始越加关注全球各大搜索引擎的性能、技术和日流量。作为企业,会根据搜索引擎的知名度以及日流量来选择是否要投放广告等;作为普通网民,会根据搜索引擎的性能和技术来选择自己喜欢的引擎查找资料;作为技术人员,会把有代表性的搜索引擎作为研究对象. 搜索引擎经济的崛起,又一次向人们证明了网络所蕴藏的巨大商机。网络离开了搜索将只剩下空洞杂乱的数... 阅读全文
posted @ 2005-11-28 21:09 小墨的童鞋 阅读(1071) 评论(0) 推荐(0) 编辑
摘要: 我喜欢用Google的个性化主页,但是需要让IE记录自己的Gmail信箱用户和密码,实现自动登陆。前些天突然IE不会记录了,每次打开IE都要重新登陆,麻烦得要死。不过有时候也能记录几分钟。研究了很久都没有结果。郁闷。。记录的Cookie怎么总是丢失呢? 阅读全文
posted @ 2005-11-28 09:35 小墨的童鞋 阅读(667) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示