03 2006 档案
摘要:CLucene - a C++ search engine http://sourceforge.net/projects/clucene/ 传统的全文检索都是基于数据库的,Sql Server Oracle mysql 都提供全文检索,但这些比较大,不适合单机或小应用程序(Mysql4.0以上可以作为整合开发),Mysql也不支持中文。 后来得知Apache有一个开源的全文检索引...
阅读全文
摘要:以前做知识管理系统的时候,由于需要建立全文检索和统计词频,需要对中文文本进行分词。对于中文分词, 国内做到好的应该是中科院自然研究所,但是相对比较复杂,我看了几次没有看明白. :) ,由于平常我们的知识系统对分词的要求没有这么高,所以 就选择了最大化的词表分词法. 词表选择的是人民日报97版的词表.实际效果可以达到90%以上,基本可以满足需要。支持 Lucene.net分词,词表是启动时一次性...
阅读全文
摘要:作者: 孙立 Email: 17bizAT126.com写于:2006/3/5版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者信息及本声明http://sunli.cnblogs.com/archive/2006/03/05/343095.html关键词:ASP 模板摘要: 阐述一种全新的ASP模板引擎,实现代码(逻辑)层与HTML(表现)层的分离.这种模板实现方法避免了一 ...
阅读全文