摘要: 测试环境:windows 2003 + php5.3.5 + apache2.2 + scws 1.1.9自定义词库,words.txt 如下:腾讯1.01.0@C++1.01.0!中国人1.01.0!就是1.01.0!1.每行由4个字段组成,依次为“词语"(由中文字或3个以下的字母合成), "TF", "IDF", "词性", 字段之间用空格或制表符分开,数量不限(注意,发现如果字段时间用空格隔开,然后用scws官方的php程序将txt词库转换xdb后,词库无效,但是txt词库有效,所以为了兼容性,字段之间最好仅用一个制表 阅读全文
posted @ 2012-03-19 15:43 再快一点 阅读(3013) 评论(2) 推荐(1) 编辑