lucene 中文分词器中的一个Bug
2012-05-01 20:16 Lves Li 阅读(175) 评论(0) 编辑 收藏 举报lucene 中文分词器如何扩充中文词库啊
求帮助???1534432371@qq.com这是我的邮箱
在帮着找找这个小程序那错了??(我想让“烟台大学”作为一个语汇单元,不分词)
import java.io.BufferedWriter;
import java.io.FileWriter;
import java.io.IOException;
import java.util.ArrayList;
import java.util.Iterator;
import org.apache.lucene.analysis.Analyzer;
import org.wltea.analyzer.lucene.IKAnalyzer;
import LuceneUtil.AnalyzerUtils;
import com.chenlb.mmseg4j.analysis.MMSegAnalyzer;
public class TestAnalyzer {
static ArrayList<String> list=null;
public static void main (String [] args) throws IOException{
//addNewWord( "烟台大学 ");
test();
}
public static void test()
{
Analyzer a1=new IKAnalyzer();
String txt="我是一名大学生,我来自菏泽,我现在烟台大学。";
AnalyzerUtils.displayToken(txt,a1);
ArrayList<String> list=new ArrayList<String>();
list.add("烟台大学 ");
org.wltea.analyzer.dic.Dictionary.addWords(list);
}
}