代码改变世界

lucene 中文分词器中的一个Bug

2012-05-01 20:16  Lves Li  阅读(175)  评论(0编辑  收藏  举报

lucene 中文分词器如何扩充中文词库啊
求帮助???1534432371@qq.com这是我的邮箱
在帮着找找这个小程序那错了??(我想让“烟台大学”作为一个语汇单元,不分词)


import java.io.BufferedWriter;
import java.io.FileWriter;
import java.io.IOException;
import java.util.ArrayList;
import java.util.Iterator;

import org.apache.lucene.analysis.Analyzer;
import org.wltea.analyzer.lucene.IKAnalyzer;

import LuceneUtil.AnalyzerUtils;

import com.chenlb.mmseg4j.analysis.MMSegAnalyzer;

public class TestAnalyzer {
 static ArrayList<String> list=null;
 
 
 public static void main (String [] args) throws IOException{
  //addNewWord( "烟台大学 ");
  test();
  
  
 }
 
 public static void test()
 {
  Analyzer a1=new IKAnalyzer();
  String txt="我是一名大学生,我来自菏泽,我现在烟台大学。";
  AnalyzerUtils.displayToken(txt,a1);
  ArrayList<String> list=new ArrayList<String>();
  list.add("烟台大学 ");
  org.wltea.analyzer.dic.Dictionary.addWords(list);
    
   
  
 }
 }