最近在做网页信息抽取方面的课题,从上研究生以来一直用C#,可是去年做信息检索大作业的时候发现了C#的弱点:开源的东西太少了,且不成熟。比如LUCENE.NET,WINISTA HTML PARSER 都是一编译就出N个exception,那个SHARPICT也是不够稳定,所以我要改行用JAVA了。因为JAVA这方面的开源软件已经很成熟啦。说道,做到,从现在开始就开始向JAVA进军。
1. 使用eclipse 建立第一个简单的JAVA工程
http://www.slyar.com/blog/java-eclipse-sample.html
2.如何在eclipse JAVA工程中添加一个JAR包
http://topic.csdn.net/t/20061111/09/5149920.html