cqusearch搜索部分问题记录
HTMLParser使用
http://allenj2ee.iteye.com/blog/222454
httpclient自动获取页面编码设置进行字符编码,使httpclient适用所有网页抓取不乱码
http://jsczxy2.iteye.com/blog/1682574
最后解决方案
URL pageURL = new URL(url);
Parser parser = new Parser(pageURL.openConnection());
配置hibernate