摘要: 官方网址:http://htmlunit.sourceforge.net/有时候你需要模拟浏览器,HtmlUnit 就是个不错的选择像 网页中js 中的内容,如果你想用爬虫爬取的话,用Jsoup 就不怎么行了,但是HtmlUnit 就是个不错的选择(1) HtmlUnit模拟表单提交 下面的代码是模拟在百度里搜索 "root" 得到的page2 就是百度搜索"root" 的结果package com.xinsearch;import java.io.IOException;import java.net.MalformedURLException;imp 阅读全文
posted @ 2013-01-22 18:13 杨桃 阅读(3410) 评论(0) 推荐(0) 编辑
摘要: pingyin4j的jar 包下载地址http://sourceforge.net/projects/pinyin4j/files/该jar包的功能是将一个汉字转换为对应的拼音,在搜索的时候如果根据汉子得到拼音的时候,这个工具就是个不错的选择先给个测试代码:package com.pinyin;import net.sourceforge.pinyin4j.PinyinHelper;import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;import net.sourceforge.pinyin4j.format.Hanyu 阅读全文
posted @ 2013-01-22 11:53 杨桃 阅读(972) 评论(0) 推荐(0) 编辑