随笔分类 -  网络爬虫

摘要:package Step1;import java.util.Calendar;import org.apache.commons.httpclient.HttpClient;import org.apache.commons.httpclient.methods.GetMethod;/** * ... 阅读全文
posted @ 2015-11-10 14:53 陈泽泽 阅读(972) 评论(0) 推荐(0) 编辑
摘要:PC端:safari 5.1 – MACUser-Agent:Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.... 阅读全文
posted @ 2015-11-05 08:48 陈泽泽 阅读(412) 评论(0) 推荐(0) 编辑
摘要:Connection conn = Jsoup.connect(String url); conn.data("txtBill", key);// 设置关键字查询字段Document doc = null;doc = conn.timeout(100000).post();//... 阅读全文
posted @ 2015-11-02 17:04 陈泽泽 阅读(341) 评论(0) 推荐(0) 编辑
摘要:1 package zeze; 2 3 import java.io.IOException; 4 5 import org.json.JSONArray; 6 import org.json.JSONException; 7 import org.json.JSONObject; 8 imp... 阅读全文
posted @ 2015-11-02 16:15 陈泽泽 阅读(473) 评论(0) 推荐(0) 编辑
摘要:package zeze;import java.io.IOException;import org.jsoup.Connection;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Elem... 阅读全文
posted @ 2015-11-01 23:45 陈泽泽 阅读(1216) 评论(0) 推荐(0) 编辑
摘要:package zeze;import java.io.IOException;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.select.Elements;public class TestJsoup... 阅读全文
posted @ 2015-11-01 18:55 陈泽泽 阅读(962) 评论(0) 推荐(0) 编辑
摘要:$url ="https://********";$contents = file_get_contents($url); //抓取页面数据//如果出现中文乱码使用下面代码 //$getcontent = iconv("gb2312", "utf-8",$contents);preg_match('... 阅读全文
posted @ 2015-10-27 18:33 陈泽泽 阅读(4445) 评论(0) 推荐(0) 编辑