paip.抓取网页内容--java php python

paip.抓取网页内容--java php python.txt

作者Attilax  艾龙, EMAIL:1466519819@qq.com
来源:attilax的专栏
地址:http://blog.csdn.net/attilax

//////////java
String urlContent = WebpageContent("http://www.123cha.com/ip/?q="+ip,"utf-8");



///////////php
file_get_contents($url);
 curl_init()>>>curl_exec
 fopen->fread->fclose
 
 
 /////python
 urllib.urlopen(url).read()
 response = urllib2.urlopen('http://www.baidu.com/')  
html = response.read()  
 
 ///ahk
 UrlDownloadToFile, URL, Filename

 
 
 public String downloadPage(String Url, String encode) {
        try {
            URL pageUrl = new URL(Url);
            // Open connection to URL for reading.
            BufferedReader reader = new BufferedReader(new InputStreamReader(
                    pageUrl.openStream(), encode));
            // BufferedReader br = new BufferedReader(new InputStreamReader(in,
            // "gbk"));
            // Read page into buffer.
            String line;
            StringBuffer pageBuffer = new StringBuffer();
            while ((line = reader.readLine()) != null) {
                pageBuffer.append(line);
            }
            String s = pageBuffer.toString();
            return s;
            // System.out.println(s);
            // return pageBuffer.toString();
        } catch (Exception e) {
            // return null;
            throw new RuntimeException(e);
        }

    }

 
 
 参考:
 php获取网页内容方法总结_php技巧_脚本之家.htm
 Python 3 抓取网页资源的 N 种方法.htm
posted @ 2014-03-10 14:44  attilaxAti  阅读(187)  评论(0编辑  收藏  举报