2013 年 12月 19 日随笔档案 - 金发萌音

2013年12月19日

摘要：一、基础知识关于xml、html基本的标签标签文本知识二、问题描述完成一个单线程的爬虫程序。对给定的网址可以提取出其中所有的A标签中的包含的网址（href属性）；并根据这些网址再获得更多的网址。要求：输入参数：网址，最大采集的网页数量。输出：采集的网页文件三、代码import java.io.*;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;import java.util.*;public cl.. 阅读全文

posted @ 2013-12-19 19:05 金发萌音阅读(539) 评论(0) 推荐(0) 编辑