摘要: 一、基础知识 关于xml、html基本的标签标签文本知识二、问题描述完成一个单线程的爬虫程序。对给定的网址可以提取出其中所有的A标签中的包含的网址(href属性);并根据这些网址再获得更多的网址。要求: 输入参数:网址,最大采集的网页数量。输出:采集的网页文件三、代码import java.io.*;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;import java.util.*;public cl.. 阅读全文
posted @ 2013-12-19 19:05 金发萌音 阅读(539) 评论(0) 推荐(0) 编辑