摘要: 这是我的第一个爬虫代码。。。算是一份测试版的代码。大牛大神别喷。。。 通过给定一个初始的地址startPiont然后对网页进行捕捉,然后通过正则表达式对网址进行匹配。 List<string> todo :进行抓取的网址的集合 List<string> visited :已经访问过的网址的集合 下面 阅读全文
posted @ 2013-12-21 23:59 lmei 阅读(5127) 评论(0) 推荐(0) 编辑