摘要: python是一门很强大的语言,在实现爬虫方面也十分方便。 这个天气预报采集是从中国天气网提取广东省内主要城市的天气并回显。本来是打算采集腾讯天气的,但是貌似它的数据是用js写上去还是什么的,得到的html文本中不包含数据,所以就算了。 爬虫简单说来包括两个步骤:获得网页文本、过滤得到数据。 1、获得html文本。 python在获取html方面十分方便,寥寥数行代码就可以实现我们需要的功能。1 def getHtml(url):2 page = urllib.urlopen(url)3 html = page.read()4 page.close()5 ... 阅读全文
posted @ 2012-10-06 21:17 coltfoal 阅读(6683) 评论(16) 推荐(5) 编辑