摘要: 注释: 1、本例子仅为测试代码有效性,故只选取了四个城市进行数据获取: 2、本例尚有可优化之处,例如代码的简洁性、循环输入城市名字等; 阅读全文
posted @ 2016-11-30 17:57 Eric9 阅读(7307) 评论(1) 推荐(1) 编辑
摘要: beautifulsoup模块,可以替代re模块来代替正则表达式进行匹配 小例子1:用beautifulsoup爬取淘宝首页的汉字 小例子2:用Beautiful soup编写一个抓取妹子图页面图片的代码 阅读全文
posted @ 2016-11-30 17:47 Eric9 阅读(3915) 评论(0) 推荐(0) 编辑
摘要: python3.5不同于python2.7,在python3.5中,编写爬虫小程序,需要安装模块urllib下的request和parse类 小程序1:编写脚本,用来实现抓取百度贴吧指定页面 小程序二:爬取指定页面指定格式的文件(本例子爬取指定页面的jpg文件) 注: 1、要爬取某个页面的文件,必须 阅读全文
posted @ 2016-11-30 16:50 Eric9 阅读(4119) 评论(3) 推荐(0) 编辑