随笔分类 - Python

高清图片爬取

摘要：目标网站：https://unsplash.com/ 目的：爬取一些图片作为Java小程序的背景图代码如下：爬取结果如下：程序中预计爬取40张，但17张够用了，所以停止了爬取，但是存在一个问题，就是爬取的速度很慢，还没有想好怎么解决这个问题。。。。。阅读全文

posted @ 2018-02-10 15:48 西*风阅读(364) 评论(0) 推荐(0) 编辑

中国部分大学排名爬虫

摘要：目标网站：http://www.zuihaodaxue.com/zuihaodaxuepaiming2016.html 目的：爬取目标网站上中国大学的排名代码如下：结果如下：第一次写的爬虫，留作纪念阅读全文

posted @ 2018-02-10 15:19 西*风阅读(259) 评论(0) 推荐(0) 编辑

selenium和PhantomJS的安装

摘要：针对w10系统 selenium安装 pip install selenium 默认安装的是3.x版本，但是3.x版本不支持PhantomJS，所以要安装2.x版本 pip install selenium==2.48.0 phantomjs安装下载链接：http://phantomjs.org/ 阅读全文

posted @ 2018-02-06 10:32 西*风阅读(166) 评论(0) 推荐(0) 编辑

爬虫之小说爬取

摘要：以笔趣阁网站为例，爬取一念永恒这本小说链接如下：http://www.biqukan.com/1_1094 具体代码如下：总结：一定要对将要爬取的网页的代码进行彻底的分析，不然可能得不到想要的效果若有不足错误的地方，欢迎兄弟们拍砖指正，大家一起学习，一起进步！！！！阅读全文

posted @ 2018-01-06 20:48 西*风阅读(1206) 评论(0) 推荐(0) 编辑

黑板客爬虫关卡之第三关

摘要：链接：http://www.heibanke.com/lesson/crawler_ex02 阅读全文

posted @ 2018-01-01 14:11 西*风阅读(215) 评论(0) 推荐(1) 编辑

黑板课爬虫闯关之关卡二

摘要：关卡二地址：http://www.heibanke.com/lesson/crawler_ex01/ 阅读全文

posted @ 2017-12-29 21:42 西*风阅读(169) 评论(0) 推荐(0) 编辑

黑板客爬虫闯关之关卡一

摘要：黑板客爬虫闯关之关卡一分析：从起始界面获得下一个界面的地址信息然后开始跳转，然后又在另外界面获得下一个界面的地址信息，直到通关闯关地址：http://www.heibanke.com/lesson/crawler_ex00/ 注意二者的区别阅读全文

posted @ 2017-12-29 17:26 西*风阅读(233) 评论(0) 推荐(0) 编辑

公告

昵称：西*风
园龄： 7年2个月
粉丝： 227
关注： 25

+加关注

2025年2月

日

一

二

三

四

五

六

若有恒，何必三更起五更眠；最无益，莫过一日曝十日寒。

随笔分类 - Python

公告

搜索

常用链接

随笔分类 (597)

随笔档案 (599)

阅读排行榜

推荐排行榜

最新评论