摘要: selenium是使用javascript编写,主要用来进行web应用程序测试,在python爬虫中可以用来进行动态网页爬取,解决爬虫中的javascript渲染(执行js语句)。总结记录下,以备后面学习 1. selenium基本使用 安装:pip install selenium 查看支持的浏览 阅读全文
posted @ 2019-04-07 20:59 silence_cho 阅读(539) 评论(0) 推荐(0) 编辑
摘要: 之前都是爬取网页中的文本信息,没有爬取过视频和音频文件,所以爬取了下b站和网易云音乐,记录下整个过程,留着学习。 1. 爬取b站视频 1.1 网页分析 最近python机器学习比较火热,那就爬取点机器学习的视频吧。首先打开b站网页,输入“python机器”进行搜索,返回页面中,审查元素可以发现每个视 阅读全文
posted @ 2019-04-07 16:55 silence_cho 阅读(19206) 评论(0) 推荐(2) 编辑