摘要: BeautifulSoup 一、什么是BeautifulSoup BS4是一个解析库,可以通过某种解析器来帮我们提取想要的数据 二、为什么用BS4 因为他可以用简洁的语法快速提取用户想要的内容 三、安装 四、基本使用 五、遍历文档树 六、搜索文档树 阅读全文
posted @ 2019-07-03 16:34 Crystal_Zh 阅读(514) 评论(0) 推荐(0) 编辑
摘要: 昨日回顾 一、爬取豆瓣电影top250 1.爬取电影页 2.解析提取电影信息 3.保存数据 二、Selenium请求库 驱动浏览器往目标网站发送请求,获取响应数据 不需要分析复杂的通信流程 执行js代码 获取动态数据 三、Selenium使用 driver = webdriver.Chrome() 阅读全文
posted @ 2019-07-03 15:24 Crystal_Zh 阅读(276) 评论(0) 推荐(0) 编辑