不会编程的小卜
人生没有白走的路,每一步都算数
摘要: 数据解析的原理 1.实现标签的定位 2.将标签中的存储的文本内容或者相关的属性值进行提取 正则 爬虫练习之爬取糗事百科 BS4 环境安装 1.pip install BS4 2.pip install lxml 解析原理 实例化一个BeautifulSoup对象,必须把即将被解析的页面源码加载到该对 阅读全文
posted @ 2019-05-11 15:51 不会编程的小卜 阅读(503) 评论(0) 推荐(0) 编辑
摘要: 简介 selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题 selenium本质是通过驱动浏览器,完全模拟浏览器的操作,比如跳转、输入、点击、下拉等,来拿到网页渲染之后的结果,可支持多种浏览器 作用: 可以让浏览器完成相关自 阅读全文
posted @ 2019-05-11 15:22 不会编程的小卜 阅读(734) 评论(0) 推荐(0) 编辑
摘要: 在我们爬取网页的时候,可能会遇到乱码的问题,解决这种的乱码的问题有一种通用的方法 阅读全文
posted @ 2019-05-11 15:19 不会编程的小卜 阅读(547) 评论(0) 推荐(0) 编辑