随笔分类 -  《Python网络爬虫权威指南》读书笔记

摘要:3.1 遍历单个域名 笔者尝试了三次, 本书源码处给出了运行结果:https://github.com/REMitchell/python-scraping/blob/master/Chapter03-web-crawlers.ipynb 如果你仔细观察那些指向词条页面的链接,会发现它们都有3个共同 阅读全文
posted @ 2019-08-23 10:24 橘子酱ing 阅读(2253) 评论(0) 推荐(0) 编辑
摘要:2.1 不是一直都要用锤子 避免解析复杂HTML页面的方式: 寻找“打印此页”的链接,或者看看网站有没有HTML样式更友好的移动版本(把自己的请求头设置成处于移动设备的状态,然后接受网站移动版)。 寻找隐藏在JavaScript文件里的信息。要实现这一点,你可能需要查看网页加载的JavaScript 阅读全文
posted @ 2019-08-19 15:55 橘子酱ing 阅读(600) 评论(0) 推荐(0) 编辑
摘要:前言 这本书的所有代码示例都在GitHub网站上(https://github.com/REMitchell/python-scraping),可以查看和下载。 如果想要更全面地学习Python,Bill Lubanovic写的《Python语言及其应用》是一本非常好的教材。(笔者还没有看,笔者选用 阅读全文
posted @ 2019-08-17 10:16 橘子酱ing 阅读(1463) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示