摘要: http://cuiqingcai.com/2621.html 一、基础介绍 <bookstore> <book> <title>Harry Potter</title> <author>J K. Rowling</author> <year>2005</year> <price>29.99</pr 阅读全文
posted @ 2016-12-14 22:17 咸鱼翻身 阅读(2056) 评论(0) 推荐(0) 编辑
摘要: 一、抓包基础 在淘宝上搜索“Python机器学习”之后,试图抓取书名、作者、图片、价格、地址、出版社、书店等信息,查看源码发现html-body中没有这些信息,分析脚本发现,数据存储在了g_page_config变量之中,初步分析需要采用抓包技术来获取其他页的数据。以前使用Fiddler非常方便,今 阅读全文
posted @ 2016-12-14 22:16 咸鱼翻身 阅读(2424) 评论(0) 推荐(0) 编辑