2020 年 2月 14 日随笔档案 - 啥123

2020年2月14日

摘要：通过这几天的学习，发现有些网页的爬取比较简单，比如小说，但是其他爬取北京市政百姓信件这个网页并没有想象中那么简单，在翻页的时候，网址并没有发生改变，后来通过询问同学，了解了ajax技术，通过scrapy框架和json来进行爬取，首先信件列表网页找到详细页面的url地址，发现网页中并没有完整的url地阅读全文

posted @ 2020-02-14 19:16 啥123 阅读(524) 评论(0) 推荐(0) 编辑