会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
不要忘记我
博客园
首页
新随笔
联系
订阅
管理
2020年2月14日
采集北京市政百姓信件内容
摘要: 通过这几天的学习,发现有些网页的爬取比较简单,比如小说,但是其他爬取北京市政百姓信件这个网页并没有想象中那么简单,在翻页的时候,网址并没有发生改变,后来通过询问同学,了解了ajax技术,通过scrapy框架和json来进行爬取,首先信件列表网页找到详细页面的url地址,发现网页中并没有完整的url地
阅读全文
posted @ 2020-02-14 19:16 啥123
阅读(524)
评论(0)
推荐(0)
编辑