会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
格式化。
博客园
首页
新随笔
联系
管理
订阅
2020年2月5日
毕业设计5
摘要: 昨天开始学习了爬虫的一些方法,有urliib,request和Scrapy,在爬取定位时用正则和xpath,综合比较,决定采用request和xpath的方法再次爬取图片和评论等相关的信息,也学习了代理池,在爬取时也用了代理池,防止被封ip。爬取的数据也会有些不规范,有多余空格等内容,对数据进行了初
阅读全文
posted @ 2020-02-05 19:08 格式化。
阅读(110)
评论(0)
推荐(0)
编辑
公告