会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
畑鹿驚
解决焦虑的最好办法就是立刻去做让你焦虑的事
首页
新随笔
联系
订阅
管理
2017年7月8日
如何使用python3爬取1000页百度百科条目
摘要: 1 问题描述 起始页面 http://baike.baidu.com/item/python 包含许多指向其他词条的页面。通过页面之间的链接访问1000条百科词条。 对每个词条,获取其标题和简介。 2 讨论 首先获取页面源码,然后解析得到自己要的数据。 这里我们通过urllib或者requests库
阅读全文
posted @ 2017-07-08 18:51 畑鹿驚
阅读(580)
评论(0)
推荐(0)
编辑