会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
lototo
晓以爱之名
博客园
首页
新随笔
联系
订阅
管理
2016年1月25日
python 之readability与BeautifulSoup
摘要: 以前要采集某个网页,一般做法是写程序源代码爬出来,然后用正则去匹配出来,这种针对指定的网页去爬效果还可以,但是如果是批量的网页这种实现就会变得不现实,在这时候就有readability出手的意义了,readability能迅速将内容爬取出来,其他的有几种库也可以,这里就不比较了但是我觉得这个挺好用...
阅读全文
posted @ 2016-01-25 23:35 有没有人知道
阅读(2052)
评论(0)
推荐(0)
编辑
公告