会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Ryana
博客园
首页
新随笔
联系
订阅
管理
2017年9月22日
爬虫实例:中国日报高频词汇爬虫
摘要: 最近偶然打开一个英文网站,仔细一看原来是中国日报的英文版本,本着培养语感的想法多看看英语新闻,奈何水平渣渣,机智如我想到了爬取文章高频词汇,废话少说,看下文: 爬取中国日报全网所有文章链接 1.用bs4获取所有含有href属性的a标签 输出: 2.正则提取符合要求的链接 输出: 3.完整源码如下:
阅读全文
posted @ 2017-09-22 16:43 Ryana
阅读(2153)
评论(0)
推荐(0)
编辑