2017年9月22日
摘要: 最近偶然打开一个英文网站,仔细一看原来是中国日报的英文版本,本着培养语感的想法多看看英语新闻,奈何水平渣渣,机智如我想到了爬取文章高频词汇,废话少说,看下文: 爬取中国日报全网所有文章链接 1.用bs4获取所有含有href属性的a标签 输出: 2.正则提取符合要求的链接 输出: 3.完整源码如下: 阅读全文
posted @ 2017-09-22 16:43 Ryana 阅读(2153) 评论(0) 推荐(0) 编辑