会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
小张学Python
博客园
首页
新随笔
联系
订阅
管理
2020年1月3日
新闻类网站的通用爬虫--GNE
摘要: GNE(GeneralNewsExtractor)是一个通用新闻网站正文抽取模块,输入一篇新闻网页的 HTML, 输出正文内容、标题、作者、发布时间、正文中的图片地址和正文所在的标签源代码。GNE在提取今日头条、网易新闻、游民星空、 观察者网、凤凰网、腾讯新闻、ReadHub、新浪新闻等数百个中文新
阅读全文
posted @ 2020-01-03 16:09 小张学Python
阅读(2285)
评论(0)
推荐(0)
编辑
公告
返回顶部