python3使用newspaper快速抓取任何新闻文章正文

newspaper用于爬取各式各样的新闻网站

1,安装newspaper

pip install newspaper3k

2,直接上代码

复制代码
from newspaper import Article

url
= '你想要爬取的网站url' news = Article(url, language='zh')
news .download() #先下载 news .parse() #再解析
print(news.text) #新闻正文 print(news.title) #新闻标题 print(news.html) #未修改的原始HTML print(news.authors) #新闻作者 print(news.top_image) #本文的“最佳图像”的URL print(news.movies) #本文电影url print(news.keywords) #新闻关键词 print(news.summary) #从文章主体txt中生成的摘要
print(news.images) #本文中的所有图像url
复制代码

 



posted @   lvye001  阅读(1845)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 25岁的心里话
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
点击右上角即可分享
微信分享提示