python3爬虫 -----新浪微博(m)-------评论爬取

复制代码

 1 import requests
 2 import time
 3 import re
 4 
 5 
 6 
 7 p=0
 8 while p<=0:
 9     p+=1
10     url = "https://m.weibo.cn/api/comments/show?id=4257289713596342&page="+str(p) #杨洋为例
11     html = requests.get(url)
12     print(html)
13     try:
14         for c in range(len(html.json()['data']['data'])):
15             data=html.json()['data']['data'][c]['text']
16             with open('comments.txt','a',encoding='utf-8') as f:
17                 comments=''.join(re.findall('[\u4e00-\u9fa5]',data))
18                 print(comments)
19                 f.write(comments+'\n'*2)
20     except:
21         None

复制代码

效果如下所示：

posted @ 2018-09-24 10:35 浅忆~ 阅读(1790) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区，博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· 智能桌面机器人：用.NET IoT库控制舵机并多方法播放表情
· Linux glibc自带哈希表的用例及性能测试
· 深入理解 Mybatis 分库分表执行原理
· 如何打造一个高并发系统？
· .NET Core GC压缩(compact_phase)底层原理浅谈

阅读排行：
· 新年开篇:在本地部署DeepSeek大模型实现联网增强的AI应用
· DeepSeek火爆全网，官网宕机？本地部署一个随便玩「LLM探索」
· Janus Pro：DeepSeek 开源革新，多模态 AI 的未来
· 上周热点回顾（1.20-1.26）
· 【译】.NET 升级助手现在支持升级到集中式包管理

<

2025年1月

>

日

一

二

三

四

五

六

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

6

7

8

最新随笔

随笔分类 (234)

阅读排行榜

最新评论

1. Re:A. Next Round
学到了
--AlbertKs
2. Re:最近IntelliJ IDEA过期啦
@前端小白菜嘎嘎已在正文里，更新了永久有效的链接...
--浅忆~
3. Re:最近IntelliJ IDEA过期啦
你好，步骤2过期了，能在发一下吗？谢谢
--前端小白菜嘎嘎