大数据分析01——数据爬取

2020.3.22

pycharm：使用python进行爬取，并存储到文件

1.爬取网页的通用代码框架

1 try:
2     r = requests.get(url, timeout = 30)
3     r.raise_for_status()
4     r.encoding = r.apparent_encoding
5     return r.text
6 except:
7     return "产生异常"

养成编写爬虫用try-except的方式来保证网络连接异常能被有效处理的习惯。

posted @ 2020-03-22 22:17 ZZKZS 阅读(288) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
· 三行代码完成国际化适配，妙~啊~

公告

昵称： ZZKZS
园龄： 7年3个月
粉丝： 5
关注： 5

+加关注

2025年3月

日

一

二

三

四

五

六

ZZKZS

大数据分析01——数据爬取

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论