python链家网高并发异步爬虫and异步存入数据

python链家网二手房异步IO爬虫，使用asyncio、aiohttp和aiomysql

很多小伙伴初学python时都会学习到爬虫，刚入门时会使用requests、urllib这些同步的库进行单线程爬虫，速度是比较慢的，后学会用scrapy框架进行爬虫，速度很快，原因是scrapy是基于twisted多线程异步IO框架。

本例使用的asyncio也是一个异步IO框架，在python3.5以后加入了协程的关键字async，能够将协程和生成器区分开来，更加方便使用协程。

经过测试，平均1秒可以爬取30个详情页信息

可以使用asyncio.Semaphore来控制并发数，达到限速的效果

posted @ 2019-05-09 14:56 嗨学编程阅读(636) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】100%开源！大型工业跨平台软件C++源码提供，建模，组态！
【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

公告

Python学习交流群：153708845

昵称：嗨学编程
园龄： 6年
粉丝： 16
关注： 0

<

2025年4月

>

日

一

二

三

四

五

六

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

1

2

3

4

5

6

7

8

9

10

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:Python中的可视化神器：pyecharts
我就服了，写个安利JuPyter，让我一下联想到安利
--泽鈢
2. Re:教你如何使用Python写游戏辅助脚本
@ 天才米布袋你怎么那么可爱...
--少年不见天空
3. Re:python实现定时发送qq消息
这个qqbot作者都不更新了，已经用不是上了
--执星
4. Re:python实现定时发送qq消息
能不能注明出处？尊重一下人家的劳动成果好吗？
--写代码的熊大
5. Re:python爬取中国天气网站数据并对其进行数据可视化
后面chart = Bar('............')
chart.add
str没有get属性啊
--骑鱼嘚猫