2021年6月22日

RabbitMQ BasicGet与BasicConsume的区别

摘要: 在RabbitMQ中消费者有2种方式获取队列中的消息: a) 一种是通过basic.consume命令,订阅某一个队列中的消息,channel会自动在处理完上一条消息之后,接收下一条消息。(同一个channel消息处理是串行的)。除非关闭channel或者取消订阅,否则客户端将会一直接收队列的消息。 阅读全文

posted @ 2021-06-22 18:34 ExplorerMan 阅读(278) 评论(0) 推荐(0) 编辑

中文分词概述及结巴分词原理

摘要: 词是中文表达语义的最小单位,自然语言处理的基础步骤就是分词,分词的结果对中文信息处理至为关键。 本文先对中文分词方法进行一下概述,然后简单讲解一下结巴分词背后的原理。 中文分词概述 简单来说,中文分词根据实现特点大致可分为两个类别: 基于词典的分词方法、基于统计的分词方法。 基于词典的分词方法 基于 阅读全文

posted @ 2021-06-22 17:11 ExplorerMan 阅读(1725) 评论(0) 推荐(0) 编辑

异步请求库aiohttp的使用

摘要: 异步请求库aiohttp的使用 1.使用aiohttp发起一个请求 官方推荐使用一个客户端会话来发起所有请求,会话中记录了请求的cookie,但你还可以使用aiohttp.request来发送请求。 当我们使用 async def 就是定义了一个异步函数,异步逻辑由asyncio提供支持。 asyn 阅读全文

posted @ 2021-06-22 16:50 ExplorerMan 阅读(414) 评论(0) 推荐(0) 编辑

不懂抓包也能做APP爬虫?1招教你爬取抖音流行歌名

摘要: 前言 说起APP爬虫,相信大家会很容易联想到一些抓包工具:Fiddler、Charles、mitmproxy和anyproxy等等。 借助这些抓包工具,我们可以知道APP在运行过程中具体发起了什么请求,之后我们就可以详细分析这些请求,再用程序模拟这些请求最终实现爬虫。 然而,在爬虫的实操中,APP的 阅读全文

posted @ 2021-06-22 11:57 ExplorerMan 阅读(740) 评论(0) 推荐(0) 编辑

导航