摘要:
GET和POST本质上就是TCP链接,并无差别。但是由于HTTP的规定和浏览器/服务器的限制,导致他们在应用过程中体现出一些不同。 GET和POST是什么?HTTP协议中的两种发送请求的方法。 HTTP是什么?HTTP是基于TCP/IP的关于数据如何在万维网中如何通信的协议。 HTTP的底层是TCP 阅读全文
摘要:
https://dl-xda.xposed.info/framework/sdk21/ 阅读全文
摘要:
Elasticsearch 是一个开源的搜索引擎,建立在一个全文搜索引擎库 Apache Lucene™ 基础之上。 Lucene 可能是目前存在的,不论开源还是私有的,拥有最先进,高性能和全功能搜索引擎功能的库。但是 Lucene 仅仅只是一个库。为了利用它,你需要编写 Java 程序,并在你的 阅读全文
摘要:
一、队列(Queue) Python的Queue模块中提供了同步的、线程安全的队列类,包括FIFO(先入先出)队列Queue,LIFO(后入先出)队列LifoQueue,和优先级队列PriorityQueue。这些队列都实现了锁原语,能够在多线程中直接使用。可以使用队列来实现线程间的同步。 常用方法 阅读全文
摘要:
请求上下文流程 flask的request对象是一个全局对象,跟django的request不太一样,django的request对象是每次请求一个,但是flask全局就一个request对象,但是每次请求它能区分开是哪个请求,这个做的挺牛逼的,我去看了一下它的源码,原来是写了一个local类,来处 阅读全文
摘要:
我们知道,在抓取数据时,多多少少会因为个别的原因(网络不好等)出现请求的故障,这样会影响我们抓取数据的效率,那遇到这样的问题我们该怎么解决呢?直接用try模式?这样会影响到抓取的数据量,这个时候retry函数就用到了。 首先安装,很简单pip install retry 然后就是讲一下,retry函 阅读全文
摘要:
(1)、jieba分词的三种模式 精确模式、全模式、搜索引擎模式 - 精确模式:把文本精确的切分开,不存在冗余单词 - 全模式:把文本中所有可能的词语都扫描出来,有冗余 - 搜索引擎模式:在精确模式基础上,对长词再次切分 (2)、jieba库常用函数 (3)、实例 import jieba txt 阅读全文
摘要:
__new__方法先被调用,返回一个实例对象,接着 init 被调用。 __init__方法可以用来做一些初始化工作,比如给实例对象的状态进行初始化: new__方法,它作为构造函数用于创建对象; call 方法,它可以将类实例也可以变成一个可调用对象,只需要实现一个特殊方法__call()。 cl 阅读全文
摘要:
Redis集群选举原理: 当slave发现自己的master挂了 将自己记录的currentEpoch加1,并向其他节点请求投票给自己成为master 其他节点收到请求,只有master会回应,判断请求的合法性,并投票,可能会有多个slave请求,每个master只能投一票 slave收集maste 阅读全文
摘要:
Scrapy 和 scrapy-redis的区别 Scrapy 是一个通用的爬虫框架,但是不支持分布式,Scrapy-redis是为了更方便地实现Scrapy分布式爬取,而提供了一些以redis为基础的组件(仅有组件)。 pip install scrapy-redis Scrapy-redis提供 阅读全文