08 2022 档案

摘要:一、rabbitmq介绍 # 消息队列:MQ:消息队列就是基础数据结构中的“先进先出”的一种数据机构。想一下,生活中买东西,需要排队,先排的人先买消费,就是典型的“先进先出 # mq解决的问题: -应用解耦 -流量削峰 -消息分发 -异步消息 # mq的比较 -rabbitmq:消息准确性 -kaf 阅读全文
posted @ 2022-08-25 16:39 马氵寿 阅读(69) 评论(0) 推荐(0) 编辑
摘要:一、广播与单播 # 广播 -同一个局域网内,启动多台es服务器,自动组成集群 # 单播 -指定集群中有那些机器,如果没有指定的机器是不会被加到机器的 二、脑裂问题 elasticsearch集群中一个或者多个节点失去和主节点的通信,然后各节点就开始选举新的主节点,继续处理请求。这个时候,可能有两个不 阅读全文
posted @ 2022-08-25 16:35 马氵寿 阅读(76) 评论(0) 推荐(0) 编辑
摘要:一、Elasticsearch的文档增删查改(CURD) # 增 PUT lqz/_doc/1 { "name":"顾老二", "age":30, "from": "gu", "desc": "皮肤黑、武器长、性格直", "tags": ["黑", "长", "直"] } # 删 DELETE lq 阅读全文
posted @ 2022-08-24 17:51 马氵寿 阅读(374) 评论(0) 推荐(0) 编辑
摘要:一、Elasticsearch介绍 # 大规模数据如何存储和检索 》elasticsearch # Elasticsearch 是一个基于Lucene的分布式搜索和分析引擎,分布式全文检索引擎,java开发,遵循apache开源协议 使用Lucene作为其核心来实现所有索引和搜索的功能,但是它的目的 阅读全文
posted @ 2022-08-22 20:37 马氵寿 阅读(171) 评论(0) 推荐(0) 编辑
摘要:一、进程、线程、协程 # 进程:进程就是一个程序在内存中的运行,进程是资源分配的最小单位 # 线程:线程是cup调度的最小单位 # 计算:消耗cpu,cpu进行运算 # io: 不消耗cpu # 垃圾回收机制:垃圾回收线程专门干这个事,一个进程下多线程情况下,使用GIL,只有获得gil锁的线程才能执 阅读全文
posted @ 2022-08-22 20:35 马氵寿 阅读(47) 评论(0) 推荐(0) 编辑
摘要:详情见:http://www.liuqingzheng.top/db/Redis系列/08-Redis系列之-Redis-Cluster/ 一、Redis主从复制 1.1 单实例存在的问题 机器故障;容量瓶颈;QPS瓶颈 1.2 什么是主从复制 架构:一主一从,一主多从 作用: 做读写分离 做数据副 阅读全文
posted @ 2022-08-22 20:21 马氵寿 阅读(194) 评论(0) 推荐(0) 编辑
摘要:一、redis介绍安装和配置典型应用场景 1.1 介绍 开源:c语言,早起版本2w3千行,没有外部依赖 基于键值对的存储系统:字典形式 多种数据结构:字符串,hash,列表,集合,有序集合 高性能,功能丰富 哪些公司在用? github,twitter,stackoverflow,阿里,百度,微博, 阅读全文
posted @ 2022-08-18 15:28 马氵寿 阅读(5922) 评论(0) 推荐(0) 编辑
摘要:一、MySQL主从搭建 1.1 什么是主从同步? 一个主库,写数据都写到主库,从库只用来读数据,可以一主一从,可以是一主多从 两台机器:主库,从库(mysql版本必须一致) 1.2 原理 mysql主从配置的流程大体如图: 1)master会将变动记录到二进制日志(binlog)里面(主库要开启bi 阅读全文
posted @ 2022-08-17 08:50 马氵寿 阅读(62) 评论(0) 推荐(0) 编辑
摘要:一、迁移备份 # 一个容器内,尽量只有一个软件,不要把mysql,redis,。。。方到一个容器中,而要放到多个容器 # 镜像 >容器 >装了软件(vim,mysql) >打包成镜像 >运行成容器(带了软件) docker commit 容器id centos-vim:v1 # 容器打包成镜像 do 阅读全文
posted @ 2022-08-16 21:37 马氵寿 阅读(662) 评论(0) 推荐(0) 编辑
摘要:一、Docker安装与启动 # 1.yum 包更新到最新 # yum remove docker docker-common docker-selinux docker-engine # rm -rf /var/lib/docker yum update # 2.安装需要的软件包, yum-util 阅读全文
posted @ 2022-08-15 15:40 马氵寿 阅读(332) 评论(0) 推荐(0) 编辑
摘要:一、docker入门介绍 # 什么是虚拟化 ​ 在计算机中,虚拟化(英语:Virtualization)是一种资源管理技术,是将计算机的各种实体资源,如服务器、网络、内存及存储等,予以抽象、转换后呈现出来,打破实体结构间的不可切割的障碍,使用户可以比原本的组态更好的方式来应用这些资源。这些资源的新虚 阅读全文
posted @ 2022-08-12 20:25 马氵寿 阅读(58) 评论(0) 推荐(0) 编辑
摘要:一、sqlalchemy的介绍及安装 1.1 介绍 sqlalchemy:独立的orm框架,轻松的集成到任意项目中去,SQLAlchemy是一个基于Python实现的ORM框架。该框架建立在 DB API之上,使用关系对象映射进行数据库操作,简言之便是:将类和对象转换成SQL,然后使用数据API执行 阅读全文
posted @ 2022-08-11 17:32 马氵寿 阅读(237) 评论(0) 推荐(0) 编辑
摘要:一、数据库连接池 # flask 可以使用pymysql操作数据库 1.1 如果把conn做成全局 ​ 多个线程使用同一个链接对象,会导致数据错乱 1.2 如果在每个视图函数中建立链接 每个线程使用一个连接,会导致mysql连接数过大 1.3 借助于第三方模块dbutils,实现数据库连接池 pip 阅读全文
posted @ 2022-08-10 18:35 马氵寿 阅读(92) 评论(0) 推荐(0) 编辑
摘要:一、session的使用和原理 1.1 session执行原理 用户第一次请求后,将产生的状态信息保存在session中,这时可以把session当做一个容器,它保存了正在使用的所有用户的状态信息;这段状态信息分配了一个唯一的标识符用来标识用户的身份,将其保存在响应对象的cookie中;当第二次请求 阅读全文
posted @ 2022-08-09 16:00 马氵寿 阅读(641) 评论(0) 推荐(0) 编辑
摘要:一、路由系统 1.路由使用 flask 路由写法: 基于装饰器 from flask import Flask app = Flask(__name__) @app.route('/index', methods=['GET'], endpoint='index') # 第一个参数为url路径,第二 阅读全文
posted @ 2022-08-08 17:47 马氵寿 阅读(214) 评论(0) 推荐(0) 编辑
摘要:一、介绍 1.Flask介绍 Flask是一个基于Python开发并且依赖jinja2模板(DTL)和Werkzeug WSGI(符合wsgi协议的web服务器,wsgiref)服务的一个微型框架,对于Werkzeug本质是Socket服务端,其用于接收http请求并对请求进行预处理,然后触发Fla 阅读全文
posted @ 2022-08-08 15:56 马氵寿 阅读(454) 评论(0) 推荐(0) 编辑
摘要:一、scrapy介绍和安装 # requests,selenium,bs4(模块) >专业爬虫:爬虫框架(scrapy),在固定位置写固定代码,就能完成爬虫的功能 # Scrapy是一个开源和协作的框架,其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的,使用它可以以快速、简单、可扩展的方式 阅读全文
posted @ 2022-08-03 20:41 马氵寿 阅读(307) 评论(0) 推荐(0) 编辑
摘要:一、 xpath的基本使用 简介:XPath 是一门在 XML 文档中查找信息的语言 # 一般解析库都会有子的的搜索标签的方法,一般都会支持css和xpath # 一般使用: div 找div标签 / 找当前路径下的标签 /div/a // 找当前路径子子孙孙下的标签 -/div//a . 表示当前 阅读全文
posted @ 2022-08-03 18:06 马氵寿 阅读(86) 评论(0) 推荐(0) 编辑
摘要:一、 selenium基本使用 # 由于requests不能执行js,有的页面内容,我们在浏览器中可以看到,但是请求下来没有 》selenium模块:模拟操作浏览器,完成人的行为 # selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScrip 阅读全文
posted @ 2022-08-02 21:19 马氵寿 阅读(303) 评论(1) 推荐(0) 编辑
摘要:一、 BeautifulSoup4 介绍 # (1)Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库 # (2)使用requests发请求拿回来的html,就可以使用bs4解析出咱们想要的数据 # (3)BeautifulSoup(要解析的字符串, "解析方式 阅读全文
posted @ 2022-08-02 20:48 马氵寿 阅读(353) 评论(0) 推荐(0) 编辑
摘要:一、 代理 1使用代理发送requests请求 import requests proxies = { 'http': '112.14.47.6:52024', } # 180.164.66.7 respone=requests.get('https://www.cnblogs.com/',prox 阅读全文
posted @ 2022-08-02 20:40 马氵寿 阅读(191) 评论(0) 推荐(1) 编辑
摘要:1 爬虫介绍 # 所有的软件,90%以上,cs,bs,主流都是用http协议通信,模拟发送http请求 》服务端把数据返回(html,xml,json) >数据的清洗(re,bs4) >入库(文件,mysql,redis,es,mongo) -mysql:tcp自定定制的协议 -redis:tcp自 阅读全文
posted @ 2022-08-02 17:12 马氵寿 阅读(863) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示
深色
回顶
展开