1 2 3 4 5 ··· 8 下一页
摘要: Matplotlib 安装 Matplotlib 是一个强大的 Python 绘图库,用于创建各种类型的静态、动态和交互式图表。 本章节,我们使用 pip 工具来安装 Matplotlib 库,如果还未安装该工具,可以参考 Python pip 安装与使用。 升级 pip: python3 -m p 阅读全文
posted @ 2024-03-28 10:42 数据阮小白 阅读(56) 评论(0) 推荐(0) 编辑
摘要: 第1章 HBase简介 1.1 什么是HBase HBase的原型是Google的BigTable论文,受到了该论文思想的启发,目前作为Hadoop的子项目来开发维护,用于支持结构化的数据存储。 官方网站:http://hbase.apache.org -- 2006年Google发表BigTabl 阅读全文
posted @ 2024-03-15 10:24 数据阮小白 阅读(15) 评论(0) 推荐(0) 编辑
摘要: 一.Hive语法详解 Hive 是基于Hadoop 构建的一套数据仓库分析系统,是一个用来搭建数仓的工具。它提供了丰富的SQL查询方式来分析存储在Hadoop分布式文件系统中的数据,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行 阅读全文
posted @ 2024-03-15 10:22 数据阮小白 阅读(891) 评论(0) 推荐(0) 编辑
摘要: Hologres 一.什么是实时数仓Hologres Hologres是阿里巴巴自主研发的一站式实时数仓引擎(Real-Time Data Warehouse),支持海量数据实时写入、实时更新、实时加工、实时分析,支持标准SQL(兼容PostgreSQL协议和语法,支持大部分PostgreSQL函数 阅读全文
posted @ 2024-03-15 10:14 数据阮小白 阅读(737) 评论(0) 推荐(0) 编辑
摘要: MySQ储存过程的血泪史 1.为什么有储存过程 为了简单方便的进行sql执行 2,第一个储存过程(生成一百万条数据) 1.创建一个简单student表,表字段有id name,sroce,age 2.创建一个函数随机生成name 点击数据库中的'函数'-->新建函数-->确定 BEGIN​decla 阅读全文
posted @ 2020-08-20 18:42 数据阮小白 阅读(110) 评论(0) 推荐(0) 编辑
摘要: python半自动爬虫简介 一,爬虫步骤 1,找到想要爬取数据的网址,得到源代码 ​​​​​<!DOCTYPE HTML><html><head> <meta charset="gbk"/> <meta name="renderer" content="webkit"/> <meta http-eq 阅读全文
posted @ 2020-08-20 18:40 数据阮小白 阅读(325) 评论(0) 推荐(0) 编辑
摘要: 关于mysql的部分优化 1. MySQL怎样优化WHERE子句 该节讨论为处理WHERE子句而进行的优化。例子中使用了SELECT语句,但相同的优化也适用DELETE和UPDATE语句中的WHERE子句。 请注意对MySQL优化器的工作在不断进行中,因此该节并不完善。MySQL执行了大量的优化,本 阅读全文
posted @ 2020-07-30 11:10 数据阮小白 阅读(125) 评论(0) 推荐(0) 编辑
摘要: pgsql基本操作 一.关于系统表 pg_class 记录了数据库中的表,索引,序列,视图("关系")。 其中比较重要字段有: relname 表,索引,视图等的名字。 relnamespace 包含这个关系的名字空间(模式)的 OID,对应pg_namespace.oid relkind r = 阅读全文
posted @ 2020-07-20 15:28 数据阮小白 阅读(1182) 评论(0) 推荐(0) 编辑
摘要: InnoDB存储引擎 InnoDB是事务安全的MySQL存储引擎,设计上采用了类似于oracle数据库的架构.通常来说,InnoDB存储引擎是OLTP应用中核心表的首选存储引擎 InnoDB简介 概述 第一个完整支持ACID事务的MySQL存储引擎,特点是行锁设计,支持MVCC,支持外键,提供一致性 阅读全文
posted @ 2020-06-22 11:36 数据阮小白 阅读(154) 评论(0) 推荐(0) 编辑
摘要: 恢复内容开始 kafka源码解读 一. 概述 1.前言 在大数据的场景里面如何应对数据激增,数据复杂度增加以及数据变化速率变快,这都是体现了大 数据架构师,Java架构师的功力。而Kafka能很好的解决这些问题。 Kafka的源码是众多开源的技术里面代码质量比较高的一个,所以本身研究它的源码就比较有 阅读全文
posted @ 2020-06-22 11:33 数据阮小白 阅读(451) 评论(0) 推荐(0) 编辑
1 2 3 4 5 ··· 8 下一页