数据库 - 随笔分类 - 坠月川

分库后如何分页

摘要：前言在实际应用中, 为了降低单表的数据量, 会对较大的表进行水平切分, 将单表的数据切分到多表多库中. 既然要切分, 就要有一个切分的依据, 比如说按照 ID 取模等. 那么多张表联合分页是如何做到的呢? 如果分表的依据是字段 A, 但是需要根据字段 B 进行分页查询, 针对这种情况应该如何处理呢阅读全文

posted @ 2021-07-03 17:34 坠月川阅读(313) 评论(0) 推荐(0)

spark计算操作整理

摘要：spark 的计算流程大概如图: 其中, 通过多次处理, 生成多个中间数据, 最后对结果进行操作获得数据. 本文不涉及任何原理, 仅总结spark在处理的时候支持的所有操作, 方便后面使用的时候, 可以参照本文进行数据的处理. 以下函数整理, 基与Python中RDD对象. 数据的转换操作数据之间阅读全文

posted @ 2021-03-21 18:56 坠月川阅读(286) 评论(0) 推荐(0)

HBase 文件合并

摘要：HBase在存储时, 使用了LSM树来进行数据存储, 会定期将文件进行合并, 以提升数据的查询效率, LSM树都是这么处理的. 那么到这里就有一个问题了, HBase在进行文件合并的时候, 势必会占用大量 IO, 难道不会对正常的业务产生影响么? 抱着这个疑问, 我去找了找HBase文件合并的方式. 阅读全文

posted @ 2021-03-13 16:37 坠月川阅读(211) 评论(0) 推荐(0)

HBase 数据存储结构

摘要：在HBase中, 从逻辑上来讲数据大概就长这样: 单从图中的逻辑模型来看, HBase 和 MySQL 的区别就是: 将不同的列归属与同一个列族下支持多版本数据这看着感觉也没有那么太大的区别呀, 它解决了 MySQL 的那些问题呢? 每一个新事物的出现, 都是为了解决原本存在的问题. 对写入友好阅读全文

posted @ 2021-02-28 00:12 坠月川阅读(660) 评论(0) 推荐(1)

HBase 命令行

摘要：hbase是一款分布式数据库. 其对数据的索引只通过row key进行. 在存储数据的时候, 通过row key的排序进行存储. 在面对一个新的数据库时, 深究其原理并不知一个明智的选择, 正如开车一般, 大多数人都是先学会开车, 然后在开车的过程中车子出故障了, 再慢慢学着去修理. 不管怎么说, 阅读全文

posted @ 2020-12-03 19:28 坠月川阅读(294) 评论(0) 推荐(0)

MySQL存储引擎

摘要：概述存储引擎是什么? MySQL中的数据用各种不同的技术存储在文件中，这些技术中的每一种技术都使用不同的存储机制、索引技巧、锁定水平并且最终提供广泛的不同的功能和能力。通过选择不同的技术，额能够获得额外的速度或功能，改善应用功能。存储引擎 1.InnoDB InnoDB是一个健壮的事务性存储引擎阅读全文

posted @ 2019-10-20 20:01 坠月川阅读(216) 评论(0) 推荐(0)

MySQL指令笔记

摘要：-- 双中划线+空格: 单行注释，与#相同 -- 链接数据库 mysql.exe -h localhost -P3306 -uroot -p -- 查看服务器的对外处理字符集 show variables like 'character_set%'; -- 修改服务器认为的客户端数据的字符集为gb 阅读全文

posted @ 2019-03-03 13:38 坠月川阅读(269) 评论(0) 推荐(0)

Loading

坠月川

随笔分类 - 数据库

公告