随笔分类 -  数据库

摘要:前言 在实际应用中, 为了降低单表的数据量, 会对较大的表进行水平切分, 将单表的数据切分到多表多库中. 既然要切分, 就要有一个切分的依据, 比如说按照 ID 取模等. 那么多张表联合分页是如何做到的呢? 如果分表的依据是字段 A, 但是需要根据字段 B 进行分页查询, 针对这种情况应该如何处理呢 阅读全文
posted @ 2021-07-03 17:34 烟草的香味 阅读(281) 评论(0) 推荐(0) 编辑
摘要:spark 的计算流程大概如图: 其中, 通过多次处理, 生成多个中间数据, 最后对结果进行操作获得数据. 本文不涉及任何原理, 仅总结spark在处理的时候支持的所有操作, 方便后面使用的时候, 可以参照本文进行数据的处理. 以下函数整理, 基与Python中RDD对象. 数据的转换操作 数据之间 阅读全文
posted @ 2021-03-21 18:56 烟草的香味 阅读(235) 评论(0) 推荐(0) 编辑
摘要:HBase在存储时, 使用了LSM树来进行数据存储, 会定期将文件进行合并, 以提升数据的查询效率, LSM树都是这么处理的. 那么到这里就有一个问题了, HBase在进行文件合并的时候, 势必会占用大量 IO, 难道不会对正常的业务产生影响么? 抱着这个疑问, 我去找了找HBase文件合并的方式. 阅读全文
posted @ 2021-03-13 16:37 烟草的香味 阅读(187) 评论(0) 推荐(0) 编辑
摘要:在HBase中, 从逻辑上来讲数据大概就长这样: 单从图中的逻辑模型来看, HBase 和 MySQL 的区别就是: 将不同的列归属与同一个列族下 支持多版本数据 这看着感觉也没有那么太大的区别呀, 它解决了 MySQL 的那些问题呢? 每一个新事物的出现, 都是为了解决原本存在的问题. 对写入友好 阅读全文
posted @ 2021-02-28 00:12 烟草的香味 阅读(612) 评论(0) 推荐(1) 编辑
摘要:hbase是一款分布式数据库. 其对数据的索引只通过row key进行. 在存储数据的时候, 通过row key的排序进行存储. 在面对一个新的数据库时, 深究其原理并不知一个明智的选择, 正如开车一般, 大多数人都是先学会开车, 然后在开车的过程中车子出故障了, 再慢慢学着去修理. 不管怎么说, 阅读全文
posted @ 2020-12-03 19:28 烟草的香味 阅读(231) 评论(0) 推荐(0) 编辑
摘要:概述 存储引擎是什么? MySQL中的数据用各种不同的技术存储在文件中,这些技术中的每一种技术都使用不同的存储机制、索引技巧、锁定水平并且最终提供广泛的不同的功能和能力。通过选择不同的技术,额能够获得额外的速度或功能,改善应用功能。 存储引擎 1.InnoDB InnoDB是一个健壮的事务性存储引擎 阅读全文
posted @ 2019-10-20 20:01 烟草的香味 阅读(187) 评论(0) 推荐(0) 编辑
摘要:-- 双中划线+空格: 单行注释, 与#相同 -- 链接数据库 mysql.exe -h localhost -P3306 -uroot -p -- 查看服务器的对外处理字符集 show variables like 'character_set%'; -- 修改服务器认为的客户端数据的字符集为gb 阅读全文
posted @ 2019-03-03 13:38 烟草的香味 阅读(251) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示
主题色彩