随笔分类 -  数据库技术

database manage system
摘要:浅谈mysql的两阶段提交协议 阅读全文
posted @ 2014-03-03 00:07 YY哥 阅读(28621) 评论(4) 推荐(4) 编辑
摘要:浅谈MySQL备份字符集的问题 阅读全文
posted @ 2013-09-07 22:58 YY哥 阅读(2671) 评论(0) 推荐(0) 编辑
摘要:前段时间在自研的基于iSCSI的SAN 上跑mysql,CPU的iowait很大,后面改用Native AIO,有了非常大的改观。这里简单总结一下Native AIO的实现。对于以IO为最大瓶颈的数据库,native AIO几乎不二的选择,仅仅依靠多线程,显然无法解决磁盘和网络的问题。 阅读全文
posted @ 2013-02-05 23:08 YY哥 阅读(13624) 评论(1) 推荐(1) 编辑
摘要:一些不得不记住的数据库大牛 阅读全文
posted @ 2011-03-30 23:21 YY哥 阅读(8180) 评论(5) 推荐(1) 编辑
摘要:一些分布式计算理论方面的小结 阅读全文
posted @ 2010-09-07 21:40 YY哥 阅读(6208) 评论(1) 推荐(4) 编辑
摘要:查询处理及优化是关系数据库得以流行的根本原因,也是关系数据库系统最核心的技术之一。SQLite的查询处理模块非常的精致,而且很容易移植到不支持SQL的存储引擎,Berkeley DB最新的版本已经将其完整的移植过来。本文将简要的讨论一下SQLite的查询处理及优化。 阅读全文
posted @ 2010-06-23 15:44 YY哥 阅读(20014) 评论(8) 推荐(10) 编辑
摘要:Lemon是一个LALR(1)文法分析器生成工具。虽然它是SQLite作者针对SQLite写的一个分析器生成工具,但是它与bison和yacc类似,是一个可以独立于SQLite使用的开源的分析器生成工具。而且它使用与yacc(bison)不同的语法规则,可以减少编程时出现错误的机会。Lemon比yacc和bison更精致、更快,而且是可重入的,也是线程安全的。本文简要的整理了一下Lemon的使用以及SQLite相应的语法规则。 阅读全文
posted @ 2010-03-23 20:47 YY哥 阅读(12380) 评论(2) 推荐(5) 编辑
摘要:有一些日子没有仔细关注SQLite了,今天打开其主页,发现其最新的版本已经是3.6.22了,更让我惊喜的是它的用户越来越多,而且邮件列表的关注者也越来越多,突然觉得自己已经太old了。惊喜的同时,不得不聊上几句了。 阅读全文
posted @ 2010-01-27 19:32 YY哥 阅读(15178) 评论(21) 推荐(2) 编辑
摘要:分区是数据库管理系统实现并行处理的一种重要手段。MySQL从5.1开始,开始支持分区这一神奇的功能。但是,目前,MySQL做得还不够多(相对于Oracle),还处于开始阶段,查询优化没有充分利用分区带来的并行优势;不过,它正在努力,有理由相信它能够做好。早在关系数据库出现初期,并行数据库就随之而生,以Teradata为代表的商业化产品已经得到市场的广泛认可,而且也是数据库系统发展的方向。2003年,MySQL从Ericsson公司取得NDB存储引擎,从此,开始了并行数据库之路。 分区并不等于并行数据库。但是,通过分区,能够为数据库管理系统带来某些并行特性,比如并行I/O,并行查询。也许将并行数据库与NDB Cluster一起讨论会更好。但是,分区与并行本来就有一种天然的联系。了解并行数据库的基本概念,才能真正理解分区;同样,理解分区,又会加深对并行数据库的理解。So,enjoy it。 阅读全文
posted @ 2009-12-24 21:36 YY哥 阅读(29196) 评论(7) 推荐(8) 编辑
摘要:复制(replication)是分布式数据库系统重要的特征之一,几乎所有的现代数据库管理系统都不同程度的支持复制。复制带来的好处很明显,数据分布式存储,随之而来的其它一系列优点:负载均衡,高可用性,高性能,容错等等。但是,另一方面,它增加了系统管理的复杂性,尤其是更新的开销,这是数据分布无法避免的。不管怎样,复制都是建立一个高性能、高可用性的分布式数据库平台的起点。所以,享受它吧。 阅读全文
posted @ 2009-12-19 11:33 YY哥 阅读(100504) 评论(17) 推荐(17) 编辑
摘要:索引对查询的速度有着至关重要的影响,理解索引也是进行数据库性能调优的起点。考虑如下情况,假设数据库中一个表有10^6条记录,DBMS的页面大小为 4K,并存储100条记录。如果没有索引,查询将对整个表进行扫描,最坏的情况下,如果所有数据页都不在内存,需要读取10^4个页面,如果这10^4个页面在磁盘上随机分布,需要进行10^4次I/O,假设磁盘每次I/O时间为10ms(忽略数据传输时间),则总共需要100s(但实际上要好很多很多)。如果对之建立B-Tree索引,则只需要进行log100(10^6)=3次页面读取,最坏情况下耗时30ms。这就是索引带来的效果,很多时候,当你的应用程序进行SQL查询速度很慢时,应该想想是否可以建索引。 阅读全文
posted @ 2009-10-28 20:24 YY哥 阅读(358782) 评论(33) 推荐(64) 编辑
摘要:最早接触的MySQL是在三年前,那时候MySQL还是4.x版本,很多功能都不支持,比如,存储过程,视图,触发器,更别说分布式事务等复杂特性了。但从5.0(2005年10月)开始,MySQL渐渐步入企业级数据库的行列了;复制、集群、分区、分布式事务,这些企业级的特性,使得现在的MySQL,完全可以应用于企业级应用环境(很多互联网公司都用其作为数据库服务器,尽管节约成本是一个因素,但是没有强大功能作后盾,则是不可想象的)。虽然,MySQL还有很多不足,比如,复制、分区的支持都十分有限、查询优化仍需要改进,但是MySQL已经是一个足够好的DBMS了,更何况它是 opensource的。这段时间没有事,出于好奇,略微的研究了一下MySQL,积累了一些资料,欲总结出来。这些资料打算分为两部分,上部主要讨论 MySQL的优化,其中主要参考了《MySQL Manual》和《High Performance MySQL》,如果有时间,以后在下部分析一下MySQL的源码。如果你是MySQL高手,希望你不吝赐教;如果你是新手,希望对你有用。 阅读全文
posted @ 2009-10-18 21:52 YY哥 阅读(29855) 评论(11) 推荐(8) 编辑
摘要:VACUUM的实现 阅读全文
posted @ 2009-09-16 20:22 YY哥 阅读(11978) 评论(1) 推荐(0) 编辑
摘要:索引与order by的实现 阅读全文
posted @ 2009-09-16 20:11 YY哥 阅读(4859) 评论(0) 推荐(0) 编辑
摘要:SQLite的页面格式浅析 阅读全文
posted @ 2009-06-14 16:28 YY哥 阅读(4864) 评论(4) 推荐(0) 编辑
摘要:SQLite作为嵌入式数据库,通常针对的应用的数据量相对于通常DBMS的数据量是较小的。所以它的存储模型设计得非常简单,总的来说,SQLite把一个数据文件分成若干大小相等的页面,然后以B树的形式来组织这些页面。而对于大型的数据库管理系统,比如Oracle,或者DM ,存储模型要复杂得多。就拿Oracle来说吧,它对数据文件不仅从物理进行分块,而且从逻辑上进行分段,盘区和页的一个层次划分,DM也一样。不管怎么说,数据库文件要存储大量的数据,为了更好管理,查询和操作数据文件,DBMS不得不从物理上、逻辑上对数据文件的数据进行复杂的组织。 阅读全文
posted @ 2009-06-01 21:12 YY哥 阅读(8478) 评论(2) 推荐(0) 编辑
摘要:oracle的number数据类型 阅读全文
posted @ 2009-06-01 11:12 YY哥 阅读(17542) 评论(0) 推荐(0) 编辑
摘要:虚拟机技术在现在是一个非常热的技术,它的历史也很悠久。最早的虚拟机可追溯到IBM的VM/370,到上个世纪90年代,在计算机程序设计语言领域又出现一件革命性的事情——Java语言的出现,它与c++最大的不同在于它必须在Java虚拟机上运行。Java虚拟机掀起了虚拟机技术的热潮,随后,Microsoft也不甘落后,雄心勃勃的推出了.Net平台。由于在这里主要讨论SQLite的虚拟机,不打算对这些做过多评论,但是作为对比,我会先对Java虚拟机作一个概述。 阅读全文
posted @ 2009-03-18 18:59 YY哥 阅读(10527) 评论(6) 推荐(0) 编辑
摘要:SQLite封锁机制的实现需要底层文件系统的支持,不管是Linux,还是Windows,都提供了文件锁的机制,而这为SQLite提供了必要的支持。本节就来谈谈SQLite使用到的文件锁。 阅读全文
posted @ 2009-03-10 21:54 YY哥 阅读(10149) 评论(5) 推荐(2) 编辑
摘要:本节主要谈谈SQLite的锁机制,SQLite是基于锁来实现并发控制的,所以本节的内容实际上是属于事务处理范畴,但是SQLite的锁机制实现非常的简单而巧妙,所以想在这里单独讨论一下。如果真正理解了它,对整个事务的实现也就差不多理解了。 阅读全文
posted @ 2009-03-01 12:32 YY哥 阅读(10512) 评论(2) 推荐(1) 编辑