摘要:
在经典的数据库理论里,本地事务具备四大特征: 原子性 事务中的所有操作都是以原子的方式执行的,要么全部成功,要么全部失败; 一致性 事务执行前后,所有的数据都应该处于一致性状态 即要满足数据库表的一致性约束,也要达到业务一致性(完成了业务目标); 隔离性 并发执行的事务不应该相互干扰;隔离性的强度由 阅读全文
摘要:
作为一个DAU上百万或千万的站点,不仅仅需要做好网站应用程序、数据库的优化,还应从TCP/IP协议层去进行相关的优化; 在我的工作中,曾使用到了以下的几种基本的优化方式: 增大最大连接数 在Linux系统里,所有的网络连接都是通过文件描述符(file descriptor)来实现的,因此一个进程所能 阅读全文
摘要:
通常而言,MySQL数据库单表支持容量为1000万条记录,如果超过了这个量级,在查询/更新数据库表记录的时候,性能会受到很大的影响。在这种情况下,我们往往会采用其他的解决方案以提高数据库读写性能: 采用非关系型数据库如ElasticSearch、Cassandra、HBase、Mongo等,非关系型 阅读全文
摘要:
数据模型 ZooKeeper数据模型是一个树状的数据结构,类似于文件系统;和文件系统的区别在于树中的每一个节点(叶子节点与非叶子节点)都可以保存数据,且每个节点的访问都必须从根节点开始,以斜线作为分隔的访问路径,如 /root/a/b/,它没有相对路径的概念,所有的节点都必须通过绝对路径来访问; Z 阅读全文
摘要:
分布式存储区别于集中式数据库存储,通过网络将海量数据存储到企业的各个数据节点(可能分布到不同的数据中心或机架上); 分布式存储需要考虑的问题 元数据管理 元数据是指数据本身的标识,通过元数据能很快的找到数据存储的位置,比如在分布式文件系统中,元数据是指文件的路径名+文件名;元数据管理包括集中式元数据 阅读全文
摘要:
HDFS分布式文件系统是一个部署在廉价机器上基于POSIX约束的高容错性、高吞吐量的大规模分布式文件管理系统;它适合于大文件的存储,应用于“一次写入多次读取”的文件模型。 架构 HDFS采用的是Master/Slave架构,一个HDFS集群由一个NameNode和一定数目的Datanotes组成,N 阅读全文