JosenZHANG - 博客园

2022年1月23日

摘要：在经典的数据库理论里，本地事务具备四大特征：原子性事务中的所有操作都是以原子的方式执行的，要么全部成功，要么全部失败；一致性事务执行前后，所有的数据都应该处于一致性状态即要满足数据库表的一致性约束，也要达到业务一致性（完成了业务目标）；隔离性并发执行的事务不应该相互干扰；隔离性的强度由阅读全文

posted @ 2022-01-23 23:24 JosenZHANG 阅读(1014) 评论(0) 推荐(0)

2022年1月12日

大型站点TCP/IP协议优化

摘要：作为一个DAU上百万或千万的站点，不仅仅需要做好网站应用程序、数据库的优化，还应从TCP/IP协议层去进行相关的优化；在我的工作中，曾使用到了以下的几种基本的优化方式：增大最大连接数在Linux系统里，所有的网络连接都是通过文件描述符（file descriptor）来实现的，因此一个进程所能阅读全文

posted @ 2022-01-12 22:49 JosenZHANG 阅读(582) 评论(0) 推荐(5)

2022年1月5日

关系型数据库分库分表系列之一

摘要：通常而言，MySQL数据库单表支持容量为1000万条记录，如果超过了这个量级，在查询/更新数据库表记录的时候，性能会受到很大的影响。在这种情况下，我们往往会采用其他的解决方案以提高数据库读写性能：采用非关系型数据库如ElasticSearch、Cassandra、HBase、Mongo等，非关系型阅读全文

posted @ 2022-01-05 17:54 JosenZHANG 阅读(611) 评论(0) 推荐(1)

2021年12月31日

大数据之ZooKeeper

摘要：数据模型 ZooKeeper数据模型是一个树状的数据结构，类似于文件系统；和文件系统的区别在于树中的每一个节点（叶子节点与非叶子节点）都可以保存数据，且每个节点的访问都必须从根节点开始，以斜线作为分隔的访问路径，如 /root/a/b/，它没有相对路径的概念，所有的节点都必须通过绝对路径来访问； Z 阅读全文

posted @ 2021-12-31 16:07 JosenZHANG 阅读(460) 评论(0) 推荐(0)

2021年12月30日

大数据分布式存储之Cassandra

摘要：分布式存储区别于集中式数据库存储，通过网络将海量数据存储到企业的各个数据节点（可能分布到不同的数据中心或机架上）；分布式存储需要考虑的问题元数据管理元数据是指数据本身的标识，通过元数据能很快的找到数据存储的位置，比如在分布式文件系统中，元数据是指文件的路径名+文件名；元数据管理包括集中式元数据阅读全文

posted @ 2021-12-30 16:35 JosenZHANG 阅读(1767) 评论(0) 推荐(0)

HDFS分布式文件系统

摘要： HDFS分布式文件系统是一个部署在廉价机器上基于POSIX约束的高容错性、高吞吐量的大规模分布式文件管理系统；它适合于大文件的存储，应用于“一次写入多次读取”的文件模型。架构 HDFS采用的是Master/Slave架构，一个HDFS集群由一个NameNode和一定数目的Datanotes组成，N 阅读全文

posted @ 2021-12-30 16:14 JosenZHANG 阅读(765) 评论(0) 推荐(0)