2019年9月1日
摘要: 第1章 概述 1.1 分布式存储概念 分布式存储系统的特性: 可扩展 低成本 高性能 易用 分布式存储系统的挑战: 数据分布 一致性 容错 负载均衡 事务与并发控制 易用性 压缩/解压缩 1.2 分布式存储分类 非结构化数据,如办公文档、文本、图片、图像、音频、视频信息等。 结构化数据,如关系数据库 阅读全文
posted @ 2019-09-01 17:44 大鹏123 阅读(683) 评论(0) 推荐(0) 编辑
  2019年7月21日
摘要: 参考 Apache Avro™ 1.9.0 Specification Avro介绍 小而巧的数字压缩算法:zigzag 原始类型(Primitive Types) 类型名 描述 描述 二进制编码(Binary Encoding) 排序(Sort Order) null 空 no value 0字节 阅读全文
posted @ 2019-07-21 08:35 大鹏123 阅读(704) 评论(0) 推荐(0) 编辑
  2019年7月7日
摘要: 第11课 统计:集中趋势 Average or Central Tendency 集中趋势在统计学中是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。 通过算术均值、中位数、众数可以反映平均值的情况。Statistics intro: Mean, median, & mode h 阅读全文
posted @ 2019-07-07 10:55 大鹏123 阅读(1480) 评论(0) 推荐(0) 编辑
摘要: http://open.163.com/special/Khan/khstatistics.html 第1集 均值mean 中位数median 众数mode 均值(mean)也就是算术平均值,即数据集中所有数据之和除以数据个数。 中位数(median, middle number)是数据集排序后,处 阅读全文
posted @ 2019-07-07 10:49 大鹏123 阅读(882) 评论(0) 推荐(1) 编辑