摘要: 前阵子上数据中心的课程,老师讲解了些磁盘阵列(RAID)的不少知识,隔了两周了,回顾下的。磁盘阵列(Redundant Arrays of Inexpensive Disks,RAID)原理是利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。缓存 磁盘阵列作为独立系统在主机外直连或通过网络与主机相连。磁盘阵列有多个端口可以被不同主机或不同端口连接。一个主机连接阵列的不同端口可提升传输速度。和目前PC用单磁盘内部集成缓存一样,在磁盘阵列内部为加快与主机交互速度,都带有一定量的缓冲存储器。主机与磁盘阵列的缓存交互,缓存与具体的磁盘交互数据。在应用中,有部分常用的数据是需要经常读取. 阅读全文
posted @ 2012-07-23 19:46 honkcal 阅读(353) 评论(0) 推荐(0) 编辑
摘要: 管理网络中跨多台计算机存储的文件系统称为分布式文件系统。Hadoop有一个称为HDFS的分布式系统称为Hadoop Distributed FilesystemHDFS设计HDFS以流式数据访问模式来存储超大文件,运行于商用硬件集群上。流式数据访问:HDFS的构建思路:一次写入,多次读取的高效的访问模式。数据集通常是由数据源生成或者从数据源复制而来,接着长时间在此数据集上进行各类分析,每次分析都涉及该数据集的大部分或者是全部,因此读取整个数据集的时间延迟比读取第一条记录的时间延迟更为重要。商用硬件:节点故障的几率还是非常高的,HDFS遇到上述故障的时候,被设计成能够继续运行且不让用户察觉到明显 阅读全文
posted @ 2012-07-23 14:17 honkcal 阅读(2796) 评论(0) 推荐(0) 编辑
摘要: 一:1 什么是数据数据是对销售等业务全过程记录下来的可以鉴别的符号。数据时销售业务全过程的属性数量、位置以及相通关系等等的抽象表示。2数据分析的目的让数据说话!!行动的向导!!杜绝浪费!!提供决策的依据!!3数据的分类按照数据的来源分为:人力资源数据,财务数据,营销数据,采购数据,仓储数据,生产数据,编辑数据4 运用统计方法应改遵循的原则坚持用数据说话的基本观点!!有目的的收集数据!掌握数据来源!认真整理数据!5统计分析流程确定问题确定分析目标--〉采用科学的方法收集数据--〉考察数据时效性整理数据--〉统计分析--〉出分析报告,提出解决方案或者建议数据分析的误区误区(1)展示的元素不宜大于三 阅读全文
posted @ 2012-07-23 13:39 honkcal 阅读(1099) 评论(0) 推荐(0) 编辑