摘要: 一.存储的主要作用1.海量存储 阵列存储 光盘存储 磁带存储 数据迁移 文件服务器,跨平台文件共享2.容灾 数据备份及恢复:磁带、光盘、阵列 数据复制:本地镜像、远程镜像3.高可用集群,双机容错、容错系统二.海量存储1.在线存储 阵列存储—直接存储 光盘存储— DVD-RAM,需要软件支持 磁带存储—需要软件支持 文件共享2.非在线存储 数据备份—磁带库或阵列 数据迁移—磁带库、光盘库或阵列三.数据备份数据备份: 通过采用数据备份软件(如Veritas 的Backup软件等)将数据备份到磁带或其他介质上,当主机的数据丢失后, 可以在一定的时间内将数据或数据库恢复。存在的问题: 数据备份通常是采 阅读全文
posted @ 2013-07-27 13:48 无尽的缥缈 阅读(254) 评论(0) 推荐(0) 编辑
摘要: 一.数据仓库概念数据仓库是一个面向主题的,集成的,随时间而变化的,不容易丢失的数据集合,支持管理部分的决策过程。为统计的历史数据分析提供坚实的平台,对信息处理提供支持。二.数据仓库的关键特征1.面向主题,2.数据集成一个数据仓库是通过多个异种数据源来构造的关系数据库,一般文件,联机事物处理使用数据清理和数据集成技术命名约定,编码结构,属性变量等的一致当数据被移到数据仓库时,它们要经过转换。3.随时间变化数据仓库的时间范围比操作系统库系统要长的多操作数据库系统:主要保存当前数据数据仓库:从历史的角度提供信息(比如过去5-10年)数据仓库中的每一个关键结构都隐式或显示的包含时间元素,而操作数据库中 阅读全文
posted @ 2013-07-27 13:34 无尽的缥缈 阅读(375) 评论(0) 推荐(0) 编辑
摘要: 一,数据模式概念/类描述:特性化和区分 归纳,总结和对比数据的特性。关联分析 分类和预测可以用来预报某些未知的或丢失的数据值。聚类分析将类似的数据归类到一起,形成一个新的类别进行分析 最大类内的相似性和最小化类间的相似性。比如画圈。 孤立点分析 孤立点:一些与数据的一般行为或模型不一致的孤立的数据。 通常孤立点被作为“噪音”或异常被丢弃。但是在欺事件中可以通过罕见事件进行孤点分析而得出结论。比如银行信用卡 趋势和演变分析 描述行为随事件变化的对象的发展规律或趋势。比如时间数据库 趋势和偏差:回归分析 序列模式匹配:周期性分析 基于类性的分析 其它定向模式或统计分析。曾转载过一篇博客说明几类问题 阅读全文
posted @ 2013-07-27 13:10 无尽的缥缈 阅读(376) 评论(0) 推荐(0) 编辑