数据挖掘读书笔记-数据库系统技术

一、数据库系统技术的演变

(1)数据收集和数据库创意(20世纪80年代和更早)

  • 原始文件处理

(2)数据库管理系统(20世纪70年-80年代初期)

  • 层次和网状数据库系统
  • 关系数据库系统
  • 数据建模工具:实体-联系模型等
  • 索引和存取方法:B树,散列等
  • 查询语言:SQL等
  • 用户界面、表单、报表等
  • 查询处理和查询优化
  • 事务、并发控制和恢复
  • 联机事务处理(OLTP)

(3)高级数据库管理系统(20世纪80年代中期-现在)

  • 高级数据模型:扩充关系的、对象-关系的等
  • 高级应用:空间的、时间的、多媒体的、主动的、流的和传感器的、科学的和工程的、基于知识的

(4)高级数据分析:数据仓库与数据挖掘(20世纪80年代后期-现在)

  • 数据仓库与OLAP
  • 数据挖掘和知识发现:泛化、分类、关联、聚类、频繁模式和结构化模式分析、离群点分析、趋势和偏差分析等
  • 高级数据挖掘应用:流数据挖掘、生物信息数据挖掘、时间序列分析、文本挖掘、web挖掘、入侵检测等
  • 数据挖掘与社会:保护隐私的数据挖掘

(5)基于web的数据库(20世纪90年代-现在)

  • 基于xml的数据库系统
  • 与信息检索集成
  • 数据与信息集成

(6)新一代的集成数据与信息系统(现在-将来)

(二)数据库管理系统

数据库管理系统由一组内部相关的数据(称作数据库)和一组管理和存储数据的软件程序组成。

1、数据库

表:

属性:

元组:

ER模型:关系数据的一种语义数据模型,将数据库表示成一组实体和它们之间的联系。

2、软件程序

软件程序负责

  1. 数据库结构定义
  2. 数据储存库以及并发、分布或共享的数据访问,在面对系统瘫痪或未授权的访问时确保存储的信息一致性及安全性。

(三)新的数据库应用需要

处理空间数据 地图
工程设计数据 如建筑设计、系统部件和集成电路
超文本和多媒体数据 包括文本、图像、视频和音频数据
时间相关的数据 如历史记录或股票交易数据
流数据 如视频监控和探测器数据,其中数据像流一样流进流出
万维网 通过因特网提供巨大的、广泛分布的可用信息存储库

新应用带来的技术挑战:

这些应用需要有效的数据结构和可伸缩的方法来处理复杂的对象结构,变长记录,半结构化或非结构化的数据、文本、空间和时间数据、多媒体数据以及具有复杂结构和动态变化的数据库模式。

posted on 2017-12-12 17:34  chilebaby  阅读(177)  评论(0编辑  收藏  举报

导航