数据分类、软件实现
1、简介
常见的数据有以下几种:
1、结构化数据
2、半结构化数据
3、非结构化数据
2、数据分类
2.1、结构化数据【如:mysql等】
2.1.1、什么是结构化数据
所谓的结构化数据,指的是数据的表现样式有一定的(横竖)结构,一般情况下,这种数据是以二维表的方式来实现数据的存储和逻辑关系的表达。 数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的。 这些数据在存储的时候,为了实现数据的统一存储,往往对数据存储的格式和长度规范都进行了一定程度的限制,这些数据的具体存储主要是以关系型数据库软件来实现。 结构化数据,是指由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理。 结构化数据的存储和排列是很有规律的,所以这些数据在查询或修改等操作的时候非常方便,但是由于数据在存储的时候,有一定的关联关系,所以在数据扩充属性或者收缩属性的时候不太方便 -- 扩展性不好。
2.1.2、结构化图
2.2、半结构化数据【xml、json等】
2.2.1、什么是半结构化数据
所谓的半结构化数据,它其实是结构化数据的一种特殊形式,这些数据无法通过普通的二维表样式来进行存储,它们是通过一些特殊的标记实现数据的逻辑关系和存储样式。有时候,这种数据类型也被称为自描述结构数据。
半结构化数据,通过专用的标记,将相关的数据或者属性信息关联在一起,由于结构标记有用户自己控制,所以这种数据的扩展性非常好。但是内容的更改或其他操作需要通过专用的方式来实现。
半结构化数据的存储一般是以文件的方式来实现的,比较常见的文件样式有:json、XML等。
2.2.2、xml-示例
<?xml version="1.0" encoding="gb2312"?> <namelist> <name1> <ID>01</ID> <name>张三</name> <sex>男</sex> <address>北京市市丰台区五里店</address> </name1> <namelist> 数据关系 存储格式是以节点为主,一个节点衍生出另外的子节点,每个节点遵循html的风格,但是里面的标签属性是我们自定义的。
2.2.3、json-示例
{ "status": 200, "message": { "person": [ { "id": 1, "name": "张三", "gender": "男", "address": { "Country": "中国", "Province": "北京市", "city": "北京市", "district": "丰台区", "town": "五里店" }, }, ], } } 数据关系 []中括号代表的是一个数组或列表 {}大括号代表的是一个数据对象 双引号“”表示的是属性值 冒号:代表的是前后之间的关系,冒号前面是属性的名称,后面是属性的值,
2.3、非结构化数据
2.3.1、什么是非结构化数据
所谓的非结构化数据,其实就是没有固定结构的数据 -- 即结构化数据之外的一切数据。它们常以 图片、视频、音频等 样式存在。对于这类数据,我们一般直接整体进行存储,而且一般存储为二进制的数据格式。
非结构化数据一般有两种生成方式: 人为手工生成 - 文本文件、图片、视频、音频、业务应用程序等。 机器自动生成 - 卫星图形、科学数据、数据监控、传感数据等 一般情况下,非结构化数据存储在非关系数据库中,并使用NoSQL进行查询。工作生活,非结构化数据是越来越多,占比远远的超出结构化数据。
3、常见的软件实现