数据分类、软件实现

1、简介

常见的数据有以下几种:
1、结构化数据
2、半结构化数据
3、非结构化数据

2、数据分类

2.1、结构化数据【如:mysql等】

2.1.1、什么是结构化数据

所谓的结构化数据,指的是数据的表现样式有一定的(横竖)结构,一般情况下,这种数据是以二维表的方式来实现数据的存储和逻辑关系的表达。
数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的。
这些数据在存储的时候,为了实现数据的统一存储,往往对数据存储的格式和长度规范都进行了一定程度的限制,这些数据的具体存储主要是以关系型数据库软件来实现。
结构化数据,是指由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理。
结构化数据的存储和排列是很有规律的,所以这些数据在查询或修改等操作的时候非常方便,但是由于数据在存储的时候,有一定的关联关系,所以在数据扩充属性或者收缩属性的时候不太方便 -- 扩展性不好。

2.1.2、结构化图

2.2、半结构化数据【xml、json等】

2.2.1、什么是半结构化数据

所谓的半结构化数据,它其实是结构化数据的一种特殊形式,这些数据无法通过普通的二维表样式来进行存储,它们是通过一些特殊的标记实现数据的逻辑关系和存储样式。有时候,这种数据类型也被称为自描述结构数据。
半结构化数据,通过专用的标记,将相关的数据或者属性信息关联在一起,由于结构标记有用户自己控制,所以这种数据的扩展性非常好。但是内容的更改或其他操作需要通过专用的方式来实现。
半结构化数据的存储一般是以文件的方式来实现的,比较常见的文件样式有:json、XML等。

2.2.2、xml-示例

<?xml version="1.0" encoding="gb2312"?>
<namelist>
 <name1>
   <ID>01</ID>
   <name>张三</name>
   <sex>男</sex>
   <address>北京市市丰台区五里店</address>
 </name1>
<namelist>
  
数据关系
 存储格式是以节点为主,一个节点衍生出另外的子节点,每个节点遵循html的风格,但是里面的标签属性是我们自定义的。

2.2.3、json-示例

{
 "status": 200,
 "message": {
   "person": [
     {
       "id": 1,
       "name": "张三",
       "gender": "",
       "address": {
         "Country": "中国",
         "Province": "北京市",
         "city": "北京市",
         "district": "丰台区",
         "town": "五里店"
       },
     },
   ],
 }
}
数据关系
 []中括号代表的是一个数组或列表
 {}大括号代表的是一个数据对象
 双引号“”表示的是属性值
 冒号:代表的是前后之间的关系,冒号前面是属性的名称,后面是属性的值,

2.3、非结构化数据

2.3.1、什么是非结构化数据

所谓的非结构化数据,其实就是没有固定结构的数据 -- 即结构化数据之外的一切数据。它们常以 图片、视频、音频等 样式存在。对于这类数据,我们一般直接整体进行存储,而且一般存储为二进制的数据格式。

非结构化数据一般有两种生成方式: 人为手工生成
- 文本文件、图片、视频、音频、业务应用程序等。 机器自动生成 - 卫星图形、科学数据、数据监控、传感数据等 一般情况下,非结构化数据存储在非关系数据库中,并使用NoSQL进行查询。工作生活,非结构化数据是越来越多,占比远远的超出结构化数据。

3、常见的软件实现

 

 

 

posted @ 2023-05-14 18:41  小粉优化大师  阅读(48)  评论(0编辑  收藏  举报