2023-学习记录18-结构化数据、半结构数据和非结构数据
作者:@kuaiquxie
作者的github:https://github.com/bitebita
本文为作者原创,如需转载,请注明出处:https://www.cnblogs.com/dzwj/p/17419411.html
1、概念
(1)结构化数据(即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据)
(2)非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等
(3)所谓半结构化数据,就是介于完全结构化数据(如关系型数据库、面向对象数据库中的数据)和完全无结构的数据(如声音、图像文件等)之间的数据,HTML文档就属于半结构化数据。它一般是自描述的,数据的结构和内容混在一起,没有明显的区分。
2、对上面三种数据结构,按照我理解的定义就是:
(1)结构化数据就是能用二维表逻辑表达实现的数据;
(2)无结构数据就是纯文本数据,没有标记;
(3)半结构化数据就是带有标记的文本。
半结构化数据特征:
a、自描述性。先有数据,再考虑其结构模式。
b、不精确性。随时间和场景变化。
c、不规则性。
d、非强制性。
e、模式复杂性。有时候模式的规模比数据的规模还要大。就像书的目录比内容要多,数据库的索引比数据要多一样。
3、三种数据结构的数据模型:
结构化数据:二维表(关系型)
半结构化数据:树、图
非结构化数据:无
RMDBS的数据模型有:如网状数据模型、层次数据模型、关系型
其他:
结构化数据:先有结构、再有数据
半结构化数据:先有数据,再有结构
分类:
——日常总结
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
2022-05-21 app第三阶段冲刺第一天—— jsoup 3
2022-05-21 idea开发常用快捷键整理