摘要:
1.有监督 vs 无监督学习 2.预测问题:分类 vs 数值预测 3.分类:模型构建 模型使用 4.决策树归纳分类 什么是决策树 决策树的生成有两个阶段组成 : 决策树构建、树剪枝 决策树的使用:对未知样本进行分类 决策树归纳的算法 : 贪心算法 终止划分的条件 5.属性选择度量:三种度量,信息增益 阅读全文
摘要:
1.什么是关联规则挖掘 关联规则反映一个事物与其它事物之间的相互依存性和关联性 关联规则挖掘是在事务、关系数据库中的项集和对象中发现频繁模式、关联规则、相关性或者 因果结构。 频繁模式:数据库中频繁出现的项集 犀利 扞许怀孕孝顺 2.关联规则基本模型 支持度是一个概率值,是一个相对计数 项集的支持度 阅读全文
摘要:
1.两种不同类别的数据挖掘方法 描述性挖掘: 数据泛化 预测性挖掘:分类、回归分析 2.数据立方体的物化 3.数据立方体、闭立方体、立方体外壳和和计算策略搭档大裆、、喜欢西幻 4.什么是概念描述 概念描述是一种数据泛化的形式,概念通常指数据的汇集 5.概念描述 vs OLAP 相似处: 数据泛化 对 阅读全文
摘要:
1.什么是数据仓库 面向主题的、集成的、时变的、非易失的 2.数据仓库和异种DBMS 3.OLTP vs OLAP 4.为什么建立分离的数据仓库? 5.多维数据模型(数据仓库的概念建模)三类度量 4.典型的OLAP操作 5.数据仓库实现 数据方的有效计算、数据方计算 6.从数据仓库到数据挖掘 7.数 阅读全文
摘要:
数据预处理 1.为什么数据预处理 2.数据为什么脏 3.为什么数据预处理是重要的 4.数据质量 5.数据预处理的主要任务 6.数据预处理的形式 数据清理 1.如何处理缺失数据 2.如何处理噪音数据 数据集成 1.模式集成、冲突数据值、冗余数据 数据变换 规范化数据的方法 :最小-最大规范化、Z-sc 阅读全文
摘要:
1.数据从何而来 2.数据对象和属性类型 数据集合的类型 结构数据的重要特征 数据对象 属性 属性类型 数据属性的类型 离散 vs.连续属性 3.数据的(基本)统计描述 分布度量 代数度量 整体度量 度量数据的中心趋势 对称/偏斜数据 4.数据可视化 5.数据的相似性和相异性、邻近度 数据矩阵和相异 阅读全文
摘要:
1.为什么不用传统的数据分析? 2.KDD过程的步骤 3.数据挖掘和商务智能 4.数据挖掘功能 5,数据挖掘分类 6,OLAP挖掘与数据仓库的集成 7.数据挖掘查询语言 调性(元语言) 阅读全文
摘要:
C语言入门(5)——运算符与表达式 C语言入门(5)——运算符与表达式 C语言入门(5)——运算符与表达式 C语言入门(5)——运算符与表达式 版权声明:本文为博主尹成联系QQ77025077,微信18510341407原创文章,欢迎转载侵权不究。 https://blog.csdn.net/yin 阅读全文
摘要:
c语言链表详解(超详细) c语言链表详解(超详细) c语言链表详解(超详细) c语言链表详解(超详细) 链表是一种常见的基础数据结构,结构体指针在这里得到了充分的利用。链表可以动态的进行存储分配,也就是说,链表是一个功能极为强大的数组,他可以在节点中定义多种数据类型,还可以根据需要随意增添,删除,插 阅读全文
摘要:
AllSight AllSight AllSight C语言 · 运用结构体的排序方法 之前遇到排序只想着最原始的方法,诸如冒泡,选择,快速排序等等,刚刚跟大牛学会了结构体的方法来排序,这样的话以后再也不用怕成绩统计、名次排序之类的题目了。 首先头文件(基于大牛的方法,本人之后做题喜欢引入题目中常用 阅读全文