随笔分类 -  数据挖掘

摘要:数据挖掘基本概念数据挖掘定义最广为接受得到定义是,数据挖掘是数据“模型”的发现过程。而“模型”却可以有多种含义。1)统计建模统计学家认为数据挖掘就是统计模型的构建过程,而这个统计模型指的就是可见数据所遵从的总体分布。2)机器学习有些人将数据挖掘看成是机器学习的同义词。毫无疑问,一些数据挖掘方法中适当使用了机器学习算法。机器学习的实践者将数据当成训练集来训练某类算法,比如贝叶斯网络、支持向量机、决策... 阅读全文
posted @ 2018-02-14 01:01 彼岸花杀是条狗 阅读(1544) 评论(0) 推荐(0) 编辑
摘要:分类本章介绍分类的基本概念,讨论诸如模型的过拟合等关键问题,并提供评估和比较分类技术性能的方法。尽管本章主要关注一种称作决策树归纳的技术,但是本章讨论的大部分内容也适用于其他的分类技术。预备知识分类任务的输入数据是记录的集合。每条记录称作实例或样例,用元组(x,y)表示,其中x是属性的集合,而y是一个特殊的属性,指出样例的类标号(也称为分类属性或目标属性)。类标号必须是离散属性,这正是区别分类与回... 阅读全文
posted @ 2018-01-23 16:29 彼岸花杀是条狗 阅读(1659) 评论(0) 推荐(0) 编辑
摘要:探索数据 数据探索有助于选择合适的数据预处理和数据分析技术。它甚至可以处理一些通常由数据挖掘解决的问题,例如,有时可以通过对数据进行直观检查来发现模式。此外数据探索中使用的某些技术(如可视化)可以用于理解和解释数据挖掘结果。 本章包括三个主题:汇总统计、可视化和联机分析处理(OLAP). 汇总统计( 阅读全文
posted @ 2018-01-20 15:04 彼岸花杀是条狗 阅读(711) 评论(0) 推荐(0) 编辑
摘要:数据本章讨论一些与数据相关的问题,他们对于数据挖掘的成败至关重要。1.数据类型2.数据的质量3,使数据适合挖掘的预处理步骤:处理一方面是要提高数据的质量,另一方面要让数据更好地适应特定的数据挖掘技术和工具。4.根据数据联系分析数据:数据分析的异种方法是找出数据对象之间的联系,之后使这些联系而不是数据对象本身来进行其余的分析数据类型数据集可以看作数据对象的集合。数据对象:记录、点、向量、模式、事件、... 阅读全文
posted @ 2018-01-19 21:25 彼岸花杀是条狗 阅读(996) 评论(0) 推荐(0) 编辑
摘要:绪论 什么是数据挖掘 数据挖掘是再大型数据存储库中,自动地发现有用信息的过程。(发现先前未知的有用模式,还可以预测未来观测结果) 并非所有的信息发现都视为数据挖掘,例使用数据库查找个别的记录或通过因特网查找特定的Web页面,则是信息检索。尽管如此,人们也在利用数据挖掘技术增强信息检索系统的能力。 数 阅读全文
posted @ 2018-01-19 10:51 彼岸花杀是条狗 阅读(1613) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示