摘要:
学习由n个不同的树的集合中选择第i个顺序统计量的问题。 输入:一个包含n个(互异的)数的集合A,1≤i≤n的整数i。 输出:元素x∈A,并且 A中恰好有i个元素小于它。求解第i小的元素的算法设计1. Max 和 Min在一个有n个元素的集合中,确定Max 和 Min的... 阅读全文
摘要:
抱怨没有用,只能靠自己。 ——崔万志 许多的应用需要一个动态的集合结构,它至少支持INSERT、SEARCH和DELETE的字典操作。 散列表是实现了字典操作的一种有效数据结构。尽管最坏情况下散列表查找一个元素的时间与链表的查找时间相同,达到了O(n)。散列表是普通数据概念的... 阅读全文
摘要:
数据预处理: 聚集、抽样、维度归约、属性选择、属性创建、离散化和二元化、变量变换。 分类和回归:分类和回归是数据挖掘领域的重要技术。分类就是在已有的数据的基础上学习出一个分类函数或构造出一个分类模型,这是通常所说的分类器。分类预测出目标是离散值,回归预测输出连续值。 分类器模型:决策树分类、贝叶... 阅读全文
摘要:
如果你现在还不努力,那么将来的你会过的更加吃力。1 选择属性属性选择是通过搜索数据中所有可能的属性组合,以找到预测效果最好的属性子集。手工选择属性既繁琐又容易出错,为了帮助用户事项选择属性自动化。Weka中提供了选择属性面板。要自动选择属性需要设立两个对象:属性评估器和搜索方法... 阅读全文
摘要:
挫折感很大、觉得很难熬的时候,可以闭上眼睛,想像自己已经是十年之后的自己,置身一段距离之外,转头去看正在遭遇的那些事。 练习这样做,心情可能会平静些,知道眼前这一切,都会过去。——蔡康永 别太嚣张,对自己没好处。——李秘书 你今天泼给我的冷水,我定要烧开了给你泼回去。—... 阅读全文
摘要:
如果你渴望得到某样东西,你得让它自由,如果它回到你身边,它就是属于你的,如果它不回来,你就从未拥有过它。——大仲马《基督山伯爵》 生活是一面镜子,我们努力追求的第一件事,就是从中辨认出自己。——尼采目录目录聚类概念聚类算法的介绍2-1 KMeansK均值2-2 EM期望最... 阅读全文
摘要:
定义: 分类就是得到一个函数或分类模型(即分类器),通过分类器将未知类别的数据对象映射到某个给定的类别。 1. 数据分类可以分为两步 第一步建立模型,通过分析由属性描述的数据集,来建立反映其特性的模型。该步骤也称为是有监督的学习,基于训练集而到处模型,训练集合是已知类别标签的数据对象。 第... 阅读全文
摘要:
抱怨不会让你成功,努力才会让你出色概述Weka中实现的过滤算法。所有的过滤器都是输入数据集进行某种程度的转换,转换为适合数据挖掘的形式。选择某个过滤器之后,过滤器的名字以及默认参数会出现在Choose按钮旁边的输入框中,通过单击框 可以在通用对象编辑器中设置其属性。过滤器和参数... 阅读全文
摘要:
子将父做马,父愿子成龙参考书籍 《数据挖掘与机器学习WEKA应用技术与实践》袁梅宇 编著 《数据挖掘:使用机器学习工具与技术》Weka功能Weka 主界面称为Weka GUI 选择器。Explorer(探索者):通过选择菜单和填写表单可以调用Weka的所有功能。不过存在... 阅读全文
摘要:
人一生别太狂,指不定谁辉煌总结排序算法的运行时间 算法 最坏运行时间 平均期望运行时间 是否是原址排序 插入排序 O(n2) O(n2) 是 归并排序 O(nlgn) O(nlgn) 否 堆排序 O(nlgn) …… 是 快速排序 O(n2)... 阅读全文