摘要: 贝叶斯定理 设是类标号未知的数据样本,为某种假设,数据样本 属于某特定的类 C ,对于该分类问题,期望确定,即给定观测数据样本,假定成立的概率,称为后验概率,或称条件下的后验概率。分类就是要确定。 例如,假定数据样本集由顾客组成,用他们的年龄和收入情况进行分类。假定表示顾客的年龄在31岁到40之间并且中等收入,表示顾客将购买电脑,则反映的是观察到顾客的年龄在31岁到40之间并且中等收入时,将购买电... 阅读全文
posted @ 2016-03-10 22:12 HUSTLX 阅读(1274) 评论(0) 推荐(0) 编辑
摘要: 1.概述 数据挖掘是从大量的,不完全的,有噪声的,模糊的,随即的数据中,提取隐含在其中的,人们事先不知道的,但有潜在的有用信息和知识的过程。数据挖掘过程一般包括数据采集,数据预处理,数据挖掘以及知识评价和呈现。在一个完整的数据挖掘过程中,数据预处理要花费60%左右的时间,而后的挖掘工作仅仅占工工作量的10%左右。目前对挖掘的研究主要集中于挖掘技术,挖掘算法,挖掘语言等在海量的原始数据中,存在这... 阅读全文
posted @ 2016-03-10 20:21 HUSTLX 阅读(6938) 评论(0) 推荐(0) 编辑
摘要: 1.BP神经网络训练过程论述 BP网络结构有3层:输入层、隐含层、输出层,如图1所示。 图1 三层BP网络结构 3层BP神经网络学习训练过程主要由4部分组成:输入模式顺传播(输入模式由输入层经隐含层向输出层传播计算)、输出误差逆传播(输出的误差由输出层经隐含层传向输入层)、循环记忆训练(模式顺序传播与误差逆传播的计算过程反复交替循环进行)和学习结果判别(判定全局误差是否趋向极小值)。... 阅读全文
posted @ 2016-03-10 20:11 HUSTLX 阅读(4516) 评论(3) 推荐(2) 编辑
摘要: 聚类算法 李鑫 2014210820 电子系 1、kmeans算法 1.1Kmeans算法理论基础 K均值算法能够使聚类域中所有样品到聚类中心距离平方和最小。其原理为:先取k个初始聚类中心,计算每个样品到这k个中心的距离,找出最小距离,把样品归入最近的聚类中心,修改中心点的值为本类所有样品的均值,再计算各个样品到新的聚类中心的距离,重新归类,修改新的中心点,直到新的聚类中心和上一... 阅读全文
posted @ 2016-03-10 19:35 HUSTLX 阅读(3534) 评论(0) 推荐(0) 编辑