2014年6月26日

[转载]非常的好的协同过滤入门文章

摘要: “探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用。同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法。本文作为这个系列的第一... 阅读全文

posted @ 2014-06-26 16:08 khunwang 阅读(192) 评论(0) 推荐(0) 编辑

[转载]简单易学的机器学习算法-决策树之ID3算的

摘要: 一、决策树分类算法概述 决策树算法是从数据的属性(或者特征)出发,以属性作为基础,划分不同的类。例如对于如下数据集(数据集)其中,第一列和第二列为属性(特征),最后一列为类别标签,1表示是,0表示否。决策树算法的思想是基于属性对数据分类,对于以上的数据我们可以得到以下的决策树模型(决策树模型)先是... 阅读全文

posted @ 2014-06-26 16:03 khunwang 阅读(510) 评论(0) 推荐(0) 编辑

[转载]简单易学的机器学习算法-神经网络之BP神经网络

摘要: 一、BP神经网络的概念 BP神经网络是一种多层的前馈神经网络,其主要的特点是:信号是前向传播的,而误差是反向传播的。具体来说,对于如下的只含一个隐层的神经网络模型:(三层BP神经网络模型)BP神经网络的过程主要分为两个阶段,第一阶段是信号的前向传播,从输入层经过隐含层,最后到达输出层;第二阶段是误... 阅读全文

posted @ 2014-06-26 15:59 khunwang 阅读(255) 评论(0) 推荐(0) 编辑

[转载]Python调用Shell 之间变量传递

摘要: python -> shell:1.环境变量[python]view plaincopyimportosvar=123或var=’123’os.environ[’var’]=str(var)#environ的键值必须是字符串os.system(’echo$var’)[python]view plai... 阅读全文

posted @ 2014-06-26 15:07 khunwang 阅读(405) 评论(0) 推荐(0) 编辑

[转载]简单易学的机器学习算法-主成分分析(PCA)

摘要: 一、数据降维 对于现在维数比较多的数据,我们首先需要做的就是对其进行降维操作。降维,简单来说就是说在尽量保证数据本质的前提下将数据中的维数降低。降维的操作可以理解为一种映射关系,例如函数,即由原来的二维转换成了一维。处理降维的技术有很多种,如前面的SVD奇异值分解,主成分分析(PCA),因子分析(... 阅读全文

posted @ 2014-06-26 11:16 khunwang 阅读(200) 评论(0) 推荐(0) 编辑

[转载]简单易学的机器学习算法-SVD奇异值分解

摘要: 一、SVD奇异值分解的定义 假设是一个的矩阵,如果存在一个分解:其中为的酉矩阵,为的半正定对角矩阵,为的共轭转置矩阵,且为的酉矩阵。这样的分解称为的奇异值分解,对角线上的元素称为奇异值,称为左奇异矩阵,称为右奇异矩阵。二、SVD奇异值分解与特征值分解的关系 特征值分解与SVD奇异值分解的目的都是... 阅读全文

posted @ 2014-06-26 11:09 khunwang 阅读(217) 评论(0) 推荐(0) 编辑

[转载]简单易学的机器学习算法-KMeans

摘要: 一、聚类算法的简介 聚类算法是一种无监督的学习算法,主要用于将相似的对象自动归到一个类别中。聚类算法与分类算法最大的区别是:聚类算法是无监督的学习算法,而分类算法是有监督的学习算法。这里提到的相似的对象,基于不同的相似度计算,会得到不同的聚类结果,常用的相似度计算方法有欧式距离法。二、kMeans... 阅读全文

posted @ 2014-06-26 11:00 khunwang 阅读(187) 评论(0) 推荐(0) 编辑

[转载]简单易学的机器学习算法-线性回归

摘要: 一、线性回归的概念 对连续型数据做出预测属于回归问题。举个简单的例子:例如我们在知道房屋面积(HouseArea)和卧室的数量(Bedrooms)的情况下要求房屋的价格(Price)。通过一组数据,我们得到了这样的关系:这样的关系就叫做线性回归方程,其中为回归系数。当我们知道房屋面积以及卧室数量时... 阅读全文

posted @ 2014-06-26 10:49 khunwang 阅读(257) 评论(0) 推荐(0) 编辑

2014年6月25日

[转载]推荐系统的那点事

摘要: 推荐系统的误区回想起来,我也算是国内接触推荐系统较早的人之一了,最近和人聊天,觉得不少人对推荐系统有所误解,以为需要多么高大上的算法才能搭建起来的,我只想说我经常说的那句话【不是这样的】,所以有了这篇文章。第一次接触【推荐系统】是在两年前在某高校的互联网信息处理实验室的时候,那时候,【机器学习】和【... 阅读全文

posted @ 2014-06-25 17:52 khunwang 阅读(88) 评论(0) 推荐(0) 编辑

[转载]WEB数据挖掘相关术语整理

摘要: WEB数据挖掘建立在对大量的网络数据进行分析的基础上,采用相应的数据挖掘算法,在具体的应用模型上进行数据的提取、数据筛选、数据转换、数据挖掘和模式分析,最后做出归纳性的推理、预测客户的个性化行为以及用户习惯,从而帮助进行决策和管理,减少决策的风险。WEB数据挖掘涉及多个领域,除数据挖掘外,还涉及计算... 阅读全文

posted @ 2014-06-25 16:36 khunwang 阅读(175) 评论(0) 推荐(0) 编辑

导航