上一页 1 ··· 12 13 14 15 16 17 18 19 20 ··· 28 下一页

2018年1月1日

转推荐算法——基于矩阵分解的推荐算法

摘要: 推荐算法概述 对于推荐系统(Recommend System, RS),从广义上的理解为:为用户(User)推荐相关的商品(Items)。常用的推荐算法主要有: 基于内容的推荐(Content-Based Recommendation) 协同过滤的推荐(Collaborative Filtering 阅读全文

posted @ 2018-01-01 17:12 多一点 阅读(3988) 评论(0) 推荐(0) 编辑

转利用python实现电影推荐

摘要: “协同过滤”是推荐系统中的常用技术,按照分析维度的不同可实现“基于用户”和“基于产品”的推荐。 以下是利用python实现电影推荐的具体方法,其中数据集源于《集体编程智慧》一书,后续的编程实现则完全是自己实现的(原书中的实现比较支离、难懂)。 这里我采用的是“基于产品”的推荐方法,因为一般情况下,产 阅读全文

posted @ 2018-01-01 16:51 多一点 阅读(2893) 评论(0) 推荐(0) 编辑

2017年12月29日

机器学习之数据预处理

摘要: 归一化处理 from sklearn.preprocessing import StandardScaler X_scaler = StandardScaler() y_scaler = StandardScaler() X_train = X_scaler.fit_transform(X_trai 阅读全文

posted @ 2017-12-29 16:33 多一点 阅读(443) 评论(0) 推荐(0) 编辑

数据挖掘算法与现实生活中的应用案例

摘要: 数据挖掘算法与现实生活中的应用案例 如何分辨出垃圾邮件”、“如何判断一笔交易是否属于欺诈”、“如何判断红酒的品质和档次”、“扫描王是如何做到文字识别的”、“如何判断佚名的著作是否出自某位名家之手”、“如何判断一个细胞是否属于肿瘤细胞”等等,这些问题似乎都很专业,都不太好回答。但是,如果了解一点点数据 阅读全文

posted @ 2017-12-29 16:28 多一点 阅读(3670) 评论(0) 推荐(0) 编辑

使用Python一步一步地来进行数据分析总结

摘要: 学习python两年以来的深刻感受,与原文作者有着同样的感受。 原文链接:Step by step approach to perform data analysis using Python 你已经决定来学习Python,但是你之前没有编程经验。因此,你常常对从哪儿着手而感到困惑,这么多Pytho 阅读全文

posted @ 2017-12-29 16:12 多一点 阅读(2168) 评论(0) 推荐(1) 编辑

机器学习算法中的过拟合与欠拟合

摘要: 在机器学习表现不佳的原因要么是过度拟合或欠拟合数据。 机器学习中的逼近目标函数过程 监督式机器学习通常理解为逼近一个目标函数(f)(f),此函数映射输入变量(X)到输出变量(Y). Y=f(X)Y=f(X) 这种特性描述可以用于定义分类和预测问题和机器学习算法的领域。 从训练数据中学习目标函数的过程 阅读全文

posted @ 2017-12-29 15:47 多一点 阅读(675) 评论(0) 推荐(0) 编辑

深入对比数据科学工具箱:Python和R之争

摘要: 建议: 如果只是处理(小)数据的,用R。结果更可靠,速度可以接受,上手方便,多有现成的命令、程序可以用。要自己搞个算法、处理大数据、计算量大的,用python。开发效率高,一切尽在掌握。 概述 在真实的数据科学世界里,我们会有两个极端,一个是业务,一个是工程。偏向业务的数据科学被称为数据分析(Dat 阅读全文

posted @ 2017-12-29 15:46 多一点 阅读(924) 评论(0) 推荐(0) 编辑

转sklearn保存模型

摘要: 训练好了一个Model 以后总需要保存和再次预测, 所以保存和读取我们的sklearn model也是同样重要的一步。 比如,我们根据房源样本数据训练了一下房价模型,当用户输入自己的房子后,我们就需要根据训练好的房价模型来预测用户房子的价格。 这样就需要在训练模型后把模型保存起来,在使用模型时把模型 阅读全文

posted @ 2017-12-29 14:03 多一点 阅读(3292) 评论(0) 推荐(0) 编辑

2017年12月28日

pandas常用

摘要: #python中的pandas库主要有DataFrame和Series类(面向对象的的语言更愿意叫类) DataFrame也就是#数据框(主要是借鉴R里面的data.frame),Series也就是序列 ,pandas底层是c写的 性能很棒,有大神#做过测试 处理亿级别的数据没问题,起性能可以跟同等 阅读全文

posted @ 2017-12-28 15:19 多一点 阅读(962) 评论(0) 推荐(0) 编辑

转Python SciPy库——拟合与插值

摘要: 1.最小二乘拟合 实例1 import numpy as np import matplotlib.pyplot as plt from scipy.optimize import leastsq plt.figure(figsize=(9,9)) x=np.linspace(0,10,1000) 阅读全文

posted @ 2017-12-28 14:01 多一点 阅读(18954) 评论(0) 推荐(3) 编辑

上一页 1 ··· 12 13 14 15 16 17 18 19 20 ··· 28 下一页

导航