多一点 - 博客园

转推荐算法——基于矩阵分解的推荐算法

摘要：推荐算法概述对于推荐系统(Recommend System, RS)，从广义上的理解为：为用户(User)推荐相关的商品(Items)。常用的推荐算法主要有：基于内容的推荐(Content-Based Recommendation) 协同过滤的推荐(Collaborative Filtering 阅读全文

posted @ 2018-01-01 17:12 多一点阅读(4093) 评论(0) 推荐(0)

转利用python实现电影推荐

摘要： “协同过滤”是推荐系统中的常用技术，按照分析维度的不同可实现“基于用户”和“基于产品”的推荐。以下是利用python实现电影推荐的具体方法，其中数据集源于《集体编程智慧》一书，后续的编程实现则完全是自己实现的（原书中的实现比较支离、难懂）。这里我采用的是“基于产品”的推荐方法，因为一般情况下，产阅读全文

posted @ 2018-01-01 16:51 多一点阅读(2941) 评论(0) 推荐(0)

机器学习之数据预处理

摘要：归一化处理 from sklearn.preprocessing import StandardScaler X_scaler = StandardScaler() y_scaler = StandardScaler() X_train = X_scaler.fit_transform(X_trai 阅读全文

posted @ 2017-12-29 16:33 多一点阅读(493) 评论(0) 推荐(0)

数据挖掘算法与现实生活中的应用案例

摘要：数据挖掘算法与现实生活中的应用案例如何分辨出垃圾邮件”、“如何判断一笔交易是否属于欺诈”、“如何判断红酒的品质和档次”、“扫描王是如何做到文字识别的”、“如何判断佚名的著作是否出自某位名家之手”、“如何判断一个细胞是否属于肿瘤细胞”等等，这些问题似乎都很专业，都不太好回答。但是，如果了解一点点数据阅读全文

posted @ 2017-12-29 16:28 多一点阅读(3933) 评论(0) 推荐(0)

使用Python一步一步地来进行数据分析总结

摘要：学习python两年以来的深刻感受，与原文作者有着同样的感受。原文链接：Step by step approach to perform data analysis using Python 你已经决定来学习Python，但是你之前没有编程经验。因此，你常常对从哪儿着手而感到困惑，这么多Pytho 阅读全文

posted @ 2017-12-29 16:12 多一点阅读(2232) 评论(0) 推荐(1)

机器学习算法中的过拟合与欠拟合

摘要：在机器学习表现不佳的原因要么是过度拟合或欠拟合数据。机器学习中的逼近目标函数过程监督式机器学习通常理解为逼近一个目标函数(f)(f)，此函数映射输入变量(X)到输出变量(Y). Y=f(X)Y=f(X) 这种特性描述可以用于定义分类和预测问题和机器学习算法的领域。从训练数据中学习目标函数的过程阅读全文

posted @ 2017-12-29 15:47 多一点阅读(775) 评论(0) 推荐(0)

深入对比数据科学工具箱：Python和R之争

摘要：建议：如果只是处理（小）数据的，用R。结果更可靠，速度可以接受，上手方便，多有现成的命令、程序可以用。要自己搞个算法、处理大数据、计算量大的，用python。开发效率高，一切尽在掌握。概述在真实的数据科学世界里，我们会有两个极端，一个是业务，一个是工程。偏向业务的数据科学被称为数据分析（Dat 阅读全文

posted @ 2017-12-29 15:46 多一点阅读(990) 评论(0) 推荐(0)

转sklearn保存模型

摘要：训练好了一个Model 以后总需要保存和再次预测, 所以保存和读取我们的sklearn model也是同样重要的一步。比如，我们根据房源样本数据训练了一下房价模型，当用户输入自己的房子后，我们就需要根据训练好的房价模型来预测用户房子的价格。这样就需要在训练模型后把模型保存起来，在使用模型时把模型阅读全文

posted @ 2017-12-29 14:03 多一点阅读(3327) 评论(0) 推荐(0)

pandas常用

摘要： #python中的pandas库主要有DataFrame和Series类(面向对象的的语言更愿意叫类) DataFrame也就是#数据框(主要是借鉴R里面的data.frame)，Series也就是序列，pandas底层是c写的性能很棒，有大神#做过测试处理亿级别的数据没问题，起性能可以跟同等阅读全文

posted @ 2017-12-28 15:19 多一点阅读(991) 评论(0) 推荐(0)

转Python SciPy库——拟合与插值

摘要： 1.最小二乘拟合实例1 import numpy as np import matplotlib.pyplot as plt from scipy.optimize import leastsq plt.figure(figsize=(9,9)) x=np.linspace(0,10,1000) 阅读全文

posted @ 2017-12-28 14:01 多一点阅读(19116) 评论(0) 推荐(3)