2017年12月29日

机器学习之数据预处理

摘要: 归一化处理 from sklearn.preprocessing import StandardScaler X_scaler = StandardScaler() y_scaler = StandardScaler() X_train = X_scaler.fit_transform(X_trai 阅读全文

posted @ 2017-12-29 16:33 多一点 阅读(447) 评论(0) 推荐(0) 编辑

数据挖掘算法与现实生活中的应用案例

摘要: 数据挖掘算法与现实生活中的应用案例 如何分辨出垃圾邮件”、“如何判断一笔交易是否属于欺诈”、“如何判断红酒的品质和档次”、“扫描王是如何做到文字识别的”、“如何判断佚名的著作是否出自某位名家之手”、“如何判断一个细胞是否属于肿瘤细胞”等等,这些问题似乎都很专业,都不太好回答。但是,如果了解一点点数据 阅读全文

posted @ 2017-12-29 16:28 多一点 阅读(3741) 评论(0) 推荐(0) 编辑

使用Python一步一步地来进行数据分析总结

摘要: 学习python两年以来的深刻感受,与原文作者有着同样的感受。 原文链接:Step by step approach to perform data analysis using Python 你已经决定来学习Python,但是你之前没有编程经验。因此,你常常对从哪儿着手而感到困惑,这么多Pytho 阅读全文

posted @ 2017-12-29 16:12 多一点 阅读(2175) 评论(0) 推荐(1) 编辑

机器学习算法中的过拟合与欠拟合

摘要: 在机器学习表现不佳的原因要么是过度拟合或欠拟合数据。 机器学习中的逼近目标函数过程 监督式机器学习通常理解为逼近一个目标函数(f)(f),此函数映射输入变量(X)到输出变量(Y). Y=f(X)Y=f(X) 这种特性描述可以用于定义分类和预测问题和机器学习算法的领域。 从训练数据中学习目标函数的过程 阅读全文

posted @ 2017-12-29 15:47 多一点 阅读(683) 评论(0) 推荐(0) 编辑

深入对比数据科学工具箱:Python和R之争

摘要: 建议: 如果只是处理(小)数据的,用R。结果更可靠,速度可以接受,上手方便,多有现成的命令、程序可以用。要自己搞个算法、处理大数据、计算量大的,用python。开发效率高,一切尽在掌握。 概述 在真实的数据科学世界里,我们会有两个极端,一个是业务,一个是工程。偏向业务的数据科学被称为数据分析(Dat 阅读全文

posted @ 2017-12-29 15:46 多一点 阅读(935) 评论(0) 推荐(0) 编辑

转sklearn保存模型

摘要: 训练好了一个Model 以后总需要保存和再次预测, 所以保存和读取我们的sklearn model也是同样重要的一步。 比如,我们根据房源样本数据训练了一下房价模型,当用户输入自己的房子后,我们就需要根据训练好的房价模型来预测用户房子的价格。 这样就需要在训练模型后把模型保存起来,在使用模型时把模型 阅读全文

posted @ 2017-12-29 14:03 多一点 阅读(3295) 评论(0) 推荐(0) 编辑

导航