12 2017 档案

机器学习之数据预处理
摘要:归一化处理 from sklearn.preprocessing import StandardScaler X_scaler = StandardScaler() y_scaler = StandardScaler() X_train = X_scaler.fit_transform(X_trai 阅读全文

posted @ 2017-12-29 16:33 多一点 阅读(454) 评论(0) 推荐(0) 编辑

数据挖掘算法与现实生活中的应用案例
摘要:数据挖掘算法与现实生活中的应用案例 如何分辨出垃圾邮件”、“如何判断一笔交易是否属于欺诈”、“如何判断红酒的品质和档次”、“扫描王是如何做到文字识别的”、“如何判断佚名的著作是否出自某位名家之手”、“如何判断一个细胞是否属于肿瘤细胞”等等,这些问题似乎都很专业,都不太好回答。但是,如果了解一点点数据 阅读全文

posted @ 2017-12-29 16:28 多一点 阅读(3776) 评论(0) 推荐(0) 编辑

使用Python一步一步地来进行数据分析总结
摘要:学习python两年以来的深刻感受,与原文作者有着同样的感受。 原文链接:Step by step approach to perform data analysis using Python 你已经决定来学习Python,但是你之前没有编程经验。因此,你常常对从哪儿着手而感到困惑,这么多Pytho 阅读全文

posted @ 2017-12-29 16:12 多一点 阅读(2177) 评论(0) 推荐(1) 编辑

机器学习算法中的过拟合与欠拟合
摘要:在机器学习表现不佳的原因要么是过度拟合或欠拟合数据。 机器学习中的逼近目标函数过程 监督式机器学习通常理解为逼近一个目标函数(f)(f),此函数映射输入变量(X)到输出变量(Y). Y=f(X)Y=f(X) 这种特性描述可以用于定义分类和预测问题和机器学习算法的领域。 从训练数据中学习目标函数的过程 阅读全文

posted @ 2017-12-29 15:47 多一点 阅读(686) 评论(0) 推荐(0) 编辑

深入对比数据科学工具箱:Python和R之争
摘要:建议: 如果只是处理(小)数据的,用R。结果更可靠,速度可以接受,上手方便,多有现成的命令、程序可以用。要自己搞个算法、处理大数据、计算量大的,用python。开发效率高,一切尽在掌握。 概述 在真实的数据科学世界里,我们会有两个极端,一个是业务,一个是工程。偏向业务的数据科学被称为数据分析(Dat 阅读全文

posted @ 2017-12-29 15:46 多一点 阅读(939) 评论(0) 推荐(0) 编辑

转sklearn保存模型
摘要:训练好了一个Model 以后总需要保存和再次预测, 所以保存和读取我们的sklearn model也是同样重要的一步。 比如,我们根据房源样本数据训练了一下房价模型,当用户输入自己的房子后,我们就需要根据训练好的房价模型来预测用户房子的价格。 这样就需要在训练模型后把模型保存起来,在使用模型时把模型 阅读全文

posted @ 2017-12-29 14:03 多一点 阅读(3295) 评论(0) 推荐(0) 编辑

pandas常用
摘要:#python中的pandas库主要有DataFrame和Series类(面向对象的的语言更愿意叫类) DataFrame也就是#数据框(主要是借鉴R里面的data.frame),Series也就是序列 ,pandas底层是c写的 性能很棒,有大神#做过测试 处理亿级别的数据没问题,起性能可以跟同等 阅读全文

posted @ 2017-12-28 15:19 多一点 阅读(968) 评论(0) 推荐(0) 编辑

转Python SciPy库——拟合与插值
摘要:1.最小二乘拟合 实例1 import numpy as np import matplotlib.pyplot as plt from scipy.optimize import leastsq plt.figure(figsize=(9,9)) x=np.linspace(0,10,1000) 阅读全文

posted @ 2017-12-28 14:01 多一点 阅读(19013) 评论(0) 推荐(3) 编辑

转朴素贝叶斯分类器的应用
摘要:作者: 阮一峰 日期: 2013年12月16日 作者: 阮一峰 日期: 2013年12月16日 生活中很多场合需要用到分类,比如新闻分类、病人分类等等。 本文介绍朴素贝叶斯分类器(Naive Bayes classifier),它是一种简单有效的常用分类算法。 一、病人分类的例子 让我从一个例子开始 阅读全文

posted @ 2017-12-28 11:28 多一点 阅读(286) 评论(0) 推荐(0) 编辑

转贝叶斯推断及其互联网应用(一):定理简介
摘要:作者: 阮一峰 作者: 阮一峰 日期: 2011年8月25日 日期: 2011年8月25日 贝叶斯推断及其互联网应用 作者:阮一峰 一、什么是贝叶斯推断 贝叶斯推断(Bayesian inference)是一种统计学方法,用来估计统计量的某种性质。 它是贝叶斯定理(Bayes' theorem)的应 阅读全文

posted @ 2017-12-28 11:26 多一点 阅读(284) 评论(0) 推荐(0) 编辑

Vim 使用入门快捷键
摘要:Vim 和 Emac 都是利器啊,前段时间决定熟悉一套跨平台的编辑器,以便在 Win,Mac,Ubuntu 下都有相同的编辑体验。 于是尝试了一下 Vim,使用了一段时间,确实比 UE 之类的要高效。Win 平台下有 gVim, Mac 下也有 MacVim。 Vim 的学习曲线确实有点陡峭,刚开始 阅读全文

posted @ 2017-12-28 00:00 多一点 阅读(309) 评论(0) 推荐(0) 编辑

从贝叶斯定理说开去
摘要:简介 贝叶斯定理是18世纪英国数学家托马斯·贝叶斯(Thomas Bayes)提出得重要概率论理论。以下摘一段 wikipedia 上的简介: 所谓的贝叶斯定理源于他生前为解决一个“逆概”问题写的一篇文章,而这篇文章是在他死后才由他的一位朋友发表出来的。在贝叶斯写这篇文章之前,人们已经能够计算“正向 阅读全文

posted @ 2017-12-27 23:57 多一点 阅读(424) 评论(0) 推荐(0) 编辑

转特征值和特征向量
摘要:介绍 特征向量和特征值在计算机视觉和机器学习中有许多重要的应用。众所周知的例子是PCA(主成分分析)进行降维或人脸识别是特征脸。特征向量和特征值的一个有趣应用在我的另一篇有关误差椭圆的博文中提到。此外,特征值分解形成协方差矩阵几何解释的基础。在这篇文章中,我将简单的介绍这个数学概念,并且展示如何手动 阅读全文

posted @ 2017-12-27 23:53 多一点 阅读(734) 评论(0) 推荐(0) 编辑

第四章 特征值与特征向量
摘要:§4.1 特征值与特征向量 §4.1.1特征值与特征向量的概念及其计算 定义1. 设A是数域P上的一个n阶矩阵,l是一个未知量, 称为A的特征多项式,记 ¦(l)=| lE-A|,是一个P上的关于 l 的n次多项式,E是单位矩阵。 ¦(l)=| lE-A|=ln+a1ln-1+…+an= 0是一个n 阅读全文

posted @ 2017-12-27 22:51 多一点 阅读(14560) 评论(0) 推荐(0) 编辑

numpy基础入门
摘要:1、Numpy是什么 很简单,Numpy是Python的一个科学计算的库,提供了矩阵运算的功能,其一般与Scipy、matplotlib一起使用。其实,list已经提供了类似于矩阵的表示形式,不过numpy为我们提供了更多的函数。如果接触过matlab、scilab,那么numpy很好入手。 在以下 阅读全文

posted @ 2017-12-27 22:43 多一点 阅读(409) 评论(0) 推荐(0) 编辑

python range函数与numpy arange函数
摘要:1.range()返回的是range object,而np.arange()返回的是numpy.ndarray() range尽可用于迭代,而np.arange作用远不止于此,它是一个序列,可被当做向量使用。 2.range()不支持步长为小数,np.arange()支持步长为小数 3.两者都可用于 阅读全文

posted @ 2017-12-27 15:52 多一点 阅读(2322) 评论(0) 推荐(0) 编辑

转悠望南山 Python闲谈(二)聊聊最小二乘法以及leastsq函数
摘要:1 最小二乘法概述 自从开始做毕设以来,发现自己无时无刻不在接触最小二乘法。从求解线性透视图中的消失点,m元n次函数的拟合,包括后来学到的神经网络,其思想归根结底全都是最小二乘法。 1-1 “多线→一点”视角与“多点→一线”视角 最小二乘法非常简单,我把它分成两种视角描述: (1)已知多条近似交汇于 阅读全文

posted @ 2017-12-26 17:18 多一点 阅读(1114) 评论(0) 推荐(0) 编辑

numpy np.newaxis 的实用
摘要:np.newaxis 在使用和功能上等价于 None,其实就是 None 的一个别名。 1. np.newaxis 的实用 2. 索引多维数组的某一列时返回的是一个行向量 如果我索引多维数组的某一列时,返回的仍然是列的结构,一种正确的索引方式是: 如果想实现第二列和第四列的拼接(层叠): 当然更为简 阅读全文

posted @ 2017-12-25 17:57 多一点 阅读(22191) 评论(0) 推荐(0) 编辑

导航

< 2025年2月 >
26 27 28 29 30 31 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 1
2 3 4 5 6 7 8
点击右上角即可分享
微信分享提示