随笔分类 - 机器学习及建模
摘要:深入学习机器学习、分布式算法才发现概率与统计,线代都很重要,下面我简单串一下如题目所示的知识 第一步: P(A|B)是在条件B发生的情况下A发生的概率,P(AB)是条件A与B同时发生的概率。关于条件概率、联合概率的例子我在最后一步骤举出,如独立事件和古典概型都懂,则请跳至最后一步看例子先记牢靠公式:
阅读全文
摘要:原文链接:https://www.cnblogs.com/kongweisi/p/10623301.htmlpredict_proba返回的是一个n行k列的数组,第i行第j列上的数值是模型预测第i个预测样本的标签为j的概率。所以每一行的和应该等于1. 举个例子 >>> from sklearn.li
阅读全文
摘要:我认为T检验 和F检验在机器学习中的作用:判断机器学习中样本集中的某个特征(自变量)和因变量之间的相关性强弱(用于在建模中判断此自变量是否可以扔掉) 最近在做数据分析方面的工作,经常需要检验两组样本之间是否存在差异,所以会遇到统计学中假设检验相关的知识。在机器学习特征工程这一步,笔者最常用到的是假设
阅读全文
摘要:点击转到数据集网站 点击进入主页
阅读全文
摘要:一.CSS入门一 CSS主要与HTML搭配使用,使HTML界面变得美观,和谐. 1.初识选择器 CSS选择器可以简单地划分为3类: 1).标签选择器:标签名称定义。应用于此类标签。p{} 2).ID选择器,#打头定义.应用于对应ID的Html元素 #top{} 3).类选择器, .打头定义。应用于对
阅读全文
摘要:使用Python的时候需要安装各种模块,而pip是很强大的模块安装工具,但是由于国外官方pypi经常被墙,导致不可用,所以我们最好是将自己使用的pip源更换一下,这样就能解决被墙导致的装不上库的烦恼。 最有效且成功率几乎百分百的方法: 使用国内源,笔者这里是使用清华大学的镜像源 每次在cmd命令行下
阅读全文
摘要:使用背景:在机器学习的过程中,安装的sklearn是0.0版本的,之后编写Python程序的时候出现了错误: from sklearn.externals import joblib ImportError: cannot import name ‘joblib‘ 问题解决链接:https://ww
阅读全文
摘要:pip install Scikit-learn==0.20.4 from sklearn.externals import joblib ImportError: cannot import name ‘joblib’ 在机器学习中,有时需要保存或加载模型,就会引入from sklearn.ext
阅读全文
摘要:转自:http://www.cnblogs.com/rainsoul/p/6247779.html 在机器学习中经常会遇到正负样本的问题,花了一点时间查找资料,基本上弄明白了一点到底是怎么回事,记录在这里以便以后查看,也希望能够帮助到有疑惑的人,当然也希望理解的比较透彻的人看到之后对于理解的不对的地
阅读全文
摘要:https://www.cnblogs.com/zhizhan/p/5007522.html 原文:http://blog.csdn.net/xmu_jupiter/article/details/47108523 对于机器学习的实际运用,光停留在知道了解的层面还不够,我们需要对实际中容易遇到的一些
阅读全文
摘要:https://blog.csdn.net/u010376788/article/details/46957957 PCA(Principal Component Analysis,主成分分析)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要
阅读全文