05 2017 档案

摘要:默认已经装好python基本环境,再进行下面步骤: 1. 下载安装IPython: c:>pip.exe install ipython 系统就会去网上寻找ipython的包, 进行下载及安装. 等待差不多5分钟, 整个安装就完成了, 并且还把pyreadline也安装了. ipython3.exe 阅读全文
posted @ 2017-05-25 14:00 光彩照人 阅读(223) 评论(0) 推荐(0) 编辑
摘要:一、模型与特征哪个重要? 参与Sberbank Russian Housing Market比赛,一开始使用sklearn的岭回归函数Ridge(),残差值一直是0.37左右,然后同样的特征又使用了XGboost,残差值降到了0.34左右,提高的还是挺显著的。 但是另外一些参赛选手,使用XGboos 阅读全文
posted @ 2017-05-19 14:13 光彩照人 阅读(299) 评论(0) 推荐(0) 编辑
摘要:一、画出模型的残差值分布情况 注:本样例只是为了说明问题,只用了几行数据来预测画图。 正常来讲,一个好的模型,残差值应该分布比较集中,而且基本都在0上下稍微浮动,表明残差值都比较小。 阅读全文
posted @ 2017-05-10 16:19 光彩照人 阅读(2486) 评论(0) 推荐(0) 编辑
摘要:一、朴素贝叶斯 有以下几个地方需要注意: 1. 如果给出的特征向量长度可能不同,这是需要归一化为通长度的向量(这里以文本分类为例),比如说是句子单词的话,则长度为整个词汇量的长度,对应位置是该单词出现的次数。 2. 计算公式如下: 其中一项条件概率可以通过朴素贝叶斯条件独立展开。要注意一点就是 的计 阅读全文
posted @ 2017-05-09 09:51 光彩照人 阅读(1717) 评论(0) 推荐(0) 编辑
摘要:一、模型验证 进行模型验证的一个重要目的是要选出一个最合适的模型,对于监督学习而言,我们希望模型对于未知数据的泛化能力强,所以就需要模型验证这一过程来体现不同的模型对于未知数据的表现效果。 这里我们将训练集再分成训练集与验证集两部分,大概比例就是3:1吧。一般来讲不同的训练集、验证集分割的方法会导致 阅读全文
posted @ 2017-05-09 09:34 光彩照人 阅读(3293) 评论(0) 推荐(0) 编辑
摘要:Scikit-Learn库已经实现了所有基本机器学习的算法,可以直接调用里面库进行模型构建。 一、逻辑回归 大多数情况下被用来解决分类问题(二元分类),但多类的分类(所谓的一对多方法)也适用。这个算法的优点是对于每一个输出的对象都有一个对应类别的概率。 二、朴素贝叶斯 它也是最有名的机器学习的算法之 阅读全文
posted @ 2017-05-09 09:33 光彩照人 阅读(1258) 评论(0) 推荐(0) 编辑
摘要:一、岭回归模型 岭回归其实就是在普通最小二乘法回归(ordinary least squares regression)的基础上,加入了正则化参数λ。 二、如何调用 class sklearn.linear_model.Ridge(alpha=1.0, fit_intercept=True, nor 阅读全文
posted @ 2017-05-05 14:39 光彩照人 阅读(6031) 评论(0) 推荐(0) 编辑
摘要:一、何为数据的偏态分布? 频数分布有正态分布和偏态分布之分。正态分布是指多数频数集中在中央位置,两端的频数分布大致对称。 偏态分布是指频数分布不对称,集中位置偏向一侧。若集中位置偏向数值小的一侧,称为正偏态分布;集中位置偏向数值大的一侧,称为负偏态分布。 如果频数分布的高峰向左偏移,长尾向右侧延伸称 阅读全文
posted @ 2017-05-03 17:28 光彩照人 阅读(17041) 评论(0) 推荐(0) 编辑
摘要:毫无疑问,解决一个问题最重要的是恰当选取特征、甚至创造特征的能力,这叫做特征选取和特征工程。对于特征选取工作,我个人认为分为两个方面: 1)利用python中已有的算法进行特征选取。 2)人为分析各个变量特征与目标值之间的关系,包括利用图表等比较直观的手段方法,剔除无意义或者说不重要的特征变量,使得 阅读全文
posted @ 2017-05-03 17:21 光彩照人 阅读(28699) 评论(0) 推荐(1) 编辑
摘要:一、快速绘图 label : 给所绘制的曲线一个名字,此名字在图示(legend)中显示。只要在字符串前后添加"$"符号,matplotlib就会使用其内嵌的latex引擎绘制的数学公式。 color : 指定曲线的颜色 linewidth : 指定曲线的宽度 label : 给所绘制的曲线一个名字 阅读全文
posted @ 2017-05-03 14:42 光彩照人 阅读(554) 评论(0) 推荐(0) 编辑
摘要:Web API 近几年变得越来越火,而简洁的 API 设计在多后端系统交互应用中也变得尤为重要。通常,会使用 RESTful API 来作为我们的 Web API 。本文介绍了几种简洁 RESTful API 设计的最佳实践。 一、使用的名词而不是动词 使用名词来定义接口,不应该使用动词: /get 阅读全文
posted @ 2017-05-02 15:40 光彩照人 阅读(412) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示