上一页 1 ··· 9 10 11 12 13 14 下一页
摘要: 感知机可以说是最古老的分类方法之一了,在1957年就已经提出。今天看来它的分类模型在大多数时候泛化能力不强,但是它的原理却值得好好研究。因为研究透了感知机模型,学习支持向量机的话会降低不少难度。同时如果研究透了感知机模型,再学习神经网络,深度学习,也是一个很好的起点。这里对感知机的原理做一个小结。 阅读全文
posted @ 2016-11-08 16:23 刘建平Pinard 阅读(57853) 评论(115) 推荐(39) 编辑
摘要: 最近参与了了一个日志和告警的数据挖掘项目,里面用到的一些思路在这里和大家做一个分享。 项目的需求是收集的客户系统一个月300G左右的的日志和告警数据做一个整理,主要是归类(Grouping)和关联(Correlation),从而得到告警和日志的一些统计关系,这些统计结果可以给一线支持人员参考。 得到 阅读全文
posted @ 2016-11-07 17:23 刘建平Pinard 阅读(18325) 评论(17) 推荐(5) 编辑
摘要: 之前在逻辑回归原理小结这篇文章中,对逻辑回归的原理做了小结。这里接着对scikit-learn中逻辑回归类库的我的使用经验做一个总结。重点讲述调参中要注意的事项。 1. 概述 在scikit-learn中,与逻辑回归有关的主要是这3个类。LogisticRegression, LogisticReg 阅读全文
posted @ 2016-11-06 19:41 刘建平Pinard 阅读(51259) 评论(66) 推荐(17) 编辑
摘要: 逻辑回归是一个分类算法,它可以处理二元分类以及多元分类。虽然它名字里面有“回归”两个字,却不是一个回归算法。那为什么有“回归”这个误导性的词呢?个人认为,虽然逻辑回归是分类模型,但是它的原理里面却残留着回归模型的影子,本文对逻辑回归原理做一个总结。 1. 从线性回归到逻辑回归 我们知道,线性回归的模 阅读全文
posted @ 2016-11-04 21:22 刘建平Pinard 阅读(107492) 评论(199) 推荐(40) 编辑
摘要: scikit-learn对于线性回归提供了比较多的类库,这些类库都可以用来做线性回归分析,本文就对这些类库的使用做一个总结,重点讲述这些线性回归算法库的不同和各自的使用场景。 线性回归的目的是要得到输出向量\(\mathbf{Y}\)和输入特征\(\mathbf{X}\)之间的线性关系,求出线性回归 阅读全文
posted @ 2016-11-03 23:41 刘建平Pinard 阅读(35665) 评论(27) 推荐(13) 编辑
摘要: 本文将用一个例子来讲述怎么用scikit-learn和pandas来学习Ridge回归。 1. Ridge回归的损失函数 在我的另外一遍讲线性回归的文章中,对Ridge回归做了一些介绍,以及什么时候适合用 Ridge回归。如果对什么是Ridge回归还完全不清楚的建议阅读我这篇文章。 线性回归原理小结 阅读全文
posted @ 2016-11-02 16:34 刘建平Pinard 阅读(30009) 评论(44) 推荐(11) 编辑
摘要: 前面的文章对线性回归做了一个小结,文章在这: 线性回归原理小结。里面对线程回归的正则化也做了一个初步的介绍。提到了线程回归的L2正则化-Ridge回归,以及线程回归的L1正则化-Lasso回归。但是对于Lasso回归的解法没有提及,本文是对该文的补充和扩展。以下都用矩阵法表示,如果对于矩阵分析不熟悉 阅读全文
posted @ 2016-11-01 17:29 刘建平Pinard 阅读(70550) 评论(73) 推荐(24) 编辑
摘要: 对于想深入了解线性回归的童鞋,这里给出一个完整的例子,详细学完这个例子,对用scikit-learn来运行线性回归,评估模型不会有什么问题了。 1. 获取数据,定义问题 没有数据,当然没法研究机器学习啦。:) 这里我们用UCI大学公开的机器学习数据来跑线性回归。 数据的介绍在这: http://ar 阅读全文
posted @ 2016-10-31 17:37 刘建平Pinard 阅读(103680) 评论(77) 推荐(20) 编辑
摘要: 很多朋友想学习机器学习,却苦于环境的搭建,这里给出windows上scikit-learn研究开发环境的搭建步骤。 Step 1. Python的安装 python有2.x和3.x的版本之分,但是很多好的机器学习python库都不支持3.x,因此,推荐安装2.7版本的python。当前最新的pyth 阅读全文
posted @ 2016-10-30 17:37 刘建平Pinard 阅读(17246) 评论(8) 推荐(4) 编辑
摘要: 目前机器学习可以说是百花齐放阶段,不过如果要学习或者研究机器学习,进而用到生产环境,对平台,开发语言,机器学习库的选择就要费一番脑筋了。这里就我自己的机器学习经验做一个建议,仅供参考。 首先,对于平台选择的第一个问题是,你是要用于生产环境,也就是具体的产品中,还是仅仅是做研究学习用? 1. 生产环境 阅读全文
posted @ 2016-10-28 12:15 刘建平Pinard 阅读(23774) 评论(30) 推荐(15) 编辑
上一页 1 ··· 9 10 11 12 13 14 下一页