06 2017 档案
摘要:来源: Poll的笔记 cnblogs.com/maybe2030/p/4734645.html 阅读目录 1. 决策树的模型 2. 决策树的基本知识 3. ID3、C4.5&CART 4. Random Forest 5. GBDT 6. 参考内容 1. 决策树的模型 2. 决策树的基本知识 3.
阅读全文
摘要:来源: Poll的笔记 cnblogs.com/maybe2030/p/4585705.html 1 什么是随机森林? 作为新兴起的、高度灵活的一种机器学习算法,随机森林(Random Forest,简称RF)拥有广泛的应用前景,从市场营销到医疗保健保险,既可以用来做市场营销模拟的建模,统计客户来源
阅读全文
摘要:Bagging和Boosting都是将已有的分类或回归算法通过一定方式组合起来,形成一个性能更加强大的分类器,更准确的说这是一种分类算法的组装方法。即将弱分类器组装成强分类器的方法。 首先介绍Bootstraping,即自助法:它是一种有放回的抽样方法(可能抽到重复的样本)。 1、Bagging (
阅读全文
摘要:迭代 你可以创建一个列表,然后逐一遍历,这就是迭代 1 2 3 4 5 6 >>> mylist = [1, 2, 3] >>> for i in mylist: ... print(i) 1 2 3 1 2 3 4 5 6 >>> mylist = [1, 2, 3] >>> for i in m
阅读全文
摘要:1、变量交换 大部分编程语言中交换两个变量的值时,不得不引入一个临时变量: pythonic 2、循环遍历区间元素 pythonic xrange 返回的是生成器对象,生成器比列表更加节省内存,不过需要注意的是 xrange 是 python2 中的写法,python3 只有 range 方法,特点
阅读全文
摘要:1.查看数据的类型概况 cols = [c for c in train.columns] #返回数据的列名到列表里 print('Number of features: {}'.format(len(cols))) print('Feature types:')train[cols].dtypes
阅读全文
摘要:作者:无影随想 时间:2016年1月。 出处:http://www.zhaokv.com/2016/01/normalization-and-standardization.html 在机器学习和数据挖掘中,经常会听到两个名词:归一化(Normalization)与标准化(Standardizati
阅读全文
摘要:作者:无影随想 时间:2016年1月。 出处:http://www.zhaokv.com/2016/01/learning-from-imbalanced-data.html 这几年来,机器学习和数据挖掘非常火热,它们逐渐为世界带来实际价值。与此同时,越来越多的机器学习算法从学术界走向工业界,而在这
阅读全文
摘要:拟合相关 一、R2 决定系数(拟合优度) 它是表征回归方程在多大程度上解释了因变量的变化,或者说方程对观测值的拟合程度如何。 因为如果单纯用残差平方和会受到你因变量和自变量绝对值大小的影响,不利于在不同模型之间进行相对比较.而用拟合优度就可以解决这个问题。例如一个模型中的因变量:10000、2000
阅读全文
摘要:问题描述:有 N (N>1000000)个数,求出其中的前K个最小的数(又被称作topK问题)。 这类问题似乎是备受面试官的青睐,相信面试过互联网公司的同学都会遇到这来问题。下面由浅入深,分析一下这类问题。 思路1:最基本的思路,将N个数进行完全排序,从中选出排在前K的元素即为所求。有了这个思路,我
阅读全文
摘要:一、什么是特征工程? "Feature engineering is the process of transforming raw data into features that better represent the underlying problem to the predictive m
阅读全文
摘要:一、比赛概述 不同比赛有不同的任务,分类、回归、推荐、排序等。比赛开始后训练集和测试集就会开放下载。 比赛通常持续 2 ~ 3 个月,每个队伍每天可以提交的次数有限,通常为 5 次。 比赛结束前一周是一个 Deadline,在这之后不能再组队,也不能再新加入比赛。所以想要参加比赛请务必在这一 Dea
阅读全文
摘要:原作者:陈成龙 简介 Kaggle 于 2010 年创立,专注数据科学,机器学习竞赛的举办,是全球最大的数据科学社区和数据竞赛平台。笔者从 2013 年开始,陆续参加了多场 Kaggle上面举办的比赛,相继获得了 CrowdFlower 搜索相关性比赛第一名(1326支队伍)和 HomeDepot
阅读全文