代码改变世界

integer encoding vs 1-hot (py)

2017-06-27 14:55 by xplorerthik, 267 阅读, 0 推荐, 收藏, 编辑
摘要:https://github.com/szilard/benchm-ml/issues/1 glouppe commented on 7 May 2015 https://github.com/szilard/benchm-ml/issues/1 glouppe commented on 7 May 阅读全文

python pipelines 用法

2017-06-26 17:02 by xplorerthik, 675 阅读, 0 推荐, 收藏, 编辑
摘要:http://zacstewart.com/2014/08/05/pipelines-of-featureunions-of-pipelines.html http://blog.csdn.net/mmc2015/article/details/46991465 http://machinelear 阅读全文

如何避免过拟合和欠拟合现象的产生

2017-06-23 10:22 by xplorerthik, 934 阅读, 0 推荐, 收藏, 编辑
摘要:偏置/方差折中问题 在所有的机器学习算法的使用中,都必须避免过拟合和欠拟合现象的产生,这就是偏置/方差折中问题的主要研究对象。维基百科中给出这种问题的详细说明: 偏置是一种误差, 这种误差主要来自于学习模型或算法中的错误假设。 比如y=x^2, 如果用线性回归的话,就会带来较大的误差; 方差:方差是 阅读全文

信息熵

2017-06-21 11:45 by xplorerthik, 222 阅读, 0 推荐, 收藏, 编辑
摘要:That transfer of information, from what we don’t know about the system to what we know, represents a change in entropy. Insight decreases the entropy 阅读全文

Installing XGBoost on Mac OSX

2017-06-20 13:25 by xplorerthik, 210 阅读, 0 推荐, 收藏, 编辑
摘要:0. Get gcc with open mp. Just paste and execute the following command in your terminal, once Homebrew installation is completed. brew install gcc --wi 阅读全文

缺失值填充

2017-06-14 10:30 by xplorerthik, 429 阅读, 0 推荐, 收藏, 编辑
摘要:https://www.analyticsvidhya.com/blog/2016/03/tutorial-powerful-packages-imputing-missing-values/ 5种超级棒的缺失值填充R算法包,需要好好实践一下。 List of R Packages So, whic 阅读全文

特征选择Boruta

2017-06-14 10:25 by xplorerthik, 1808 阅读, 0 推荐, 收藏, 编辑
摘要:A good feature subset is one that: contains features highly correlated with (predictive of) the class, yet uncorrelated with (not predictive of) each 阅读全文

五花八门的信用与业务相关程度研究是一个思路

2017-06-09 18:42 by xplorerthik, 147 阅读, 0 推荐, 收藏, 编辑
摘要:信用,从某种程度上有点像悬在每个人头上一把虚拟的剑,其本身并没有锋芒,而一旦它和实际商务活动、生活联系起来,将成为可以制约所有人的利器。 一方面,信用的数据来源很多。交通罚单、水电费交费记录、信用卡还款证明,甚至大学时候的一次考试作弊,都会成为信用数据来源的依据,都可以成为衡量一个人信用好坏的论据之 阅读全文

迁移学习

2017-06-09 10:34 by xplorerthik, 194 阅读, 0 推荐, 收藏, 编辑
摘要:给定源域Ds和目标域Dt,D={X,P(X)},并且给定源任务和目标任务 Ts 和 Tt,其中T={Y,P(Y|X)}.4种分法: χs≠χt。源域和目标域的特征空间不同,例如,文档是用两种不同的语言写的 xs=xt, 但P(Xs)≠P(Xt)。源域和目标域的边缘概率分布不同,例如,两个文档有着不同 阅读全文

信贷(信用贷款)风控

2017-06-08 18:08 by xplorerthik, 347 阅读, 0 推荐, 收藏, 编辑
摘要:信贷风控贯穿:贷前,贷中,贷后整个业务线 风控应该跟着场景走:知道资金用途,风控更容易 对客户进行风险评估;而在上面医美和教育的例子里,我们不仅要对客户进行评估,还要对企业进行评估,以防骗贷 普通信用贷款是指以借款人的信誉发放的贷款,借款人不需要提供担保。其特征就是债务人无需提供抵押品或第三方担保仅 阅读全文
上一页 1 ··· 4 5 6 7 8 9 10 11 下一页