摘要:
XGBoost 是一种集大成的机器学习算法,可用于回归,分类和排序等各种问题,在机器学习大赛及工业领域被广泛应用。成功案例包括:网页文本分类、顾客行为预测、情感挖掘、广告点击率预测、恶意软件分类、物品分类、风险评估、大规模在线课程退学率预测。 XGBoost是初学者最值得深度理解的模型之一,它将决策 阅读全文
摘要:
数学概念 方差:用来衡量随机变量与其数学期望(均值)之间的偏离程度。统计中的方差(样本方差)是各个数据分别与其平均数之差的平方的和的平均数。 \(Var(X)=\frac{1}{n}\sum(x_i-μ)^2\) 协方差:度量两个随机变量关系的统计量,协方差为0的两个随机变量是不相关的。 \(cov 阅读全文
摘要:
无论是数据分析还是机器学习,数据的预处理必不可少。 其中最常用、最基础的Python库非numpy和pandas莫属,很多初学者可能看了很多教程,但是很快就把用法忘光了。 光看不练假把式,今天向大家推荐三套感觉不错的练习题,感兴趣的同学可以练练手。 每套题都分四个Level的难度 Difficult 阅读全文
摘要:
数据开发,离不开数据库,一款优秀的数据库开发和管理工具可以达到事半功倍的效果。市面上比较流行的数据库管理工具主要有Navicat、DBeaver、SQLyog等等,Navicat是其中的无冕之王,其拳头产品Navicat Premium可满足现今数据库管理系统(支持单一程序同時连接多达7种数据库:M 阅读全文
摘要:
Bookdown是著名R包作者谢益辉开发的,支持采用Rmarkdown (R代码可以运行)或普通markdown编写文档,然后编译成HTML, WORD, PDF, Epub等格式。 bookdown是个素颜版的 LaTeX ,满足了99%的需求,而使用难度大概只有 LaTeX 的1%,性价比极高。 阅读全文