2019年1月16日

开源书籍汇总

摘要: 这篇博客汇总所有开源的书籍 "开源电子书集合@github.com" "Interpretable Machine Learning A Guide for Making Black Box Models Explainable" 开源书籍(很多是关于R语言的) https://bookdown.o 阅读全文

posted @ 2019-01-16 23:19 Frank_Allen 阅读(603) 评论(0) 推荐(0) 编辑

The 10 Statistical Techniques Data Scientists Need to Master

摘要: "原文" 就我个人所知有太多的软件工程师尝试转行到数据科学家而盲目地使用机器学习框架来处理数据,例如,TensorFlow或者Apache Spark,但是对于这些框架背后的统计理论没有完全的理解。所以提起 statistical learning,这是机器学习的理论框架,是从统计学和泛函分析(fu 阅读全文

posted @ 2019-01-16 22:44 Frank_Allen 阅读(204) 评论(0) 推荐(0) 编辑

sklearn.model_selection Part 2: Model validation

摘要: 1. check_cv() 阅读源代码要抓主干,所以我把细枝末节的代码注释掉了。 2. cross_validate() 这个函数的代码有点复杂,讲解其他有用的代码。 从 "这里" 可以找到 scoring的名字对应的函数 注意 : 得分函数(score function)是返回的值越高越好,而损失 阅读全文

posted @ 2019-01-16 17:21 Frank_Allen 阅读(246) 评论(0) 推荐(0) 编辑

sklearn.model_selection Part 1: Splitter Classes

摘要: 1. GroupKFold(_BaseKFold) 主要参数: n_splits : int, default=3 在GroupKFold.split(X[, y, groups])中会调用下面的方法 总结 : GroupKFold是没有随机性参数的,也就是样本的groups确定后,每一折包含那些样 阅读全文

posted @ 2019-01-16 15:09 Frank_Allen 阅读(405) 评论(0) 推荐(0) 编辑

导航