摘要:
常用Hive日期时间函数整理 阅读全文
摘要:
PCA(Principal Component Analysis,主元分析)是一种对数据进行分析的技术,可以去除数据中的噪音或冗余,实现将复杂数据降维的效果。 本文的案例主要来自参考资料1、2,原理推导来自参考资料1。本文的线性代数基变换部分建议结合参考资料3的视频观看,强推3Blue1Brown大 阅读全文
摘要:
不同项目中使用pickle.load函数读取自定义类对象遇到的问题 阅读全文
摘要:
于是她蒙上了双眼 阅读全文
摘要:
读《园冶注释》时,觉得书中图式甚为精巧,想着将其整理收藏。正好博客园又能在文章中放上SVG图案,便有了此系列随笔,权当复习H5的SVG绘图知识与自娱自乐。 阅读全文
摘要:
本文为Judea Pearl《The Book of Why》的读书笔记,整理了书中对第四章对混杂及去混杂的介绍。 阅读全文
摘要:
本文为Judea Pearl《The Book of Why》的读书笔记,整理了书中对因果图的定义、示例以及接合关系的相关概念。 阅读全文
摘要:
本文为Judea Pearl《The Book of Why》的读书笔记,对作者提到的因果关系之梯的层级结构:关联、干预、反事实进行了介绍,并通过行刑队的例子对上述层级对应的问题展开理解。 阅读全文
摘要:
一、引言 1.1 模型融合是什么? 模型融合是一种将多个异质个体学习器进行组合从而得到具有比单学习器更强泛化能力模型的方法,属于集成学习的范畴。 在这里,需要区别一下模型融合和集成学习中的另一类方法——机器学习元算法。机器学习元算法包括大家熟知的Bagging和Boosting方法(本文不对这两种方 阅读全文
摘要:
本文整理了target encoding的相关知识,如果你对特征编码的内容不太了解,建议先阅读一下参考资料[1],在对特征编码方法有一定了解后,本文的阅读会更加轻松。 特征编码可以仅基于特征本身进行,也可以结合目标值(target)的信息进行。Target encoding就是一种结合目标值进行特征 阅读全文