05 2020 档案

摘要:原文地址:https://zhuanlan.zhihu.com/p/32658341 问题 之前我们讨论的 PCA降维,对样本数据来言,可以是没有类别标签 y 的。如果我们做回归时,如果特征太多,那么会产生不相关特征引入、过度拟合等问题。我们可以使用PCA 来降维,但 PCA 没有将类别标签考虑进去 阅读全文
posted @ 2020-05-17 11:26 瘋子朱磊 阅读(372) 评论(0) 推荐(0) 编辑
摘要:原文地址:https://www.cnblogs.com/xinyuyang/p/11178676.html 主成分分析原理与实现 主成分分析是一种矩阵的压缩算法,在减少矩阵维数的同时尽可能的保留原矩阵的信息,简单来说就是将 n×mn×m的矩阵转换成n×kn×k的矩阵,仅保留矩阵中所存在的主要特性, 阅读全文
posted @ 2020-05-16 22:32 瘋子朱磊 阅读(852) 评论(0) 推荐(0) 编辑
摘要:原文地址:https://www.cnblogs.com/frankdeng/p/9310278.html 一、系统架构 注意:应该是每一个 RegionServer 就只有一个 HLog,而不是一个 Region 有一个 HLog。 从HBase的架构图上可以看出,HBase中的组件包括Clien 阅读全文
posted @ 2020-05-13 19:30 瘋子朱磊 阅读(333) 评论(0) 推荐(0) 编辑
摘要:原文地址:https://blog.csdn.net/lavorange/article/details/82775275 一、简介 HBase - Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构 阅读全文
posted @ 2020-05-11 20:23 瘋子朱磊 阅读(265) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示