2021 年 11月随笔档案 - lotuslaw

1-Hive学习笔记

摘要：Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能；本质是：将HQL转化成MapReduce程序阅读全文

posted @ 2021-11-29 20:35 lotuslaw 阅读(105) 评论(0) 推荐(0) 编辑

15-《增长黑客》读书笔记

摘要：2010年，肖恩·埃利斯首次提出“增长黑客”的概念。他认为：增长黑客唯一的使命就是增长。阅读全文

posted @ 2021-11-26 16:41 lotuslaw 阅读(332) 评论(0) 推荐(0) 编辑

6-Hadoop学习笔记3

摘要：YARN。阅读全文

posted @ 2021-11-24 20:43 lotuslaw 阅读(69) 评论(0) 推荐(0) 编辑

5-Hadoop学习笔记2

摘要：MapReduce。阅读全文

posted @ 2021-11-24 15:48 lotuslaw 阅读(35) 评论(0) 推荐(0) 编辑

4-Hadoop学习笔记1

摘要：大数据概率、Hadoop入门、HDFS。阅读全文

posted @ 2021-11-22 20:55 lotuslaw 阅读(25) 评论(0) 推荐(0) 编辑

14-使用RNN和CNN处理序列

摘要：击球手将球击出，外野手立即开始奔跑，预测球的轨迹。他追踪它，调整自己的运单，最后抓住球(在一片掌声中)。不管你是在听完朋友的话还是在早餐时期期待咖啡的味道，预测都是你一直在做阅读全文

posted @ 2021-11-20 15:09 lotuslaw 阅读(257) 评论(0) 推荐(0) 编辑

13-使用卷积神经网络的深度计算机视觉

摘要：卷积神经网络(CNN)起源于对大脑的视觉皮层的研究。阅读全文

posted @ 2021-11-19 17:44 lotuslaw 阅读(265) 评论(0) 推荐(0) 编辑

12-使用TensorFlow加载和预处理数据

摘要：读取大型数据集并对其进行有效预处理可能对其他深度学习库来说很难实现，但是TensorFlow借助Data API很容易实现：只需创建一个数据集对象，并告诉它如何从何处获取数据以及如何对其进行转换。阅读全文

posted @ 2021-11-18 15:01 lotuslaw 阅读(1084) 评论(0) 推荐(0) 编辑

11-使用TensorFlow自定义模型和训练

摘要：当你需要额外的控制来编写自定义损失函数、自定义指标、层、模型、初始化程序、正则化函数、权重约束等，TensorFlow的底层Python API将非常有用。你甚至可以完全控制训练循环本身。阅读全文

posted @ 2021-11-17 14:43 lotuslaw 阅读(1007) 评论(0) 推荐(0) 编辑

10-训练深度神经网络

摘要：训练DNN常见问题：梯度消失或梯度爆炸、没有足够的带标签数据、训练非常缓慢、过拟合。解决方式：初始化、激活函数、归一化、正则化、优化器、学习率调度。阅读全文

posted @ 2021-11-16 16:01 lotuslaw 阅读(290) 评论(0) 推荐(0) 编辑

9-Keras人工神经网络简介

摘要：人工神经网络是深度学习的核心。阅读全文

posted @ 2021-11-15 14:20 lotuslaw 阅读(275) 评论(0) 推荐(0) 编辑

8-无监督学习技术

摘要：如果智能是蛋糕，无监督学习将是蛋糕体，有监督学习是蛋糕上的糖霜，强化学习是蛋糕上的樱桃阅读全文

posted @ 2021-11-14 14:27 lotuslaw 阅读(219) 评论(0) 推荐(0) 编辑

7-降维

摘要：许多机器学习问题设计每个训练实例的成千上万甚至数百万个特征。正如我们将看到的那样，所有这些特征不仅使训练变得极其缓慢，而且还会使找到好的解决方案变得更加困难。这个问题通常称为维度的诅咒。阅读全文

posted @ 2021-11-13 11:35 lotuslaw 阅读(95) 评论(0) 推荐(0) 编辑

6-集成学习和随机森林

摘要：如果你随机向几千个人询问一个问题，然后汇总他们的回答，在许多情况下，你会发现，这个汇总的回答比专家回答的还要好，这被称为群体智慧。阅读全文

posted @ 2021-11-12 11:49 lotuslaw 阅读(262) 评论(0) 推荐(0) 编辑

14-《精益数据分析》读书笔记

摘要：《精益数据分析》用于衡量你的进展，帮助你提出最重要的问题，并尽快得到明确的答案。阅读全文

posted @ 2021-11-11 17:06 lotuslaw 阅读(503) 评论(0) 推荐(0) 编辑

5-决策树

摘要：决策树是通用的机器学习算法，可以执行分类和回归任务，甚至多输出任务。阅读全文

posted @ 2021-11-11 10:42 lotuslaw 阅读(97) 评论(0) 推荐(0) 编辑

4-支持向量机

摘要：支持向量机是一个功能强大且全面的机器学习模型，它能够执行线性或非线性分类、回归，甚至是异常检测任务。阅读全文

posted @ 2021-11-10 19:39 lotuslaw 阅读(67) 评论(0) 推荐(0) 编辑

3-训练模型

摘要：线性回归-多项式回归-正则化-逻辑回归。阅读全文

posted @ 2021-11-10 16:48 lotuslaw 阅读(167) 评论(0) 推荐(0) 编辑

2-分类

摘要：最常见的有监督学习任务包括分类任何和回归任务，本章主要关注分类任务：二分类、多分类(多标签分类、多输出分类) 阅读全文

posted @ 2021-11-10 13:04 lotuslaw 阅读(73) 评论(0) 推荐(0) 编辑

1-确定变量间是否有关系—显著性检验

摘要：原假设H0：假设两个变量间没有关系（有没有差异）；p值>α，则接受原假设，即变量间没有关系（没有差异）；p值<α，则拒绝原假设，即变量间有关系（有差异）。阅读全文

posted @ 2021-11-09 10:14 lotuslaw 阅读(600) 评论(0) 推荐(0) 编辑

13-AB Test学习

摘要：AB测试是为Web或App界面或流程制作两个（A/B）或多个（A/B/n）版本，在同一时间维度，分别让组成成分相同（相似）的访客群组（目标人群）随机的访问这些版本，收集各群组的用户体验数据和业务数据，最后分析、评估出最好版本，正式采用。阅读全文

posted @ 2021-11-08 16:40 lotuslaw 阅读(682) 评论(0) 推荐(0) 编辑

Loading

lotuslaw

11 2021 档案

公告