11 2021 档案
摘要:Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能;本质是:将HQL转化成MapReduce程序
阅读全文
摘要:2010年,肖恩·埃利斯首次提出“增长黑客”的概念。他认为:增长黑客唯一的使命就是增长。
阅读全文
摘要:击球手将球击出,外野手立即开始奔跑,预测球的轨迹。他追踪它,调整自己的运单,最后抓住球(在一片掌声中)。不管你是在听完朋友的话还是在早餐时期期待咖啡的味道,预测都是你一直在做
阅读全文
摘要:卷积神经网络(CNN)起源于对大脑的视觉皮层的研究。
阅读全文
摘要:读取大型数据集并对其进行有效预处理可能对其他深度学习库来说很难实现,但是TensorFlow借助Data API很容易实现:只需创建一个数据集对象,并告诉它如何从何处获取数据以及如何对其进行转换。
阅读全文
摘要:当你需要额外的控制来编写自定义损失函数、自定义指标、层、模型、初始化程序、正则化函数、权重约束等,TensorFlow的底层Python API将非常有用。你甚至可以完全控制训练循环本身。
阅读全文
摘要:训练DNN常见问题:梯度消失或梯度爆炸、没有足够的带标签数据、训练非常缓慢、过拟合。解决方式:初始化、激活函数、归一化、正则化、优化器、学习率调度。
阅读全文
摘要:如果智能是蛋糕,无监督学习将是蛋糕体,有监督学习是蛋糕上的糖霜,强化学习是蛋糕上的樱桃
阅读全文
摘要:许多机器学习问题设计每个训练实例的成千上万甚至数百万个特征。正如我们将看到的那样,所有这些特征不仅使训练变得极其缓慢,而且还会使找到好的解决方案变得更加困难。这个问题通常称为维度的诅咒。
阅读全文
摘要:如果你随机向几千个人询问一个问题,然后汇总他们的回答,在许多情况下,你会发现,这个汇总的回答比专家回答的还要好,这被称为群体智慧。
阅读全文
摘要:《精益数据分析》用于衡量你的进展,帮助你提出最重要的问题,并尽快得到明确的答案。
阅读全文
摘要:决策树是通用的机器学习算法,可以执行分类和回归任务,甚至多输出任务。
阅读全文
摘要:支持向量机是一个功能强大且全面的机器学习模型,它能够执行线性或非线性分类、回归,甚至是异常检测任务。
阅读全文
摘要:最常见的有监督学习任务包括分类任何和回归任务,本章主要关注分类任务:二分类、多分类(多标签分类、多输出分类)
阅读全文
摘要:原假设H0:假设两个变量间没有关系(有没有差异);p值>α,则接受原假设,即变量间没有关系(没有差异);p值<α,则拒绝原假设,即变量间有关系(有差异)。
阅读全文
摘要:AB测试是为Web或App界面或流程制作两个(A/B)或多个(A/B/n)版本,在同一时间维度,分别让组成成分相同(相似)的访客群组(目标人群)随机的访问这些版本,收集各群组的用户体验数据和业务数据,最后分析、评估出最好版本,正式采用。
阅读全文
