2019年7月18日

堆、栈、堆栈、队列的区别

摘要: 堆栈都是一种数据项按序排列的数据结构,只能在一端(称为栈顶(top))对数据项进行插入和删除。 要点:堆:顺序随意 栈:后进先出(Last-In/First-Out) 堆 堆:什么是堆?又该怎么理解呢? ①堆通常是一个可以被看做一棵树的数组对象。堆总是满足下列性质: 堆中某个节点的值总是不大于或不小 阅读全文

posted @ 2019-07-18 16:26 农夫三拳有點疼 阅读(293) 评论(0) 推荐(0) 编辑

特征工程

摘要: 背景 在之前学习机器学习技术中,很少关注特征工程(Feature Engineering),而且机器学习的书中基本上是已经处理好的数据或者作者自己构造的虚拟的数据。所以在机器学习的实践中,可能会选择使用这些算法,但是常常不知道怎么提取特征来建模。因此,结合网上的资料和项目中的经验试着来总结一下。 特 阅读全文

posted @ 2019-07-18 14:13 农夫三拳有點疼 阅读(448) 评论(0) 推荐(0) 编辑

0 MapReduce实现Reduce Side Join操作

摘要: 一.准备两张表以及对应的数据 (1)m_ys_lab_jointest_a(以下简称表A) 建表语句: 具体数据如下: (2)m_ys_lab_jointest_b(以下简称表B) 建表语句为: create table if not exists m_ys_lab_jointest_b ( id 阅读全文

posted @ 2019-07-18 11:39 农夫三拳有點疼 阅读(166) 评论(0) 推荐(0) 编辑

20 Storm的理解

摘要: 一、Storm概念 1、Storm流式处理: Storm vs. mapreduce Storm:面向实时 缺点:吞吐能力差 优点:时效性好,毫秒级别,增量式处理 Mapreduce:面向批量 缺点:时效性差 优点:吞吐能力强,适合批处理 2、Storm:没有持久化功能——》快 可靠性:保证消息处理 阅读全文

posted @ 2019-07-18 09:49 农夫三拳有點疼 阅读(44) 评论(0) 推荐(0) 编辑

导航