摘要: 很多初学者,对大数据的概念都是模糊不清的,大数据是什么,能做什么,学的时候,该按照什么线路去学习,学完往哪方面发展,想深入了解,想学习的同学欢迎加入大数据学习qq群:410391744,有大量干货(零基础以及进阶的经典实战)分享给大家,并且有清华大学毕业的资深大数据讲师给大家免费授课,给大家分享目前国内最完整的大数据高端实战实用学习流程体系。 阅读全文
posted @ 2019-05-21 21:53 大数据工程师8 阅读(551) 评论(0) 推荐(0) 编辑
摘要: 随着移动互联网的结束与人工智能的到来大数据变成越来越重要,下一个成功者应该是拥有海量数据的,数据与数据库你应该知道。 一、数据库概要 数据库(Database)是存储与管理数据的软件系统,就像一个存入数据的物流仓库。 在商业领域,信息就意味着商机,取得信息的一个非常重要的途径就是对数据进行分析处理, 阅读全文
posted @ 2019-06-02 14:49 大数据工程师8 阅读(476) 评论(0) 推荐(0) 编辑
摘要: Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 Hadoop是一个专为离线和大规模数据分析而设计的,并不适合那种对几个记录随机读写的在线事务处理模式。 Hadoop=HDFS(文件系统,数据存储技术相关)+ Mapreduce(数据处理),Hadoop的数据来源可以是任何形式,在 阅读全文
posted @ 2019-06-01 23:09 大数据工程师8 阅读(576) 评论(0) 推荐(0) 编辑
摘要: 最近学习了hashtable的一点知识,发现可以用来解决大数据的一些问题。我们这里讲的大数据分析事实上并不是分布式和数据挖掘这些高深的概念,而是针对从从一个大文件或者一堆数据(内存放不下)中找出具有某种特点的数,这也是近年来各大公司经常考的问题。 面试题1:给一个超过100G大小的log file, 阅读全文
posted @ 2019-05-31 12:42 大数据工程师8 阅读(479) 评论(0) 推荐(0) 编辑
摘要: 作为一名热爱数据分析、通过努力拿到心仪offer的学生,是许许多多通过努力实现目标的学生中的普通一员。一路走来,我把自己的经历按照时间线写下来,中间穿插我的经验,在记录自己工作的同时,希望能给想要进入数据分析师岗位的学弟学妹们一点点的小收获。 一、本科4年,初识数学建模,爱上统计 从小就特别喜欢数学 阅读全文
posted @ 2019-05-29 16:48 大数据工程师8 阅读(3163) 评论(0) 推荐(0) 编辑
摘要: server配置 server.address指定server绑定的地址 server.compression.enabled是否开启压缩,默认为false. server.compression.excluded-user-agents指定不压缩的user-agent,多个以逗号分隔,默认值为:t 阅读全文
posted @ 2019-05-28 21:34 大数据工程师8 阅读(484) 评论(0) 推荐(0) 编辑
摘要: 大数据的领域非常广泛,往往使想要开始学习大数据及相关技术的人望而生畏。大数据技术的种类众多,这同样使得初学者难以选择从何处下手。科多大数据希望能为你开始学习大数据的征程提供帮助,以及在大数据产业领域找到工作指明道路。 一、大数据技术基础 1、linux操作基础 · linux系统简介与安装 · li 阅读全文
posted @ 2019-05-28 21:31 大数据工程师8 阅读(288) 评论(0) 推荐(0) 编辑
摘要: 501、MapReduce计算框架中的输入和输出的基本数据结构是键-值对。 502、Hadoop神奇的一部分在于sort和shuffle过程。 503、Hive驱动计算的“语言”是一XML形式编码的。 504、Hive通过和Jobtracker通信来初始化MapReduce任务(Job)。 505、 阅读全文
posted @ 2019-05-27 23:33 大数据工程师8 阅读(362) 评论(0) 推荐(0) 编辑
摘要: 要说当下IT行业什么最火?ABC无出其右。所谓ABC者,AI + Big Data + Cloud也,即人工智能、大数据和云计算(云平台)。每个领域目前都有行业领袖在引领前行,今天我们来讨论下大数据Big Data这个方向。 二,大数据里面的角色 角色一:大数据工程 大数据工程需要解决数据的定义、收 阅读全文
posted @ 2019-05-24 14:16 大数据工程师8 阅读(480) 评论(0) 推荐(1) 编辑
摘要: Apache Spark 简介 Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,拥有Hadoop MapReduce所具有的优点 阅读全文
posted @ 2019-05-23 23:02 大数据工程师8 阅读(685) 评论(0) 推荐(1) 编辑
摘要: 欢迎关注作者:大数据教程,AI教程、学习资源、论文解读,你想看的都在这里!最近不少同学跃跃欲试,想投入 AI 的怀抱,但苦于不知如何下手。其中,人工智能的核心就是机器学习(Machine Learning),它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 我们今天就来分享一篇来自 E 阅读全文
posted @ 2019-05-23 15:38 大数据工程师8 阅读(1367) 评论(0) 推荐(1) 编辑