摘要:
真理越辩越明,见惯了大数据的照本宣科,来体会一下大数据论战的真到真枪吧。 阅读全文
摘要:
社区的力量是巨大的,开源的诱惑也 是魅力无穷,靠忽悠无法长久的云计算已是昨日黄花,IT新贵的发力点聚焦大数据,言必称大数据,语必谈数据黄金,更有甚者,高唱2013是大数据元 年,2014必将是大数据爆发的一年。而企业也已躁动不安,纷纷举旗遥相呐喊:“大数据我来了”。在此给这些企业泼盆冷水,降降温度。让大数据回归理性。 阅读全文
摘要:
本章节由《Hadoop专业解决方案群:313702010》翻译小组完成,为小组校验稿,已经通过小组内部校验通过,特此面向网络征集意见,如果对本章节内容有任何异议,请在评论中加以说明,说明时,请标明行号,也可以以修订的方式,发送给我。非常感谢。 阅读全文
摘要:
第13章Hadoop的发展趋势
本章节将介绍的内容:
1.了解当前以及新兴的MapReduce的DSLs
2.了解更高效,高扩展性的程序改进
3.回顾安全性方面的功能改进
4.了解最新的趋势 阅读全文
摘要:
本课程是大数据高级培训课程,主要面向企业中层及以上管理人员,IT战略规划部门。理论联系实际,就大数据的应用方向,演进路线和企业大数据战略规划进行探讨,结合完整的大数据项目实施案例,进行讲解。旨在帮助企业IT战略决策部门解决大数据时代,企业大数据战略面临的各种问题:是否需要大数据?为何要上大数据?大数据能够给企业带来什么样的价值和意义?大数据平台如何和企业现有业务系统进行整合? 阅读全文
摘要:
flume-ng是一个分布式、高可靠和高效的日志收集系统,flume-ng是flume的新版本的意思,其中“ng”意为new generate(新一代),目前来说,flume-ng 1.4是最新的版本。flume-ng与flume相比,发生了很大的变化,因为之前一直在flume0.9的版本,一直没有升级到flume-ng,最近因为项目需要,做了一次升级,发现了一些问题,特记录下来,分享给大家。 阅读全文
摘要:
Hive元数据存储可以放到RDBMS数据库中,本文以Hive与MySQL数据库的整合为目标,详细说明Hive与MySQL的整合方法。 阅读全文
摘要:
Heritrix3.X与1.X版本变化比较大,基于此带来的Extractor定向扩展方法也受到影响,自定义扩展方面因为接口的变化受阻,从而萌生了通用网络信息采集器设计的想法。一直没有一个好的网络信息采集器,必须能够适应下载对象的多样性和下载内容的复杂性。比如需要同时下载100多家主流媒体的新闻信息,并解析入库等。本文围绕通用网络信息采集器的设计展开。 阅读全文
摘要:
最近各种客户咨询项目中,往往涉及大数据引入必要性和价值意义的深层次挖掘,用后有数据,有平台,但是不知到底要不要上大数据,为何要上大数据和大数据可以带来哪些价值和意义。本文关于大数据的必要性进行阐述,来源实际项目,算是分享吧。 阅读全文
摘要:
一、招募启事招募贴:Hadoop专业解决方案招募义务翻译人员,英文原著名称:《Wrox.Professional.Hadoop.Solutions》。愿意参与到此项工作中来的请加群:313702010欢迎大家踊跃报名。二、图书大纲中文部分:chapter1:大数据和Hadoop生态圈 1.1当大数据遇到Hadoop 1.2Hadoop生态圈 1.3Hadoop核心组件 1.4Hadoop版本分发 1.5 基于Hadoop开发企业级应用chapter2:数据存储之Hadoop 2.1 HDFS 2.2 HBase 2.3 HDFS和HBase相结合,进行实际数据存储 2.4 ... 阅读全文