摘要: Kafka中存在大量的延迟操作,比如延迟生产、延迟拉取以及延迟删除等。Kafka并没有使用JDK自带的Timer或者DelayQueue来实现延迟的功能,而是基于时间轮自定义了一个用于实现延迟功能的定时器(SystemTimer)。JDK的Timer和DelayQueue插入和删除操作的平均时间复杂 阅读全文
posted @ 2018-06-06 15:07 jingluodashu 阅读(2139) 评论(1) 推荐(0) 编辑
摘要: Hadoop是由Apache基金会开发的一个大数据分布式系统基础架构,最早版本是2003年原Yahoo!DougCutting根据Google发布的学术论文研究而来。 用户可以在不了解分布式底层细节的情况下,轻松地在Hadoop上开发和运行处理海量数据的应用程序。低成本、高可靠、高扩展、高有效、高容 阅读全文
posted @ 2018-06-05 16:23 jingluodashu 阅读(532) 评论(0) 推荐(0) 编辑
摘要: 在又是就业的高峰期了,我公司天天都有过来面试的,这不大学生们也都毕业了,今天这位小伙子就是个奇葩,面试不好好做酷炫特效或者能够让面试官眼前一辆的代码,却画起了画,面试官表示: 相信有很多学习大数据的道友,在这里我给大家说说我滴群哦,大数据海量知识分享,784789432.在此我保证,绝对大数据的干货 阅读全文
posted @ 2018-06-04 19:41 jingluodashu 阅读(1674) 评论(0) 推荐(0) 编辑
摘要: 目前,市场上的大数据产品太多,但远远低于IAAS的标准化水平,各产品之间的差异还不十分清楚。当许多公司正在制造大数据平台或大数据解决方案时,他们往往不知道选择哪些产品来满足他们的需求。一般的做法是做研究、学习、建造环境、测试和整合各种产品,但通常这个过程很长,而且成本很高。如果你想了解大数据的学习路 阅读全文
posted @ 2018-06-04 15:24 jingluodashu 阅读(606) 评论(0) 推荐(0) 编辑
摘要: 微服务的诞生并非偶然,它是在互联网高速发展,技术日新月异的变化以及传统架构无法适应快速变化等多重因素的推动下诞生的产物。 微服务的诞生并非偶然,它是在互联网高速发展,技术日新月异的变化以及传统架构无法适应快速变化等多重因素的推动下诞生的产物。互联网时代的产品通常有两类特点:需求变化快和用户群体庞大, 阅读全文
posted @ 2018-06-03 21:48 jingluodashu 阅读(230) 评论(0) 推荐(0) 编辑
摘要: 1.Docker简介 1.1虚拟化 1.1.1什么是虚拟化 在计算机中,虚拟化(英语:Virtualization)是一种资源管理技术,是将计算机的各种实体资源,如服务器、网络、内存及存储等,予以抽象、转换后呈现出来,打破实体结构间的不可切割的障碍,使用户可以比原本的组态更好的方式来应用这些资源。这 阅读全文
posted @ 2018-06-03 20:30 jingluodashu 阅读(468) 评论(0) 推荐(0) 编辑
摘要: 前言 “当你不创造东西时,你只会根据自己的感觉而不是能力去看待问题。” – WhyTheLuckyStiff 汇总一些自己在大数据路上走过的弯路,愿大家不再掉坑… 1.分布式存储 传统化集中式存储存在已有一段时间。但大数据并非真的适合集中式存储架构。Hadoop设计用于将计算更接近数据节点,同时采用 阅读全文
posted @ 2018-06-02 19:08 jingluodashu 阅读(1544) 评论(0) 推荐(0) 编辑
摘要: hadoop安全目录: kerberos(已发布) elasticsearch(已发布)http://blog.51cto.com/chenhao6/2113873 knox oozie ranger apache sentry 简介: 从运维青铜到运维白银再到运维黄金,这里就要牵扯到方向问题也就是 阅读全文
posted @ 2018-06-02 18:04 jingluodashu 阅读(429) 评论(0) 推荐(0) 编辑