吴文杰的个人github博客

随笔分类 -  大数据

摘要:2015年提出基于在线实时和离线计算的云计算在线直播系统 ArcSoft介绍:你们没听过这家公司,但是你们肯定用过他的服务。(三星、小米、vivo oppo 还有最著名的苹果第一个提出人脸识别 face id 只要用到手机摄像头、需要美颜的都有他的存在) 1.什么是大数据 2.大数据的组件运用 需求 阅读全文
posted @ 2020-12-31 11:49 我是2货呀 阅读(119) 评论(0) 推荐(0) 编辑
摘要:HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于B 阅读全文
posted @ 2020-03-24 15:50 我是2货呀 阅读(398) 评论(0) 推荐(0) 编辑
摘要:大数据实时流式数据处理是大数据应用中最为常见的场景,与我们的生活也息息相关,以手机流量实时统计来说,它总是能够实时的统计出用户的使用的流量,在第一时间通知用户流量的使用情况,并且最为人性化的为用户提供各种优惠的方案,如果采用离线处理,那么等到用户流量超标了才通知用户,这样会使得用户体验满意度降低,这 阅读全文
posted @ 2020-03-24 09:44 我是2货呀 阅读(934) 评论(0) 推荐(0) 编辑
摘要:ODPS(Open Data Processing Service),是阿里巴巴通用计算平台提供的一种快速、完全托管的 GB/TB/PB 级数据仓库解决方案,现在已更名为MaxCompute,MaxCompute 向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数 阅读全文
posted @ 2020-03-24 09:29 我是2货呀 阅读(376) 评论(0) 推荐(0) 编辑
摘要:文件系统 数据存储 内存技术 数据搜集 消息系统 数据处理 查询引擎 分析和报告工具 调度与管理服务 机器学习 开发平台 文件系统 HDFS Hadoop Distributed File System,简称HDFS,是一个分布式文件系统。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HD 阅读全文
posted @ 2020-03-24 09:23 我是2货呀 阅读(218) 评论(0) 推荐(0) 编辑
摘要:参考美团文档:https://tech.meituan.com/2017/04/21/mt-leaf.html Twitter-Snowflake算法产生的背景相当简单,为了满足Twitter每秒上万条消息的请求,每条消息都必须分配一条唯一的id,这些id还需要一些大致的顺序(方便客户端排序),并且 阅读全文
posted @ 2019-01-22 17:17 我是2货呀 阅读(1173) 评论(0) 推荐(1) 编辑

Live2D
点击右上角即可分享
微信分享提示