[DB] 数据量

某光伏电站项目

  • 7488个组件,容量2396kWp,单片功率320Wp,每24个一串,每13个串接入一台逆变器,共24台100kW组串式逆变器
  • 10个方阵各3台逆变器1个月的5min间隔有功功率运行数据,数据量 8.5M

 贝壳找房

  • 产品技术团队:1000人
  • 日志流式数据:线上服务2000个
  • 埋点数据:APP、web端上报经纪人、用户行为,通过前端埋点上报
  • 业务数据:kafka消息队列产生实时业务数据
  • YARN平台:700个节点,1000多个实时任务,每天消息量千亿级,单峰单个任务百万条/s

58同城

  • Hadoop离线计算平台:4000+服务器,数百PB存储,日40万计算任务
  • HDFS日240T数据接入,共计150PB数据存储
  • MR/Spark每日计算任务40万+,中间处理数据量14P
  • 冷数据用GZIP压缩,热数据用LZO压缩
  • 离线Hbase集群,80台RS,100+表

 滴滴

  • 流计算业务50多个,集群1000+,计算任务3000+,每天处理数据万亿条

 

posted @   cxc1357  阅读(163)  评论(0编辑  收藏  举报
编辑推荐:
· 智能桌面机器人:用.NET IoT库控制舵机并多方法播放表情
· Linux glibc自带哈希表的用例及性能测试
· 深入理解 Mybatis 分库分表执行原理
· 如何打造一个高并发系统?
· .NET Core GC压缩(compact_phase)底层原理浅谈
阅读排行:
· 手把手教你在本地部署DeepSeek R1,搭建web-ui ,建议收藏!
· 新年开篇:在本地部署DeepSeek大模型实现联网增强的AI应用
· Janus Pro:DeepSeek 开源革新,多模态 AI 的未来
· 互联网不景气了那就玩玩嵌入式吧,用纯.NET开发并制作一个智能桌面机器人(三):用.NET IoT库
· 【非技术】说说2024年我都干了些啥
历史上的今天:
2020-07-29 [bug] MapReduce卡死
2020-07-29 [bug] Container killed on request. Exit code is 143
点击右上角即可分享
微信分享提示