摘要: MaxCompute表设计最佳实践 产生大量小文件的操作 MaxCompute表的小文件会影响存储和计算性能,因此我们先介绍下什么样的操作会产生大量小文件,从 而在做表设计的时候考虑避开此类操作。 使用MaxCompute Tunnel SDK上传数据,上传过程中,每commit一次就会产生一个文件 阅读全文
posted @ 2018-12-19 15:20 zhaowei121 阅读(658) 评论(0) 推荐(1) 编辑
摘要: 概述 最近,Amazon新推出了完全托管的时间序列数据库Timestream,可见,各大厂商对未来时间序列数据库的重视与日俱增。阿里云TSDB是阿里巴巴集团数据库事业部研发的一款高性能分布式时序时空数据库,在即将过去的2018年,我们对TSDB进行了多次的系统架构改进,引入了倒排索引、无限时间线支持 阅读全文
posted @ 2018-12-19 15:16 zhaowei121 阅读(1194) 评论(0) 推荐(0) 编辑
摘要: 本文档围绕如何将您其他云厂商上的数据迁移到阿里云,提供了多个场景的实践方案。 文档合集 AWS 数据迁移至阿里云 Amazon S3数据迁移到OSS 从AWS RDS迁移MySQL到阿里云RDS AWS S3迁移到OSS(在线迁移服务) Azure数据迁移至阿里云 Azure Blob迁移到OSS 阅读全文
posted @ 2018-12-19 15:12 zhaowei121 阅读(214) 评论(0) 推荐(0) 编辑
摘要: 基本介绍及应用场景 Tunnel是MaxCompute提供的离线批量数据通道服务,主要提供大批量离线数据上传和下载,仅提供每次批量大于等于64MB数据的场景,小批量流式数据场景请使用DataHub实时数据通道以获得更好的性能和体验。 SDK上传最佳实践 构造器举例说明: PartitionSpec( 阅读全文
posted @ 2018-12-19 15:09 zhaowei121 阅读(575) 评论(0) 推荐(0) 编辑
摘要: 表的限制项 表(Table)设计规范 表设计主要目标 表设计的影响 表设计步骤 表数据存储规范 按数据分层规范数据生命周期 按数据的变更和历史规范数据的保存 数据导入通道与表设计 分区设计与逻辑存储的对应 表和分区设计基本规则 分区设计 分区字段和普通字段的选择 分区字段定义依据 分区个数定义依据 阅读全文
posted @ 2018-12-19 15:06 zhaowei121 阅读(459) 评论(0) 推荐(0) 编辑