摘要: 模式设计基础 1.表至少有一个主键。 2.只有主键才会被索引。(考虑查询会使用什么作为条件) 3.不能更新主键。 4.只有主键才能被用来做表分区。 主键和列的设计 设计表模式,最重要的一项是决定你的主键。你只能将主键用作分区模式的一部分,但无法更新它们。 其他列可以通过update和upsert选项 阅读全文
posted @ 2020-09-25 17:11 猫七的blog 阅读(7) 评论(0) 推荐(0) 编辑
摘要: KUDU开发 使用MapReduce、Spark或Impala,你可以读取Kudu表并将其写入HDFS KUDU API Kudu以结构化、强类型的方式存储数据,因此可以提供KUDU的SQL访问。 目前你可以Spark Sql来访问和操作数据。还可以使用Impala。Impala是Hadoop生态系 阅读全文
posted @ 2020-09-25 09:49 猫七的blog 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 为什么要使用云端? 当你要部署一个应用的多个副本时,每个副本要有自己的私有数据。 与虚拟机的区别 借助虚拟机你可以在单个主机运行Windows和Linux。虚拟机的缺点在于需要大量的磁盘空间。 比如Linux虚拟机至少需要一个处理核心和1GB内存。Windows虚拟机可能需要两个处理核心和4GB内存 阅读全文
posted @ 2020-09-25 08:13 猫七的blog 阅读(140) 评论(0) 推荐(0) 编辑