2018年9月17日

摘要: Apache Kylin™是由eBay开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay Inc. 开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。 底层存储用的是HBase,数据输入与cube building 阅读全文

posted @ 2018-09-17 13:50 打杂滴 阅读(406) 评论(0) 推荐(0) 编辑

摘要: 已知文本有三列,整理数据,并导入mysql scala> import org.apache.spark.sql.SQLContextimport org.apache.spark.sql.SQLContext scala> val gitrdd=sc.textFile("/tmp/git.txt" 阅读全文

posted @ 2018-09-17 11:45 打杂滴 阅读(339) 评论(0) 推荐(0) 编辑


Copyright © 2024 打杂滴
Powered by .NET 8.0 on Kubernetes