摘要: metrics的简单介绍 metrics是一种性能指标工具,有很多开源工具使用之来来作为其性能监控,如Hadoop,Kafka,Spark,JStorm等。 metrics使用最主要有三个东西: Metric Registries Metrics 度量指标的类型 Metrics Report 数据展 阅读全文
posted @ 2019-04-16 20:40 兴风作浪 阅读(2745) 评论(0) 推荐(0) 编辑
摘要: 1、cube简称数据魔方,可以实现hive多个任意维度的查询,cube(a,b,c)则首先会对(a,b,c)进行group by,然后依次是(a,b),(a,c),(a),(b,c),(b),(c),最后在对全表进行group by,他会统计所选列中值的所有组合的聚合 select device_i 阅读全文
posted @ 2019-04-16 16:19 兴风作浪 阅读(1469) 评论(0) 推荐(0) 编辑
摘要: 一. 显示地展示当前使用的数据库 hive> set hive.cli.print.current.db=true; ̶ 切换当前的数据库 hive(default)> USE hduser4801; ̶ 使Hive显示列头 set hive.cli.print.header=true; ̶ 创建数 阅读全文
posted @ 2019-04-16 16:03 兴风作浪 阅读(1112) 评论(0) 推荐(0) 编辑
摘要: line = "12r45ofjo13jr3 3j"print line[0:3].isdigit()返回:false line = "12345ofjo13jr3 3j"print line[0:3].isdigit()返回:trueisdigit是返回line[0:3]是否全为数字,若全为数字则 阅读全文
posted @ 2019-04-16 15:08 兴风作浪 阅读(560) 评论(0) 推荐(0) 编辑