摘要:
spark 累加器的理论概念不用多说 原生支持的long/couble数值类加和list,但生产上实际使用场景,map<>类累加的用途非常广泛 class CollectionAccumulator[T] extends AccumulatorV2[T, java.util.List[T]] cla 阅读全文
摘要:
// 21/04/23 17:47:51 WARN AsyncProcess: #43, table=ns:table_test, attempt=1/1 failed=108ops, last exception: org.apache.hadoop.hbase.RegionTooBusyExce 阅读全文
摘要:
创建region,官方提供4种重载 hbase shell 里创建table 就不说了,简单资料也多,最大的坑是版本冲突,或包缺失 例 create 'ns_test:table_test', {NAME => 'cf', COMPRESSION => 'SNAPPY', BLOCKCACHE => 阅读全文
摘要:
读写方式 其实个人最近访问hbase 都是通过shc df/sql 来访问的 df的读写方式,足够覆盖90%的场景,但该方案有一个前提是,明确的知道hbase 的列族和列信息,新项目都会规范这一点,可以使用 但有些历史包袱的项目,列族是明确的,但是列族里的列信息是不明确的,正好要做一个旧项目列的标准 阅读全文