摘要: 群里的问题 hive表数据量19亿左右(id有少量重复),把id作为es的_id进行写入,发现es中的数据量比hive通过id去重后的数据要多几万条 force merge之后做一次count试试,你看到的数据条数可能包含同一条数据不同版本的。 es小知识点 动态映射 都知道动态映射会创建mappi 阅读全文
posted @ 2022-01-19 16:10 夜旦 阅读(2115) 评论(0) 推荐(0) 编辑