摘要: 当数据集比较大时,可能需要通过采集一部分数据集进行分析,称之为采样。在HQL中支持三种方式的采样:随机采样(random sampling)、分桶表采样(bucket table sampling)以及块采样(block sampling)。 1.随机采样 随... 阅读全文
posted @ 2019-03-02 14:37 大数据技术与数仓 阅读(947) 评论(0) 推荐(0) 编辑