摘要: 在大规模数据量的数据分析及建模任务中,往往针对全量数据进行挖掘分析时会十分耗时和占用集群资源,因此一般情况下只需要抽取一小部分数据进行分析及建模操作。Hive提供了数据取样(SAMPLING)的功能,能够根据一定的规则进行数据抽样,目前支持数据块抽样,分桶抽样和随机抽样,具体如下所示: 1. 数据块 阅读全文
posted @ 2022-04-25 11:44 Linux运维阿铭 阅读(230) 评论(0) 推荐(0) 编辑
摘要: Ant Design 项目链接:Ant Design 包大小(来自 BundlePhobia):缩小后 1.2mB,缩小 +gzip 压缩后 349.2kB,通过摇树减少体积。 优点: AntDesign 随附了大量支持文档,有一个社区,包括一个带有预制模板的单独项目(AntDesignPro); 阅读全文
posted @ 2022-04-25 11:36 Linux运维阿铭 阅读(812) 评论(0) 推荐(0) 编辑
摘要: 一、POI简介(Apache POI) 1、什么是POI Apache POI是Apache软件基金会的开放源码函式库,POI提供API给Java程序对Microsoft Office格式档案读和写的功能。 HSSF - 提供读写Microsoft Excel格式档案的功能。(.xls) XSSF 阅读全文
posted @ 2022-04-25 11:19 Linux运维阿铭 阅读(95) 评论(0) 推荐(0) 编辑