假期总结TABLESAMPLE函数

进行随机抽样,本质上就是用TABLESAMPLE函数 语法1,基于随机分桶抽样: SELECT ... FROM tbl TABLESAMPLE(BUCKET x OUT OF y ON(colname | rand())) y表示将表数据随机划分成y份(y个桶) x表示从y里面随机抽取x份数据作为取样 colname表示随机的依据基于某个列的值 rand()表示随机的依据基于整行 示例: SELECT username, orderId, totalmoney FROM itheima.orders TABLESAMPLE(BUCKET 1 OUT OF 10 ON username); SELECT * FROM itheima.orders TABLESAMPLE(BUCKET 1 OUT OF 10 ON rand()); 注意: 使用colname作为随机依据,则其它条件不变下,每次抽样结果一致 使用rand()作为随机依据,每次抽样结果都不同

posted @ 2023-08-11 21:57  哈哈哈老先生  阅读(160)  评论(0编辑  收藏  举报