Doris 知识点

列映射的目的主要是描述导入文件中各个列的信息,相当于为源数据中的列定义名称。通过描述列映射关系,我们可以将于表中列顺序不同、列数量不同的源文件导入到 Doris 中。
https://doris.apache.org/zh-CN/docs/dev/data-operate/import/import-scenes/load-data-convert/#列映射

UPDATE 语句目前仅支持 UNIQUE KEY 模型。
https://doris.apache.org/zh-CN/docs/dev/sql-manual/sql-reference/Data-Manipulation-Statements/Manipulation/UPDATE?_highlight=update#description

【重要】COLUMNS FROM PATH AS (c1, c2, ...):用来导入hive中的分区列;doris建对应hive表的时候,将分区列(如果有多个分区列,按顺序)放在最后。
https://doris.apache.org/zh-CN/docs/dev/sql-manual/sql-reference/Data-Manipulation-Statements/Load/BROKER-LOAD/

如果分区是数字类型,可以将分区固定写好,比如:

CREATE TABLE IF NOT EXISTS dws_northstar_ops.table1
(
    weekid bigint
)
ENGINE=OLAP
DUPLICATE KEY(`weekid`)
PARTITION BY RANGE(`weekid`)
(
    PARTITION p2022001 VALUES [("2022001"), ("2022002")),
    PARTITION p2022002 VALUES [("2022002"), ("2022003"))
)
DISTRIBUTED BY HASH(`weekid`) BUCKETS 32
PROPERTIES ("replication_num" = "3");

映射:定义源数据中的列。如果定义的列名和表中的列相同,则直接映射为表中的列。如果不同,则这个被定义的列可以用于之后的转换操作。https://doris.apache.org/zh-CN/docs/dev/data-operate/import/import-scenes/load-data-convert/

posted on 2023-09-13 15:51  cag2050  阅读(42)  评论(0编辑  收藏  举报

导航