KingbaseES file_dw 介绍

file_dw简介

​ file_fdw模块提供外部数据包装器file_fdw, 它能被用来访问服务器的文件系统中的数据文件,或者在服务器上执行程序并读取它们的输出。 数据文件或程序输出必须是能够被COPY FROM读取的格式. 详见COPY。当前只能读取数据文件。

参数设置:

  • filename

    指定要被读取的文件。必须是一个绝对路径名。 必须指定filename或program, 但不能同时指定两个。

  • program

    指定要执行的命令。该命令的标准输出将被读取, 就像使用COPY FROM PROGRAM一样。必须指定program 或filename,但不能同时指定两个。

    注意该命令是由 shell 调用,因此如果你需要传递任何来自不可信来源的 参数给 shell 命令,你必须小心地剥离那些可能对 shell 有特殊意义的特殊字符。出于安全原因,最好使用一个固定的命令字符串,或者至少避免传递任何用户输入到其中。

  • format

    指定数据的格式:text、 csv(逗号分隔值)或者binary。默认是text

  • header

    指定数据是否具有一个头部行,指定文件包含标题行,其中有每一列的名称。在输出时,第一行包含来自表的列名。在输入时,第一行会被忽略。只有使用 CSV格式时才允许这个选项。。

  • delimiter

    指定分隔文件每行中各列的字符。文本格式中默认是一个制表符,而CSV格式中默认是一个逗号。KingbaseES支持设置不大于8个字节的分隔符。使用binary格式时不允许这个选项。

  • quote

    指定数据的引用字符,默认是双引号。这必须是一个单一的单字节字符。只有使用 CSV格式时才允许这个选项。

  • escape

    指定数据的转义字符,这必须是一个单一的单字节字符。只有使用 CSV格式时才允许这个选项。

  • null

    指定数据的空字符串,指定表示一个空值的字符串。文本格式中默认是 \N(反斜线-N),CSV格式中默认是一个未加引用的空串。在你不想区分空值和空串的情况下,即使在文本格式中你也可能更喜欢空串。使用binary格式时不允许这个选项。。

  • encoding

    指定数据的编码,和COPY的ENCODING选项相同。

file_fdw使用

以下测试基于kingbase v8r6版本:

1.将file_fdw 安装为 一个扩展

test=# create extension file_fdw;
CREATE EXTENSION

2.创建一个外部服务接口

test=# create server ser_file_fdw foreign data wrapper file_fdw;
CREATE SERVER

查询已创建的外部服务接口
test=# \des
             外部服务器列表
     名称     | 拥有者 | 外部数据封装器
--------------+--------+----------------
 ser_file_fdw | system | file_fdw
 sysaudit_svr | system | sysaudit_fdw
(2 行记录)

3.通过program方式创建外部表

test=# CREATE FOREIGN TABLE etc_password (
test(#   username  TEXT,
test(#   password  TEXT,
test(#   user_id   INTEGER,
test(#   group_id  INTEGER,
test(#   user_info TEXT
test(# ) SERVER fs OPTIONS (
test(#   PROGRAM 
test(# $$
test$# awk -F: 'NF && !/^[:space:]*#/ {print $1,$2,$3,$4,$5}' OFS='\037' /etc/passwd
test$# $$
test(# , 
test(#   FORMAT 'csv', DELIMITER E'\037'
test(# );
CREATE FOREIGN TABLE
test=# select * from etc_password;
     username     | password | user_id | group_id |                            user_info                            
------------------+----------+---------+----------+-----------------------------------------------------------------
 root             | x        |       0 |        0 | root
 bin              | x        |       1 |        1 | bin
 daemon           | x        |       2 |        2 | daemon
 adm              | x        |       3 |        4 | adm
 lp               | x        |       4 |        7 | lp
 sync             | x        |       5 |        0 | sync
 shutdown         | x        |       6 |        0 | shutdown
 halt             | x        |       7 |        0 | halt
 mail             | x        |       8 |       12 | mail
 operator         | x        |      11 |        0 | operator
 games            | x        |      12 |      100 | games
 ftp              | x        |      14 |       50 | FTP User
 nobody           | x        |   65534 |    65534 | Kernel Overflow User
 systemd-coredump | x        |     999 |      997 | systemd Core Dumper
 systemd-network  | x        |     192 |      192 | systemd Network Management
 systemd-resolve  | x        |     193 |      193 | systemd Resolver
 systemd-timesync | x        |     998 |      996 | systemd Time Synchronization
 tss              | x        |      59 |       59 | Account used by the trousers package to sandbox the tcsd daemon
 unbound          | x        |     997 |      995 | Unbound DNS resolver
 polkitd          | x        |     996 |      994 | User for polkitd
 rtkit            | x        |     172 |      172 | RealtimeKit
 chrony           | x        |     995 |      993 | 
 dhcpd            | x        |     177 |      177 | DHCP server
 sshd             | x        |      74 |       74 | Privilege-separated SSH
 geoclue          | x        |     994 |      990 | User for geoclue
 pulse            | x        |     171 |      171 | PulseAudio System Daemon
 tcpdump          | x        |      72 |       72 | 
 dbus             | x        |     987 |      987 | System Message Bus
 apache           | x        |      48 |       48 | Apache
 kingbase         | x        |    1000 |     1000 | 
 test             | x        |    1001 |     1001 | 
 kdb1             | x        |    1002 |     1002 | 
(32 rows)



​ 4.通过csv创建一个外部表

创建test.csv内容如下

ID    ID2   NAME
2     55   single
6     58   multiple
8     53   single

根据csv文件创建外部表

test=# CREATE FOREIGN TABLE foreign_tab (
test(#   "ID" character varying(50 char) NULL,
test(#   "ID2" integer NULL,
test(#   "NAME" character varying(50 char) NULL
test(# ) SERVER ser_file_fdw
test-# OPTIONS ( filename 'C:\Program Files\Kingbase\ES\V8\data\ECRecord.CSV',format 'csv', HEADER 'TRUE' );
CREATE FOREIGN TABLE

test=# SELECT * FROM FOREIGN_TAB;
 ID | ID2 |   NAME
----+-----+----------
 2  |  55 | Single
 6  |  58 | Multiple
 8  |  53 | Single
(3 行记录)

对外部表的操作,外部表不支持insert ,update和delete操作。

1.连接查询

test=# select * from t1;
 f_rowid | dingdan  | yaopin
---------+----------+--------
       1 | d001     | c001
       3 | d003     | c003
       2 | Single   | c002
       6 | Multiple | c006
      11 | Single   | Single
(5 行记录)

test=# SELECT * FROM foreign_tab f ,t1 b WHERE f.id=b.f_rowid;
 ID | ID2 |   NAME   | f_rowid | dingdan  | yaopin
----+-----+----------+---------+----------+--------
 2  |  55 | Single   |       2 | Single   | c002
 6  |  58 | Multiple |       6 | Multiple | c006
(2 行记录)

2.merge 操作   由于外部表不支持delete insert update操作,merge时外部表只能做参照表

test=# select * from t1;
 f_rowid | dingdan  | yaopin
---------+----------+--------
       1 | d001     | c001
       3 | d003     | c003
       2 | Single   | c002
       6 | Multiple | c006
(4 行记录)


test=# select * from foreign_tab;
 ID | ID2 |   NAME
----+-----+----------
 2  |  55 | Single
 6  |  58 | Multiple
 8  |  53 | Single
(3 行记录)


test=# merge into t1 a using foreign_tab b
test-# on (a."f_rowid" = b.id)
test-# when matched then update set dingdan=b.id2
test-# when not matched then insert values(b.id, b.id2,b.name);
MERGE 3
test=# select * from t1;
 f_rowid | dingdan | yaopin
---------+---------+--------
       1 | d001    | c001
       3 | d003    | c003
       2 | 55      | c002
       6 | 58      | c006
       8 | 53      | Single
(5 行记录)

file_fdw卸载

​ 在ksql中运行drop命令进行卸载 如果有外部表依赖则需要加cascade

test=# drop extension file_fdw;
DROP EXTENSION

存在依赖:
test=# drop extension file_fdw;
错误:  无法删除 扩展 file_fdw 因为有其它对象倚赖它
描述:  服务器 pglog 倚赖于 外部数据封装器 file_fdw
外部表 ECRecord_new 倚赖于 服务器 pglog
外部表 ECRecord_new2 倚赖于 服务器 pglog
外部表 ECRecord_new3 倚赖于 服务器 pglog
外部表 ECRecord_new4 倚赖于 服务器 pglog
提示:  使用 DROP .. CASCADE 把倚赖对象一并删除.
test=# drop extension file_fdw cascade;
注意:  串联删除5个其它对象
描述:  递归删除 服务器 pglog
递归删除 外部表 ECRecord_new
递归删除 外部表 ECRecord_new2
递归删除 外部表 ECRecord_new3
递归删除 外部表 ECRecord_new4
DROP EXTENSION

file_fdw升级

​ file_fdw扩展插件通常随着KingbaseES安装包一并升级。通常情况下用户无须单独升级些插件。

posted @ 2023-02-28 17:39  KINGBASE研究院  阅读(69)  评论(0编辑  收藏  举报