[TD笔记]Teradata XML

简介

Teradata数据库 (以下简称TD) 为存储和处理XML数据提供以下支持:

  • XML数据类型,允许用户以紧密二进制形式存储XML内容,用来保留XML文档的信息集
  • 支持常见XML操作,如解析,验证,转换(XSLT)和查询(XPath和XQuery)等和方法
  • 用于查询和转换XML内容的XQuery查询语言
  • 存储过程,允许用户以XML格式发布SQL查询的结果
  • 粉碎功能,允许用户从XML文档中提取值并使用它们来更新数据库表

XML 数据类型

TD为XML数据提供了XML数据类型。你可以像使用其他TD支持的SQL数据类型一样使用它。它可以保留XML文档的信息集,包括从XML验证派生的层次结构信息和类型信息。XML类型可以存储最大2GB的XML数据,并支持XML处理功能。

####创建新的XML类型实例
你可以通过以下方法创建XML类型实例:

  • New 操作符
  • CREATEXML 函数
  • XMLPARSE 函数

例如以下例子,我们假设XML数据以文本形式被载入到customerText表的customerXMLText (VARCHAR或者CLOB类型)的列中。然后我们可以利用New 操作符来从以文本表达的XML数据中创建一个XML实例。

SELECT customerID, (NEW XML(customerXMLText)).XMLEXTRACT('/Customer/Address', NULL)
FROM customerText;

查询的结果如下:

customerID NEW XML(customerXMLText).XMLEXTRACT('/Customer/Address', Null)
-------------------------------------------------------------------------
1 <Address>100 1st Street, San Francisco, CA 94118</Address>

同样地我们也用用CREATEXML来创建相应实例:

SELECT customerID, (CREATEXML(customerXMLText)).XMLEXTRACT('/Customer/Address', NULL)
FROM customerText;

####用法
你可以指定XML类型:

  • 在表定义中
    注意:XML类型是LOB类型,最多一行占用4096个字节。考虑到一个64K的行大小,你可以在单个表上定义不超过15个XML类型的列。
  • 作为存储过程中的IN,OUT或INOUT参数
  • 作为结构化UDT的一部分

INSERT and UPDATE statements can also assign XML type values to columns.

限制

你不能将XML类型指定为:

  • UDF或UDM中的输入参数或结果类型
  • 外部存储过程中的IN,OUT或INOUT参数

UDF,UDM和外部存储过程只能将XML数据处理为VARCHAR,CLOB,VARBYTE或BLOB值; 因此,在将XML值传递给外部例程之前,必须使用XMLSERIALIZE函数将XML值序列化为VARCHAR,CLOB,VARBYTE或BLOB值。 您可以使用CREATEXML函数将外部例程的结果转化为XML类型值。

  • **XML类型可以容纳最大2GB的值。**However, operations like XSLT and XQuery are only supported on documents that are smaller in size where the processing operation does not require more memory than specified by the XML_MemoryLimit DBS Control field.
  • XML类型的列不能:
    • 存在于队列表中
    • 成为索引的一部分
    • 参与JOIN操作
  • 你不能在依赖于排序或比较的子句中使用XML类型的列,例如ORDER BY,GROUP BY或HAVING。
  • 你不能在算术表达式中使用XML值。 XML值可以是一个类型,如xs:int,可用于算术计算。 在这种情况下,您可以将XML值转换为适当的SQL类型来执行计算。
  • XML类型值不具有可比性,不应在关系比较操作中使用(例如>,<,=)。 XML值可以显式转换为其他标量SQL类型,这些类型的值可能是可比较的。 例如,如果已知该值是XML类型xs:int,则可以将其转换为SQL整数数据类型。

注意:因为XML值不具有可比性,所以它们不包含在对行重复的检查中(例如,在插入到一个集表**中)。 这种行为类似于也不参与行重复检查的CLOB / BLOB类型。

  • 尽管XML值的外部表示是字符串类型,但是字符串操作不能直接在XML值上使用。 在应用字符串操作之前,可以对XML进行序列化或强制转换以生成字符串表示。

排序

XML值不具有可比性。 在任何依赖比较值(如ORDER BY,GROUP BY或DISTINCT)的子句中引用XML类型列都会导致错误。

转换

从其他SQL类型转换为XML类型时,an XML value of the nearest xml schema primitive type is created. 。 例如,VARCHAR / CLOB的xs:string和DATE的xs:date。在向另一个方向转换时,XML实例的字符串值应该与目标数据类型兼容。 例如,将xs:date值转换为SQL DATE类型。
以下数据类型支持向和从XML类型转换。
VARCHAR | CLOB | VARBYTE | BLOB | BYTEINT | SMALLINT
INTEGER | DATE | DECIMAL | FLOAT | NUMBER |BIGINT
TIME | TIME WITH TIMEZONE
TIMESTAMP | TIMESTAMP WITH TIMEZONE

注意:从大对象类型(CLOB和BLOB)转换为XML类型受限于其大小,只有小于64K才能成功转换。

####数据迁移
要将存储在VARCHAR或CLOB列中的XML数据迁移到具有XML类型列的等效模式,请执行以下操作:

  1. 验证XML数据是否格式正确,并符合XML格式的规则。
  2. 使用XML类型为保存XML数据的列创建新版本的表。
  3. 使用NEW XML运算符或CREATEXML函数将XML文本插入到XML列中。

####范例
该语句创建一个包含XML类型列customerXML的表:

CREATE TABLE customer (
    customerID INTEGER,
    customerName VARCHAR(256),
    customerXML XML 
)  PRIMARY INDEX (customerID);
posted @ 2019-02-16 12:11  LestatZ  阅读(285)  评论(0编辑  收藏  举报