代码改变世界

SQLite数据类型

2012-06-12 22:18  Continue  阅读(609)  评论(0编辑  收藏  举报

大部分SQL数据库引擎使用静态数据类型,数据的类型取决于它的存储单元(即所在的列)的类型。SQLite3采用了动态的数据类型,存储值的数据类型和数值本身相关,而不是由它的字段的类型决定。SQLite3的动态数据类型能够向后兼容其它数据库普遍使用的静态类型,这就意味着,在那些使用静态数据类型的数据库上使用的数据表,在SQLite3上也能被使用。

1.SQLite3具有以下5种存储类别(在这里,存储类别和数据类型有所区别):
        NULL          空值
        INTEGER       带符号整数,根据存入的数值的大小占据1,2,3,4,6或者8个字节
        REAL          浮点数,采用8byte(即双精度)的IEEE格式表示
        TEXT          字符串文本,采用数据库的编码(UTF-8,UTF-16BE 或者UTF-16LE)
        BLOB          无类型,可用于保存二进制文件

存储类别可能比数据类型更加普遍一点,比如INTEGER存储类别,它包含了6种长度不同的整形数,它们在磁盘上的存储方式有一点差别,但当它们被读入内存进行处理的时候,将会被转换为更加普遍的数据类型(8字节有符号数)。所以,大多数时候,“存储类别”和“数据类型”有一些不易觉察的差别,而且他们也能够被交换使用。

SQLite3数据库(SQLite version 3 database)中除了被声明为主键的INTEGER类型的列外,任何列都能够存储属于任一存储类型的数值。

SQL语句中的任何数值,无论它们是被嵌入到SQL语句中的字面值,还是被绑定到预编译过的SQL语句中的参数
有一个隐含的存储类别,在下面所描述的情形中,在执行SQL语句时,数据库引擎可能会在 NUMERIC存储类别(INTEGER 和 REAL) 和 TEXT存储类别间转换这些数值。

1.1 布尔值
    SQLite3没有独立的布尔存储类型,作为替代,布尔值被存储为INTEGER类别 1(true) 0(false)。

1.2 日期,时间
   SQLite没有单独设立存储类型来存储 日期,时间, 或者 日期时间,作为替代,内置的 “时间,日期 函数”(Date And Time Functions)能够以 TEXT,REAL 或者 INTEGER 类别来存储时间日期。

   TEXT        遵循ISO8601 字符串("YYYY-MM-DD HH:MMSS:SSS")
   REAL        按照公历,从现在到格林威治时间的 November 24 B.C
   INTEGER     按照Unix系统时间,从1970-01-01 00:00:00 UTC 到现在的秒数
应用程序能够在这中间选择任意格式来表示时间日期,并且使用内置的时间日期函数在这几种格式之间自由的转换。


2.类型亲和性
    为了在SQLite和其它数据库引擎之间实现兼容性最大化,SQLite 在列上支持“类型亲和性”(原文为Type Affinity)这一概念。列类型亲和性的原意为“为存储在该列的数值推荐的类型”,注意,是推荐而不是必须的,任何列任然能够存储任意类型的数据,仅仅只是当你给它选择的机会时(应该是说当没有明确指定类型时)时,相比其他的存储类型,它更乐意使用的存储类型,这一类型即为列的 亲和性。
    SQLite3数据库中的每一列都被指定了下面所列出的类型亲和性中的一个:
               TEXT
               NUMERIC
               INTEGER
               REAL
               NONE

    具有 TEXT 亲和性的列使用 NULL,TEXT 或者 BLOB存储类别来存储数据,如果数字值(Numeric data)被插入到具有 TEXT 亲和性的列中, 在存储前,它会被转换成文本
    具有 NUMERIC 亲和性的列,有可能会使用上述的五种存储类别,当插入文本数据时,当可以进行无损且可逆的转换时(如果文本中的前15个有效10进制数字能够被保护,转换就被认为是无损且可逆的),文本的存储类别会被转换到 INTEGER 或者 REAL。 为了在 TEXT 和 REAL 存储类别间进行转换,如果无法进行无损且可逆的转换的话,数字将会采用 TEXT 存储类别。不会试图对 NULL存储类别 和 BLOB存储类别 的数值进行转换。
    一个字符串可能看起来像浮点数的十进制指数表示法,但是,只要它能够用整数来表示,NUMERIC 亲和性将会把它转换为整数,因此,字符串“3.0e+5”在具有 NUMRIC 亲和性的列中被存储为整数300000而不是浮点数300000.0 。
    具有 INTEGER 亲和性的列的表现和具有 NUMERIC 亲和性的列一致,唯一明显的差别是在进行表达式计算的时候
    具有 REAL 亲和力的列类似具有 NUMRIC 亲和力的列,但是它强制将整数使用浮点数表示(作为优化手段,存储在具有 REAL 亲和性的列中,没有小数部分且值较小的浮点数,将被当做整数写入到磁盘以节省空间,当从磁盘独处的时候,将会被自动转换为浮点数,这一优化方式对于 SQL 这一层次不可见,并且只有通过检查数据库文件在磁盘扇区上对应的 比特位才能发现它)
    具有 NULL 亲和性的列没有偏好的存储类别,也不会强制转换存储类别。

2.1 列的类型亲和性的决定
   列的亲和性由这一列被声明的类型来决定,它遵从以下顺序规则:
        1.如果声明的类型中含有字符串“INT”,它将具有 INTEGER 亲和性
        2.如果列的类型声明中含有“CHAR”,“CLOB”或者“TEXT”中的任意一个,这一列将具有 TEXT 亲和性。比如 VARCHAR 类型 含有字符串“CHAR”,因此被指定 TEXT 亲和性。
        3.如果列的类型声明中含有字符串“BLOB”或者没有声明类型,它将具有 NULL 亲和性
        4.如果列的类型声明中含有“REAL”,“FLOA”,“DOUB”中的任意一个,它将具有 REAL 亲和性
        5.其他的将具有 NUMERIC 亲和性
   记住这些规则的优先级从上到下,如果一个列的类型被声明为“CHARINT”,它将满足规则1和2,但是按照优先级,它将具有 INTEGER 亲和性。

 

由以上可以看出,SQLite使用的弱数据类型,它将能够存放的数据分:空值(NULL),整数(INTEGER),浮点数(REAL),字符串文本(TEXT),无类型(BLOB),数据的类型是由要存储的数值自身决定的,与列的类型声明无关,事实上,完全可以不声明列的类型,但是为了代码的可阅读性以及兼容其他数据库引擎,不建议缺省列的类型声明。给列声明的类型不决定存储在其中的数据的类型,它主要用于兼容其它的数据库引擎以及决定列的 类型亲和性,便于程序阅读。列的类型亲和性主要决定了存储数据时的转换动作。 

CREATE TABLE TypeTest(C1,C2,C3,C4);
INSERT INTO TypeTest VALUES(1,'Test',1.200,NULL);
INSERT INTO TypeTest VALUES('Test',NULL,2,2.5);
INSERT INTO TypeTest VALUES(2.45,NULL,'Test',1000);

SELECT * FROM TypeTest;
SELECT TYPEOF(C1) AS C1,TYPEOF(C2) AS C2,TYPEOF(C3) AS C3,TYPEOF(C4) AS C4 FROM TypeTest;

 

3.0 比较表达式

         Sqlite v3有一系列有用的比较操作符,包括 "=", "==", "<", "<=", ">", ">=", "!=", "<>", "IN", "NOT IN", "BETWEEN AND", "IS", 和 "IS NOT"


3.1 排序

    比较操作的结果基于操作数的存储类型,根据下面的规则:

  • 存储类型为NULL的值被认为小于其他任何的值(包括另一个存储类型为NULL的值)
  • 一个INTEGER或REAL值小于任何TEXT或BLOB值。当一个INTEGER或REAL值与另外一个INTEGER或REAL值比较的话,就执行数值比较
  • TEXT值小于BLOB值。当两个TEXT值比较的时候,就根据序列的比较来决定结果
  • 当两个BLOB值比较的时候,使用memcmp来决定结果


操作符:

    所有的数学操作符(+, -, *, /, %, <<, >>, &, and |)在执行之前都会先将操作数转换为NUMERIC存储类型,即使在转换过程中可能会造成数据信息的丢失。此外,如果其中一个操作数为NULL,那么它们的结果亦为NULL。在数学操作符中,如果其中一个操作数看上去并不像数值类型,那么它们结果为0或0.0。