开发必会系列:JavaEE持久层框架对比与hibernate主键生成策略总结
一、持久层框架对比
ORM框架:即对象关系映射。它把数据库表映射到pojo类,然后通过对类的操作来实现对数据库的增删改查,sql语句自动生成。
对于代码开发者来说,就是在代码里先创建数据库连接对象,然后写你想执行的sql,把变化的字段空出来,然后用你刚创建的数据库连接对象,调用一个方法,把你的sql作为参数传给这个方法,你就能得到一个prepareStatement对象,这个方法干的事儿,叫做sql解析,意思就是数据库系统DBMS已经生成了这sql的执行计划,就等着你给它传那些变化的参数了,因为DBMS在你没给它参数的时候,它就解析过了sql,而sql注入是发生在sql解析时的,所以这就避免了sql注入。最后再用这个prepareStatement对象set各种变化的参数,再调用execute方法一执行,就完事了。
ORM,其实很符合Java的思想,啥都是对象,你执行sql就是创建个对象,然后set它的各种属性,所以Java在1.5版本时,提出了JPA规范,叫Java持久层API,这个相当于轿车轮毂的尺寸,ISO标准组织呼吁为了省材料,咱们全球要一样,于是定了个规范,这样谁想开个轮胎厂,直接按这个轮毂尺寸表,生产对应的轮胎就行了,哪个牌子的轿车都能用。Java为如何操作数据库,提供了一个规范,里面是一些接口,各种ORM领域的厂商实现这些接口,然后封装成产品,就能给人用了,厂商里这些年做的最大的就是hibernate,大到可以参与JPA规范的制定。后来,spring那家厂子,也出了持久化的产品,spring data ,封装了对各种存储产品的操作,比如redis呀,mongoDB呀,oracle呀等等,其中有个叫spring data JPA,它也属于ORM领域,它就是基于hibernate实现的。
我刚工作的时候,一直用hibernate,后来springboot兴起,不让有那么多配置文件,就用了spring data JPA。
ibatis是个不完整的ORM框架,是半自动的框架。它与hibernate相比最大的优势在于sql语句的灵活性。只要在配置文件里写出想要的sql语句,和查出的数据所对应的实体类,就行。它不像hibernate需要严格遵循数据库规则。ibatis是Apache这个组织的开源产品,后来升级了,变成了mybatis,通俗讲就是又封装了一部分操作,用起来更简单方便了。
虽然mybatis特色是能自己写各种sql,但要注意sql注入问题。在mybatis用来放sql语句的mapper.xml配置文件里,如果你在放参数的位置,用${},那就会把前端传来的参数,直接拼到sql中,这会造成sql注入,但是,用#{},它就会把你传的参数当做字符串处理,就不用担心sql注入了,为什么呢?因为mybatis的底层实现,对于用#{}的地方,也用的是底层JDBC的prepareStatement对象,去操作的,因为预编译了,所以安全。
二、hibernate主键生成策略
以前总是很迷惑各种主键策略有啥区别,不懂也不敢放心用,这次总结一下:
1、assigned
主键由外部程序负责生成,在 save() 之前必须手动赋一个值。Hibernate不负责维护主键生成。
<id name="id" column="id"> <generator class="assigned" /> </id>
特点:可以跨数据库,人为控制主键生成,应尽量避免。
2、Increment
由Hibernate从数据库中取出主键的最大值(每个session只取1次),以该值为基础,每次增量为1,在内存中生成主键,不依赖于底层的数据库,因此可以跨数据库。
<id name="id" column="id"> <generator class="increment" /> </id>
Hibernate调用org.hibernate.id.IncrementGenerator类里面的generate()方法,使用select max(idColumnName) from tableName语句获取主键最大值。该方法被声明成了synchronized,所以在一个独立的Java虚拟机内部是没有问题的,然而,在多个JVM同时并发访问数据库select max时就可能取出相同的值,再insert就会发生Dumplicate entry的错误。所以只能有一个Hibernate应用进程访问数据库,否则就可能产生主键冲突,所以不适合多进程并发更新数据库,适合单一进程访问数据库,不能用于群集环境。
官方文档:只有在没有其他进程往同一张表中插入数据时才能使用,在集群下不要使用。
特点:跨数据库,不适合多进程并发更新数据库,适合单一进程访问数据库,不能用于群集环境。
3、hilo
hilo(高低位方式high low)是hibernate中最常用的一种生成方式,需要一张额外的表保存hi的值。保存hi值的表至少有一条记录(只与第一条记录有关),否则会出现错误。可以跨数据库。
4、seqhilo
与hilo类似,通过hi/lo算法实现的主键生成机制,只是将hilo中的数据表换成了序列sequence,需要数据库中先创建sequence,适用于支持sequence的数据库,如Oracle。
<id name="id" column="id"> <generator class="seqhilo"> <param name="sequence">hibernate_seq</param> <param name="max_lo">100</param> </generator> </id>
特点:与hilo类似,只能在支持序列的数据库中使用。
5、sequence
采用数据库提供的sequence机制生成主键,需要数据库支持sequence。如oralce、DB、SAP DB、PostgerSQL、McKoi中的sequence。MySQL这种不支持sequence的数据库则不行(可以使用identity)。
<generator class="sequence"> <param name="sequence">hibernate_id</param> </generator> <param name="sequence">hibernate_id</param> 指定sequence的名称
Hibernate生成主键时,查找sequence并赋给主键值,主键值由数据库生成,Hibernate不负责维护,使用时必须先创建一个sequence,如果不指定sequence名称,则使用Hibernate默认的sequence,名称为hibernate_sequence,前提要在数据库中创建该sequence。
特点:只能在支持序列的数据库中使用,如Oracle。
6、identity
identity由底层数据库生成标识符。identity是由数据库自己生成的,但这个主键必须设置为自增长,使用identity的前提条件是底层数据库支持自动增长字段类型,如DB2、SQL Server、MySQL、Sybase和HypersonicSQL等,Oracle这类没有自增字段的则不支持。
<id name="id" column="id"> <generator class="identity" /> </id>
例:如果使用MySQL数据库,则主键字段必须设置成auto_increment。
id int(11) primary key auto_increment
特点:只能用在支持自动增长的字段数据库中使用,如MySQL。
7、native
native由hibernate根据使用的数据库自行判断采用identity、hilo、sequence其中一种作为主键生成方式,灵活性很强。如果能支持identity则使用identity,如果支持sequence则使用sequence。
<id name="id" column="id"> <generator class="native" /> </id>
例如MySQL使用identity,Oracle使用sequence
注意:如果Hibernate自动选择sequence或者hilo,则所有的表的主键都会从Hibernate默认的sequence或hilo表中取。并且,有的数据库对于默认情况主键生成测试的支持,效率并不是很高。
使用sequence或hilo时,可以加入参数,指定sequence名称或hi值表名称等,如
<param name="sequence">hibernate_id</param>
特点:根据数据库自动选择,项目中如果用到多个数据库时,可以使用这种方式,使用时需要设置表的自增字段或建立序列,建立表等。
8、uuid
UUID:Universally Unique Identifier,是指在一台机器上生成的数字,它保证对在同一时空中的所有机器都是唯一的。按照开放软件基金会(OSF)制定的标准计算,用到了以太网卡地址、纳秒级时间、芯片ID码和许多可能的数字,标准的UUID格式为:
xxxxxxxx-xxxx-xxxx-xxxxxx-xxxxxxxxxx (8-4-4-4-12)
其中每个 x 是 0-9 或 a-f 范围内的一个十六进制的数字。
<id name="id" column="id"> <generator class="uuid" /> </id>
Hibernate在保存对象时,生成一个UUID字符串作为主键,保证了唯一性,但其并无任何业务逻辑意义,只能作为主键,唯一缺点长度较大,32位(Hibernate将UUID中间的“-”删除了)的字符串,占用存储空间大,但是有两个很重要的优点,Hibernate在维护主键时,不用去数据库查询,从而提高效率,而且它是跨数据库的,以后切换数据库极其方便。
特点:uuid长度大,占用空间大,跨数据库,不用访问数据库就生成主键值,所以效率高且能保证唯一性,移植非常方便,推荐使用。
9、guid
GUID:Globally Unique Identifier全球唯一标识符,也称作 UUID,是一个128位长的数字,用16进制表示。算法的核心思想是结合机器的网卡、当地时间、一个随即数来生成GUID。从理论上讲,如果一台机器每秒产生10000000个GUID,则可以保证(概率意义上)3240年不重复。
<id name="id" column="id"> <generator class="guid" /> </id>
Hibernate在维护主键时,先查询数据库,获得一个uuid字符串,该字符串就是主键值,该值唯一,缺点长度较大,支持数据库有限,优点同uuid,跨数据库,但是仍然需要访问数据库。
注意:长度因数据库不同而不同
MySQL中使用select uuid()语句获得的为36位(包含标准格式的“-”)
Oracle中,使用select rawtohex(sys_guid()) from dual语句获得的为32位(不包含“-”)
特点:需要数据库支持查询uuid,生成时需要查询数据库,效率没有uuid高,推荐使用uuid。
注意:对于主键生成策略,面试题: 要知道indentity、uuid、native、increment、assigned、sequence 这几个如何使用;
Mysql:自增 indentity 手动填:native
Oracle:自增:sequence 手动填:assigned
结束。