EXPDP、IMPDP规范及常用技巧总结
EXPDP、IMPDP规范及常用技巧总结
一、巧用并行提升速度
在EXPDP/IMPDP过程中,为了提升速度,而使用并行,有人说不就是加个parallel=n参数嘛,但该如何利用该参数做到真正提升速度呢?
1、单表导出导入数据时使用parallel=n参数无效
2、导入(IMPDP)索引过程中是串行的方式,虽然在执行计划中看到建索引时是带并行参数,但建议使用sqlfile参数生成语句的方式建索引,避免因创建了结构后,再导入数据,这样就会变得异常慢。大概步骤如下:
以上可能看起来简单的事变的复杂,步骤多了,本来一个参数能解决的事(实际也不能解决),这个步骤已经经过多次实践,解决索引不能并行建的问题。
3、在线调整并行度
当导出导入动作已经发起后,发现并行还可以加大,或者需要减少,该怎么办?
expdp \'\/ as sysdba\' attach=SYS_EXPORT_SCHEMA_01
再执行paralele n就可以调整。
二、含LOB大表导出技巧
在导出含LOB字段的大表时,表未分区,并且表大小已过TB,在导出过程中经常遇到因undo表空间大小和undo_retention设置保留时间,导致ORA-01555: snapshot too old的报错。那该怎么避免呢?
通过rowid或者主键的方式分批导出(推荐使用rowid)
或者通过如下脚本:
三、多表串行自动化导出导入
有这样一种场景,做OGG初始化时,需要导出导入某个业务不同schema下不同的表,如果表数量比较多的情况下,降低导出导入时对库的压力,可通过以下方式,进行导出导入。
这里可能应用场景并不多,但对于自动化生成脚本可以提供一个很好的参考。
四、进度查询和监控
但领导问你导数进度时,会不会手忙脚乱的,无从查起?当然,作为一个负责任的DBA,实时的知道导出导入的进度,是必须掌握的技能。
1、 查看数据泵作业的运行情况
2、监控数据泵的逻辑备份程度
3、查看数据泵的详细进度
五、性能诊断技巧
在导出导入过程中,偶尔会遇到一些性能问题,可以会因主机资源,数据库版本,PSU版本,datapump本身bug等原因导致。
首先可根据需求判断是在哪个环节出问题,导出/导入元数据还是数据时出现性能问题;是否是导出/导入特定对象遇到性能问题?对于这些问题,MOS上提供了如下3种诊断方法:
以上为MOS提供的诊断方法,可灵活的使用,查询出DataPump进程的SID后可以查询是否有会话阻塞,异常等待事件是什么?比如由于“StreamsAQ: enqueue blocked on low memory”等待事件导致expdp / impdp命令出现严重性能问题,是因为Bug 27634991引起的(在版本19.1及更高版本中修复了)。
六、其它参数技巧
1、巧用括号将参数包含
导入目标库要求换用户名和表名,比如:
remap_schema=scott:test
remap_table= t1:t2 --无括号需多个参数
可直接写成
remap_table=(scott.t1: test.t2) --正确姿势
如果没有括号会怎样呢?
remap_table= scott.t1: test.t2
. . imported "SCOTT"."TEST.T2" 0 KB 0 rows –可看到导入的还是SCOTT用户的表
2、 存储参数的消除
当导入到目标端时,如果表空间不同,需要用remap_tablespace转换表空间,且源端导出的元数据是创建表结构的语句是包含预分配段的,此时会占用很多的表空间,可用以下参数消除存储参数。
transform=segment_attributes:n
使用该参数会将对象段分配在导入目标用户的默认表空间上。
3、预估导数时间
有时想预估导出导入某个对象的时间和消耗,而不想真正导入,可以使用estimate
4、关于压缩compression
在空间不足的情况下,使用compression=all进行压缩导入,压缩比大概是1:6左右,根据导出数据类型的不同会有偏差,使用压缩,导出/导入时,耗时较长。
5、include/exclude包含选择性条件时需注意的点
exclude/include参数用法:
exclude=[object_type]:[name_clause],[object_type]:[name_clause] -->排出特定对象
include=[object_type]:[name_clause],[object_type]:[name_clause] -->包含特定对象
l exclude、include参数不能同时使用,这2个参数相斥
l 使用parfile,可以用多个exclude参数,但只能用一个include参数
l include、exclude参数中,在escape语句中,不能用\作为转义符
6、query参数的使用技巧
直接在命令行输入参数,在linux环境下,所有特殊字符都否要使用\转义
通过用parfile方式,可以不用加转义符(推荐)
7、expdp/impdp其它需要注意问题
expdp/impdp是服务端工具,不能导出sys用户下的对象,只能通过exp/imp客户端工具导出导入;对应表空间的建立,表空间大小分配,归档目录大小(导入会产生很多归档),导入索引时temp表空间的大小,源和目标库的版本(高进低出),字符集是否一致,share pool大小等都是需要考虑的点。
七、源和目标导数比对
查询是否存在报错:grep –i ora- expdp_testdump_20181219.log
grep ^". . exported " exp_testdump_20181219.log|awk '{print $4,$7}'|sed 's/"//g'|sort –n>1.txt
grep ^". . exported " imp_testdump_20181219.log|awk '{print $4,$7}'|sed 's/"//g'|sort –n>2.txt
comm 1.txt 2.txt --比对导出导入记录数是否一致
源和目标对比导出导入对象数是否一致
select owner,object_type,count(*) from dba_objects where owner='SCOTT' group by owner,object_type order by 1,2,3;
八、12c的一些新功能
1、 像表一样导出视图
views_as_tables参数允许把视图当成表导出
2、 transform参数的扩展加强
为减少导入期间减少相关日志的产生,可使用transform=disable_archive_logging:y,(包含表和索引级别)导入后再将日志属性重置为LOGGING。
导入时改变表的LOB存储:TRANFORM参数的LOB_STORAGE子句使得在进行非可传输导入操作时改变表的压缩特性。TRANSFORM=LOB_STORAGE:[SECUREFILE | BASICFILE| DEFAULT | NO_CHANGE]
导入时改变表压缩:TRANSFORM参数的TABLE_COMPRESSION_CLAUSE子句允许表导入过程中动态改变表的压缩特性TRANSFORM=TABLE_COMPRESSION_CLAUSE:[NONE |compression_clause]
3、 导出压缩可指定压缩级别
COMPRESSION_ALGORITHM=[BASIC | LOW | MEDIUM |HIGH]
4、 在安全方面,增加了expdp/impdp的审计功能,已经使用加密导出时,加密口令的增强。
5、数据泵用于PDB和用于非CDB数据库没太大差别,要导出/导入某个PDB时,指定对应的就行userid='/ as sysdba@pdb'
总结:
使用数据泵进行导出导入需要考虑的地方很多,这里是对以往经验的一些总结,文中没有介绍数据泵在传输表空间中相关的内容和技巧,后续补充。也欢迎各位童鞋评论补充。