Copy命令
- Copy命令优化手段: 压缩, 2. 对大文件进行分割,一次copy多个文件。(文件数对应slice个数)3. 使用temporary staging table(这种方法的本质利用table的drop和create代替delete, update,insert,因为后者是DML会触发事务。)
- Copy命令如果文件过多,可以使用manifest文件。
- Reshift Copy可以直接从S3和DynamoDB导入数据。
- DynamoDB encryption client只加密某几列,Redshift Copy命令不能解密,需要用DynamoDB stream+Lambda。
- Redshift copy对应slices数量,slice是一片内存和计算资源,一个node有多个slice。
信息安全
- Redshift日志本身加密=对日志的S3加密。
- Redshift enable HSM加密,必须新启动一个集群,已创建的集群无法enable。(classic resize)
- Redshift连On-Premises HSM用VPN
- Reshift column level access control=Grant SQL command。Row-level=SQL(CREATE POLICY&Attach)
- Query级别日志=audit logging
资源管理
- Redshift Concurrency Scaling:按需另起一个集群实现快速扩容,它支持读操作和少部分写操作比如insert。Concurrency Scaling比elastic resize更方便高效。
- Redshift resize类型:classic新建一个集群然后数据迁移,elastic新增一个节点,比classic快。两者都可以更改node类型,此时会先创建snapshot再迁移倒新集群。
- Redshift dense compute=SSD, CPU好,内存大,dense storage=HDD,存储大。
- Redshift auto vaccum会有通知,如果没有通知则vaccum可能被阻塞无法执行,导致查询慢。
- 不常用的数据放到S3里用Spectrum读取。
- RA3 nodes利用S3扩容。
- Redshift WLM query monitoring rules设定规则对满足条件的query进行特定action,比如abort。一个rule包括name,predicate(谓词)和action。
- WLM另一个功能小query优先执行。
其他
- Redshift使用federate query跨VPC用VPC peering
posted @
2022-11-27 21:51
爱知菜
阅读(
45)
评论()
编辑
收藏
举报