AWS DAS认证考点整理(Redshift篇)

Copy命令

  1. Copy命令优化手段: 压缩, 2. 对大文件进行分割,一次copy多个文件。(文件数对应slice个数)3. 使用temporary staging table(这种方法的本质利用table的drop和create代替delete, update,insert,因为后者是DML会触发事务。)
  2. Copy命令如果文件过多,可以使用manifest文件。
  3. Reshift Copy可以直接从S3和DynamoDB导入数据。
  4. DynamoDB encryption client只加密某几列,Redshift Copy命令不能解密,需要用DynamoDB stream+Lambda。
  5. Redshift copy对应slices数量,slice是一片内存和计算资源,一个node有多个slice。

信息安全

  1. Redshift日志本身加密=对日志的S3加密。
  2. Redshift enable HSM加密,必须新启动一个集群,已创建的集群无法enable。(classic resize)
  3. Redshift连On-Premises HSM用VPN
  4. Reshift column level access control=Grant SQL command。Row-level=SQL(CREATE POLICY&Attach)
  5. Query级别日志=audit logging

资源管理

  1. Redshift Concurrency Scaling:按需另起一个集群实现快速扩容,它支持读操作和少部分写操作比如insert。Concurrency Scaling比elastic resize更方便高效。
  2. Redshift resize类型:classic新建一个集群然后数据迁移,elastic新增一个节点,比classic快。两者都可以更改node类型,此时会先创建snapshot再迁移倒新集群。
  3. Redshift dense compute=SSD, CPU好,内存大,dense storage=HDD,存储大。
  4. Redshift auto vaccum会有通知,如果没有通知则vaccum可能被阻塞无法执行,导致查询慢。
  5. 不常用的数据放到S3里用Spectrum读取。
  6. RA3 nodes利用S3扩容。
  7. Redshift WLM query monitoring rules设定规则对满足条件的query进行特定action,比如abort。一个rule包括name,predicate(谓词)和action。
  8. WLM另一个功能小query优先执行。

其他

  1. Redshift使用federate query跨VPC用VPC peering 
posted @ 2022-11-27 21:51  爱知菜  阅读(45)  评论(0编辑  收藏  举报