Pool与PG

PG英文全称 Placement Group，中文称之为归置组

作用：
    PG相当于一个虚拟组件，出于集群伸缩，性能方面的考虑。Ceph将每个存储池分为多个PG，如果存储池为副本池类型，并会给该存储池每个PG分配一个主OSD和多个从OSD，当数据量大的时候PG将均衡的分布行不通集群中的每个OSD上面。

设置PG数量：
    一个Ceph集群中，PG的数量不能随便的设定。而应该合理的设定。通常如果一个集群有个超过50个OSD，建议每个OSD大约有50到100到PG。如果有更大规模的集群，建议每个OSD大约100到200个PG。

    总PG的数量基本计算公式为： (总OSD数*每个OSD计划PG数)/副本数 => 总PG数

    因为总PG数推荐为2的N次幂，计算出来的结果不一定为2的N次幂，需要取比计算结果小的，最近的一个数，并且这个数为2的N次幂。因为2的N次幂计算结果最快，这样可以减少CPU内存的消耗。

    说明：总的PG数=所有Pool中定义的PG数的总和

    假设集群中有50个OSD，按推荐超过50个OSD的RADOS集群推荐的每个OSD的PG数为50到100。计划PG数为60，这时候公式为：(50*60)/3 = 1000 => 512，所以这时候集群中总的PG数量推荐为512个。

    为什么我们定义每个OSD的PG数为60，而不是100?

    如果一个OSD的PG数越多，那么在移动数据的时候会更少，但更浪费CPU的内存。如果一个OSD的PG数越少，这样移动的数据会越多，会对正常的性能产生负面影响。而在OSD之间进行数据持久存储和数据分布需要较多的PG，它们的数据应该减少到最大性能所需要的最小值，也减少CPU和内存资源。这个性能需要根据自身情况而定。 备注：PG所对应的就是实际的存储对象。移动PG就相当于移动数据。

PG觉状态　　

 1 ~]$ ceph pg stat
 2 通常状态为active+clean表示正常。
 3 
 4 ~]$ ceph pg dump
 5 Active：表示主OSD和从OSD都处理就绪状态，可常用提供客户端请求。
 6 Clean：表示主OSD和从OSD都处理就绪状态，所有对象的副本均符合期望。
 7 Peering：通常此状态表示正在将主OSD和从OSD的对象同步一致的过程，如果这个过程完成后，通过状态就为Active。
 8 Degraded：当我某OSD标记为down的时候，这时候映射到此的OSD的PG将进入Degraded（降级）状态，当OSD重新up，并完成Peering后，将重回正常状态。 一旦标记为down超过5分钟，这时候此OSD将被T出集群，Ceph将启动自恢复操作，相当于重新分配PG，直到状态正常。 有时候某个OSD不可用，崩溃的时候也会处此此状态。
 9 Stale：每个OSD都要周期性的向Monitor报千其主OSD所持有的PG最新统计数据。如果因为任何原因某个主OSD主法正常向Monitor报告，或由其它OSD报告某个OSD已经挂了，这时候以以OSD为主的其它OSD都将标记为此状态。
10 Undersized：当PG中的副本数少于其存储池指定的个数的时候，就为此状态。
11 Scrubbing：各OSD还会周期性的检查其持有的数据对象的完性，以确保主和从的数据一致，这时候状态就为此状态。 另外PG偶尔还需要查检确保一个对象的OSD上能按位匹配，这时候状态为scrubbing+deep。
12 Recovering：当添加一个新的OSD到集中中，或者某个OSD宕掉时，PG有要嗵会被重新映射，而这些处理同步过各中的PG则会标记为recovering。
13 Backfilling：新OSD加放到集群后，Ceph会进入数据重新均衡的状态，即一些数据会从现有OSD迁移到新的OSD，这些操作过程即为backfill。
14 存储池的相关操作

︻◣_蝸犇り~

公告