后处理逻辑整理
1. 文字处理(WordPro) -|编码转换 -|映射参数存储 -|文字转音素序列 -|转换中间计算 2. 特征处理(c++库或) -| 特征矩阵保存计算 -| 特征矩阵平滑 -| 特征矩阵转mel图计算 3. 波形处理(c++库) -| 进行首末尾silence剔除:librosa.effects.trim -|固定参数:trim_top_db=50,trim_fft_size=2048, trim_hop_size=512 -| -| 计算去预加重过滤 -| 波形平滑
-|1.分段: 活动语音样本检测分段。
-|2.样本均值: 计算每个分段的样本均值。
-|3.分段均值: 计算上一步分段均值的均值。
-|4.平滑: 当前活动样本*分段均值/当前样本均值。
-| 能量对齐
-|取绝对值最大值
-|采样/max
-|*32767
-|float32转int6