后处理逻辑整理

1. 文字处理(WordPro)
        -|编码转换
        -|映射参数存储
        -|文字转音素序列
        -|转换中间计算
2. 特征处理(c++库或)
       -| 特征矩阵保存计算
       -| 特征矩阵平滑
       -| 特征矩阵转mel图计算
3. 波形处理(c++库)
       -| 进行首末尾silence剔除:librosa.effects.trim
            -|固定参数:trim_top_db=50,trim_fft_size=2048, trim_hop_size=512
            -|
       -| 计算去预加重过滤
       -| 波形平滑
        
-|1.分段: 活动语音样本检测分段。
        -|2.样本均值: 计算每个分段的样本均值。
        -|3.分段均值: 计算上一步分段均值的均值。
        -|4.平滑: 当前活动样本*分段均值/当前样本均值。
    -| 能量对齐
        -|取绝对值最大值
        -|采样/max
        -|*32767
        -|float32转int6

 

posted @ 2020-08-20 20:08  小菜77  阅读(194)  评论(0编辑  收藏  举报