摘要: ''' 语音识别:声音的本质是震动,震动的本质是位移关于时间的函数,波形文件(.wav)中记录了不同采样时刻的位移。 通过傅里叶变换,可以将时间域的声音函数分解为一系列不同频率的正弦函数的叠加,通过频率谱线的特殊分布, 建立音频内容和文本的对应关系,以此作为模型训练的基础。 梅尔频率倒谱系数(MFCC)通过与声音内... 阅读全文
posted @ 2019-07-24 22:16 一如年少模样 阅读(416) 评论(0) 推荐(0) 编辑
摘要: # 模拟业务场景 reviews = [ 'It is an amazing movie.', 'This is a dull movie. I would never recommend it to anyone.', 'The cinematography is pretty great in this movie.', 'The direction was ... 阅读全文
posted @ 2019-07-24 19:58 一如年少模样 阅读(1072) 评论(0) 推荐(0) 编辑
摘要: ''' 自然语言处理(NLP) 词袋模型:一句话的语义很大程度取决于某个单词出现的次数,所以可以把句子中所有可能出现的单词作为特征名, 每一个句子为一个样本,单词在句子中出现的次数为特征值构建数学模型,称为词袋模型。 例如: 1 The ... 阅读全文
posted @ 2019-07-24 08:11 一如年少模样 阅读(3761) 评论(0) 推荐(0) 编辑