上一页 1 2 3 4 5 6 ··· 8 下一页
摘要: ICASSP 2019 SLP-P11.11 IMPROVING NOISE ROBUSTNESS OF AUTOMATIC SPEECH RECOGNITION VIA PARALLEL DATA AND TEACHER-STUDENT LEARNING 简述 Teacher模型对三音素的离散概率分布用于指导Student模型。由于一般的ASR系统包含数千个三音素,处理一帧将计算数千的... 阅读全文
posted @ 2019-05-30 16:42 JarvanWang 阅读(507) 评论(0) 推荐(0) 编辑
摘要: ICASSP 2019 SLP-P17.3: ATTENTIVE ADVERSARIAL LEARNING FOR DOMAIN-INVARIANT TRAINING(针对领域不变训练的注意力对抗学习) 简介 基于注意力机制的领域不变对抗性训练,用于抑制说话人变量与环境变量,以实现鲁棒ASR。 基于对抗的领域不变性训练(Adversarial Domain-Invarian... 阅读全文
posted @ 2019-05-30 16:36 JarvanWang 阅读(780) 评论(0) 推荐(0) 编辑
摘要: 摘要 BLSTM解码时,解码器需要等待整个音频到达后才开始解码,因为时间反方向的前向传播需要末尾的历史信息。BLSTM这一延时问题使其不适用与实时语音识别。context-sensitive-chunk BLSTM(CSC-LSTM)和latency-controlled BLSTM(LC-BLSTM,延时控制-双向LSTM)都将整句切分为数个chunks。通过在每个chunk中添加左右上下文帧,... 阅读全文
posted @ 2019-04-23 15:48 JarvanWang 阅读(6269) 评论(0) 推荐(0) 编辑
摘要: chainbin/nnet3-chain-train.cc int main(int argc, char *argv[]) { ... Nnet nnet; ReadKaldiObject(nnet_rxfilename, &nnet); bool ok; { fst::StdVectorFst den_fst; ReadFstKaldi(den_fst_r... 阅读全文
posted @ 2019-01-17 10:58 JarvanWang 阅读(2744) 评论(2) 推荐(1) 编辑
摘要: matrix/cblas-wrappers.h 该头文件对CBLAS与CLAPACK的接口进行了简单的封装(将不同数据类型的多个接口封装为一个)。 比如 cblas_scopy和cblas_dcopy封装为cblas_Xcopy clapack_sgetri和clapack_dgetri封装为clapack_Xgetri 上述接口的声明位于matrix/kaldi-blas.h中... 阅读全文
posted @ 2019-01-17 10:44 JarvanWang 阅读(1896) 评论(0) 推荐(1) 编辑
摘要: cudamatrix/cublas-wrappers.h 该头文件对cuBLAS的接口进行了简单的封装(函数名的简化和部分kaldi函数的封装)。 比如 cublasSgemm_v2封装为cublas_gemm cublas_copy_kaldi_fd和cublas_copy_kaldi_df封装为cublas_copy cudamatrix/cu-kernels.{h,cu} ... 阅读全文
posted @ 2019-01-17 10:44 JarvanWang 阅读(1071) 评论(0) 推荐(0) 编辑
摘要: 安装 http://www.openfst.org/twiki/bin/view/GRM/ThraxQuickTour http://cslu.ogi.edu/~sproatr/Courses/TextNorm/tutorial.html http://www.openfst.org/twiki/pub/GRM/ThraxDownload/thrax-1.2.7.tar.gz thra... 阅读全文
posted @ 2019-01-17 10:33 JarvanWang 阅读(2882) 评论(0) 推荐(0) 编辑
摘要: gdb nnet3-compute测试命令 $ matrix-dim 'scp: head -n 1 data/test/feats.scp|' ~/kaldi/src/bin/matrix-dim 'scp: head -n 1 data/test/feats.scp|' foo 20560 39 $ nnet3-compute --frame_subsampling-factor=... 阅读全文
posted @ 2019-01-17 10:23 JarvanWang 阅读(829) 评论(0) 推荐(0) 编辑
摘要: #!/usr/bin/env perl # Copyright 2018 Jarvan Wang if (@ARGV != 1) { #print STDERR "Usage: keyword_summarize.pl text utt2dur\n"; print STDERR "Usage: keyword_summarize.pl \n"; exit(1); } my $text... 阅读全文
posted @ 2019-01-17 10:14 JarvanWang 阅读(280) 评论(0) 推荐(0) 编辑
摘要: #!/bin/bash # Copyright 2018 Jarvan Wang # Copyright 2017 Vimal Manohar # Apache 2.0. cmd=run.pl nj=40 if [ -f ./path.sh ]; then . ./path.sh; fi . ./utils/parse_options.sh if [ $# -ne 3... 阅读全文
posted @ 2019-01-17 10:13 JarvanWang 阅读(405) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 8 下一页