摘要: noise generalization: 提高降噪模型对噪声的泛化性,主要还是通过增加噪声数据的多样性(可以收集不同噪声数据/或对噪声数据做perturbation) 噪声数据集: sound-ideas 包含各种噪声类型,但是要收费 https://www.sound-ideas.com/ fr 阅读全文
posted @ 2020-04-14 11:23 hahahaf 阅读(755) 评论(0) 推荐(0) 编辑
摘要: 要用到无标签的数据就要给无标签的数据造一个监督训练的目标,常用的造目标的方法: Pseudo-labeling 可以用现有的数据训练模型,在用模型跑无标签的数据得到一个假的label,用无标签数据和假的label 帮助训练模型,最后再用有label数据finetune data augmentati 阅读全文
posted @ 2020-03-04 18:53 hahahaf 阅读(740) 评论(0) 推荐(0) 编辑
摘要: 当前基于深度学习的语音降噪方法主要分为两个类: 基于TF时频域的方法 (有两大类:基于mask和非基于mask的方法) 基于时域的方法,就我自己的实验结果来说,基于时域的方法比基于TFmask的方法要差一些,可能这样方法的trick更多一些吧。 基于时频域方法中的基于mask的方法更常见一些,主要的 阅读全文
posted @ 2020-03-03 17:48 hahahaf 阅读(1054) 评论(0) 推荐(0) 编辑
摘要: kaldi : wav-to-duration scp:aishell_test_wav.scp ark,t:length.txt sox: for A in `cat aishell_test.file` do sox $A -n stat >> length.txt done cat lengt 阅读全文
posted @ 2020-02-24 18:48 hahahaf 阅读(227) 评论(0) 推荐(0) 编辑
摘要: 使用git做开发管理: 1. Git clone 将远程代码克隆到本地; 2. Git branch 查看本地branch (git clone 时会创建 master) 3. git branch -a 查看本地和远程分支;(远程分支包括 remotes/origin/master 远程maste 阅读全文
posted @ 2020-02-24 18:12 hahahaf 阅读(1892) 评论(0) 推荐(0) 编辑
摘要: tensorflow计算图 计算图是对有向图的表示,主要包含点和边;tensorflow使用计算图计算,计算图的点对应于ops,variables,constant,placeholder等,边对应于Tensors。因此tensorflow主要包含两个部分:构建计算图和runtime运行计算图。 为 阅读全文
posted @ 2020-02-21 15:33 hahahaf 阅读(468) 评论(0) 推荐(0) 编辑
摘要: 接着上篇tensorflow compute graph的理解,其中operation node 需要给运算定义forward 和backward函数。这篇中我们实现一个简单的fully_connected layer的forward 和backward 函数: class fullyconnect 阅读全文
posted @ 2020-02-21 15:31 hahahaf 阅读(895) 评论(0) 推荐(0) 编辑
摘要: 为了做模型压缩,常见方法将正常卷积换成seperable 卷积(正常卷积和可分离卷积具体见下图) ​​​ (1)正常卷积 (2)depthwise 卷积 (3)pointwise 卷积 正常卷积卷积的大小: kernel_size_w * kernel_size_h * input_channel 阅读全文
posted @ 2020-02-21 15:29 hahahaf 阅读(404) 评论(0) 推荐(0) 编辑
摘要: 主要的视频分割算法分为两类: OSVOS(one shot video object segmentation)每一帧单独处理 MaskTrack考虑时序信息 在MaskTrack中,首先使用图像语义分割网络(deeplabv2)得到instance segmentation。但问题是:怎么让网络知 阅读全文
posted @ 2018-01-09 16:36 hahahaf 阅读(1515) 评论(0) 推荐(0) 编辑
摘要: 1. 提供主流的model,和常用数据集 2. 对 torch.utils.data.Dataset进行扩充,针对不同类别图像放入不同文件夹的数据进行读取, torchvision.datasets.ImageFolder是torch.utils.data.Dataset 的子类。 3.提供tran 阅读全文
posted @ 2017-12-16 11:34 hahahaf 阅读(2482) 评论(0) 推荐(0) 编辑