04 2021 档案

基于Kaldi的中文在线识别系统
摘要:本文来自公众号“AI大道理”。 三音子模型词错误率为:36.03%,对比单音素模型词错误率为50.58%。 可见三音素模型识别率已经有了提高。 不管模型识别率怎么样,先利用三音子模型搭建一个中文在线识别系统看看效果。 ​ ​在线识别与离线识别 本文主要搭建在线语音识别,还有一种离线语音识别,两者有什 阅读全文

posted @ 2021-04-22 13:21 AI大道理 阅读(675) 评论(0) 推荐(1) 编辑

AI大视觉(二) | Yolo v1 为何只要看一眼就够了?
摘要:本文来自公众号“AI大道理” RCNN系列属于候选区域/窗 + 深度学习分类的两步走方法。 即使是该系列最好的模型还是无法达到实时检测目标的效果,获取region proposal, 再对每个proposal分类计算量还是较大。 灵魂的拷问:两步走无法再进一步了,那能否一步到位? YOLO,you 阅读全文

posted @ 2021-04-22 13:18 AI大道理 阅读(312) 评论(0) 推荐(0) 编辑

__init__()与self
摘要:类有一个名为 __init__() 的特殊方法(构造方法),该方法在类实例化时会自动调用,像下面这样: def __init__(self): self.data = [] 类定义了 __init__() 方法,类的实例化操作会自动调用 __init__() 方法。如下实例化类 MyClass,对应 阅读全文

posted @ 2021-04-19 11:18 AI大道理 阅读(107) 评论(0) 推荐(0) 编辑

AIBigKaldi(十七)| Kaldi的DNN模型(源码解析)
摘要:本文来自公众号“AI大道理” 单音素模型词错误率为50.58%,三音子模型词错误率为36.03%,lda-mllt模型词错误率为32.12%,说话人自适应模型词错误率为28.41%,quick模型词错误率为27.94%。 可见quick模型识别率继续有了一定的提高。 能否继续优化模型?又要从哪些方面 阅读全文

posted @ 2021-04-18 14:26 AI大道理 阅读(613) 评论(0) 推荐(0) 编辑

AI大视觉(一) | RCNN系列
摘要:本文来自公众号“AI大道理” ​ 目标检测不仅要用算法判断图片中是不是一只鱼,还要在图片中标记出鱼的位置,用边框把鱼框起来,这就是目标检测问题。 其中“定位”的意思是判断鱼在图片中的具体位置。 ​滑动窗口分类法(原始) (AI大视觉:撒小渔网,一个小渔网从最旁边的地方撒下去,看有没有鱼,然后移动该渔 阅读全文

posted @ 2021-04-18 14:18 AI大道理 阅读(205) 评论(0) 推荐(0) 编辑

导航