随笔档案「2021年4月」 - AI大道理

基于Kaldi的中文在线识别系统

摘要：本文来自公众号“AI大道理”。三音子模型词错误率为：36.03%，对比单音素模型词错误率为50.58%。可见三音素模型识别率已经有了提高。不管模型识别率怎么样，先利用三音子模型搭建一个中文在线识别系统看看效果。在线识别与离线识别本文主要搭建在线语音识别，还有一种离线语音识别，两者有什阅读全文

posted @ 2021-04-22 13:21 AI大道理阅读(731) 评论(0) 推荐(1)

AI大视觉（二） | Yolo v1 为何只要看一眼就够了？

摘要：本文来自公众号“AI大道理” RCNN系列属于候选区域/窗 + 深度学习分类的两步走方法。即使是该系列最好的模型还是无法达到实时检测目标的效果，获取region proposal，再对每个proposal分类计算量还是较大。灵魂的拷问：两步走无法再进一步了，那能否一步到位？ YOLO，you 阅读全文

posted @ 2021-04-22 13:18 AI大道理阅读(377) 评论(0) 推荐(0)

init()与self

摘要：类有一个名为 __init__() 的特殊方法（构造方法），该方法在类实例化时会自动调用，像下面这样： def __init__(self): self.data = [] 类定义了 __init__() 方法，类的实例化操作会自动调用 __init__() 方法。如下实例化类 MyClass，对应阅读全文

posted @ 2021-04-19 11:18 AI大道理阅读(132) 评论(0) 推荐(0)

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析）

摘要：本文来自公众号“AI大道理” 单音素模型词错误率为50.58%，三音子模型词错误率为36.03%，lda-mllt模型词错误率为32.12%，说话人自适应模型词错误率为28.41%，quick模型词错误率为27.94%。可见quick模型识别率继续有了一定的提高。能否继续优化模型？又要从哪些方面阅读全文

posted @ 2021-04-18 14:26 AI大道理阅读(674) 评论(0) 推荐(0)

AI大视觉（一) | RCNN系列

摘要：本文来自公众号“AI大道理” 目标检测不仅要用算法判断图片中是不是一只鱼，还要在图片中标记出鱼的位置，用边框把鱼框起来，这就是目标检测问题。其中“定位”的意思是判断鱼在图片中的具体位置。滑动窗口分类法（原始）（AI大视觉：撒小渔网，一个小渔网从最旁边的地方撒下去，看有没有鱼，然后移动该渔阅读全文

posted @ 2021-04-18 14:18 AI大道理阅读(253) 评论(0) 推荐(0)

04 2021 档案

基于Kaldi的中文在线识别系统

AI大视觉（二） | Yolo v1 为何只要看一眼就够了？

init()与self

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析）

AI大视觉（一) | RCNN系列

导航

公告

04 2021 档案

基于Kaldi的中文在线识别系统

AI大视觉（二） | Yolo v1 为何只要看一眼就够了？

__init__()与self

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析）

AI大视觉（一) | RCNN系列

导航

公告

init()与self