上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 38 下一页

2021年6月22日

AI大视觉(七) | 残差网络在解决什么问题?

摘要: ​ 本文来自公众号“AI大道理” ​为什么会有ResNet? 神经网络叠的越深,则学习出的效果就一定会越好吗? 答案无疑是否定的,人们发现当模型层数增加到某种程度,模型的效果将会不升反降。 也就是说,深度模型发生了退化情况。 那么,为什么会出现这种情况? 按理说,当我们堆叠一个模型时,理所当然的会认 阅读全文

posted @ 2021-06-22 10:16 AI大道理 阅读(398) 评论(0) 推荐(0) 编辑

2021年6月11日

AI大视觉(六) | 特征金字塔(FPN)如何进行特征融合?

摘要: 本文来自公众号”AI大道理“ 在深度学习的很多工作中(例如目标检测、图像分割),融合不同尺度的特征是提高性能的一个重要手段。 低层特征分辨率更高,包含更多位置、细节信息,但是由于经过的卷积更少,其语义性更低,噪声更多。 高层特征具有更强的语义信息,但是分辨率很低,对细节的感知能力较差。 如何将两者高 阅读全文

posted @ 2021-06-11 11:22 AI大道理 阅读(2390) 评论(0) 推荐(0) 编辑

2021年6月10日

AI大视觉(五) | YOLOv3网络详解与代码实现

摘要: 本文来自公众号“AI大道理” 在YOLOv3中继续改进,提出了一个更深的、借鉴了ResNet和的FPN的网络Darknet-53。 ​ ​darknet-19 YOLO作者自己写的一个深度学习框架叫darknet,后来在YOLO9000中又提出了一个19层卷积网络作为YOLO9000的主干,称为Da 阅读全文

posted @ 2021-06-10 14:04 AI大道理 阅读(733) 评论(0) 推荐(0) 编辑

2021年6月9日

AI大视觉(四) | Yolo v3 如何提高对小目标的检测效率

摘要: 本文来自公众号“AI大道理” ​ YOLO v3 是目前工业界用的非常多的目标检测的算法。 YOLO v3 没有太多的创新,主要是借鉴一些好的方案融合到 YOLO v2 里面。 不过效果还是不错的,在保持速度优势的前提下,提升了预测精度,尤其是加强了对小物体的识别能力。 YOLO v3 主要的改进有 阅读全文

posted @ 2021-06-09 10:28 AI大道理 阅读(2002) 评论(0) 推荐(0) 编辑

2021年6月8日

AI大视觉(三) | Yolo v2的改进思想

摘要: 本文来自公众号“AI大道理” YOLO v2 是 YOLO v1的进阶版,它没有彻底否定 YOLO v1,而是在 YOLO v1 的基础上,融合了很多其它论文优秀的思想做了大幅的提升。 YOLO v1 比较低的召回率和比较高的定位误差。 所以,让 YOLO v1变得更好指的是保持准确率的情况下: 提 阅读全文

posted @ 2021-06-08 16:12 AI大道理 阅读(236) 评论(0) 推荐(0) 编辑

2021年4月22日

基于Kaldi的中文在线识别系统

摘要: 本文来自公众号“AI大道理”。 三音子模型词错误率为:36.03%,对比单音素模型词错误率为50.58%。 可见三音素模型识别率已经有了提高。 不管模型识别率怎么样,先利用三音子模型搭建一个中文在线识别系统看看效果。 ​ ​在线识别与离线识别 本文主要搭建在线语音识别,还有一种离线语音识别,两者有什 阅读全文

posted @ 2021-04-22 13:21 AI大道理 阅读(653) 评论(0) 推荐(1) 编辑

AI大视觉(二) | Yolo v1 为何只要看一眼就够了?

摘要: 本文来自公众号“AI大道理” RCNN系列属于候选区域/窗 + 深度学习分类的两步走方法。 即使是该系列最好的模型还是无法达到实时检测目标的效果,获取region proposal, 再对每个proposal分类计算量还是较大。 灵魂的拷问:两步走无法再进一步了,那能否一步到位? YOLO,you 阅读全文

posted @ 2021-04-22 13:18 AI大道理 阅读(281) 评论(0) 推荐(0) 编辑

2021年4月19日

__init__()与self

摘要: 类有一个名为 __init__() 的特殊方法(构造方法),该方法在类实例化时会自动调用,像下面这样: def __init__(self): self.data = [] 类定义了 __init__() 方法,类的实例化操作会自动调用 __init__() 方法。如下实例化类 MyClass,对应 阅读全文

posted @ 2021-04-19 11:18 AI大道理 阅读(104) 评论(0) 推荐(0) 编辑

2021年4月18日

AIBigKaldi(十七)| Kaldi的DNN模型(源码解析)

摘要: 本文来自公众号“AI大道理” 单音素模型词错误率为50.58%,三音子模型词错误率为36.03%,lda-mllt模型词错误率为32.12%,说话人自适应模型词错误率为28.41%,quick模型词错误率为27.94%。 可见quick模型识别率继续有了一定的提高。 能否继续优化模型?又要从哪些方面 阅读全文

posted @ 2021-04-18 14:26 AI大道理 阅读(597) 评论(0) 推荐(0) 编辑

AI大视觉(一) | RCNN系列

摘要: 本文来自公众号“AI大道理” ​ 目标检测不仅要用算法判断图片中是不是一只鱼,还要在图片中标记出鱼的位置,用边框把鱼框起来,这就是目标检测问题。 其中“定位”的意思是判断鱼在图片中的具体位置。 ​滑动窗口分类法(原始) (AI大视觉:撒小渔网,一个小渔网从最旁边的地方撒下去,看有没有鱼,然后移动该渔 阅读全文

posted @ 2021-04-18 14:18 AI大道理 阅读(197) 评论(0) 推荐(0) 编辑

上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 38 下一页

导航