随笔分类 - CV
摘要:最近在做一个项目,涉及到扫描答题卡的方向判断。其中一种方法是训练一个文本方向分类模型来判断方向。此处记录一下训练的过程。 环境准备 在一处空闲空间足够大的地方克隆 PaddleOCR 仓库:https://github.com/PaddlePaddle/PaddleOCR PaddleOCR 仓库体
阅读全文
摘要:本文将简单介绍在 ArchLinux 中安装 OpenCV C++ 库并运行一个简单的 OpenCV 程序的过程。 参考:https://github.com/donaldssh/Install-OpenCV 我的环境 最新的 ArchLinux KDE Plasma 6 桌面环境 OpenCV 4
阅读全文
摘要:因毕设需要,尝试了将 PyTorch 模型转为 ONNX 然后用 C# 做推理,记录一下经验。 总的来说,C# 对深度学习的支持远不如 Python,缺少很多必要的库,不少代码需要自己编写。 思路 毕设做的是 image-to-image 的 low-level 视觉任务,因此需要 3 个主要步骤:
阅读全文
摘要:参考: https://einops.rocks/1-einops-basics/ einops(Einstein Operations)提供了一种语法来便捷地操纵张量。einops 支持大多数张量库(当然包括 numpy 和 pytorch)。einops 针对所有张量库的语法都完全一致。eino
阅读全文
摘要:可能有帮助的链接:https://paperswithcode.com/task/single-image-deraining 合成数据集 真实数据集是直接在雨天拍摄照片,而合成数据集是在清晰图像上通过各种方式添加雨迹来获得带雨的图像。 这些数据集大多采用单词+数字的模式命名,不同论文引用的名字各不
阅读全文
摘要:PSNR 和 SSIM 是两种常见的图像质量评价指标,通常用于衡量两张图像的相似度。 参考材料: https://zh.wikipedia.org/wiki/峰值信噪比 https://zhuanlan.zhihu.com/p/50757421 PSNR PSNR:峰值信噪比(Peak signal
阅读全文
摘要:注意! 2022年12月8日更新:目前Doc3D的FTP服务器已经停机,无法下载数据集,笔者目前也已经不再使用该数据集,手上的数据并不完整,因此请不要联系笔者索要数据集了。 另:笔者在撰写本文时只是一名普通本科生,Doc3D是在做大创项目时了解到的,这篇文章写得并不专业,也缺失了很多关键内容,请见谅
阅读全文