摘要:
引子 最近在做之前工作的资料整理,无意间翻到基于图像处理的划痕检测文章,网址都失效了 。OK,让我们开始吧。网址:http://www.qualitymag.com/articles/91490-detecting-of-cracks-and-scratches 检测产品表面缺陷,诸如污点、龟裂和刮 阅读全文
摘要:
引子 对于CV从业者来说,YOLO系列是个绕不过的经典结构,笔者遥想当年YOLO横空出世的时候,Faster RCNN还是学术界目标检测的翘楚。二阶段检测还是大行其道,不过时至今日,估摸着没有人再提二阶段目标检测的结构了。YOLO系列也从1更新到了9,这新鲜出炉的v9版本,我也来凑个热闹(虽然没有前 阅读全文
摘要:
引子 近期,文生图,wav2lip很火,文生图,见识的太多,不多说了。wav2lip其通过语音驱动唇部动作并对视频质量进行修复,里面一般涉及到三个步骤,文本到语音转化,语音驱动唇部动作,图像质量修复。最后一步骤涉及到图像质量修复,考虑到之前做过基于GFP-GAN相关的工作,在此,总结汇总下。本文主要 阅读全文
摘要:
引子 近期接到一个文本中英互译的任务,一直以为这种翻译应该很成熟,各种商用版本很多。那么开源的一定也不少,经过网络搜索发现,近两年还真的出现了很多优秀的开源翻译项目。找到了赫尔辛基大学开源免费的多语言翻译模型,开发了1400多个多语种翻译模型。其中就包含了中译英和英译中。OK,那就让我们开始吧。 一 阅读全文
摘要:
引子 在深度学习CV领域,最初2012年突破的就是图像分类,发展这么多年,基本上已经没有什么进展了。此篇作为之前EfficientNet挽留过的总结,现在整理下,OK,让我们开始吧。 一、EfficientNet安装 1、pytorch版本网址:https://github.com/lukemela 阅读全文
摘要:
引子 最近手上接了一个活儿,基于文本语料的实体抽取任务,调研了一圈发现目前开源轮子做的比较好的也就是PaddleNLP(大模型那种巨废资源,且幻觉严重的,不予考虑)。OK,那就让我们开始吧。 一、命名实体识别概念 命名实体识别(Named EntitiesRecognition,NER)是自然语言处 阅读全文
摘要:
引子 国产AI芯片这个集合,一直想补充的完整点。故翻了翻陈年的笔记,找到当年使用瑞芯微电子出的一款芯片RV1126的使用笔记,当时拿到的是一款基于RV1126的IP摄像头,在此整理记录下。OK,让我们开始吧。 一、文档 首先拿到官方的SDK包,解压后,SDK文档目录:rv1109_1126_sdk\ 阅读全文
摘要:
引子 前文已经有一篇,华为服务器Atlas芯片的文章(https://www.cnblogs.com/nick-algorithmer/p/17943216)。熟悉AI的同学们一定知道,除了服务器端端训练推理。AI推理还有一部分是边端推理,各大芯片厂商都有推出边端推理芯片,凑巧,拿到一个一块很老的华 阅读全文
摘要:
引子 CV领域肯定是少不了绕不过去图像编解码。童鞋们,可能会说,CV领域中遇事不决,OpenCV。没错,OpenCV是可以解决图像处理中的绝大部分问题,但是由于OpenCV是是一个通用的CV&图像处理的库。它用起来确实很顺手,但是嘛。。。但是它在一些性能方面有的时候确实是差点意思。那么,之前项目中有 阅读全文
摘要:
引子 国产大模型此起彼伏,各种刷榜。作为没有能力训练的我们,只能跟着大佬开源的模型尝试下效果,零一科技23年底发布的Yi大模型,之前就有尝试,现汇总总结下,OK,我们开始吧。 一、环境安装 模型下载 https://huggingface.co/01-ai/Yi-34B-Chat/tree/main 阅读全文