摘要: 引子 之前分享过一篇SAM(感兴趣的,请移步https://blog.csdn.net/zzq1989_/article/details/135479818?spm=1001.2014.3001.5502)环境搭建&推理测试,虽然话说Segment Anything,但是原始模型对于一些子领域的效果 阅读全文
posted @ 2024-04-15 09:12 要养家的程序猿 阅读(77) 评论(0) 推荐(0) 编辑
摘要: 引子 敏感词检测,这个是很多文字类服务都要遇到的问题,最近项目上接触到,特此调研梳理下这部分的内容。比如当我们输入一些包含暴力或者色情的文本,系统会阻止信息提交。敏感词过滤就是检查用户输入的内容有没有敏感词。OK,让我们开始吧。 一、算法原理简介 一般敏感词检测之后有两个处理策略。(1)直接阻止信息 阅读全文
posted @ 2024-04-08 09:31 要养家的程序猿 阅读(121) 评论(0) 推荐(0) 编辑
摘要: 引子 Sora,2024年2月15日,OpenAI发布的人工智能文生视频大模型。支持60秒视频生成,震荡了国内国际学术圈、广告圈、AI教培圈。Sora最主要有三个优点:第一,“60s超长视频”,之前文本生成视频大模型一直无法真正突破AI视频的4秒连贯性瓶颈,而Sora直接做到了60秒连贯视频。第二, 阅读全文
posted @ 2024-04-03 08:56 要养家的程序猿 阅读(199) 评论(2) 推荐(0) 编辑
摘要: 引子 作为YOLO的拥趸,之前一直没有太关注DETR,虽然知道效果很好。但是,巨大的计算开销,还是一直让我望而却步。然而,今天在翻阅CVPR2024的论文的时候,突然看到这么一篇《RT-DETR: DETRs Beat YOLOs on Real-time Object Detection》。嗯,它 阅读全文
posted @ 2024-03-28 14:12 要养家的程序猿 阅读(320) 评论(0) 推荐(0) 编辑
摘要: 引子 最近在做之前工作的资料整理,无意间翻到基于图像处理的划痕检测文章,网址都失效了 。OK,让我们开始吧。网址:http://www.qualitymag.com/articles/91490-detecting-of-cracks-and-scratches 检测产品表面缺陷,诸如污点、龟裂和刮 阅读全文
posted @ 2024-03-21 15:55 要养家的程序猿 阅读(8) 评论(0) 推荐(0) 编辑
摘要: 引子 对于CV从业者来说,YOLO系列是个绕不过的经典结构,笔者遥想当年YOLO横空出世的时候,Faster RCNN还是学术界目标检测的翘楚。二阶段检测还是大行其道,不过时至今日,估摸着没有人再提二阶段目标检测的结构了。YOLO系列也从1更新到了9,这新鲜出炉的v9版本,我也来凑个热闹(虽然没有前 阅读全文
posted @ 2024-03-11 10:09 要养家的程序猿 阅读(577) 评论(0) 推荐(0) 编辑
摘要: 引子 近期,文生图,wav2lip很火,文生图,见识的太多,不多说了。wav2lip其通过语音驱动唇部动作并对视频质量进行修复,里面一般涉及到三个步骤,文本到语音转化,语音驱动唇部动作,图像质量修复。最后一步骤涉及到图像质量修复,考虑到之前做过基于GFP-GAN相关的工作,在此,总结汇总下。本文主要 阅读全文
posted @ 2024-03-06 11:36 要养家的程序猿 阅读(83) 评论(0) 推荐(0) 编辑
摘要: 引子 近期接到一个文本中英互译的任务,一直以为这种翻译应该很成熟,各种商用版本很多。那么开源的一定也不少,经过网络搜索发现,近两年还真的出现了很多优秀的开源翻译项目。找到了赫尔辛基大学开源免费的多语言翻译模型,开发了1400多个多语种翻译模型。其中就包含了中译英和英译中。OK,那就让我们开始吧。 一 阅读全文
posted @ 2024-02-26 17:28 要养家的程序猿 阅读(148) 评论(0) 推荐(0) 编辑
摘要: 引子 在深度学习CV领域,最初2012年突破的就是图像分类,发展这么多年,基本上已经没有什么进展了。此篇作为之前EfficientNet挽留过的总结,现在整理下,OK,让我们开始吧。 一、EfficientNet安装 1、pytorch版本网址:https://github.com/lukemela 阅读全文
posted @ 2024-02-22 19:02 要养家的程序猿 阅读(95) 评论(0) 推荐(0) 编辑
摘要: 引子 最近手上接了一个活儿,基于文本语料的实体抽取任务,调研了一圈发现目前开源轮子做的比较好的也就是PaddleNLP(大模型那种巨废资源,且幻觉严重的,不予考虑)。OK,那就让我们开始吧。 一、命名实体识别概念 命名实体识别(Named EntitiesRecognition,NER)是自然语言处 阅读全文
posted @ 2024-02-18 09:56 要养家的程序猿 阅读(81) 评论(0) 推荐(0) 编辑