04 2024 档案

摘要:​ 引子 对于多模态大语言模型,一直没有怎么接触。刚巧一朋友有问到这方面的问题,也就顺手调研下。智谱AI的东西一直以来,还是很不错的。ChatGLM的忠实fans,看到白嫖网站github上有他们开源的多模态CogVLM/CogAgent,那就顺手看看了。OK,让我们开始吧。 一、模型介绍 CogV 阅读全文
posted @ 2024-04-30 10:16 要养家的程序猿 阅读(331) 评论(0) 推荐(0) 编辑
摘要:​引子 由于工作上需要,一直在用Qwen做大模型推理,有个再训练的需求,特此琢磨下Qwen的训练。OK,我们开始吧。 一、安装环境 查看显卡驱动版本 根据官网推荐 OK,docker在手,天下我有。 docker pull qwenllm/qwen:cu117 docker run -it --rm 阅读全文
posted @ 2024-04-23 11:45 要养家的程序猿 阅读(925) 评论(4) 推荐(0) 编辑
摘要:引子 之前分享过一篇SAM(感兴趣的,请移步https://blog.csdn.net/zzq1989_/article/details/135479818?spm=1001.2014.3001.5502)环境搭建&推理测试,虽然话说Segment Anything,但是原始模型对于一些子领域的效果 阅读全文
posted @ 2024-04-15 09:12 要养家的程序猿 阅读(261) 评论(0) 推荐(0) 编辑
摘要:引子 敏感词检测,这个是很多文字类服务都要遇到的问题,最近项目上接触到,特此调研梳理下这部分的内容。比如当我们输入一些包含暴力或者色情的文本,系统会阻止信息提交。敏感词过滤就是检查用户输入的内容有没有敏感词。OK,让我们开始吧。 一、算法原理简介 一般敏感词检测之后有两个处理策略。(1)直接阻止信息 阅读全文
posted @ 2024-04-08 09:31 要养家的程序猿 阅读(292) 评论(0) 推荐(0) 编辑
摘要:引子 Sora,2024年2月15日,OpenAI发布的人工智能文生视频大模型。支持60秒视频生成,震荡了国内国际学术圈、广告圈、AI教培圈。Sora最主要有三个优点:第一,“60s超长视频”,之前文本生成视频大模型一直无法真正突破AI视频的4秒连贯性瓶颈,而Sora直接做到了60秒连贯视频。第二, 阅读全文
posted @ 2024-04-03 08:56 要养家的程序猿 阅读(374) 评论(2) 推荐(1) 编辑