CV技术指南（公众号）

2024年11月27日

摘要：前言时空预测，真的需要 RNN 吗？真的需要 CNN 吗？是否能够设计一个模型，可以自动地学习数据中的时空依赖，而不需要依赖于归纳偏置呢？欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。本文转载自PaperWeekly 仅用于学术分享，若侵权请阅读全文

posted @ 2024-11-27 11:20 CV技术指南（公众号）阅读(18) 评论(0) 推荐(0) 编辑

NeurIPS2024 | 提高专业生产力，让你的AI画作布局可控，360 AI Research开源新模型HiCo

摘要：前言为了解决这一问题，360人工智能研究院在人工智能顶会NeurIPS2024上提出了布局可控AI绘画模型HiCo，并将于近期开源。基于HiCo模型，使用者可以对生成画面中的不同主体的布局进行自由控制和调整，实现“指哪打哪”的生成效果。欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新阅读全文

posted @ 2024-11-27 11:15 CV技术指南（公众号）阅读(15) 评论(0) 推荐(0) 编辑

2024年8月30日

标签贴错，AMD召回所有新一代CPU

摘要：前言上个月，AMD 首席执行官苏姿丰博士在 ComputeX 开幕主题演讲上揭开了 Zen 5 架构的神秘面纱。作为 AMD 未来几年 CPU 的台柱子，Zen 5 立刻被引入消费级市场，面向笔记本和台式机的产品在几周内相继发布。欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟阅读全文

posted @ 2024-08-30 17:36 CV技术指南（公众号）阅读(14) 评论(0) 推荐(0) 编辑

Diffusion反馈强势助力CLIP秒变火眼金睛：北京智源研究院、中科院自动化所联合推出DIVA

摘要：前言本文分享论文Diffusion Feedback Helps CLIP See Better，专注于通过自监督学习范式解决CLIP无法区分细粒度视觉细节的问题。欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。本文转载自我爱计算机视觉仅用于阅读全文

posted @ 2024-08-30 17:33 CV技术指南（公众号）阅读(48) 评论(0) 推荐(0) 编辑

2024年8月29日

ECCV24｜全局式SfM最新SOTA，GLOMAP重新定义SfM！

摘要：前言 ETH&微软最新开源-全局式GLOMAP，它与以前的全局SfM系统相比，其核心区别在于全局定位步骤。不是先执行不适定的平移平均然后进行全局三角测量，而是进行联合相机和点位置估计。GLOMAP不仅在鲁棒性和准确性方面达到增量式COLMAP系统相当或更优的水平，同时还比COLMAP快几个数量级。阅读全文

posted @ 2024-08-29 14:33 CV技术指南（公众号）阅读(197) 评论(0) 推荐(0) 编辑

英伟达玩转剪枝、蒸馏：把Llama 3.1 8B参数减半，性能同尺寸更强

摘要：前言小模型崛起了。欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。本文转载自机器之心仅用于学术分享，若侵权请联系删除 CV方向的准研究生们，未来三年如何度过？招聘高光谱图像、语义分割、diffusion等方向论文指导老师上个月，Meta 阅读全文

posted @ 2024-08-29 14:31 CV技术指南（公众号）阅读(50) 评论(0) 推荐(0) 编辑

2024年8月26日

语言图像模型大一统！Meta将Transformer和Diffusion融合，多模态AI王者登场

摘要：前言就在刚刚，Meta最新发布的Transfusion，能够训练生成文本和图像的统一模型了！完美融合Transformer和扩散领域之后，语言模型和图像大一统，又近了一步。也就是说，真正的多模态AI模型，可能很快就要来了！欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典阅读全文

posted @ 2024-08-26 22:12 CV技术指南（公众号）阅读(27) 评论(0) 推荐(0) 编辑

ICML 2024 | 全新图卷积！Mila和华为提出CKGConv：连续卷积核的图卷积网络

摘要：前言在ICML2024上，来自麦吉尔大学， Mila魁北克人工智能研究所以及华为诺亚方舟实验室的研究者发表了一个基于连续卷积核(continuous kernel)的全新图卷积算子(图连续卷积CKGConv)，基于此算子的纯图卷积网络(CKGCN)在多个图任务中同样能够达到媲美SOTA图Trans 阅读全文

posted @ 2024-08-26 22:07 CV技术指南（公众号）阅读(196) 评论(0) 推荐(0) 编辑

Transformer作者预警：只卖模型玩不过OpenAI！

摘要：前言只卖模型真的不赚钱！欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。本文转载自量子位仅用于学术分享，若侵权请联系删除 CV方向的准研究生们，未来三年如何度过？招聘高光谱图像、语义分割、diffusion等方向论文指导老师谷歌版的Aid 阅读全文

posted @ 2024-08-26 22:03 CV技术指南（公众号）阅读(13) 评论(0) 推荐(0) 编辑

2024年8月18日

InstantStyleGaussian：利用3D Gaussian Splatting实现高效艺术风格迁移

摘要：前言本文介绍了InstantStyleGaussian，这是一种基于三维高斯飞溅（3DGS）场景表示的创新三维风格迁移方法。通过输入目标风格图像，它能够快速生成新的三维GS场景。方法作用于预先重建的GS场景，结合了扩散模型与改进的迭代数据集更新策略。它利用扩散模型生成目标风格图像，将这些新图像添加阅读全文

posted @ 2024-08-18 14:45 CV技术指南（公众号）阅读(404) 评论(0) 推荐(0) 编辑

公告