摘要: 前言 时空预测,真的需要 RNN 吗?真的需要 CNN 吗?是否能够设计一个模型,可以自动地学习数据中的时空依赖,而不需要依赖于归纳偏置呢? 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 本文转载自PaperWeekly 仅用于学术分享,若侵权请 阅读全文
posted @ 2024-11-27 11:20 CV技术指南(公众号) 阅读(18) 评论(0) 推荐(0) 编辑
摘要: 前言 为了解决这一问题,360人工智能研究院在人工智能顶会NeurIPS2024上提出了布局可控AI绘画模型HiCo,并将于近期开源。基于HiCo模型,使用者可以对生成画面中的不同主体的布局进行自由控制和调整,实现“指哪打哪”的生成效果。 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新 阅读全文
posted @ 2024-11-27 11:15 CV技术指南(公众号) 阅读(15) 评论(0) 推荐(0) 编辑
摘要: 前言 上个月,AMD 首席执行官苏姿丰博士在 ComputeX 开幕主题演讲上揭开了 Zen 5 架构的神秘面纱。作为 AMD 未来几年 CPU 的台柱子,Zen 5 立刻被引入消费级市场,面向笔记本和台式机的产品在几周内相继发布。 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟 阅读全文
posted @ 2024-08-30 17:36 CV技术指南(公众号) 阅读(14) 评论(0) 推荐(0) 编辑
摘要: 前言 本文分享论文Diffusion Feedback Helps CLIP See Better,专注于通过自监督学习范式解决CLIP无法区分细粒度视觉细节的问题。 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 本文转载自我爱计算机视觉 仅用于 阅读全文
posted @ 2024-08-30 17:33 CV技术指南(公众号) 阅读(48) 评论(0) 推荐(0) 编辑
摘要: 前言 ETH&微软最新开源-全局式GLOMAP,它与以前的全局SfM系统相比,其核心区别在于全局定位步骤。不是先执行不适定的平移平均然后进行全局三角测量,而是进行联合相机和点位置估计。GLOMAP不仅在鲁棒性和准确性方面达到增量式COLMAP系统相当或更优的水平,同时还比COLMAP快几个数量级。 阅读全文
posted @ 2024-08-29 14:33 CV技术指南(公众号) 阅读(197) 评论(0) 推荐(0) 编辑
摘要: 前言 小模型崛起了。 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 本文转载自机器之心 仅用于学术分享,若侵权请联系删除 CV方向的准研究生们,未来三年如何度过? 招聘高光谱图像、语义分割、diffusion等方向论文指导老师 上个月,Meta 阅读全文
posted @ 2024-08-29 14:31 CV技术指南(公众号) 阅读(50) 评论(0) 推荐(0) 编辑
摘要: 前言 就在刚刚,Meta最新发布的Transfusion,能够训练生成文本和图像的统一模型了!完美融合Transformer和扩散领域之后,语言模型和图像大一统,又近了一步。也就是说,真正的多模态AI模型,可能很快就要来了! 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典 阅读全文
posted @ 2024-08-26 22:12 CV技术指南(公众号) 阅读(27) 评论(0) 推荐(0) 编辑
摘要: 前言 在ICML2024上,来自麦吉尔大学, Mila魁北克人工智能研究所以及华为诺亚方舟实验室的研究者发表了一个基于连续卷积核(continuous kernel)的全新图卷积算子(图连续卷积CKGConv),基于此算子的纯图卷积网络(CKGCN)在多个图任务中同样能够达到媲美SOTA图Trans 阅读全文
posted @ 2024-08-26 22:07 CV技术指南(公众号) 阅读(196) 评论(0) 推荐(0) 编辑
摘要: 前言 只卖模型真的不赚钱! 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 本文转载自量子位 仅用于学术分享,若侵权请联系删除 CV方向的准研究生们,未来三年如何度过? 招聘高光谱图像、语义分割、diffusion等方向论文指导老师 谷歌版的Aid 阅读全文
posted @ 2024-08-26 22:03 CV技术指南(公众号) 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 前言 本文介绍了InstantStyleGaussian,这是一种基于三维高斯飞溅(3DGS)场景表示的创新三维风格迁移方法。通过输入目标风格图像,它能够快速生成新的三维GS场景。方法作用于预先重建的GS场景,结合了扩散模型与改进的迭代数据集更新策略。它利用扩散模型生成目标风格图像,将这些新图像添加 阅读全文
posted @ 2024-08-18 14:45 CV技术指南(公众号) 阅读(404) 评论(0) 推荐(0) 编辑