摘要:
目录一、图像生成(画画、做图、海报、电商图)二、视频生成(从文字/图 → 视频)三、语音 / 声音创作(TTS、配音、唱歌)四、3D 创作(3D模型、物体、场景)五、文本创作(文案、小说、剧本、代码)六、数字人 / 唇形同步极简总结(你记这个就行) 我给你按赛道 + 用途直接列全,都是现在最主流、最 阅读全文
posted @ 2026-03-04 08:30
向着朝阳
阅读(4)
评论(0)
推荐(0)
摘要:
目录一句话定位更通俗的比喻三层结构(最经典的多模态架构)最终极简结论(你可以直接记) 可以这么理解,但要更精准一点: ✅ ViT 是「图像理解 / 特征理解」 ✅ YOLOv8 是「视觉感知 / 目标检测」 ✅ MiniCPM4.0 是「语言交互 / 逻辑决策」 我用最直白的话帮你把三者串起来: 一 阅读全文
posted @ 2026-03-04 08:27
向着朝阳
阅读(4)
评论(0)
推荐(0)

浙公网安备 33010602011771号