2024 年 4月 24 日随笔档案 - 蝈蝈俊

2024年4月24日

LLaVA

摘要： LLaVA（Large Language and Vision Assistant 大型语言和视觉助手 https://llava-vl.github.io/）是个多模态人工智能模型，它能同时理解和生成文本和图像内容。简单来说，这个模型就像一个可以看懂图片并且能用语言与人交流的智能助手。 LLaVA 阅读全文

posted @ 2024-04-24 15:30 蝈蝈俊阅读(533) 评论(0) 推荐(0) 编辑

蝈蝈俊的技术心得

导航

公告

LLaVA