【semantic Kernel】图识文
多模态是每个LLM具有的能力,图片又是最常见的信息载体,GPT对图片的识别也很早就有了,随着GPT版本的迭代,效果越来越好。SK也是在很多就适配了图识文,只不过最近版本才支持本地图片的上传。
代码:
var builder = Kernel.CreateBuilder()
.AddOpenAIChatCompletion(modelId: "gpt-4o", Config.OpenAiKey);
var kernel = builder.Build();
var chatCompletionService = kernel.GetRequiredService<IChatCompletionService>();
var history = new ChatHistory();
var bytes = File.ReadAllBytes("imagecode.jpg");//File.ReadAllBytes("1.jpg");
history.AddUserMessage(
new ChatMessageContentItemCollection {
new TextContent("输出图片中的文字"),
new ImageContent( bytes,"image/jpeg") });
//var bytes = File.ReadAllBytes("1.jpg");
//history.AddUserMessage(
// new ChatMessageContentItemCollection {
// new TextContent("图片中有多少人"),
// new ImageContent( bytes,"image/jpeg") });
var result = await chatCompletionService.GetChatMessageContentAsync(history, kernel: kernel);
Console.WriteLine($"{result.Role} > {result.ToString()}");
Console.ReadKey();
imagecode.jpg:
输出:
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?
2020-11-07 Nuget
2020-11-07 MSBuild笔记-预留
2020-11-07 【.NET Core框架】文件系统(File Providers)