OpenAI 支持的模型

模型

概述

OpenAI API 由一组具有不同功能和价位的各种模型提供支持。您还可以通过微调来针对您的特定用例对我们的模型进行自定义。

模型 描述
GPT-4 和 GPT-4 Turbo 一组改进了 GPT-3.5 的模型,可以理解和生成自然语言或代码
GPT-3.5 一组改进了 GPT-3 的模型,可以理解和生成自然语言或代码
DALL·E 一个可以在自然语言提示下生成和编辑图像的模型
TTS 一组可以将文本转换为自然发音的语音音频的模型
Whisper 可以将音频转换为文本的模型
Embeddings 一组可以将文本转换为数字形式的模型
Moderation 一个微调的模型,可以检测文本是否敏感或不安全
GPT base 一组没有指令的模型,可以理解和生成自然语言或代码
GPT-3 Legacy 一组可以理解和生成自然语言的模型
Deprecated 已弃用的模型的完整列表以及建议的替换项

我们还发布了开源模型,包括 Point-E、Whisper、Jukebox 和 CLIP。

访问我们的模型索引,供研究人员学习 更多关于我们的研究论文中介绍了哪些模型以及差异 在 InstructGPT 和 GPT-3.5 等模型系列之间。

持续的模型升级

gpt-3.5-turbo、 ,然后指向最新的模型版本。您可以通过在发送请求后查看响应对象来验证这一点。响应将包括使用的特定模型版本(例如)。gpt-4gpt-4-32kgpt-3.5-turbo-0613

我们还提供静态模型版本,开发人员可以在引入更新的模型后继续使用至少三个月。随着模型更新的新节奏,我们还使人们能够贡献评估,以帮助我们针对不同的用例改进模型。如果您有兴趣,请查看 OpenAI Evals 存储库。

以下模型是临时快照,我们已经宣布了这些模型的弃用日期及其替换日期。如果要使用最新的模型版本,请使用标准模型名称,如 或 。gpt-4gpt-3.5-turbo

模型名称 停产日期 替换型号
gpt-3.5-turbo-0613 6月 13, 2024 gpt-3.5-turbo-1106
gpt-3.5-turbo-0301 6月 13, 2024 gpt-3.5-turbo-1106
gpt-4-0314 6月 13, 2024 gpt-4-0613
gpt-4-32k-0314 6月 13, 2024 gpt-4-32k-0613

GPT-4 和 GPT-4 Turbo

GPT-4 是一个大型多模态模型(接受文本或图像输入并输出文本),由于其更广泛的常识和先进的推理能力,它可以比我们以前的任何模型更准确地解决难题。GPT-4 在 OpenAI API 中可供付费客户使用。与 一样,GPT-4 针对聊天进行了优化,但适用于使用聊天完成 API 的传统完成任务。在我们的 GPT 指南中了解如何使用 GPT-4。gpt-3.5-turbo

模型 描述 上下文窗口 训练数据
GPT-4-1106-preview GPT-4 Turbo新 最新的 GPT-4 模型,具有改进的指令跟随、JSON 模式、可重复输出、并行函数调用等。最多返回 4,096 个输出标记。此预览模型尚不适合生产流量。了解更多。 128,000 个 代币 截至2023年4月
GPT-4-vision-preview GPT-4 Turbo 具有视觉除了所有其他 GPT-4 Turbo 功能外,还具有理解图像的新功能。最多返回 4,096 个输出标记。这是一个预览模型版本,尚不适合生产流量。了解更多。 128,000 个代币 截至2023年4月
GPT-4 当前指向 。查看持续模型升级。gpt-4-0613 8,192 个代币 截至2021年9月
GPT-4-32K 当前指向 。查看持续模型升级。gpt-4-32k-0613 32,768 个代币 截至2021年9月
GPT-4-0613 从 2023 年 6 月 13 日开始的快照,改进了函数调用支持。gpt-4 8,192 个代币 截至2021年9月
GPT-4-32K-0613 从 2023 年 6 月 13 日开始的快照,改进了函数调用支持。gpt-4-32k 32,768 个代币 截至2021年9月
gpt-4-0314 从 2023 年 3 月 14 日开始的快照,支持函数调用。此模型版本将于 2024 年 6 月 13 日弃用。gpt-4 8,192 个代币 截至2021年9月
GPT-4-32K-0314 从 2023 年 3 月 14 日开始的快照,支持函数调用。此模型版本将于 2024 年 6 月 13 日弃用。gpt-4-32k 32,768 个代币 截至2021年9月

对于许多基本任务,GPT-4 和 GPT-3.5 模型之间的差异并不显着。然而,在更复杂的推理情况下,GPT-4 比我们以前的任何模型都更强大。

GPT-3.5模型

GPT-3.5 模型可以理解和生成自然语言或代码。我们在 GPT-3.5 系列中功能最强大、最具成本效益的模型是针对使用聊天完成 API 的聊天进行了优化,但也适用于传统的完成任务。gpt-3.5-turbo

模型 描述 上下文窗口 训练数据
GPT-3.5-turbo-1106 更新 GPT 3.5 Turbo 新增 最新的 GPT-3.5 Turbo 模型,改进了指令遵循、JSON 模式、可重现输出、并行函数调用等。最多返回 4,096 个输出标记。了解更多。 16,385 个代币 截至2021年9月
GPT-3.5-turbo 当前指向 。将指向 2023 年 12 月 11 日开始。查看持续模型升级。gpt-3.5-turbo-0613gpt-3.5-turbo-1106 4,096 个代币 截至2021年9月
GPT-3.5-turbo-16K 当前指向 。将指向 2023 年 12 月 11 日开始。查看持续模型升级。gpt-3.5-turbo-0613gpt-3.5-turbo-1106 16,385 个代币 截至2021年9月
GPT-3.5-turbo-instruct 与旧版“完成”终结点(而不是聊天完成)的功能类似,但与旧版“完成”终结点兼容。text-davinci-003 4,096 个代币 截至2021年9月
gpt-3.5-turbo-0613 Legacy 2023 年 6 月 13 日的快照。将于 2024 年 6 月 13 日弃用。gpt-3.5-turbo 4,096 个代币 截至2021年9月
gpt-3.5-turbo-16k-0613 Legacy 2023 年 6 月 13 日的快照。将于 2024 年 6 月 13 日弃用。gpt-3.5-16k-turbo 16,385 个代币 截至2021年9月
gpt-3.5-turbo-0301 Legacy 2023 年 3 月 1 日的快照。将于 2024 年 6 月 13 日弃用。gpt-3.5-turbo 4,096 个代币 截至2021年9月
text-davinci-003 Legacy 可以以比居里、巴贝奇或 ada 模型更好的质量和一致性完成语言任务。将于 2024 年 1 月 4 日弃用。 4,096 个代币 截至2021年6月
text-davinci-002 Legacy 与功能类似,但通过监督微调而不是强化学习进行训练。将于 2024 年 1 月 4 日弃用。text-davinci-003 4,096 个代币 截至2021年6月
code-davinci-002 Legacy 针对代码完成任务进行了优化。将于 2024 年 1 月 4 日弃用。 8,001 个代币 截至2021年6月

我们建议使用其他 GPT-3.5 型号,因为它的成本更低,性能更高。gpt-3.5-turbo

DALL·E模型

达尔·E 是一种人工智能系统,可以从自然语言的描述中创建逼真的图像和艺术。达尔·E 3 目前支持在给定提示的情况下创建具有特定大小的新映像的功能。达尔·E 2 还支持编辑现有图像或创建用户提供的图像的变体的功能。

模型 描述
dall-e-3 达尔·E 3New 最新 DALL·E 型号于 2023 年 11 月发布。了解更多。
dall-e-2 上一届DALL·E 型号于 2022 年 11 月发布。The 2nd iteration of DALL·E 具有比原始模型更逼真、更准确且分辨率高 4 倍的图像。

TTS模型

TTS 是一种 AI 模型,可将文本转换为自然发音的口语文本。我们提供两种不同的模型变体,针对实时文本转语音用例进行了优化,并针对质量进行了优化。这些模型可以与音频 API 中的语音终结点一起使用。tts-1tts-1-hd

模型 描述
tts-1 文本转语音 1 新增最新的文本转语音模型,针对速度进行了优化。
tts-1-hd 文字转语音 1 HD新增最新的文字转语音模型,针对质量进行了优化。

Whisper模型

Whisper 是一种通用的语音识别模型。它是在各种音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。Whisper v2-large 模型目前可通过我们的 API 获得,其名称为模型。whisper-1

目前,Whisper 的开源版本和通过我们的 API 提供的版本之间没有区别。但是,通过我们的 API,我们提供了一个优化的推理过程,这使得通过我们的 API 运行 Whisper 比通过其他方式运行要快得多。有关 Whisper 的更多技术细节,您可以阅读论文。

Embedding模型

嵌入是文本的数字表示形式,可用于测量两段文本之间的相关性。我们的第二代嵌入模型旨在以一小部分成本取代之前的 16 种第一代嵌入模型。嵌入对于搜索、聚类分析、建议、异常检测和分类任务非常有用。您可以在公告博客文章中阅读有关我们最新嵌入模型的更多信息。text-embedding-ada-002

Moderation模型

审核模型旨在检查内容是否符合 OpenAI 的使用政策。这些模型提供分类功能,用于查找以下类别的内容:仇恨、仇恨/威胁、自残、性、性/未成年人、暴力和暴力/血腥。您可以在我们的审核指南中找到更多信息。

审核模型接受任意大小的输入,该输入会自动分解为 4,096 个令牌的块。如果输入超过 32,768 个令牌,则使用截断,在极少数情况下,可能会从审核检查中省略少量令牌。

每个请求对审核终结点的最终结果显示每个类别的最大值。例如,如果一个 4K 令牌块的类别得分为 0.9901,另一个得分为 0.1901,则结果将在 API 响应中显示 0.9901,因为它更高。

模型 描述 最大代币数
text-moderation-latest 最有能力的审核模型。精度将略高于稳定模型。 32,768
text-moderation-stable 几乎与最新型号一样强大,但略旧。 32,768

GPT Base模型

GPT 基础模型可以理解和生成自然语言或代码,但不能通过指令遵循进行训练。这些模型旨在替代我们原始的 GPT-3 基本模型,并使用传统的 Completions API。大多数客户应该使用 GPT-3.5 或 GPT-4。
| 模型 | 描述 | 最大代币数 | 训练数据 |
| babbage-002 | GPT-3 和基本型号的替代品。adababbage | 16,384 个代币 | 截至2021年9月 |
| davinci-002 | GPT-3 和基本型号的替代品。curiedavinci | 16,384 个代币 | 截至2021年9月 |

GPT-3模型

GPT-3 模型可以理解和生成自然语言。这些模型被更强大的 GPT-3.5 代模型所取代。但是,原始的 GPT-3 基本模型(、、和 )是当前唯一可以微调的模型。davincicurieadababbage

模型 描述 最大代币数 训练数据
text-curie-001 比达芬奇功能强大,速度更快,成本更低。 2,049 个代币 截至2019年10月
text-babbage-001 能够完成简单的任务,速度非常快,成本更低。 2,049 个代币 截至2019年10月
text-ada-001 能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,而且成本最低。 2,049 个代币 截至2019年10月
davinci 最强大的 GPT-3 模型。可以完成其他模型可以完成的任何任务,通常质量更高。 2,049 个代币 截至2019年10月
curie 非常有能力,但比达芬奇更快,成本更低。 2,049 个代币 截至2019年10月
babbage 能够完成简单的任务,速度非常快,成本更低。 2,049 个代币 截至2019年10月
ada 能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,而且成本最低。 2,049 个代币 截至2019年10月

我们如何使用您的数据

您的数据就是您的数据。

自 2023 年 3 月 1 日起,发送到 OpenAI API 的数据将不会用于训练或改进 OpenAI 模型(除非您明确选择加入)。选择加入的一个好处是,随着时间的推移,模型可能会在您的用例中变得更好。

为了帮助识别滥用行为,API 数据最多可保留 30 天,之后将被删除(除非法律另有要求)。对于具有敏感应用程序的受信任客户,可能提供零数据保留。在数据保留为零的情况下,请求和响应正文不会持久化到任何日志记录机制中,而仅存在于内存中以便为请求提供服务。

请注意,此数据政策不适用于 OpenAI 的非 API 消费者服务,如 ChatGPT 或 DALL·E 实验室。

按终端节点划分的默认使用策略

端点 数据是否用于训练 默认保留期 符合零保留条件
/v1/chat/completions* 30天 是,图像输入除外*
/v1/files 直到被客户删除
/v1/assistants 直到被客户删除
/v1/threads 30天
/v1/threads/messages 30天
/v1/threads/runs 30天
/v1/threads/runs/steps 30天
/v1/images/generations 30天
/v1/images/edits 30天
/v1/images/variations 30天
/v1/embeddings 30天 是的
/v1/audio/transcriptions 零数据保留 -
/v1/audio/translations 零数据保留 -
/v1/audio/speech 30天 -
/v1/fine_tuning/jobs 直到被客户删除
/v1/fine-tunes 直到被客户删除
/v1/moderations 零数据保留 -
/v1/completions 30天 是的
/v1/edits 30天 是的

*通过模型输入的图像不符合零保留条件。gpt-4-vision-preview

有关详细信息,请参阅我们的 API 数据使用政策。要了解有关零保留的更多信息,请与我们的销售团队联系。

模型终结点兼容性

端点 最新型号
/v1/assistants 除支持外的所有型号。 工具需要或 .gpt-3.5-turbo-0301retrievalgpt-4-1106-previewgpt-3.5-turbo-1106
/v1/audio/transcriptions whisper-1
/v1/audio/translations whisper-1
/v1/audio/speech tts-1,tts-1-hd
/v1/chat/completions gpt-4以及注明日期的肖像权授权书、 、 和注明日期的肖像权授权书、注明日期的肖像权授权书、gpt-4-1106-previewgpt-4-vision-previewgpt-4-32kgpt-3.5-turbogpt-3.5-turbo-16kgpt-3.5-turbo
/v1/completions(旧版)/v1/completions (Legacy) gpt-3.5-turbo-instruct, ,babbage-002davinci-002
/v1/embeddings text-embedding-ada-002
/v1/fine_tuning/jobs gpt-3.5-turbo, ,babbage-002davinci-002
/v1/moderations text-moderation-stable,text-moderation-latest
/v1/images/generations dall-e-2,dall-e-3

引用OpenAI官方文档翻译链接

  1. OpenAI ChatGPT支持的模型
  2. OpenAI ChatGPT开发人员快速入门
  3. OpenAI ChatGPT生成图片API
  4. OpenAI ChatGPT文字转语音API
  5. OpenAI ChatGPT语音转文字API
  6. OpenAI ChatGPT视觉API
  7. OpenAI ChatGPT函数调用API
posted @ 2023-11-13 20:40  ryan-Z  阅读(387)  评论(0编辑  收藏  举报