OpenAI 支持的模型
模型
概述
OpenAI API 由一组具有不同功能和价位的各种模型提供支持。您还可以通过微调来针对您的特定用例对我们的模型进行自定义。
模型 | 描述 |
---|---|
GPT-4 和 GPT-4 Turbo | 一组改进了 GPT-3.5 的模型,可以理解和生成自然语言或代码 |
GPT-3.5 | 一组改进了 GPT-3 的模型,可以理解和生成自然语言或代码 |
DALL·E | 一个可以在自然语言提示下生成和编辑图像的模型 |
TTS | 一组可以将文本转换为自然发音的语音音频的模型 |
Whisper | 可以将音频转换为文本的模型 |
Embeddings | 一组可以将文本转换为数字形式的模型 |
Moderation | 一个微调的模型,可以检测文本是否敏感或不安全 |
GPT base | 一组没有指令的模型,可以理解和生成自然语言或代码 |
GPT-3 Legacy | 一组可以理解和生成自然语言的模型 |
Deprecated | 已弃用的模型的完整列表以及建议的替换项 |
我们还发布了开源模型,包括 Point-E、Whisper、Jukebox 和 CLIP。
访问我们的模型索引,供研究人员学习 更多关于我们的研究论文中介绍了哪些模型以及差异 在 InstructGPT 和 GPT-3.5 等模型系列之间。
持续的模型升级
gpt-3.5-turbo、 ,然后指向最新的模型版本。您可以通过在发送请求后查看响应对象来验证这一点。响应将包括使用的特定模型版本(例如)。gpt-4gpt-4-32kgpt-3.5-turbo-0613
我们还提供静态模型版本,开发人员可以在引入更新的模型后继续使用至少三个月。随着模型更新的新节奏,我们还使人们能够贡献评估,以帮助我们针对不同的用例改进模型。如果您有兴趣,请查看 OpenAI Evals 存储库。
以下模型是临时快照,我们已经宣布了这些模型的弃用日期及其替换日期。如果要使用最新的模型版本,请使用标准模型名称,如 或 。gpt-4gpt-3.5-turbo
模型名称 | 停产日期 | 替换型号 |
---|---|---|
gpt-3.5-turbo-0613 | 6月 13, 2024 | gpt-3.5-turbo-1106 |
gpt-3.5-turbo-0301 | 6月 13, 2024 | gpt-3.5-turbo-1106 |
gpt-4-0314 | 6月 13, 2024 | gpt-4-0613 |
gpt-4-32k-0314 | 6月 13, 2024 | gpt-4-32k-0613 |
GPT-4 和 GPT-4 Turbo
GPT-4 是一个大型多模态模型(接受文本或图像输入并输出文本),由于其更广泛的常识和先进的推理能力,它可以比我们以前的任何模型更准确地解决难题。GPT-4 在 OpenAI API 中可供付费客户使用。与 一样,GPT-4 针对聊天进行了优化,但适用于使用聊天完成 API 的传统完成任务。在我们的 GPT 指南中了解如何使用 GPT-4。gpt-3.5-turbo
模型 | 描述 | 上下文窗口 | 训练数据 |
---|---|---|---|
GPT-4-1106-preview | GPT-4 Turbo新 最新的 GPT-4 模型,具有改进的指令跟随、JSON 模式、可重复输出、并行函数调用等。最多返回 4,096 个输出标记。此预览模型尚不适合生产流量。了解更多。 | 128,000 个 代币 | 截至2023年4月 |
GPT-4-vision-preview | GPT-4 Turbo 具有视觉除了所有其他 GPT-4 Turbo 功能外,还具有理解图像的新功能。最多返回 4,096 个输出标记。这是一个预览模型版本,尚不适合生产流量。了解更多。 | 128,000 个代币 | 截至2023年4月 |
GPT-4 | 当前指向 。查看持续模型升级。gpt-4-0613 | 8,192 个代币 | 截至2021年9月 |
GPT-4-32K | 当前指向 。查看持续模型升级。gpt-4-32k-0613 | 32,768 个代币 | 截至2021年9月 |
GPT-4-0613 | 从 2023 年 6 月 13 日开始的快照,改进了函数调用支持。gpt-4 | 8,192 个代币 | 截至2021年9月 |
GPT-4-32K-0613 | 从 2023 年 6 月 13 日开始的快照,改进了函数调用支持。gpt-4-32k | 32,768 个代币 | 截至2021年9月 |
gpt-4-0314 | 从 2023 年 3 月 14 日开始的快照,支持函数调用。此模型版本将于 2024 年 6 月 13 日弃用。gpt-4 | 8,192 个代币 | 截至2021年9月 |
GPT-4-32K-0314 | 从 2023 年 3 月 14 日开始的快照,支持函数调用。此模型版本将于 2024 年 6 月 13 日弃用。gpt-4-32k | 32,768 个代币 | 截至2021年9月 |
对于许多基本任务,GPT-4 和 GPT-3.5 模型之间的差异并不显着。然而,在更复杂的推理情况下,GPT-4 比我们以前的任何模型都更强大。
GPT-3.5模型
GPT-3.5 模型可以理解和生成自然语言或代码。我们在 GPT-3.5 系列中功能最强大、最具成本效益的模型是针对使用聊天完成 API 的聊天进行了优化,但也适用于传统的完成任务。gpt-3.5-turbo
模型 | 描述 | 上下文窗口 | 训练数据 |
---|---|---|---|
GPT-3.5-turbo-1106 | 更新 GPT 3.5 Turbo 新增 最新的 GPT-3.5 Turbo 模型,改进了指令遵循、JSON 模式、可重现输出、并行函数调用等。最多返回 4,096 个输出标记。了解更多。 | 16,385 个代币 | 截至2021年9月 |
GPT-3.5-turbo | 当前指向 。将指向 2023 年 12 月 11 日开始。查看持续模型升级。gpt-3.5-turbo-0613gpt-3.5-turbo-1106 | 4,096 个代币 | 截至2021年9月 |
GPT-3.5-turbo-16K | 当前指向 。将指向 2023 年 12 月 11 日开始。查看持续模型升级。gpt-3.5-turbo-0613gpt-3.5-turbo-1106 | 16,385 个代币 | 截至2021年9月 |
GPT-3.5-turbo-instruct | 与旧版“完成”终结点(而不是聊天完成)的功能类似,但与旧版“完成”终结点兼容。text-davinci-003 | 4,096 个代币 | 截至2021年9月 |
gpt-3.5-turbo-0613 Legacy | 2023 年 6 月 13 日的快照。将于 2024 年 6 月 13 日弃用。gpt-3.5-turbo | 4,096 个代币 | 截至2021年9月 |
gpt-3.5-turbo-16k-0613 Legacy | 2023 年 6 月 13 日的快照。将于 2024 年 6 月 13 日弃用。gpt-3.5-16k-turbo | 16,385 个代币 | 截至2021年9月 |
gpt-3.5-turbo-0301 Legacy | 2023 年 3 月 1 日的快照。将于 2024 年 6 月 13 日弃用。gpt-3.5-turbo | 4,096 个代币 | 截至2021年9月 |
text-davinci-003 Legacy | 可以以比居里、巴贝奇或 ada 模型更好的质量和一致性完成语言任务。将于 2024 年 1 月 4 日弃用。 | 4,096 个代币 | 截至2021年6月 |
text-davinci-002 Legacy | 与功能类似,但通过监督微调而不是强化学习进行训练。将于 2024 年 1 月 4 日弃用。text-davinci-003 | 4,096 个代币 | 截至2021年6月 |
code-davinci-002 Legacy | 针对代码完成任务进行了优化。将于 2024 年 1 月 4 日弃用。 | 8,001 个代币 | 截至2021年6月 |
我们建议使用其他 GPT-3.5 型号,因为它的成本更低,性能更高。gpt-3.5-turbo
DALL·E模型
达尔·E 是一种人工智能系统,可以从自然语言的描述中创建逼真的图像和艺术。达尔·E 3 目前支持在给定提示的情况下创建具有特定大小的新映像的功能。达尔·E 2 还支持编辑现有图像或创建用户提供的图像的变体的功能。
模型 | 描述 |
---|---|
dall-e-3 | 达尔·E 3New 最新 DALL·E 型号于 2023 年 11 月发布。了解更多。 |
dall-e-2 | 上一届DALL·E 型号于 2022 年 11 月发布。The 2nd iteration of DALL·E 具有比原始模型更逼真、更准确且分辨率高 4 倍的图像。 |
TTS模型
TTS 是一种 AI 模型,可将文本转换为自然发音的口语文本。我们提供两种不同的模型变体,针对实时文本转语音用例进行了优化,并针对质量进行了优化。这些模型可以与音频 API 中的语音终结点一起使用。tts-1tts-1-hd
模型 | 描述 |
---|---|
tts-1 | 文本转语音 1 新增最新的文本转语音模型,针对速度进行了优化。 |
tts-1-hd | 文字转语音 1 HD新增最新的文字转语音模型,针对质量进行了优化。 |
Whisper模型
Whisper 是一种通用的语音识别模型。它是在各种音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。Whisper v2-large 模型目前可通过我们的 API 获得,其名称为模型。whisper-1
目前,Whisper 的开源版本和通过我们的 API 提供的版本之间没有区别。但是,通过我们的 API,我们提供了一个优化的推理过程,这使得通过我们的 API 运行 Whisper 比通过其他方式运行要快得多。有关 Whisper 的更多技术细节,您可以阅读论文。
Embedding模型
嵌入是文本的数字表示形式,可用于测量两段文本之间的相关性。我们的第二代嵌入模型旨在以一小部分成本取代之前的 16 种第一代嵌入模型。嵌入对于搜索、聚类分析、建议、异常检测和分类任务非常有用。您可以在公告博客文章中阅读有关我们最新嵌入模型的更多信息。text-embedding-ada-002
Moderation模型
审核模型旨在检查内容是否符合 OpenAI 的使用政策。这些模型提供分类功能,用于查找以下类别的内容:仇恨、仇恨/威胁、自残、性、性/未成年人、暴力和暴力/血腥。您可以在我们的审核指南中找到更多信息。
审核模型接受任意大小的输入,该输入会自动分解为 4,096 个令牌的块。如果输入超过 32,768 个令牌,则使用截断,在极少数情况下,可能会从审核检查中省略少量令牌。
每个请求对审核终结点的最终结果显示每个类别的最大值。例如,如果一个 4K 令牌块的类别得分为 0.9901,另一个得分为 0.1901,则结果将在 API 响应中显示 0.9901,因为它更高。
模型 | 描述 | 最大代币数 |
---|---|---|
text-moderation-latest | 最有能力的审核模型。精度将略高于稳定模型。 | 32,768 |
text-moderation-stable | 几乎与最新型号一样强大,但略旧。 | 32,768 |
GPT Base模型
GPT 基础模型可以理解和生成自然语言或代码,但不能通过指令遵循进行训练。这些模型旨在替代我们原始的 GPT-3 基本模型,并使用传统的 Completions API。大多数客户应该使用 GPT-3.5 或 GPT-4。
| 模型 | 描述 | 最大代币数 | 训练数据 |
| babbage-002 | GPT-3 和基本型号的替代品。adababbage | 16,384 个代币 | 截至2021年9月 |
| davinci-002 | GPT-3 和基本型号的替代品。curiedavinci | 16,384 个代币 | 截至2021年9月 |
GPT-3模型
GPT-3 模型可以理解和生成自然语言。这些模型被更强大的 GPT-3.5 代模型所取代。但是,原始的 GPT-3 基本模型(、、和 )是当前唯一可以微调的模型。davincicurieadababbage
模型 | 描述 | 最大代币数 | 训练数据 |
---|---|---|---|
text-curie-001 | 比达芬奇功能强大,速度更快,成本更低。 | 2,049 个代币 | 截至2019年10月 |
text-babbage-001 | 能够完成简单的任务,速度非常快,成本更低。 | 2,049 个代币 | 截至2019年10月 |
text-ada-001 | 能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,而且成本最低。 | 2,049 个代币 | 截至2019年10月 |
davinci | 最强大的 GPT-3 模型。可以完成其他模型可以完成的任何任务,通常质量更高。 | 2,049 个代币 | 截至2019年10月 |
curie | 非常有能力,但比达芬奇更快,成本更低。 | 2,049 个代币 | 截至2019年10月 |
babbage | 能够完成简单的任务,速度非常快,成本更低。 | 2,049 个代币 | 截至2019年10月 |
ada | 能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,而且成本最低。 | 2,049 个代币 | 截至2019年10月 |
我们如何使用您的数据
您的数据就是您的数据。
自 2023 年 3 月 1 日起,发送到 OpenAI API 的数据将不会用于训练或改进 OpenAI 模型(除非您明确选择加入)。选择加入的一个好处是,随着时间的推移,模型可能会在您的用例中变得更好。
为了帮助识别滥用行为,API 数据最多可保留 30 天,之后将被删除(除非法律另有要求)。对于具有敏感应用程序的受信任客户,可能提供零数据保留。在数据保留为零的情况下,请求和响应正文不会持久化到任何日志记录机制中,而仅存在于内存中以便为请求提供服务。
请注意,此数据政策不适用于 OpenAI 的非 API 消费者服务,如 ChatGPT 或 DALL·E 实验室。
按终端节点划分的默认使用策略
端点 | 数据是否用于训练 | 默认保留期 | 符合零保留条件 |
---|---|---|---|
/v1/chat/completions* | 不 | 30天 | 是,图像输入除外* |
/v1/files | 不 | 直到被客户删除 | 不 |
/v1/assistants | 不 | 直到被客户删除 | 不 |
/v1/threads | 不 | 30天 | 不 |
/v1/threads/messages | 不 | 30天 | 不 |
/v1/threads/runs | 不 | 30天 | 不 |
/v1/threads/runs/steps | 不 | 30天 | 不 |
/v1/images/generations | 不 | 30天 | 不 |
/v1/images/edits | 不 | 30天 | 不 |
/v1/images/variations | 不 | 30天 | 不 |
/v1/embeddings | 不 | 30天 | 是的 |
/v1/audio/transcriptions | 不 | 零数据保留 | - |
/v1/audio/translations | 不 | 零数据保留 | - |
/v1/audio/speech | 不 | 30天 | - |
/v1/fine_tuning/jobs | 不 | 直到被客户删除 | 不 |
/v1/fine-tunes | 不 | 直到被客户删除 | 不 |
/v1/moderations | 不 | 零数据保留 | - |
/v1/completions | 不 | 30天 | 是的 |
/v1/edits | 不 | 30天 | 是的 |
*通过模型输入的图像不符合零保留条件。gpt-4-vision-preview
有关详细信息,请参阅我们的 API 数据使用政策。要了解有关零保留的更多信息,请与我们的销售团队联系。
模型终结点兼容性
端点 | 最新型号 |
---|---|
/v1/assistants | 除支持外的所有型号。 工具需要或 .gpt-3.5-turbo-0301retrievalgpt-4-1106-previewgpt-3.5-turbo-1106 |
/v1/audio/transcriptions | whisper-1 |
/v1/audio/translations | whisper-1 |
/v1/audio/speech | tts-1,tts-1-hd |
/v1/chat/completions | gpt-4以及注明日期的肖像权授权书、 、 和注明日期的肖像权授权书、注明日期的肖像权授权书、gpt-4-1106-previewgpt-4-vision-previewgpt-4-32kgpt-3.5-turbogpt-3.5-turbo-16kgpt-3.5-turbo |
/v1/completions(旧版)/v1/completions (Legacy) | gpt-3.5-turbo-instruct, ,babbage-002davinci-002 |
/v1/embeddings | text-embedding-ada-002 |
/v1/fine_tuning/jobs | gpt-3.5-turbo, ,babbage-002davinci-002 |
/v1/moderations | text-moderation-stable,text-moderation-latest |
/v1/images/generations | dall-e-2,dall-e-3 |