OpenAI API 快速开发手册 - 模型

模型

概述

OpenAI API由一组具有不同功能和价格的多样化模型支持。您还可以对我们的原始基础模型进行有限的自定义，以适应您的特定用例，使用微调。

模型	描述
GPT-4	A set of models that improve on GPT-3.5 and can understand as well as generate natural language or code
GPT-3.5	A set of models that improve on GPT-3 and can understand as well as generate natural language or code
DALL·E	A model that can generate and edit images given a natural language prompt
Whisper	A model that can convert audio into text
Embeddings	A set of models that can convert text into a numerical form
Moderation	A fine-tuned model that can detect whether text may be sensitive or unsafe
GPT-3Legacy	A set of models that can understand and generate natural language
Deprecated	A full list of models that have been deprecated

我们还发布了一些开源模型，包括Point-E、Whisper、Jukebox和CLIP。

访问我们的研究人员模型索引，了解有关哪些模型在我们的研究论文中亮相以及InstructGPT和GPT-3.5等模型系列之间的差异的更多信息。

持续的模型升级

基于开发者的反馈，我们将持续支持gpt-3.5-turbo-0301和gpt-4-0314模型在OpenAI API中的使用，至少延长至2024年6月13日。我们已更新了6月13日的博客文章，提供更多细节。

随着gpt-3.5-turbo的发布，我们的一些模型现在正在不断更新。我们还提供静态模型版本，开发者可以在更新后的模型推出至少三个月内继续使用。随着模型更新节奏的加快，我们还赋予了人们贡献评估（evals）的能力，帮助我们改进模型以适应不同的用例。如果您有兴趣，请查看OpenAI Evals存储库。

以下模型是临时快照，我们将在更新版本可用后宣布它们的弃用日期。如果您想使用最新的模型版本，请使用标准的模型名称，如gpt-4或gpt-3.5-turbo。

模型名称	停用日期	替代模型
gpt-3.5-turbo-0301	at earliest 06/13/2024	gpt-3.5-turbo-0613
gpt-4-0314	at earliest 06/13/2024	gpt-4-0613
gpt-4-32k-0314	at earliest 06/13/2024	gpt-4-32k-0613

有关模型弃用的更多信息，请参阅我们的弃用页面。

GPT-4

GPT-4目前对于那些通过我们的开发者平台进行了至少一次成功支付的用户是可访问的。

GPT-4是一个大型多模态模型（目前接受文本输入和输出，未来将支持图像输入），可以比我们之前的任何模型更准确地解决困难问题，这要归功于其更广泛的通用知识和先进的推理能力。像gpt-3.5-turbo一样，GPT-4也是为聊天优化的，但在使用聊天完成API时，也可以很好地处理传统的完成任务。在我们的GPT指南中了解如何使用GPT-4。

GPT-4

模型名称	描述	最大 TOKENS	训练数据
gpt-4	比GPT-3.5模型更强大，能够执行更复杂的任务，优化为聊天。将在发布后2周内更新为最新模型迭代版本。	8,192	Up to Sep 2021
gpt-4-0613	来自2023年6月13日的gpt-4快照，包含函数调用数据。与gpt-4不同，此模型将不会接收更新，并将在发布新版本后的3个月内弃用。	8,192	Up to Sep 2021
gpt-4-32k	与基础gpt-4模型具有相同的功能，但上下文长度增加4倍。将随最新模型迭代更新。	32,768	Up to Sep 2021
gpt-4-32k-0613	来自2023年6月13日的gpt-4-32k快照。与gpt-4-32k不同，此模型将不会接收更新，并将在发布新版本后的3个月内弃用。	32,768	Up to Sep 2021

截至2021年9月

对于许多基本任务，GPT-4和GPT-3.5模型之间的差异并不显著。但在更复杂的推理情况下，GPT-4比我们以前的任何模型都更强大。

GPT-3.5

GPT-3.5模型可以理解和生成自然语言或代码。在GPT-3.5系列中，我们最有能力和性价比最高的模型是gpt-3.5-turbo，它已经针对聊天进行了优化，但在传统的完成任务中也表现良好。

GPT-3.5

最新的模型	描述	最大 TOKENS	训练数据
gpt-3.5-turbo	GPT-3.5模型中最有能力且成本效益最高的模型，优化为聊天，相较于text-davinci-003成本仅为其1/10。将随最新模型迭代更新。	4,096	Up to Sep 2021
gpt-3.5-turbo-16k	与标准gpt-3.5-turbo模型具有相同的功能，但上下文长度增加4倍。	16,384	Up to Sep 2021
gpt-3.5-turbo-0613	来自2023年6月13日的gpt-3.5-turbo快照，包含函数调用数据。与gpt-3.5-turbo不同，此模型将不会接收更新，并将在发布新版本后的3个月内弃用。	4,096	Up to Sep 2021
gpt-3.5-turbo-16k-0613	来自2023年6月13日的gpt-3.5-turbo-16k快照。与gpt-3.5-turbo-16k不同，此模型将不会接收更新，并将在发布新版本后的3个月内弃用。	16,384	Up to Sep 2021

我们建议使用gpt-3.5-turbo而不是其他GPT-3.5模型，因为它成本更低，性能更好。

OpenAI的模型是非确定性的，意味着相同的输入可能产生不同的输出。将temperature设置为0将使输出基本上确定性，但可能仍然保留一小部分变化性。

DALL·E

DALL·E是一个能够根据自然语言描述创建逼真图像和艺术品的AI系统。目前，我们通过API支持根据提示创建具有特定尺寸的新图像、编辑现有图像或创建用户提供图像的变体的功能。

目前可用的DALL·E模型是DALL·E的第二次迭代，比原始模型具有更逼真、更准确和4倍分辨率的图像。您可以通过我们的Labs界面或API来尝试它。

Whisper

Whisper是一个通用的语音识别模型。它是基于大量多样化音频数据进行训练的多任务模型，可以执行多语言语音识别、语音翻译和语言识别任务。Whisper v2-large模型目前通过我们的API提供，模型名称为whisper-1。

目前，开源版本的Whisper和我们API中可用的版本之间没有区别。然而，通过我们的API，我们提供了优化的推断过程，使通过API运行Whisper比其他方式更快。有关Whisper的更多技术细节，请阅读相关论文。

Embeddings

嵌入（Embeddings）是文本的数值表示形式，可用于衡量两段文本之间的相关性。我们的第二代嵌入模型text-embedding-ada-002被设计用于取代先前的16个第一代嵌入模型，成本仅为其一小部分。嵌入在搜索、聚类、推荐、异常检测和分类任务中非常有用。您可以在我们的最新嵌入模型的公告博客文章中阅读更多信息。

Moderation

Moderation模型旨在检查内容是否符合OpenAI的使用政策。模型提供分类功能，可查找以下类别的内容：仇恨、仇恨/威胁、自残、性行为、性行为/未成年人、暴力和暴力/图形。您可以在我们的Moderation指南中了解更多信息。

Moderation模型接收任意大小的输入，并自动分割以适应模型的特定上下文窗口。

模型	描述
text-moderation-latest	最有能力的Moderation模型。准确性略高于稳定模型。
text-moderation-stable	几乎与最新模型一样有能力，但稍旧。

GPT-3 Legacy

GPT-3模型可以理解和生成自然语言。这些模型已被更强大的GPT-3.5代模型取代。但是，原始的GPT-3基础模型

（davinci、curie、ada和babbage）是目前唯一可用于微调的模型。

最新模型	描述	最大 TOKENS	训练数据
text-curie-001	Very capable, faster and lower cost than Davinci.	2,049	Up to Oct 2019
text-babbage-001	Capable of straightforward tasks, very fast, and lower cost.	2,049	Up to Oct 2019
text-ada-001	Capable of very simple tasks, usually the fastest model in the GPT-3 series, and lowest cost.	2,049	Up to Oct 2019
davinci	Most capable GPT-3 model. Can do any task the other models can do, often with higher quality.	2,049	Up to Oct 2019
curie	Very capable, but faster and lower cost than Davinci.	2,049	Up to Oct 2019
babbage	Capable of straightforward tasks, very fast, and lower cost.	2,049	Up to Oct 2019
ada	Capable of very simple tasks, usually the fastest model in the GPT-3 series, and lowest cost.	2,049	Up to Oct 2019

我们如何使用您的数据

您的数据是您的数据。

截至2023年3月1日，通过OpenAI API发送的数据将不用于训练或改进OpenAI模型（除非您明确选择加入）。加入后的一个优势是模型可能随着时间对您的用例变得更好。

为了帮助识别滥用，API数据可能会保留最多30天，之后将被删除（除非法律另有要求）。对于可信赖的具有敏感应用程序的客户，可能提供零数据保留。零数据保留意味着请求和响应内容不会被保存到任何日志机制，并且仅存在于内存中以服务于请求。

请注意，此数据政策不适用于OpenAI的非API消费者服务，如ChatGPT或DALL·E Labs。

默认的端点使用政策

端点	用于训练的数据	默认保留期	是否适用零数据保留
/v1/completions	No	30 days	Yes
/v1/chat/completions	No	30 days	Yes
/v1/edits	No	30 days	Yes
/v1/images/generations	No	30 days	No
/v1/images/edits	No	30 days	No
/v1/images/variations	No	30 days	No
/v1/embeddings	No	30 days	Yes
/v1/audio/transcriptions	No	Zero data retention	-
/v1/audio/translations	No	Zero data retention	-
/v1/files	No	Until deleted by customer	No
/v1/fine-tunes	No	Until deleted by customer	No
/v1/moderations	No	Zero data retention	-

有关详情，请参阅我们的API数据使用政策。要了解更多有关零数据保留的信息，请与我们的销售团队联系。

模型端点兼容性

端点	模型名称
/v1/chat/completions	gpt-4, gpt-4-0613, gpt-4-32k, gpt-4-32k-0613, gpt-3.5-turbo, gpt-3.5-turbo-0613, gpt-3.5-turbo-16k, gpt-3.5-turbo-16k-0613
/v1/completions (Legacy)	text-davinci-003, text-davinci-002, text-davinci-001, text-curie-001, text-babbage-001, text-ada-001, davinci, curie, babbage, ada
/v1/audio/transcriptions	whisper-1
/v1/audio/translations	whisper-1
/v1/fine-tunes	davinci, curie, babbage, ada
/v1/embeddings	text-embedding-ada-002, text-similarity--001, text-search---001, code-search--*-001
/v1/moderations	text-moderation-stable, text-moderation-latest

此列表不包括我们的第一代嵌入模型和DALL·E模型。

posted @ 2023-08-04 15:19 ryan-Z 阅读(212) 评论(0) 收藏举报

刷新页面返回顶部