open w rt（OpenAI为ChatGPT与Whisper模型推出增强API，成本大降90%）

时间2025-08-30 19:24:42分类IT科技浏览5881

导读：自从ChatGPT发布以来，每月活跃用户估计超过1亿。2023年2月份推出优质服务ChatGPT Plus，目前微软新Bing搜索集成了ChatGPT版本，但其他用户只能在网页上注册和体验ChatGPT的效果，2023年3月1日OpenAI发布了ChatGPT的API，不过仍然是收费的，但根据官方介绍比GPT3便宜了10倍。与Ch...

自从ChatGPT发布以来，每月活跃用户估计超过1亿。2023年2月份推出优质服务ChatGPT Plus ，目前微软新Bing搜索集成了ChatGPT版本，但其他用户只能在网页上注册和体验ChatGPT的效果，2023年3月1日OpenAI发布了ChatGPT的API ，不过仍然是收费的，但根据官方介绍比GPT3便宜了10倍。与ChatGPT一起发布的还有Whisper。

ChatGPT和Whisper模型的API访问地址：https://openai.com/product

官方发布地址：https://openai.com/blog/introducing-chatgpt-and-whisper-apis

语音转文本指南：https://platform.openai.com/docs/guides/speech-to-text

下面是官网发布内容的翻译

ChatGPT和Whisper模型现在可以在我们的API上使用，让开发人员可以使用最新的语言（不仅仅是聊天！）和语音到文本的功能。通过一系列系统范围的优化，自去年12月以来，ChatGPT的成本降低了90%；我们现在将这些节省的资金转移给API用户。开发人员现在可以在API中使用我们的开源Whisper大v2模型，获得更快、更经济的结果。ChatGPT API用户可以期望不断改进模型，并可以选择专用容量来对模型进行更深入的控制。我们还密切听取了开发人员的反馈，并改进了API服务条款，以更好地满足他们的需求。

ChatGPT和Whisper API的早期用户

Snap Inc是Snapchat的创建者，本周推出了My AI for Snapchat+ 。实验功能正在ChatGPT API上运行。我的AI为Snapchatters提供了一个友好的、可定制的聊天机器人，它可以提供建议，甚至可以在几秒钟内为朋友写一首俳句。Snapchat每月有7.5亿Snapchat用户，在Snapchat中，通信和消息是一种日常行为。

Quizlet是一个全球学习平台，有6000多万学生使用它来学习、练习和掌握他们正在学习的任何东西。Quizlet在过去三年中一直与OpenAI合作，在多个用例中利用GPT-3 ，包括词汇学习和实践测试。随着ChatGPT API的推出，Quizlet将推出Q-Chat ，这是一款完全自适应的AI导师，它让学生根据通过有趣的聊天体验提供的相关学习材料提出自适应问题。

Instacart正在扩充Instacart应用程序，使客户能够询问食物并获得鼓舞人心的、可购物的答案。这将ChatGPT与Instacart自己的AI和75000多家零售合作伙伴门店的产品数据一起使用，帮助客户发现开放式购物目标的想法，例如“我如何制作很棒的鱼玉米卷？ ”或“我的孩子吃什么健康午餐？ ”Instacart计划在今年晚些时候推出“Ask Instacart” 。

Shop是Shopify的消费者应用程序被1亿购物者用来寻找并参与他们喜爱的产品和品牌。ChatGPT API用于为Shop的新购物助手提供动力。当购物者搜索产品时，购物助手会根据他们的要求进行个性化推荐。Shop新推出的人工智能购物助手将通过扫描数以百万计的产品来简化应用内购物，以快速找到买家想要的东西或帮助他们发现新的东西。

Speak是一款AI驱动的语言学习应用程序，专注于打造口语流利的最佳路径。他们是韩国增长最快的英语应用程序，已经在使用Whisper API为一款新的讲AI的配套产品提供动力，并迅速将其推向世界其他地区。Whisper对每一个级别的语言学习者都具有人类水平的准确度，这开启了真正的开放式对话练习和高度准确的反馈。

ChatGPT API

模型：我们今天发布的ChatGPT模型系列，gpt-3.5-turbo ，与ChatGPT产品中使用的型号相同。它的价格为每1k代币0.002美元，比我们现有的GPT-3.5型号便宜10倍。这也是我们许多非聊天用例的最佳模型——我们看到早期的测试人员从text-davinci-003迁移到gpt-3.5-turbo ，只需要对他们的提示进行少量调整。

API：传统上，GPT模型使用非结构化文本，该文本在模型中表示为“令牌 ”序列。相反，ChatGPT模型会使用一系列消息以及元数据。（好奇者：在引擎盖下，输入仍然作为模型要消耗的“令牌 ”序列呈现给模型；模型使用的原始格式是一种名为聊天标记语言（“ChatML ”）的新格式。）

下面是ChatGPT模型交互API的使用方法：

Request

curl https://api.openai.com/v1/chat/completions -H "Authorization: Bearer $OPENAI_API_KEY" -H "Content-Type: application/json" -d { "model": "gpt-3.5-turbo", "messages": [{"role": "user", "content": "What is the OpenAI mission?"}]} Response { "id": "chatcmpl-6p5FEv1JHictSSnDZsGU4KvbuBsbu", "object": "messages", "created": 1677693600, "model": "gpt-3.5-turbo", "choices": [ { "index": 0, "finish_reason": "stop", "messages": [ { "role": "assistant", "content": "OpenAIs mission is to ensure that artificial general intelligence benefits all of humanity." } ] } ], "usage": { "prompt_tokens": 20, "completion_tokens": 18, "total_tokens": 38 }} Python的调用接口 import openai completion = openai.ChatCompletion.create( model="gpt-3.5-turbo", messages=[{"role": "user", "content": "Tell the world about the ChatGPT API in the style of a pirate."}]) print(completion)

ChatGPT升级

我们正在不断改进我们的ChatGPT模型，并希望向开发人员提供这些增强功能。使用gpt-3.5-turbo模型的开发人员将始终获得我们推荐的稳定模型，同时仍然可以灵活选择特定的模型版本。例如，今天我们将发布gpt-3.5-turbo-0301，该版本将至少支持到6月1日，我们将在4月将gpt-3.5-turbo更新为新的稳定版本。模型页面将提供切换更新。

专用实例

我们现在还为希望更深入控制特定模型版本和系统性能的用户提供专用实例。默认情况下，请求在与其他用户共享的计算基础设施上运行，这些用户按请求付费。我们的API在Azure上运行，通过专用实例，开发人员将按时间段支付为为服务其请求而保留的计算基础设施的分配付费。

开发人员可以完全控制实例的负载（更高的负载可以提高吞吐量，但使每个请求变慢），启用更长的上下文限制等功能的选项，以及固定模型快照的能力。

对于每天运行超过约4.5亿个代币的开发人员来说，专用实例可以带来经济意义。此外，它能够根据硬件性能直接优化开发人员的工作负载，这可以大幅降低相对于共享基础设施的成本。有关专门的实例查询，请联系我们。

Whisper

我们于2022年9月开源的语音转文本模型Whisper获得了开发人员社区的巨大赞誉，但也很难运行。我们现在通过我们的API提供了大型v2模型，该模型提供方便的按需访问，价格为0.006美元/分钟。此外，与其他服务相比，我们高度优化的服务堆栈确保了更快的性能。

Whisper API可以通过我们的transcriptions（源语言转录）或translations（转录成英语）端点获得，并接受各种格式（m4a 、mp3 、mp4 、mpeg 、mpga 、wav 、webm）。

Request

curl https://api.openai.com/v1/audio/transcriptions \ -H "Authorization: Bearer $OPENAI_API_KEY" \ -H "Content-Type: multipart/form-data" \ -F model="whisper-1" \ -F file="@/path/to/file/openai.mp3"

Response

{ "text": "Imagine the wildest idea that youve ever had, and youre curious about how it might scale to something thats a 100, a 1,000 times bigger..."}

Python的调用接口

# Python的调用接口 import openai file = open("/path/to/file/openai.mp3", "rb") transcription = openai.Audio.transcribe("whisper-1", f) print(transcription)