OpenAI推出gpt-realtime语音对话模型:支持情感感知、多语言无缝切换(openai推出gpt 4.5)

8 月 29 日消息,OpenAI 已将其“Realtime API”正式投入生产环境,将其移出测试阶段(Beta)。

据 了解,这款 API 主要面向企业与开发者群体,旨在助力他们开发适用于实际场景的语音助手,覆盖客户支持、教育、个人效率提升等领域。其核心组件“gpt-realtime”模型采用端到端 Speech-to-Speech 架构,可直接生成并处理语音,省去了常规的文本转换步骤。据 OpenAI 介绍,相比前代版本,该模型响应速度更快、语音更自然,对复杂指令的处理能力也更强。

OpenAI 表示,目前 gpt-realtime 模型能够捕捉笑声等非语言信号,支持对话过程中中途切换语言,还可调整语音语气 —— 例如实现“带法国口音的友好语调”或“语速较快的专业语调”。此外,该模型新增了“Cedar”和“Marin”两种语音,并对现有的 8 种语音效果进行了优化。

在性能基准测试中,gpt-realtime 模型表现显著提升:在 Big Bench Audio 基准测试中准确率从 65.6% 升至 82.8%,在 MultiChallenge 基准测试中从 20.6% 升至 30.5%,在 ComplexFuncBench 基准测试中则从 49.7% 提升至 66.5%。

此次 API 升级优化了工具集成流程。OpenAI 称,该模型能更精准地选择适用工具、在恰当时机触发工具,并正确配置工具参数,大幅提升了函数调用的可靠性。开发者可通过会话初始协议(SIP)与远程媒体控制协议(MCP)『服务器』,连接外部工具与服务。同时,可复用的提示词功能支持保存不同使用场景下的配置与工具设置,进一步提升开发效率。

该 API 现已支持图像输入功能。用户在对话过程中可发送截图或照片,模型能参考图像内容进行交互 —— 例如读取图像中的文字,或回答与图像内容相关的问题。开发者可自主控制模型能够获取的图像范围。

此外,API 新增了两项实用功能:开发者可设置 token 使用上限,并对多轮对话内容进行精简处理。这两项功能有助于在较长会话中更好地控制成本。价格方面,gpt-realtime 模型的使用成本降低 20%,当前定价为:音频输入 token 每百万个 32 美元💵( 注:现汇率约合 229 元人民币),音频输出 token 每百万个 64 美元💵(现汇率约合 457.9 元人民币),缓存输入 token 每百万个 0.40 美元💵(现汇率约合 2.9 元人民币)。

OpenAI 表示,该 API 具备检测问题内容的能力,若对话违反平台政策,可自动终止会话。不过,从语言模型的安全发展历程来看,这不应是唯一的安全保障手段,开发者仍需自行添加专属安全要求。

针对欧盟用户,该 API 提供了数据本地化存储选项,并为企业用户制定了特殊隐私规则,以符合欧盟地区的数据保护法规。

特别声明:[OpenAI推出gpt-realtime语音对话模型:支持情感感知、多语言无缝切换(openai推出gpt 4.5)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

如何辨别『化妆品』用微胶囊原料的品质优劣?(如何辨别『化妆品』含激素)

活性成分失效:若微胶囊的包覆密封性差,核心活性物易与外界氧气、水分接触发生降解,导致产品功效大打折扣;配方稳定性风险:劣质微胶囊可能在配方中出现沉底、破裂、褪色等问题,影响产品外观与货架期; 使用体验下…

如何辨别『化妆品』用微胶囊原料的品质优劣?(如何辨别『化妆品』含激素)

横店又新鲜出炉一部!《顾大状,您的白月光带子上门了》5天开杀青(新横店在哪里)

项目能高水平完成,刘宁之强调离不开每个人的初心和努力;王九舒也在话语里透露了筹备的苦与细节:从一个灵感的火花❇️,到剧本来回打磨,再到团队夜以继日去把细节做对做满,导演说这是对“讲好一个故事”的赤诚。家人们,我…

横店又新鲜出炉一部!《<strong>顾大状,您的白月光带子上门了</strong>》5天开杀青(新横店在哪里)

歌手2026名单曝光 ?苏醒正在走陈楚生的老路,能成功再翻红吗?(歌手202020)

最近,我看到了《歌手2026》的网上流传的名单,这时候,我忽然就觉得,不知不觉地,这档节目都成了『娱乐圈』️的重新走红工厂,你瞧瞧那份名单,张靓颖、林宥嘉、郑欣宜、黄霄云、刘柏辛、苏醒,还有外国歌手GreysonC…

歌手2026名单曝光 ?苏醒正在走陈楚生的老路,能成功再翻红吗?(歌手202020)

服务大国重器!上海三维工业动画制作公司有哪些硬核玩家?(服务国家发展的重要信息平台)

服务核电、航天等&quot;大国重器&quot;级企业,对动画公司的技术精度、保密能力和行业理解提出极高要求。国内具备此资质的企业中,红蓝视觉以严格保密流程赢得央企信赖,上海漫玻数字则擅长大众汽车、宝钢等超大型工业项目。 上

服务大国重器!上海三维工业动画制作公司有哪些硬核玩家?(服务国家发展的重要信息平台)

离婚不到1年,『陈妍希』周柯宇官宣好消息,网友们的反应很精彩(离婚一年不到可以再起诉么)

昨日,『陈妍希』与周柯宇带来了一个令人兴奋的好消息:两位将在微博之夜的舞台上合唱《早安晚安》,这一消息一经发布,立刻引发了网友们的热烈讨论。 这部剧的成功,带给『陈妍希』的是口碑的暴涨,她也因此收获了大量粉丝…

离婚不到1年,『陈妍希』周柯宇官宣好消息,网友们的反应很精彩(离婚一年不到可以再起诉么)