报谈: OpenAI整合团队拟一季度发布新语音模子, 为发布AI个东谈主无屏缔造铺路

106 2026-01-04 11:15

OpenAI正优化其音频东谈主工智能模子，为筹画中的语音运转型个东谈主缔造作念准备。

1月1日，据TheInformation报谈，OpenAI当年两个月内整合工程、居品和磋商力量，纠合攻克音频交互的时间瓶颈，策画打造一款可通过当然语音辅导操作的破费级缔造。

公司里面磋商东谈主员以为，现时ChatGPT的语音模子在准确性和反应速率上均逾期于文本模子，且两者使用的底层架构并不交流。

据报谈，新语音模子将具备更当然的热诚抒发智商和及时对话功能，包括处理对话打断的智商，这是现存模子无法竣事的要道特色，筹画2026年第一季度发布。

报谈征引知情东谈主士称，OpenAI还筹画推出一系列无屏缔造，包括智能眼镜和智能音箱，将缔造定位为用户的"配合伴侣"而非单纯的愚弄进口。

不外在推出解救语音辅导的破费级AI硬件居品前，OpenAI需要先更正用户的使用俗例。

团队整合聚焦无屏交互样式

据报谈，OpenAI现时的语音模子与文本模子分属不同架构，导致用户通过语音与ChatGPT对话时，得回的回答质料和速率均逊于文本模子。

为科罚这一问题，OpenAI在当年两个月内完成了要道团队整合。

在组织层面，今夏从Character.AI加入的语音磋商员KundanKumar担任音频AI样式中枢老成东谈主。

居品磋商控制BenNewhouse正在重构音频AI基础体式，多模态ChatGPT居品司理JackieShannon也参与其中。

报谈征引知情东谈主士称，新音频模子架构概况生成更精确潜入的薪金，解救与用户及时对话，并更好地处理对话打断等复杂场景。

在硬件形态上，OpenAI与谷歌、亚马逊、Meta和苹果的判断相通：现存主流缔造并不适应将来AI交互。

OpenAI团队但愿用户通过“谈话”而非“看屏幕”与缔造互动，以为语音才是最迫临东谈主类交流本能的样式。

此外，与OpenAI合作硬件开垦的前苹果设想控制乔尼·艾夫强调，无屏幕设想不仅更当然，还有助于幸免用户千里迷。他在5月采访中默示：

用户俗例培养成要道挑战

OpenAI濒临的主要艰涩在于用户活动。

据报谈，大皆ChatGPT用户尚未养谚语音交互俗例，原因包括音频模子质料不及或用户未意志到该功能存在。

要推出以音频为中枢的AI缔造，公司需先培养用户通过语音与AI居品互动的俗例。

此前报谈暴露，OpenAI已在2025岁首斥资近65亿好意思元收购乔尼·艾夫长入创办的io，并同步鼓吹供应链、工业设想与模子研发等多条职责线。首款缔造展望至少还需一年时间智力面世。

这一时间表意味着OpenAI需要在居品发布前，通过修订现存ChatGPT语音功能来积聚用户基础，并考据音频交互在平素场景中的实用性。

推荐资讯

96 2025-12-17

66 2025-12-15

111 2025-12-11