必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟(jì)5G手機(jī)智能汽車智慧城市會展特約記者

報(bào)道:OpenAI整合團(tuán)隊(duì)擬一季度發(fā)布新語音模型,為發(fā)布AI個(gè)人無屏設(shè)備鋪路

2026年1月4日 09:01華爾街見聞

OpenAI正優(yōu)化其音頻人工智能模型,為計(jì)劃中的語音驅(qū)動型個(gè)人設(shè)備做準(zhǔn)備。

1月1日,據(jù)The Information報(bào)道,OpenAI過去兩個(gè)月內(nèi)整合工程、產(chǎn)品和研究力量,集中攻克音頻交互的技術(shù)瓶頸,目標(biāo)打造一款可通過自然語音指令操作的消費(fèi)級設(shè)備。

公司內(nèi)部研究人員認(rèn)為,當(dāng)前ChatGPT的語音模型在準(zhǔn)確性和響應(yīng)速度上均落后于文本模型,且兩者使用的底層架構(gòu)并不相同。

據(jù)報(bào)道,新語音模型將具備更自然的情感表達(dá)能力和實(shí)時(shí)對話功能,包括處理對話打斷的能力,這是現(xiàn)有模型無法實(shí)現(xiàn)的關(guān)鍵特性,計(jì)劃2026年第一季度發(fā)布。

報(bào)道援引知情人士稱,OpenAI還計(jì)劃推出一系列無屏設(shè)備,包括智能眼鏡和智能音箱,將設(shè)備定位為用戶的“協(xié)作伴侶”而非單純的應(yīng)用入口。

不過在推出支持語音指令的消費(fèi)級AI硬件產(chǎn)品前,OpenAI需要先改變用戶的使用習(xí)慣。

團(tuán)隊(duì)整合聚焦無屏交互方式

據(jù)報(bào)道,OpenAI當(dāng)前的語音模型與文本模型分屬不同架構(gòu),導(dǎo)致用戶通過語音與ChatGPT對話時(shí),獲得的回答質(zhì)量和速度均遜于文本模型。

為解決這一問題,OpenAI在過去兩個(gè)月內(nèi)完成了關(guān)鍵團(tuán)隊(duì)整合。

在組織層面,今夏從Character.AI加入的語音研究員Kundan Kumar擔(dān)任音頻AI項(xiàng)目核心負(fù)責(zé)人。

產(chǎn)品研究主管Ben Newhouse正在重構(gòu)音頻AI基礎(chǔ)設(shè)施,多模態(tài)ChatGPT產(chǎn)品經(jīng)理Jackie Shannon也參與其中。

報(bào)道援引知情人士稱,新音頻模型架構(gòu)能夠生成更精準(zhǔn)深入的回應(yīng),支持與用戶實(shí)時(shí)對話,并更好地處理對話打斷等復(fù)雜場景。

在硬件形態(tài)上,OpenAI與谷歌、亞馬遜、Meta 和蘋果的判斷相似:現(xiàn)有主流設(shè)備并不適合未來AI交互。

OpenAI 團(tuán)隊(duì)希望用戶通過“說話”而非“看屏幕”與設(shè)備互動,認(rèn)為語音才是最貼近人類交流本能的方式。

此外,與OpenAI合作硬件開發(fā)的前蘋果設(shè)計(jì)主管喬尼·艾夫強(qiáng)調(diào),無屏幕設(shè)計(jì)不僅更自然,還有助于避免用戶沉迷。他在5月采訪中表示:

用戶習(xí)慣培養(yǎng)成關(guān)鍵挑戰(zhàn)

OpenAI面臨的主要障礙在于用戶行為。

據(jù)報(bào)道,多數(shù)ChatGPT用戶尚未養(yǎng)成語音交互習(xí)慣,原因包括音頻模型質(zhì)量不足或用戶未意識到該功能存在。

要推出以音頻為核心的AI設(shè)備,公司需先培養(yǎng)用戶通過語音與AI產(chǎn)品互動的習(xí)慣。

此前報(bào)道顯示,OpenAI已在2025年初斥資近65億美元收購喬尼·艾夫聯(lián)合創(chuàng)辦的io,并同步推進(jìn)供應(yīng)鏈、工業(yè)設(shè)計(jì)與模型研發(fā)等多條工作線。首款設(shè)備預(yù)計(jì)至少還需一年時(shí)間才能面世。

這一時(shí)間表意味著OpenAI需要在產(chǎn)品發(fā)布前,通過改進(jìn)現(xiàn)有ChatGPT語音功能來積累用戶基礎(chǔ),并驗(yàn)證音頻交互在日常場景中的實(shí)用性。

編 輯:章芳
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦閱讀

精彩視頻

精彩專題

關(guān)于我們廣告報(bào)價(jià)聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像