必讀視頻專(zhuān)題飛象趣談光通信人工智能低空經(jīng)濟(jì)5G手機(jī)智能汽車(chē)智慧城市會(huì)展特約記者

AI拍照解題技術(shù)新突破,傳音相關(guān)研究成果入選計(jì)算機(jī)視覺(jué)頂會(huì)CVPR 2026

2026年4月3日 18:13CCTIME飛象網(wǎng)

傳音持續(xù)深化AI領(lǐng)域的產(chǎn)學(xué)研協(xié)同,積極推動(dòng)與國(guó)內(nèi)外知名高校的深度合作,圍繞AI視覺(jué)、語(yǔ)音、語(yǔ)言與大模型等方向推進(jìn)協(xié)同創(chuàng)新。日前,傳音TEX AI中心與中山大學(xué)、穆罕默德·本·扎耶德人工智能大學(xué)(Mohamed bin Zayed University of Artificial Intelligence,簡(jiǎn)稱(chēng)MBZUAI)聯(lián)合開(kāi)展的“拍照解題”項(xiàng)目研究取得重要進(jìn)展,相關(guān)成果論文已被計(jì)算機(jī)視覺(jué)領(lǐng)域的國(guó)際頂級(jí)學(xué)術(shù)會(huì)議CVPR 2026正式錄用

CVPR是IEEE主辦的計(jì)算機(jī)視覺(jué)與模式識(shí)別領(lǐng)域的頂級(jí)會(huì)議,是中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)推薦的A類(lèi)會(huì)議,它與ICCV、ECCV并稱(chēng)為計(jì)算機(jī)視覺(jué)領(lǐng)域“三大頂會(huì)”。據(jù)最新數(shù)據(jù),CVPR 2026共有逾三萬(wàn)人投稿,在進(jìn)入評(píng)審流程的16,092篇有效文章中,最終接收率僅25.42%,每篇論文都必須通過(guò)3-5位全球頂尖專(zhuān)家的雙盲評(píng)審。

近年來(lái),AI大模型在邏輯推理與復(fù)雜問(wèn)題求解方面的能力持續(xù)提升,但在實(shí)際應(yīng)用中,其在復(fù)雜數(shù)學(xué)題上的處理表現(xiàn)仍存在不足。例如,解題結(jié)果正確但推理過(guò)程存在邏輯漏洞,或步驟看似完整但實(shí)際推導(dǎo)錯(cuò)誤。這類(lèi)問(wèn)題在學(xué)習(xí)場(chǎng)景中尤為關(guān)鍵,相較于答案本身,推理過(guò)程的準(zhǔn)確性更直接影響學(xué)生對(duì)知識(shí)的理解與掌握。

針對(duì)這一問(wèn)題,傳音TEX AI中心與中山大學(xué)、MBZUAI團(tuán)隊(duì)合作,開(kāi)發(fā)了CARE(Contrastive Anchored REflection)技術(shù),從訓(xùn)練機(jī)制上對(duì)傳統(tǒng)路徑進(jìn)行了優(yōu)化。不同于僅以“結(jié)果對(duì)錯(cuò)”作為反饋信號(hào)的方式,CARE技術(shù)將關(guān)注點(diǎn)前移到推理過(guò)程本身,重點(diǎn)引入“高質(zhì)量錯(cuò)誤樣本”——即那些接近正確但存在關(guān)鍵步驟偏差的解題路徑。通過(guò)將這類(lèi)樣本與標(biāo)準(zhǔn)解法進(jìn)行對(duì)比分析,并結(jié)合反思式重推理機(jī)制,模型能夠識(shí)別具體錯(cuò)誤環(huán)節(jié),并完成自我修正,從而形成更穩(wěn)定、連貫的推理能力。在引入反思機(jī)制后,模型對(duì)復(fù)雜問(wèn)題的二次推理成功率由約10%–19%提升至76.6%,有效增強(qiáng)了面對(duì)復(fù)雜題目時(shí)的穩(wěn)定性。

此外,CARE技術(shù)還引入“救援機(jī)制”:即使多次嘗試均未得到正確結(jié)果,系統(tǒng)仍會(huì)從已有錯(cuò)誤路徑中篩選出“相對(duì)最優(yōu)解”,作為進(jìn)一步學(xué)習(xí)的起點(diǎn),使模型在復(fù)雜問(wèn)題下仍能持續(xù)優(yōu)化推理能力。

在實(shí)際效果上,該方法顯著提升了模型的解題質(zhì)量。在MathVista(圖像數(shù)學(xué)推理)測(cè)試中,CARE準(zhǔn)確率比傳統(tǒng)方法的68.9%高13.2個(gè)百分點(diǎn),提升至82.1%;在MMMU-Pro(多學(xué)科綜合推理)測(cè)試中,CARE將準(zhǔn)確率從36.4%提升至46.7%。整體來(lái)看,CARE 比傳統(tǒng)方法平均提升 4.6 個(gè)百分點(diǎn)。

目前,該技術(shù)已進(jìn)入產(chǎn)品化階段,并逐步應(yīng)用于傳音手機(jī)智能助手中。基于CARE優(yōu)化后的能力,傳音手機(jī)智能助手拍照解題功能在輸出結(jié)果時(shí)不僅能夠提供答案,還能呈現(xiàn)更清晰、結(jié)構(gòu)更完整的解題步驟,在面對(duì)多步驟推導(dǎo)問(wèn)題時(shí)也更不容易出現(xiàn)邏輯中斷或錯(cuò)誤累積。這種“過(guò)程可解釋”的能力,使AI從單純的解題工具,進(jìn)一步向“可輔助理解”的學(xué)習(xí)工具演進(jìn)。

拍照解題是傳音在 AI 教育應(yīng)用上的重要方向。在非洲、南亞等地區(qū),教育資源相對(duì)稀缺,部分家庭在課后輔導(dǎo)方面仍面臨一定困難。傳音推出的拍照解題功能為學(xué)生提供即時(shí)的解題思路與步驟解析,在一定程度上彌補(bǔ)學(xué)習(xí)支持資源的不足,幫助用戶(hù)更高效地理解知識(shí)點(diǎn),提升學(xué)習(xí)效率,讓前沿科技真正服務(wù)于每個(gè)人的生活。

隨著AI技術(shù)持續(xù)向真實(shí)場(chǎng)景滲透,AI已經(jīng)成為理解用戶(hù)需求、創(chuàng)造新體驗(yàn)的重要工具。傳音積極將 AI 能力深度融入社交、出行、健康、教育等高頻場(chǎng)景,讓技術(shù)從“可用” 變?yōu)椤罢鎸?shí)可感”,實(shí)現(xiàn)用戶(hù)的體驗(yàn)升級(jí)。此次聯(lián)合研究成果的落地,也為AI在教育場(chǎng)景中的進(jìn)一步應(yīng)用提供了新的技術(shù)路徑與實(shí)踐基礎(chǔ)。通過(guò)持續(xù)推進(jìn)以用戶(hù)需求為導(dǎo)向的技術(shù)創(chuàng)新,并深化與高校的協(xié)同研發(fā),傳音正不斷將前沿AI能力轉(zhuǎn)化為可落地的產(chǎn)品體驗(yàn),讓更多用戶(hù)能夠享受到AI帶來(lái)的便利。

編 輯:T01
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來(lái)源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來(lái)源。
2.凡注明“來(lái)源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
推薦閱讀
  • 2026十大科技趨勢(shì)

    2026 十大科技趨勢(shì),定義新一年的每一次突破。祝大家馬年大吉,馬到成功!初八啟新程,萬(wàn)事皆順?biāo)欤?/P>[詳細(xì)]

精彩視頻

精彩專(zhuān)題

關(guān)于我們廣告報(bào)價(jià)聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2026 By CCTIME.COM

京ICP備08004280號(hào)-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)

公司名稱(chēng): 北京飛象互動(dòng)文化傳媒有限公司

未經(jīng)書(shū)面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像