今天,「2025百度十大科技前沿發(fā)明」亮相!
從大模型、深度學(xué)習(xí)框架到智能體、數(shù)字人、無人駕駛等AI技術(shù)突破,今年發(fā)布的十大科技前沿發(fā)明涵蓋了人工智能算力、框架、模型、場景應(yīng)用全棧技術(shù)體系。
歷經(jīng)十余年技術(shù)投入,百度在AI領(lǐng)域積累了豐碩創(chuàng)新成果,人工智能全領(lǐng)域?qū)@堰B續(xù)七年居國內(nèi)第一。
《2025人工智能創(chuàng)新與專利白皮書》顯示,百度生成式AI、智能體專利中國第一,大模型專利申請量全球第二、中國第一,深度學(xué)習(xí)專利申請量全球第一,高級別自動駕駛專利族數(shù)全球第一。
同時,我們也在積極推進前沿科技發(fā)明在內(nèi)外部場景的應(yīng)用,加速創(chuàng)新成果落地轉(zhuǎn)化,為產(chǎn)業(yè)創(chuàng)造價值。
一同見證前沿發(fā)明引領(lǐng)智能躍遷
感受AI應(yīng)用效果涌現(xiàn)
1.自回歸統(tǒng)一建模的原生多模態(tài)大模型
本發(fā)明是新一代文心大模型的核心技術(shù),提出了業(yè)界首個能夠同時支持語言、圖像、視頻、音頻統(tǒng)一建模的多模態(tài)大模型技術(shù)框架,實現(xiàn)了多模態(tài)原生統(tǒng)一的融合建模,可同時支持任意模態(tài)的理解與生成;在此基礎(chǔ)上構(gòu)建了一種面向大模型的獎勵系統(tǒng),為多環(huán)境多任務(wù)場景提供高質(zhì)量的強化學(xué)習(xí)獎勵信號。
2.大模型訓(xùn)練全流程高效容錯技術(shù)
本發(fā)明提出了大模型訓(xùn)練高效容錯技術(shù),構(gòu)建了完備高效的軟硬件故障自動召回定位恢復(fù)體系,創(chuàng)新性地提出基于大模型通信行為的全場景故障定位方法和零損失訓(xùn)練快照機制,攻克了集群訓(xùn)練中故障定位與召回恢復(fù)兩大關(guān)鍵難題。同時,通過研制層次清晰、架構(gòu)合理的容錯接入體系及全流程測試框架,在大模型訓(xùn)練過程中實現(xiàn)了高效部署與驗證,顯著提升故障恢復(fù)效率,降低系統(tǒng)故障概率。
3.劇本驅(qū)動的高說服力數(shù)字人技術(shù)
本發(fā)明構(gòu)建了高說服力數(shù)字人方案,依托數(shù)字人視頻生成大模型基座設(shè)計了多模協(xié)同、高表現(xiàn)力、超長時長的數(shù)字人視頻生產(chǎn)方案,涵蓋可控視頻生成技術(shù)、超擬真唇形驅(qū)動技術(shù)、劇本智能創(chuàng)作和AI大腦自主決策4個核心能力,突破大表情/大動作、音容話一致、人-物-場復(fù)雜交互等一系列業(yè)界難題。
4.基于多智能體協(xié)同的AI搜索引擎
該發(fā)明創(chuàng)新性地提出了一種AI搜索引擎技術(shù),其核心框架Deep-Search以Master-Planner-Execu-tor-Generator四層智能體體系為技術(shù)底座,模擬人類信息處理的“感知-規(guī)劃-執(zhí)行-生成”全流程,動態(tài)適配從單輪事實查詢到復(fù)雜多階段推理的全場景需求。AI搜索引擎,系統(tǒng)地融合顯式任務(wù)規(guī)劃、動態(tài)工具調(diào)用與實時反思機制,為新一代智能搜索提供了核心技術(shù)支撐。
5.蒸汽機(文心專精)音視頻一體化生成大模型技術(shù)
本發(fā)明是全球首個中文音視頻一體化生成模型,通過多模態(tài)信息的精準(zhǔn)同步與自然交互,支持分鐘級多人有聲音視頻生成與交互;該發(fā)明由自回歸擴散建模、有聲一體化訓(xùn)練、高性能訓(xùn)推優(yōu)化三大技術(shù)核心構(gòu)成;通過極致的中文場景高質(zhì)量數(shù)據(jù)清洗與結(jié)構(gòu)化描述、訓(xùn)推一致性優(yōu)化,調(diào)教支持長視頻生成基座;搭載首創(chuàng)的Latent Multi Modal Planner技術(shù)重構(gòu)生成邏輯,實現(xiàn)視頻的全流程有聲一體化生成;極致工程優(yōu)化突破傳統(tǒng)擴散模型限制,壓縮視頻成本,滿足生成實時交互。
6.從芯片到集群的跨層級訓(xùn)推一體A基建系統(tǒng)性技水
本發(fā)明提出了從芯片到集群的跨層級協(xié)同優(yōu)化、訓(xùn)推一體的AI基建系統(tǒng)性創(chuàng)新技術(shù),計算架構(gòu)上,首創(chuàng)Ultra Server柜級超節(jié)點,兼容多卡;自研XPULink與PD分離架構(gòu),全棧優(yōu)化軟硬件協(xié)同;存儲系統(tǒng)上,自適應(yīng)元數(shù)據(jù)架構(gòu)突破大規(guī)模管理瓶頸,專屬kVCache加速方案適配Al業(yè)務(wù);網(wǎng)絡(luò)技術(shù)上,推理專屬2跳可達架構(gòu)+彈性生eRDMA,構(gòu)建低時延傳輸通道;云原生能力上,全鏈路智能運維(異常自感知/診斷/恢復(fù)),AI網(wǎng)關(guān)增LLM智能路由。
7.兼容端到端軌跡方案的自動駕駛橫縱聯(lián)合控制技術(shù)
本發(fā)明提出了一種可兼容端到端軌跡方案的自動駕駛橫縱聯(lián)合控制技術(shù),基于車輛的橫縱耦合動力學(xué),設(shè)計線性時變模型預(yù)測控制器,實現(xiàn)車輛運動的橫、縱向聯(lián)合協(xié)同控制,模型假設(shè)近似更少,對上游數(shù)據(jù)依賴更少,橫縱向指令更加穩(wěn)定,實現(xiàn)對傳統(tǒng)方案的升級和超越。該發(fā)明可完美適配Apollo ADFM的端到端上游軌跡方案,大幅提升安全性和乘坐舒適性,對于低速橫向晃動幅度可優(yōu)化70%,100%消除彎道橫向抽動的控制問題。
8.信息流端到端內(nèi)容理解與序列生成技術(shù)
本發(fā)明突破了現(xiàn)有推薦系統(tǒng)中內(nèi)容理解與分發(fā)模型相互割裂的局限,首創(chuàng)端到端多模態(tài)內(nèi)容理解與序列生成技術(shù),構(gòu)建了“理解生成-分發(fā)反饋-再理解生成”的自增強閉環(huán)。通過全新的多模態(tài)語義對齊和動態(tài)Token統(tǒng)一量化技術(shù),融合用戶快慢反饋,將多模態(tài)知識對齊與生成式行為建模深度融合,實現(xiàn)Feed信息流系統(tǒng)從記憶檢索,邁向深度理解生成推理的新階段。
9.飛槳科學(xué)計算高效求解技術(shù)
本發(fā)明基于飛槳的科學(xué)計算核心技術(shù),通過組合算子拆分、高階自動微分、符號表達式的推理和神經(jīng)網(wǎng)絡(luò)編譯器技術(shù),實現(xiàn)了微分方程的高效求解,解決了科學(xué)計算場景高階微分方程求解的難題。本發(fā)明的微分方程求解速度較傳統(tǒng)方法提升2到4個數(shù)量級,比PyTorch提速115%,被國際知名微分方程求解庫DeepXDE唯一推薦;已在飛槳框架中實現(xiàn),集成于Paddle-Science、PaddleCFD等產(chǎn)品,并實現(xiàn)產(chǎn)業(yè)化應(yīng)用。
10.基于智能體的自進化應(yīng)用生成技術(shù)
本發(fā)明以大模型與強化學(xué)習(xí)為核心,構(gòu)建了由“需求模型、代碼模型、創(chuàng)意模型”組成的三重自進化學(xué)習(xí)架構(gòu),通過自然語言理解用戶需求,經(jīng)由代碼模型實現(xiàn)高質(zhì)量代碼生成,并在用戶反饋與強化學(xué)習(xí)機制下形成持續(xù)優(yōu)化的數(shù)據(jù)飛輪。基于該發(fā)明技術(shù)的系統(tǒng)不僅能執(zhí)行代碼生成任務(wù),更能在實踐中自我學(xué)習(xí)、逐步提升智能水平,真正實現(xiàn)“越用越聰明”的AI開發(fā)助手;其多模型協(xié)同機制與端到端軌跡學(xué)習(xí)技術(shù),打破了傳統(tǒng)無代碼平臺的靜態(tài)瓶頸,形成可持續(xù)演化的智能體編程體系。
這些前沿發(fā)明是AI行業(yè)新技術(shù)趨勢的重要反映,其中不少技術(shù)已落地內(nèi)外部場景應(yīng)用。例如:
信息流端到端內(nèi)容理解與序列生成技術(shù)
該技術(shù)突破傳統(tǒng)內(nèi)容理解與分發(fā)模型割裂的局限,構(gòu)建了“理解生成-分發(fā)反饋-再理解生成”的自增強閉環(huán),該發(fā)明所在的“心流”團隊于9月獲得今年百度最高獎。
劇本驅(qū)動的高說服力數(shù)字人技術(shù)
曾推動數(shù)字人技術(shù)進入高質(zhì)量、低成本、廣應(yīng)用的普惠時代,使數(shù)字人具備超擬真、高表現(xiàn)力、AI大腦靈活調(diào)度、劇本智能創(chuàng)作等特性。該技術(shù)曾支撐羅永浩數(shù)字人直播首秀創(chuàng)下GMV5500萬元行業(yè)紀(jì)錄。
兼容端到端軌跡方案的自動駕駛橫縱聯(lián)合控制技術(shù)
支撐了Apollo領(lǐng)先的控制技術(shù)方案,大幅提升自動駕駛車輛的安全性和乘坐舒適性。目前,蘿卜快跑已累計提供超1400萬次出行服務(wù),安全行駛里程超2億公里。
……
想了解更多前沿技術(shù)?來!就在百度世界2025,11月13日,北京國家會議中心二期,一起見證AI效果涌現(xiàn)時刻。
-
AI
+關(guān)注
關(guān)注
91文章
39755瀏覽量
301350 -
百度
+關(guān)注
關(guān)注
9文章
2377瀏覽量
94858 -
人工智能
+關(guān)注
關(guān)注
1817文章
50094瀏覽量
265263
原文標(biāo)題:2025百度十大科技前沿發(fā)明,亮相!
文章出處:【微信號:baidu_2000,微信公眾號:百度】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
2025年度“十大科技熱詞”
百度地圖開放平臺與400萬開發(fā)者共赴智能時空新未來
進迭時空2025年度十大開發(fā)者揭曉
格靈深瞳精彩亮相百度世界2025大會
百度世界大會亮點 五年五芯 百度宣布打造最硬AI云
百度世界2025進行中 百度昆侖芯超節(jié)點亮相 性能巨幅提升
百度快訊:蘿卜快跑獲批在香港九龍跨區(qū)測試;百度2025十大科技前沿發(fā)明亮相;入選國家知識產(chǎn)權(quán)局首批產(chǎn)業(yè)
昆侖芯科技亮相2025百度云智大會
百度智能云亮相第二十二屆ChinaJoy
百度亮相2025世界新能源汽車大會
百度發(fā)布2025年Q1財報 蘿卜快跑一季度全球訂單超140萬
2025百度十大科技前沿發(fā)明亮相
評論