11月13日,百度世界2025大會(huì)在北京國(guó)家會(huì)議中心二期舉辦。活動(dòng)期間,格靈深瞳與百度進(jìn)行深入交流,并圍繞VLM、AI Infra、應(yīng)用場(chǎng)景等話題展開全面分享。
現(xiàn)場(chǎng),格靈深瞳與百度共同探討了視覺(jué)算法、VLM、應(yīng)用場(chǎng)景等AI重點(diǎn)方向,深度交流彼此的思考與實(shí)踐,并展望未來(lái)的合作發(fā)展空間。
在分論壇和公開課環(huán)節(jié),格靈深瞳聚焦全開源多模態(tài)大模型、超融合產(chǎn)品與算力市場(chǎng)、金融視覺(jué)任務(wù)、AI開發(fā)平臺(tái)四大話題,全面分享技術(shù)創(chuàng)新和行業(yè)應(yīng)用。
VLM全開源:Open Source,Open Innovation
在分論壇環(huán)節(jié),格靈深瞳靈感實(shí)驗(yàn)室負(fù)責(zé)人馮子勇分享《LLaVA-OneVision-1.5:揭秘商用級(jí)別VLM構(gòu)建流程》主題演講,介紹多模態(tài)大模型LLaVA-OneVision-1.5全開源背后的技術(shù)細(xì)節(jié)。
區(qū)別于一般開源模型僅開源模型權(quán)重和部分代碼,LLaVA-OneVision-1.5實(shí)現(xiàn)了訓(xùn)練數(shù)據(jù)、代碼和模型權(quán)重的全鏈路開源,并且效果優(yōu)于同等規(guī)模Qwen2.5-VL。在創(chuàng)新性上,團(tuán)隊(duì)對(duì)“視覺(jué)編碼器+投影層+大語(yǔ)言模型”的LLaVA架構(gòu)進(jìn)行模塊升級(jí):視覺(jué)編碼器從CLIP替換為格靈深瞳自研Glint-ViT v1.5(RICE),大語(yǔ)言模型從Qwen2替換為Qwen3。同時(shí),基于高效的訓(xùn)練框架和多模態(tài)數(shù)據(jù)拼接,模型可在一周內(nèi)完成訓(xùn)練,單次成本不超過(guò)10萬(wàn)元。
超融合產(chǎn)品與算力市場(chǎng):扎根實(shí)際業(yè)務(wù)場(chǎng)景
在分論壇圓桌環(huán)節(jié),格靈深瞳產(chǎn)品負(fù)責(zé)人陳天博圍繞“AI推理時(shí)代,重塑算力格局”主題,分享來(lái)自一線的超融合硬件產(chǎn)品應(yīng)用和算力市場(chǎng)觀察。
隨著模型能力逐步深入業(yè)務(wù)流程,硬件產(chǎn)品和算力需求迎來(lái)新變化。行業(yè)用戶聚焦實(shí)際業(yè)務(wù)場(chǎng)景和規(guī)模,重視高并發(fā)場(chǎng)景下計(jì)算平臺(tái)的穩(wěn)定和性能提升。同時(shí),行業(yè)專家的市場(chǎng)角色更加突出,持續(xù)進(jìn)化的端到端產(chǎn)品服務(wù)能力成為關(guān)鍵。格靈深瞳超融合一體機(jī)基于全國(guó)產(chǎn)底座,可確保從硬件到應(yīng)用的安全自主可控,滿足行業(yè)用戶的產(chǎn)品落地需求。
金融視覺(jué)進(jìn)化:大模型時(shí)代的“火眼金睛”煉成術(shù)
在“AI提效大玩家”主題公開課,格靈深瞳副總裁羅楷分享《不靠巨量數(shù)據(jù),如何煉就AI的“火眼金睛”?》,介紹金融視覺(jué)任務(wù)的進(jìn)化之路。
相較于過(guò)去的CNN范式,大模型時(shí)代的視覺(jué)任務(wù)在數(shù)據(jù)、模型訓(xùn)練與推理、工程化、產(chǎn)品設(shè)計(jì)等方面,都發(fā)生了明顯變化。格靈深瞳通過(guò)原始數(shù)據(jù)和訓(xùn)練數(shù)據(jù)生成、基于Glint-MVT視覺(jué)模型基座提高訓(xùn)練效率、優(yōu)化邊緣端與中心端多種推理方式、Infra能力保障算力資源高效利用等方式,“組合拳”破題,解決如何在有限資源下,更多釋放大模型的產(chǎn)品價(jià)值,讓計(jì)算機(jī)更好地看懂世界。
模型生產(chǎn)平臺(tái)化:讓開發(fā)者變身“六邊形戰(zhàn)士”
在“AI產(chǎn)業(yè)大變革”主題公開課,格靈深瞳研發(fā)副總裁閆梓禎分享《視覺(jué)智能應(yīng)用高效落地秘籍》,介紹Glint Lab一站式AI開放平臺(tái)的功能亮點(diǎn)。
針對(duì)AI定制化開發(fā)過(guò)程中的痛點(diǎn),Glint Lab一體化開發(fā)平臺(tái)功能覆蓋算法模型生產(chǎn)全流程。僅需按照平臺(tái)引導(dǎo),一位開發(fā)者可以完成數(shù)據(jù)的采集、處理、標(biāo)注和模型的訓(xùn)練、發(fā)布、部署,輕松上手6項(xiàng)角色任務(wù),實(shí)現(xiàn)端到端的項(xiàng)目開發(fā)閉環(huán),解決數(shù)據(jù)、模型、部署終端割裂的問(wèn)題。在自研邊緣終端的基礎(chǔ)上,平臺(tái)可適配市場(chǎng)主流終端設(shè)備,讓開放的算法能力賦能不同行業(yè)智能化變革。
未來(lái),格靈深瞳將持續(xù)深耕視覺(jué)算法與多模態(tài)大模型,構(gòu)建“模型算法-產(chǎn)品方案-AI服務(wù)”的端到端能力。通過(guò)技術(shù)產(chǎn)品在多元場(chǎng)景下的深化應(yīng)用,助力AI賦能千行百業(yè)。
-
百度
+關(guān)注
關(guān)注
9文章
2377瀏覽量
94864 -
格靈深瞳
+關(guān)注
關(guān)注
1文章
90瀏覽量
5956
原文標(biāo)題:四大話題、有趣有料,格靈深瞳的“環(huán)游記” | 百度世界2025
文章出處:【微信號(hào):shentongzhineng,微信公眾號(hào):格靈深瞳】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
格靈深瞳精彩亮相百度世界2025大會(huì)
評(píng)論