11月13日,百度世界2025大會(huì)在北京國家會(huì)議中心二期舉辦。活動(dòng)期間,格靈深瞳與百度進(jìn)行深入交流,并圍繞VLM、AI Infra、應(yīng)用場景等話題展開全面分享。
現(xiàn)場,格靈深瞳與百度共同探討了視覺算法、VLM、應(yīng)用場景等AI重點(diǎn)方向,深度交流彼此的思考與實(shí)踐,并展望未來的合作發(fā)展空間。
在分論壇和公開課環(huán)節(jié),格靈深瞳聚焦全開源多模態(tài)大模型、超融合產(chǎn)品與算力市場、金融視覺任務(wù)、AI開發(fā)平臺(tái)四大話題,全面分享技術(shù)創(chuàng)新和行業(yè)應(yīng)用。
VLM全開源:Open Source,Open Innovation
在分論壇環(huán)節(jié),格靈深瞳靈感實(shí)驗(yàn)室負(fù)責(zé)人馮子勇分享《LLaVA-OneVision-1.5:揭秘商用級(jí)別VLM構(gòu)建流程》主題演講,介紹多模態(tài)大模型LLaVA-OneVision-1.5全開源背后的技術(shù)細(xì)節(jié)。
區(qū)別于一般開源模型僅開源模型權(quán)重和部分代碼,LLaVA-OneVision-1.5實(shí)現(xiàn)了訓(xùn)練數(shù)據(jù)、代碼和模型權(quán)重的全鏈路開源,并且效果優(yōu)于同等規(guī)模Qwen2.5-VL。在創(chuàng)新性上,團(tuán)隊(duì)對(duì)“視覺編碼器+投影層+大語言模型”的LLaVA架構(gòu)進(jìn)行模塊升級(jí):視覺編碼器從CLIP替換為格靈深瞳自研Glint-ViT v1.5(RICE),大語言模型從Qwen2替換為Qwen3。同時(shí),基于高效的訓(xùn)練框架和多模態(tài)數(shù)據(jù)拼接,模型可在一周內(nèi)完成訓(xùn)練,單次成本不超過10萬元。
超融合產(chǎn)品與算力市場:扎根實(shí)際業(yè)務(wù)場景
在分論壇圓桌環(huán)節(jié),格靈深瞳產(chǎn)品負(fù)責(zé)人陳天博圍繞“AI推理時(shí)代,重塑算力格局”主題,分享來自一線的超融合硬件產(chǎn)品應(yīng)用和算力市場觀察。
隨著模型能力逐步深入業(yè)務(wù)流程,硬件產(chǎn)品和算力需求迎來新變化。行業(yè)用戶聚焦實(shí)際業(yè)務(wù)場景和規(guī)模,重視高并發(fā)場景下計(jì)算平臺(tái)的穩(wěn)定和性能提升。同時(shí),行業(yè)專家的市場角色更加突出,持續(xù)進(jìn)化的端到端產(chǎn)品服務(wù)能力成為關(guān)鍵。格靈深瞳超融合一體機(jī)基于全國產(chǎn)底座,可確保從硬件到應(yīng)用的安全自主可控,滿足行業(yè)用戶的產(chǎn)品落地需求。
金融視覺進(jìn)化:大模型時(shí)代的“火眼金睛”煉成術(shù)
在“AI提效大玩家”主題公開課,格靈深瞳副總裁羅楷分享《不靠巨量數(shù)據(jù),如何煉就AI的“火眼金睛”?》,介紹金融視覺任務(wù)的進(jìn)化之路。
相較于過去的CNN范式,大模型時(shí)代的視覺任務(wù)在數(shù)據(jù)、模型訓(xùn)練與推理、工程化、產(chǎn)品設(shè)計(jì)等方面,都發(fā)生了明顯變化。格靈深瞳通過原始數(shù)據(jù)和訓(xùn)練數(shù)據(jù)生成、基于Glint-MVT視覺模型基座提高訓(xùn)練效率、優(yōu)化邊緣端與中心端多種推理方式、Infra能力保障算力資源高效利用等方式,“組合拳”破題,解決如何在有限資源下,更多釋放大模型的產(chǎn)品價(jià)值,讓計(jì)算機(jī)更好地看懂世界。
模型生產(chǎn)平臺(tái)化:讓開發(fā)者變身“六邊形戰(zhàn)士”
在“AI產(chǎn)業(yè)大變革”主題公開課,格靈深瞳研發(fā)副總裁閆梓禎分享《視覺智能應(yīng)用高效落地秘籍》,介紹Glint Lab一站式AI開放平臺(tái)的功能亮點(diǎn)。
針對(duì)AI定制化開發(fā)過程中的痛點(diǎn),Glint Lab一體化開發(fā)平臺(tái)功能覆蓋算法模型生產(chǎn)全流程。僅需按照平臺(tái)引導(dǎo),一位開發(fā)者可以完成數(shù)據(jù)的采集、處理、標(biāo)注和模型的訓(xùn)練、發(fā)布、部署,輕松上手6項(xiàng)角色任務(wù),實(shí)現(xiàn)端到端的項(xiàng)目開發(fā)閉環(huán),解決數(shù)據(jù)、模型、部署終端割裂的問題。在自研邊緣終端的基礎(chǔ)上,平臺(tái)可適配市場主流終端設(shè)備,讓開放的算法能力賦能不同行業(yè)智能化變革。
未來,格靈深瞳將持續(xù)深耕視覺算法與多模態(tài)大模型,構(gòu)建“模型算法-產(chǎn)品方案-AI服務(wù)”的端到端能力。通過技術(shù)產(chǎn)品在多元場景下的深化應(yīng)用,助力AI賦能千行百業(yè)。
-
百度
+關(guān)注
關(guān)注
9文章
2381瀏覽量
95094 -
格靈深瞳
+關(guān)注
關(guān)注
1文章
93瀏覽量
5991
原文標(biāo)題:四大話題、有趣有料,格靈深瞳的“環(huán)游記” | 百度世界2025
文章出處:【微信號(hào):shentongzhineng,微信公眾號(hào):格靈深瞳】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
格靈深瞳精彩亮相百度世界2025大會(huì)
評(píng)論