當(dāng)下,AI技術(shù)繁榮無比,但無數(shù)企業(yè)卻陷入“叫好不叫座”的困境:算法模型很先進,但一到真實的行業(yè)場景中就“水土不服”。問題究竟出在哪?大模型和智能體的興起,又為我們提供了怎樣的新解題思路?本文將深入探討算法落地的核心痛點,并闡述我們?nèi)绾谓枇π录夹g(shù),打造出真正解決問題的產(chǎn)品。
一、 落地之困:價值兌現(xiàn)的“最后一公里”難題
盡管技術(shù)不斷突破,但算法在深入行業(yè)應(yīng)用時,依然面臨幾個核心挑戰(zhàn):
“專用”與“通用”的矛盾:
傳統(tǒng)小模型要求算法定義明確,功能上稍作調(diào)整或者換一個細(xì)分場景都需要重新開發(fā),研發(fā)成本高、周期長,難以規(guī)模化復(fù)制;
“感知”與“認(rèn)知”的割裂:
由于小模型并不具備“類似于人的認(rèn)知”,因此要求給出明確的算法定義,而對于部分需求而言,算法定義難以設(shè)計,因而這些功能無法被有效實現(xiàn)出來;
“交付”與“優(yōu)化”的斷層:
行業(yè)落地過程中,算法上線只是開始,持續(xù)不斷的優(yōu)化非常關(guān)鍵,僅僅提供算法本身是不夠的。
二、破局之器:大模型與智能體的特性與優(yōu)勢
幸運的是,技術(shù)本身也在演進,大模型和智能體帶來了新的可能性:
大模型的特點
“通用”但不“專精”
模型的能力來自于數(shù)據(jù)。得益于大量互聯(lián)網(wǎng)數(shù)據(jù)的訓(xùn)練,目前的基礎(chǔ)大模型具備了廣泛的知識,但這些知識落到具體某個行業(yè)、場景上,就非常依賴于對應(yīng)行業(yè)、場景的數(shù)據(jù)是否在互聯(lián)網(wǎng)上出現(xiàn)過,以及出現(xiàn)過多少。所以,在我們看來,大模型在不同的場景下會有截然不同的表現(xiàn),比如馬路上的行人檢測精度不錯,但是油田場景中抽油機的驢頭檢測卻效果不佳。基于大模型的這一特點,可以通過提示詞快速賦能某個具體場景,但不少情況下也需要做行業(yè)化的迭代。
與人類形成模糊意義的“認(rèn)知”對齊:
大模型除了能作為快速賦能的工具之外,還具備一些小模型不具備的能力,大模型與人類從模糊意義上來說認(rèn)知是對齊的,這跟人與人之間的認(rèn)知對齊形式非常像。舉個例子,比如消防通道堵塞問題,對于人來說,即便是安全主管對安全員說“這條安全通道很重要,務(wù)必不能堵塞”,不同的安全員收到這個任務(wù)后的執(zhí)行情況也會因人而異。如下圖所示,這四種情況可以看作是不同意義上的“消防通道沒有堵塞”。因此,人與人之間形成了模糊的認(rèn)知對齊,而大模型也是如此,本身就能理解諸如消防通道堵塞、沿街晾曬等任務(wù),而不需要像小模型一樣在“什么東西堵算堵、堵多少算堵”等問題上糾結(jié),這種模糊對齊的認(rèn)知恰恰是互聯(lián)網(wǎng)數(shù)據(jù)賦予的。
智能體的特點
智能體的兩種內(nèi)在模式:
從智能體底層的實現(xiàn)上來看,主要分為工作流模式和全自主模式。工作流模式指的是“智能體基于預(yù)設(shè)的方案工作,使用大模型和工具實現(xiàn)目標(biāo)”,該模式適用于“有相對明確的流程,希望通過自動化來提升效率”的場景,其局限性在于面向新任務(wù)的拓展性受限。全自主模式指的是“智能體自主規(guī)劃決策,以結(jié)果為導(dǎo)向”,該模式適用于“只有大致思路甚至沒有思路,需要開放式、多路徑的探索”的場景,該模式也存在一些問題,在算力消耗、魯棒性、可信度方面都需要進一步的技術(shù)突破。
如何進行模式選擇:
“Less structure, more intelligence”,從技術(shù)上來說確實如此,畢竟方案設(shè)計越少,對模型能力的要求也越高。但是從應(yīng)用落地的角度上來說,效果好、成本低才是技術(shù)實現(xiàn)價值兌現(xiàn)的核心。因此,面向不同的行業(yè)、場景做出合理選擇是必要的。比如在判斷某次施工是否符合預(yù)設(shè)的流程規(guī)范時,工作流模式就是一種不錯的選擇。
三、解題之道:大小模型協(xié)同 & 端到端優(yōu)化
面對前面提到的落地難點,曠視并未將大模型視為萬能藥,而是依托于十多年來積累的算法、系統(tǒng)、硬件的全棧技術(shù)實力,引入大模型和智能體,完成整體解決方案的升級。
大小模型協(xié)同
我們深刻理解大小模型各自的特點,因此采用大小協(xié)同架構(gòu),讓大小模型在最適合的位置發(fā)揮價值。具體而言,我們利用大模型的通用屬性,為行業(yè)場景提供快速接入的解決方案,也利用大模型的強認(rèn)知屬性,作為智能體的大腦中樞;同時,我們也在合適的場景下,用經(jīng)過行業(yè)數(shù)據(jù)迭代的小模型實現(xiàn)應(yīng)用降本。以視頻巡檢智能體為例,不僅集成了行業(yè)化的太乙大模型,還在模型庫內(nèi)接入了曠視沉淀的百余種視覺小模型,讓視頻巡檢能夠?qū)崿F(xiàn)任務(wù)接入快、運行成本低、算法精度高。
端到端優(yōu)化
一個AI系統(tǒng)的上線不是終點,而是優(yōu)化的起點。基于此,曠視經(jīng)過多年打磨,研發(fā)了一套高效的算法生產(chǎn)與應(yīng)用平臺(AIS),基于這套平臺,我們實現(xiàn)了從數(shù)據(jù)到模型、從軟件到硬件、從研發(fā)到落地的有機結(jié)合,解決了算法模型“交付即落后”的行業(yè)痛點,實現(xiàn)了技術(shù)與場景的“雙向賦能”和協(xié)同進化。舉例來說,使用這套平臺可以快速實現(xiàn)三步走式的行業(yè)算法生產(chǎn)范式。在新場景落地初期,核心訴求、算法邊界尚不明了,此時可以通過零樣本、少樣本技術(shù)快速調(diào)試基礎(chǔ)模型,實現(xiàn)“從無到有”;在小范圍使用一段時間后,可以依托于實際場景的數(shù)據(jù)做場景化訓(xùn)練,實現(xiàn)“從有到優(yōu)”;最后,對于部分任務(wù)而言,積累了一定量的數(shù)據(jù)、認(rèn)知后,可以產(chǎn)出場景模型與算法,實現(xiàn)“使用降本”。
結(jié)語:邁向“雙向賦能”的新階段
算法的價值,最終必須在場景中兌現(xiàn)。大模型和智能體不是炫技,而是我們解決老問題的新答案。它們讓我們能夠搭建一座橋梁,連接技術(shù)的無限可能性與行業(yè)的真實需求,真正實現(xiàn)技術(shù)與場景的雙向奔赴、協(xié)同進化。
-
智能體
+關(guān)注
關(guān)注
1文章
476瀏覽量
11604 -
曠視
+關(guān)注
關(guān)注
0文章
87瀏覽量
6922 -
大模型
+關(guān)注
關(guān)注
2文章
3648瀏覽量
5179
原文標(biāo)題:算法落地之困:曠視如何用大模型與智能體破局?
文章出處:【微信號:megvii,微信公眾號:曠視MEGVII】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
曠視積極參與國家人工智能應(yīng)用中試基地建設(shè)
Nullmax MaxDrive Basic智能前視一體機及小域控方案
曠視入選2025北京人工智能治理案例集
騰視科技AI大模型應(yīng)用:提效、破局與落地,重塑智能新生態(tài)
騰視科技大模型一體機解決方案:低成本私有化落地,重塑行業(yè)智能應(yīng)用新格局
開普云「開悟智核」:極致性價比的智能體一體機,破局大模型應(yīng)用難題
AI耳機邁入智能體時代,2037年65%應(yīng)用將為智能體驅(qū)動
宇視科技梧桐大模型賦能交通治理
宇視科技2025合作伙伴大會丨業(yè)內(nèi)首次提出“AIoT智能體”新理念
曠視借助大模型與智能體推動算法落地
評論