国产一区二区中文字幕,色道久久综合亚洲精品蜜桃 ,91tv成人精品人妻91资源

截至2025年，生成式AI大模型的能力仍在迅速提升。如果關注這個領域，會發(fā)現(xiàn)有不少創(chuàng)業(yè)者花大量精力打造的AI應用，但往往很快就被新一代大模型“原生功能”所取代。

這一類應用被歸類是Prompt（提示詞）包裝層應用，這些應用通過設計提示詞調(diào)用大模型基礎能力，但沒有構(gòu)建更深層次業(yè)務價值。因為應用的價值主要靠大模型的原始能力，所以很容易被不斷變強的大模型取代。

如何開發(fā)出不容易被大模型“抄家”的AI應用？

對此，英特爾技術專家認為，大模型應用開發(fā)不應僅僅沿著大模型本身能力的延展，直接基于大模型開發(fā)智能體，這樣很容易隨著大模型能力的提升而被淘汰。大模型應用開發(fā)要從大模型不擅長或無法克服的點進行切入，如解決數(shù)據(jù)地基的問題。

目前大模型最明顯的兩個問題都與數(shù)據(jù)有關。

首當其沖的就是幻覺。大模型本質(zhì)上是在做概率運算，輸出的內(nèi)容越多，概率偏差就越大。此外，訓練數(shù)據(jù)質(zhì)量也會導致幻覺。而要在短期內(nèi)徹底消除幻覺問題，則需要根本性的技術變革為前提。

第二，是大模型的知識無法實時更新。大模型預訓練都有固定的時間，可能是幾個月甚至是幾年之前，完全不知道新發(fā)生的事情，無法及時更新自己的知識庫。做出的回答也只能基于舊的已知內(nèi)容。

針對這兩大問題，業(yè)內(nèi)達成的共識就是基于RAG（檢索增強生成）構(gòu)建知識庫，它在預訓練的大模型基礎上連接外部的數(shù)據(jù)源，所有的任務和回答的內(nèi)容上下文都從知識庫中提取，然后，由大模型做出回答。

具體操作中，企業(yè)需要把內(nèi)部的文檔資料轉(zhuǎn)化為機器能讀懂的形式。先對文檔進行切分，然后再進行向量化處理，最后存到向量數(shù)據(jù)庫里。當用戶提出問題時，問題也被轉(zhuǎn)成向量，基于這些在向量數(shù)據(jù)庫里進行檢索，最后根據(jù)檢索到的內(nèi)容生成答復。

在生成答復的時候，召回率和準確率是非常關鍵的指標。召回率看的是，在所有“真正相關”的文檔中，有多少被檢索到了。而準確率Precision看的是，在所有被檢索出來的文檔中，有多少是“真正相關”的。

英特爾專家表示，當看到這些技術細節(jié)后，就應該意識到，大模型的效果受到太多因素或環(huán)節(jié)的影響。比如，負責把文本轉(zhuǎn)換成向量的Embedding模型的選擇，切分文檔的大小，檢索數(shù)據(jù)的處理等等都會影響最后生成的結(jié)果。

在英特爾專家看來，做大模型開發(fā)，直接從智能體開始或許不是最優(yōu)選。數(shù)據(jù)基礎上的微小差異，最終效果可能會差出很多。換言之，如果能處理好數(shù)據(jù)本身，而不只是單純依靠大模型本身的表現(xiàn)，則會創(chuàng)造更多不可替代的價值。

快速上手，在云上構(gòu)建企業(yè)級RAG開發(fā)環(huán)境

目前，國內(nèi)外多家大型企業(yè)都基于大語言模型和RAG技術構(gòu)建了企業(yè)知識庫，而且很多一線員工都非常認可。鑒于RAG知識庫對企業(yè)非常重要，火山引擎推出了支持RAG場景的云主機鏡像。

火山引擎在大模型服務領域表現(xiàn)非常亮眼。根據(jù)IDC發(fā)布的《中國公有云大模型服務市場格局分析，1Q25》報告，火山引擎在2024年中國公有云大模型調(diào)用量市場中占據(jù)了46.4%的份額，位居第一。

火山引擎不僅有火山方舟這種大模型服務平臺，還有扣子（Coze）這類低代碼AI應用開發(fā)平臺，以及HiAgent這樣的企業(yè)專屬AI應用創(chuàng)新平臺。新推出的RAG鏡像則是讓普通開發(fā)者以更低的門檻，開發(fā)出不容易被大模型“抄家”的AI應用。

RAG鏡像中不僅包含Embedding（嵌入式）模塊，還有向量數(shù)據(jù)庫、Re-rank模型和7B的DeepSeek蒸餾模型，甚至還提供了數(shù)據(jù)預處理服務，以及處理在線問答服務的模塊和前端頁面，而且所有軟件棧都經(jīng)過了提前優(yōu)化。

火山引擎的RAG鏡像作為面向企業(yè)的服務，參考了OPEA的架構(gòu)。OPEA是英特爾在去年發(fā)起的開源社區(qū)，利用開放架構(gòu)和模塊化組件的方式，幫助企業(yè)構(gòu)建可擴展的AI應用部署基礎。相比普通的開源架構(gòu)，火山引擎的鏡像具備更多企業(yè)級特性。

很多云廠商也提供了RAG服務，這些服務對普通用戶來說門檻更低，但對于專業(yè)開發(fā)者而言，這些“黑盒”屏蔽了大量技術細節(jié)。而火山引擎的RAG鏡像作為開源方案，讓開發(fā)者能夠看到更多底層細節(jié)，從多個技術維度進行優(yōu)化，從而構(gòu)建起真正的技術壁壘。

DeepSeek爆火之后，很多企業(yè)都計劃進行本地部署，市場上出現(xiàn)了很多一體機解決方案，一臺一體機里經(jīng)常會有8張高性能顯卡，這套方案的成本并不低，在沒有明確業(yè)務需求之前，動輒幾十萬的成本投入或許并不明智。

現(xiàn)在，用戶只需要在火山引擎上選擇好虛擬機和鏡像，就能在三分鐘內(nèi)搭建好一套開發(fā)環(huán)境，開始各種學習和實踐。為了幫助開發(fā)者提升能力，英特爾還準備了一系列課程，幫助大家補齊相關知識，更輕松地邁出從0到1的第一步，打好數(shù)據(jù)基礎。

大模型應用開發(fā)的三要素，硬件平臺是基礎

英特爾專家總結(jié)了大模型應用開發(fā)的三要素，除了剛才提到的軟件棧和配套的指導課程，硬件環(huán)境同樣至關重要。火山引擎基于英特爾至強處理器打造了多種云主機，最近推出的基于英特爾至強6性能核處理器的通用型實例 g4il，非常適合做大模型應用開發(fā)。

g4il是火山引擎的第四代通用型實例，其中 “g” 代表通用型，“4” 表示第四代，“i” 代表英特爾CPU平臺。與第三代相比，其整體性能有顯著提升，無論是在數(shù)據(jù)庫應用、Web應用，還是圖像渲染方面表現(xiàn)都更加出色，而在AI推理方面的優(yōu)勢更是尤為突出。

得益于集成AMX加速器，英特爾至強6處理器已成為目前最擅長AI推理的x86架構(gòu)處理器之一。在火山引擎的g4il實例中，用戶可以使用CPU完成AI推理。相比基于GPU的方案，它具備成本更低、資源更容易獲得的優(yōu)勢，能滿足基本需求。

基于CPU的AI推理方案特別適合用于AI應用的開發(fā)和驗證階段。搭配前面提到的火山引擎RAG鏡像，用戶可以在云上快速搭建起一套大模型應用的開發(fā)環(huán)境，大大降低了對硬件資源的門檻。

而到了生產(chǎn)環(huán)節(jié)，通常需要采用CPU+GPU的異構(gòu)計算架構(gòu)。比如，可以使用帶有AMX的至強CPU來處理Embedding（文本嵌入）、Re-Rank、向量數(shù)據(jù)庫等輕量級AI負載，讓GPU專注于處理重型AI負載，從而提高資源利用率和整體處理能力。

g4il的一大亮點在于：用戶只需選擇一臺配備16 vCPU或32 vCPU的云主機，即使不使用GPU，也能運行參數(shù)量為7或14B的DeepSeek蒸餾版模型。值得一提的是，該方案還支持DeepSeek推薦的高精度計算格式BF16，進一步提升推理質(zhì)量。

小結(jié)

在技術快速演進的當下，借助云平臺進行開發(fā)，既能降低試錯成本，又能加快創(chuàng)新速度，為企業(yè)和開發(fā)者提供了更靈活的選擇。更重要的是，通過精細化RAG等技術深耕數(shù)據(jù)底座，而不只是單純靠巧妙的提示詞，才能打造出不容易被大模型“抄家”的AI應用。

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

英特爾

英特爾

+關注

關注
61

文章
10301

瀏覽量
180427
AI

AI

+關注

關注
91

文章
39755

瀏覽量
301361
大模型

大模型

+關注

關注
2

文章
3648

瀏覽量
5179

搜索歷史

AI應用如何不被淘汰？深耕RAG與數(shù)據(jù)底座是關鍵

評論