面對(duì)大量不斷迭代的新知識(shí),大模型必須“終身學(xué)習(xí)”才能滿足實(shí)際應(yīng)用的需求。RAG(Retrieval-augmented Generation,檢索增強(qiáng)生成)讓生成式大模型能夠利用外部的知識(shí)源來(lái)增強(qiáng)生成能力,提高生成質(zhì)量和可靠性。但企業(yè)構(gòu)建知識(shí)檢索系統(tǒng)并非易事,通常面臨開(kāi)發(fā)門檻高、生成內(nèi)容差等難題。而借助浪潮信息元腦企智EPAI企業(yè)大模型開(kāi)發(fā)平臺(tái),企業(yè)僅需三步即可高效創(chuàng)建大模型RAG,讓企業(yè)內(nèi)部積累的大量數(shù)據(jù)得到有效利用,喚醒企業(yè)沉睡的知識(shí),顯著提升大模型回答的準(zhǔn)確性。
RAG:生成式大模型落地的最佳實(shí)踐方案
在AIGC大模型落地企業(yè)應(yīng)用過(guò)程中,必然會(huì)碰到的一個(gè)問(wèn)題是,大模型從訓(xùn)練到完成部署,并不意味著抵達(dá)了開(kāi)發(fā)工作的“終點(diǎn)”。在真實(shí)場(chǎng)景中,每時(shí)每刻都在產(chǎn)生大量數(shù)據(jù),知識(shí)會(huì)迭代得飛快,如新學(xué)說(shuō)的出現(xiàn)、領(lǐng)域知識(shí)的更新、某個(gè)定義的延展、某個(gè)指標(biāo)的調(diào)整等,“終身學(xué)習(xí)”不僅適用于人類本身,對(duì)AI來(lái)說(shuō)同樣是必須具備的能力。一旦喪失這種能力,大模型會(huì)很快表現(xiàn)出能力的“天花板”,包括產(chǎn)生幻覺(jué)、缺乏對(duì)生成文本的可解釋性、專業(yè)領(lǐng)域知識(shí)理解差,以及對(duì)最新知識(shí)的了解有限等等。
針對(duì)這一問(wèn)題,業(yè)界主要有兩種解決途徑:一種是微調(diào)(Fine Tune)來(lái)更新模型,另一種是讓AI能夠與外部世界互動(dòng),以不同的形式和方式獲取知識(shí),即大模型+RAG。
微調(diào)固然效果好,可以讓模型真正的“學(xué)會(huì)”一些私域知識(shí)。但是微調(diào)也會(huì)帶來(lái)幾個(gè)問(wèn)題:首先,由于生成模型依賴于內(nèi)在知識(shí)(權(quán)重),因此模型還是無(wú)法擺脫幻覺(jué)的產(chǎn)生,在對(duì)理解門檻高且準(zhǔn)確性要求嚴(yán)格的場(chǎng)景下,這是完全無(wú)法接受的。其次,模型微調(diào)并不是一個(gè)簡(jiǎn)單的工作,無(wú)論是從數(shù)據(jù)準(zhǔn)備、算力消耗、微調(diào)效果、訓(xùn)練時(shí)間等各個(gè)角度來(lái)看,隨時(shí)用新產(chǎn)生的數(shù)據(jù)來(lái)進(jìn)行微調(diào)都是不現(xiàn)實(shí)的,且最終微調(diào)的效果也無(wú)法保證,能夠做到每月更新一次都已經(jīng)是很理想的狀態(tài)。
相比之下,RAG讓生成式大模型能夠利用外部的知識(shí)源(非模型本身的知識(shí)庫(kù))來(lái)增強(qiáng)模型的生成能力,減少生成內(nèi)容的偏差和錯(cuò)誤,提高生成質(zhì)量和可靠性,在有效緩解模型幻覺(jué)的同時(shí),也能夠“喚醒沉睡的知識(shí)”,讓企業(yè)內(nèi)部積累的大量數(shù)據(jù)得到有效利用。由于接入外部實(shí)時(shí)動(dòng)態(tài)數(shù)據(jù),RAG在理論上沒(méi)有知識(shí)邊界的限制,且無(wú)需頻繁進(jìn)行模型訓(xùn)練,故已經(jīng)成為生成式大模型行業(yè)落地最佳實(shí)踐方案。
RAG很好,但好的RAG不好開(kāi)發(fā)
RAG雖好,但在實(shí)際開(kāi)發(fā)應(yīng)用的場(chǎng)景中,企業(yè)構(gòu)建知識(shí)檢索系統(tǒng)并非易事,通常面臨較高的開(kāi)發(fā)門檻和較差的生成內(nèi)容等難題。
■ 技術(shù)門檻高,開(kāi)發(fā)效率低
首先,即便技術(shù)人員編程能力扎實(shí)、深悟大模型架構(gòu)原理,從海量開(kāi)源方案里挑選出最合適的大模型+ RAG組合,也需要不斷的試錯(cuò),定制化開(kāi)發(fā)的時(shí)間成本高昂。其次,RAG的構(gòu)建包含知識(shí)文檔的準(zhǔn)備、嵌入模型(embedding model)、向量數(shù)據(jù)庫(kù)、查詢檢索和生成回答五個(gè)基本環(huán)節(jié),各個(gè)環(huán)節(jié)均有著極大的優(yōu)化空間。如在處理企業(yè)數(shù)據(jù)時(shí),仍需設(shè)計(jì)流程,清洗、分類、標(biāo)注各類數(shù)據(jù),保其質(zhì)量達(dá)模型訓(xùn)練標(biāo)準(zhǔn);檢索參數(shù)配置同樣如此,向量模型選取與優(yōu)化若有差池,也易使模型訓(xùn)練失敗、檢索不準(zhǔn)。而遵循效果相乘疊加的定律,90%×90%×90%×90%×90%=59%,這意味著任何一個(gè)環(huán)節(jié)優(yōu)化效果不佳,將會(huì)導(dǎo)致最終的生成效果與最初設(shè)想相距甚遠(yuǎn)。
■ 復(fù)雜文檔解析能力不足,生成效果差
企業(yè)數(shù)據(jù)文檔種類繁雜,高質(zhì)量的文檔解析能力會(huì)極大影響最終的知識(shí)檢索成效。以金融機(jī)構(gòu)為例,合同、報(bào)告、Excel 財(cái)務(wù)數(shù)據(jù)表及 PPT 產(chǎn)品介紹等文檔多格式并行,開(kāi)源RAG方案對(duì)此的解析能力較差,如在合同關(guān)鍵條款的提取方面失準(zhǔn),條款解讀發(fā)生偏差;進(jìn)行產(chǎn)品比對(duì)推薦時(shí),易導(dǎo)致檢索參數(shù)及大模型抉擇失當(dāng),推薦金融產(chǎn)品難以滿足個(gè)性化需求,使客戶對(duì)企業(yè)信任與滿意度滑坡。
元腦企智EPAI:構(gòu)建大模型RAG僅需三步,喚醒企業(yè)沉睡的知識(shí)
針對(duì)當(dāng)前企業(yè)在構(gòu)建RAG上普遍面臨的難題,浪潮信息元腦企智EPAI(Enterprise Platform of AI)為企業(yè)發(fā)掘數(shù)據(jù)資產(chǎn)、“喚醒沉睡的知識(shí)”提供了強(qiáng)大的開(kāi)發(fā)平臺(tái),文檔解析、知識(shí)庫(kù)構(gòu)建、檢索增強(qiáng)生成等特色功能,不僅極大提升了企業(yè)知識(shí)管理系統(tǒng)的構(gòu)建效率,還顯著增強(qiáng)了大模型回答的準(zhǔn)確性。
■ 高效的文檔解析與知識(shí)庫(kù)構(gòu)建
元腦企智EPAI適配PDF、TXT、DOCX等多類文檔格式上傳解析,可深度處理文檔內(nèi)容,通過(guò)強(qiáng)大數(shù)據(jù)清洗和靈活的知識(shí)分塊,幫助企業(yè)建立高質(zhì)量私域知識(shí)庫(kù),并支持復(fù)雜問(wèn)題、大型數(shù)據(jù)集或跨多個(gè)文檔查詢。
■ 更優(yōu)的檢索增強(qiáng)生成效果
元腦企智EPAI囊括關(guān)鍵詞檢索、語(yǔ)義檢索、混合檢索等多元檢索模式,精準(zhǔn)適配各類場(chǎng)景檢索訴求。用戶可依自身特定需求,選擇最合適的檢索方法。借由自動(dòng)化 RAG pipeline技術(shù),能敏捷抓取最新知識(shí)融入大模型,實(shí)現(xiàn)檢索庫(kù)的定期更新,從而確保生成的文本內(nèi)容基于最新的信息,提升生成內(nèi)容的準(zhǔn)確性和效率,切實(shí)滿足企業(yè)多樣化的使用需求。
經(jīng)過(guò)浪潮信息在大模型+RAG開(kāi)發(fā)上的反復(fù)實(shí)踐與驗(yàn)證,元腦企智EPAI封裝了浪潮信息深度優(yōu)化的RAG環(huán)境,開(kāi)發(fā)者僅需三步即可快速完成檢索增強(qiáng)生成系統(tǒng)的構(gòu)建。
Step1創(chuàng)建知識(shí)庫(kù),奠定知識(shí)基石
首先,用戶需要在元腦企智EPAI上創(chuàng)建一個(gè)知識(shí)庫(kù)并上傳企業(yè)文檔。元腦企智EPAI支持多種文檔格式,包括PDF、TXT、DOCX等。然后選配解析參數(shù),如編碼模型、文本分塊長(zhǎng)度等。開(kāi)始文檔解析。文檔解析是將文檔的內(nèi)容進(jìn)行抽取并對(duì)其進(jìn)行分塊,元腦企智EPAI在解析中支持文檔版式識(shí)別,對(duì)表格、圖片的文字都能做到精準(zhǔn)提取。
文檔解析成功后,內(nèi)容將被存儲(chǔ)在知識(shí)庫(kù)中,形成結(jié)構(gòu)化的知識(shí)塊。
Step2配置檢索參數(shù),優(yōu)化檢索效能
在文檔解析完成后,用戶需要配置大模型和檢索參數(shù),以優(yōu)化檢索效果。元腦企智EPAI提供了多種檢索參數(shù),包括粗排引用數(shù)量、引用數(shù)量、檢索類型等。在檢索策略上,支持混合檢索、關(guān)鍵詞檢索、向量檢索等。
配置好檢索參數(shù)后,用戶可以進(jìn)行檢索測(cè)試,以驗(yàn)證文檔分塊和檢索效果。在檢索測(cè)試界面,用戶可以輸入測(cè)試文本,查看檢索結(jié)果。
Step3對(duì)話交互,實(shí)現(xiàn)智能應(yīng)用
測(cè)試完成后,元腦企智EPAI可以將知識(shí)庫(kù)發(fā)布為知識(shí)助手,并且提供在線交互和API兩種使用方式。
在線交互中,用戶輸入問(wèn)題,元腦企智EPAI將結(jié)合知識(shí)庫(kù)內(nèi)容,通過(guò)大模型生成準(zhǔn)確的回答,并展示引用源。下圖展示,元腦企智EPAI作為營(yíng)養(yǎng)問(wèn)答助手,通過(guò)檢索增強(qiáng)生成,提供營(yíng)養(yǎng)方面的回答。
如果選擇用API的方式,用戶可以通過(guò)元腦企智EPAI創(chuàng)建自定義助手,將配置好的模型和知識(shí)庫(kù)保存為助手,并通過(guò)API接口調(diào)用。這一功能使得用戶可以輕松地將元腦企智EPAI的RAG能力集成到現(xiàn)有的信息系統(tǒng)中,提升系統(tǒng)的智能化水平。
元腦企智EPAI讓某領(lǐng)先IT企業(yè)智能生產(chǎn)力激增
業(yè)界領(lǐng)先的某IT企業(yè)積極利用元腦企智EPAI平臺(tái)推動(dòng)內(nèi)部的智能化轉(zhuǎn)型,目前已“零代碼”開(kāi)發(fā)出IT售前助手“元小智”和撰稿助手“元小墨”。
在“元小智”開(kāi)發(fā)過(guò)程中,該企業(yè)售前團(tuán)隊(duì)(非專業(yè)開(kāi)發(fā)人員)利用元腦企智EPAI內(nèi)置的數(shù)據(jù)處理工具,自動(dòng)化解析結(jié)構(gòu)及非結(jié)構(gòu)化數(shù)據(jù),從超 1500份涵蓋 PDF、DOCX、DOC、XLS等多樣格式的數(shù)據(jù)資源里,成功構(gòu)筑8大業(yè)務(wù)線所有在售產(chǎn)品知識(shí)庫(kù),整個(gè)開(kāi)發(fā)時(shí)間僅耗時(shí)1人1月,有力驅(qū)動(dòng)知識(shí)集成與業(yè)務(wù)精進(jìn)。
在“元小墨”開(kāi)發(fā)過(guò)程中,該企業(yè)市場(chǎng)部團(tuán)隊(duì)(非專業(yè)開(kāi)發(fā)人員)按照不同業(yè)務(wù)線、稿件類型收集了1300+篇成文稿件、背景資料、速記、白皮書,一鍵打包上傳,不用任何代碼即構(gòu)建起專用知識(shí)庫(kù)。同時(shí)通過(guò)自動(dòng)化的RAG pipeline 技術(shù)將最新的知識(shí)融入大模型,通過(guò)選擇關(guān)鍵詞檢索、語(yǔ)義檢索、混合檢索等不同的檢索策略,有效提升檢索生成內(nèi)容的準(zhǔn)確性。
在“元小墨”的加持下,該企業(yè)市場(chǎng)部團(tuán)隊(duì)資料搜索時(shí)間縮減80%,同時(shí)內(nèi)容生成質(zhì)量躍升,緊密貼合多元需求,驅(qū)動(dòng)市場(chǎng)傳播創(chuàng)新。如在內(nèi)容策劃時(shí),關(guān)鍵詞檢索鎖定產(chǎn)品亮點(diǎn)與市場(chǎng)趨勢(shì)報(bào)告;定制文案階段,語(yǔ)義檢索精準(zhǔn)捕捉品牌意圖,推送契合風(fēng)格文案;官微運(yùn)營(yíng)中,利用混合檢索融合優(yōu)勢(shì),從海量素材中精準(zhǔn)定位熱點(diǎn)關(guān)聯(lián)素材助力推文。
元腦企智EPAI(Enterprise Platform of AI)是浪潮信息的大模型應(yīng)用落地解決之道,能夠?yàn)槠髽I(yè)AI大模型落地應(yīng)用提供高效、易用、安全的端到端開(kāi)發(fā)平臺(tái),提供數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、知識(shí)檢索、應(yīng)用框架等系列工具,支持調(diào)度多元算力和多模算法,幫助企業(yè)高效開(kāi)發(fā)部署生成式AI應(yīng)用、打造智能生產(chǎn)力。在大模型技術(shù)持續(xù)演進(jìn)的進(jìn)程中,元腦企智EPAI 將以持續(xù)創(chuàng)新,助力企業(yè)智能應(yīng)用創(chuàng)新與效率提升。
-
浪潮
+關(guān)注
關(guān)注
1文章
476瀏覽量
25421 -
AI
+關(guān)注
關(guān)注
91文章
39793瀏覽量
301431 -
大模型
+關(guān)注
關(guān)注
2文章
3650瀏覽量
5186
原文標(biāo)題:?jiǎn)拘哑髽I(yè)沉睡的知識(shí),元腦企智EPAI三步高效創(chuàng)建大模型RAG
文章出處:【微信號(hào):浪潮AIHPC,微信公眾號(hào):浪潮AIHPC】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
RAG(檢索增強(qiáng)生成)原理與實(shí)踐
發(fā)布元服務(wù)填寫審核信息與聯(lián)系方式
RAG實(shí)踐:一文掌握大模型RAG過(guò)程
脈沖神經(jīng)元模型的硬件實(shí)現(xiàn)
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+神經(jīng)形態(tài)計(jì)算、類腦芯片
浪潮信息發(fā)布"元腦SD200"超節(jié)點(diǎn),面向萬(wàn)億參數(shù)大模型創(chuàng)新設(shè)計(jì)
萬(wàn)億參數(shù)!元腦企智一體機(jī)率先支持Kimi K2大模型
飛利信與浪潮信息達(dá)成戰(zhàn)略合作
使用 llm-agent-rag-llamaindex 筆記本時(shí)收到的 NPU 錯(cuò)誤怎么解決?
DevEco Studio AI輔助開(kāi)發(fā)工具兩大升級(jí)功能 鴻蒙應(yīng)用開(kāi)發(fā)效率再提升
筑基"AI+人才"培養(yǎng),浪潮信息攜手元腦伙伴拓爾思推出智慧教育新平臺(tái)
天瞳威視與浪潮信息達(dá)成戰(zhàn)略合作,推進(jìn)高階智駕車載計(jì)算系統(tǒng)創(chuàng)新
聚浪十年 共儲(chǔ)未來(lái)!2025元腦存儲(chǔ)分銷合作伙伴大會(huì)成功舉辦
浪潮信息:元腦企智DeepSeek一體機(jī)將舉辦生態(tài)伙伴推介體驗(yàn)會(huì)
借助浪潮信息元腦企智EPAI高效創(chuàng)建大模型RAG
評(píng)論