国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

科技云報到:大模型時代下,向量數據庫的野望

科技云報到 ? 來源:科技云報到 ? 作者:科技云報到 ? 2024-10-14 17:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

科技云報到原創。

自ChatGPT爆火,國內頭部平臺型公司一擁而上,先后發布AGI或垂類LLM,但鮮有大模型基礎設施在數據層面的進化,比如向量數據庫。

在此之前,向量數據庫經歷了幾年的沉寂期,現在似乎終于乘著ChatGPT的東風成為資本的“寵兒”。然而,一年狂飆之后,市場逐漸退潮,因此有人質疑,向量數據庫又涼了?

判斷一條賽道是否真的有潛力,資本的注入雖是前提,但更重要的還有市場的態度。大模型應用的逐步落地于向量數據庫而言,無疑是最好的催熟劑。

然而任何新技術的到來,都需要更長的時間才能得到市場的接受。

一份關于向量數據庫的市場研究是,隨著AI應用場景加速落地,據西南證券分析,預計2025年向量數據庫滲透率約為30%,其中,中國向量數據庫市場規模約為82.56億元。而據中國信通院測算,到2025年,中國數據庫市場規模將達688億元。這意味著,兩年后向量數據庫在中國的滲透率將超過10%。

在國內,不少數據庫廠商都在嘗試推出向量數據庫產品,然而從市場驗證階段走向實現盈利,中間還需要一段更漫長的時間。向量數據庫究竟是虛火過旺還是星辰大海?在向量數據庫這條賽道,能否看到更遠的未來?


向量數據庫,剛剛開始

向量數據庫,顧名思義,是一種專門處理向量數據的數據庫。在傳統的關系型數據庫中,數據通常以表格形式存儲,而向量數據庫則將非結構化數據(如文本、圖像、音頻等)轉換為向量形式進行存儲。這種數據表示方法使得向量數據庫能夠高效地處理大規模、高維度的數據集,為AI提供了強大的計算基礎。

如果說數據庫是數據的“硬盤”,那么,向量數據庫就是更適合AI體質的“硬盤”,其“AI原生”的體質,具體表現在以下幾個方面。

首先,是更高的效率。AI算法,要從圖像、音頻和文本等海量的非結構化數據中學習,提取出以向量為表示形式的“特征”,以便模型能夠理解和處理。因此,向量數據庫比傳統基于索引的數據庫有明顯優勢。

其次,更低的成本。大模型要從一種新技術轉化為產業價值,必須達到合理的投入產出比,而向量數據庫可以有效減少存儲和計算成本。一個公開數據是,通過騰訊云向量數據庫,QQ音樂人均聽歌時長提升3.2%、騰訊視頻有效曝光人均時長提升1.74%、QQ瀏覽器成本降低37.9%,就在于檢索效率、運行穩定性、運營效率、推薦算法等,有了較大的提升。

第三,更強的數據安全。企業想做大模型,還要確保數據的隱私安全,就必須與數據庫產品做好配合,這給向量數據庫的本地部署帶來了廣闊的需求。

第四,更大的擴展性。隨著大模型走向行業應用,垂直領域的AI用例不斷增多,洶涌的數據洪潮和存算任務,會帶來大量向量搜索的需求。而向量數據庫嵌入向量的長度不受限制,具有良好的擴展性,可以根據AI用例和模型而變化,更好地處理大規模數據集。

從大模型技術標桿的OpenAI發布的GPT-4o和即將發布的GPT-5消息來看,以及國內外商業化大模型的進展來看,大模型的技術路線還沒有發生顛覆性的變革,因此落地應用還是需要向量檢索和向量數據庫。

由此可見,向量數據庫與AI的關系緊密相連。在大模型興起之前,傳統數據庫已經在不斷嘗試與AI結合,主要涉及以下幾個方向:數據存儲與管理、數據清洗與預處理、數據檢索與查詢、數據集成與共享、數據安全與隱私保護。隨著大模型的興起,可以看到在這些方向上,數據庫與AI間的關聯比以往任何時候都要密切。

此外,AI 大模型的興起還為數據庫注入了預測估算的能力。AI模型可以通過學習歷史數據和模式,對未來的趨勢和結果進行預測和估算。傳統數據庫可以集成AI模型,實現對數據的預測分析。這使得數據庫可以不僅提供對歷史數據的查詢和分析,還能夠提供對未來數據的預測和估算結果,幫助用戶做出更準確的決策。

總的來說,幾乎所有類型的數據庫都在積極向AI靠攏,比如在數據庫中添加向量索引,數據庫和AI已經密不可分,兩者相輔相成,共同推動著技術的進步和應用的拓展。


兩大新勢力,云是方向

傳統數據庫廠商不必多說,既有相應的能力建設,也有一定的客戶基礎,推出相關產品是必然。一些在AI領域積淀已久的科技大廠,如谷歌、微軟、Meta、百度等大廠,都有向量數據庫的技術積累,也都可以向外輸出相關能力和產品。

除了這些常規面孔,向量數據庫市場也吸引了新的參與者。作為這一輪大模型投資熱和創業熱的主要目標之一,向量數據庫領域誕生了不少創新創業公司。比如AI創業新秀Pinecone就是閉源的領跑者,憑借良好的開箱即用的產品體驗,獲得了非常大的增長,B輪估值達到7.5億美元。其他競爭者大多建立在開源項目的基礎上。

不過,作為創業公司,長期盈利能力還有待驗證。一個主要原因,是客戶大多是嘗鮮、實驗性質。

企業需要先將非結構化的私密數據,放入一個小的模型中進行數據轉化,即數據向量化,產生一個向量的矩陣,再存儲到向量數據庫里,來供大模型學習和檢索。這個過程涉及大量的工程化,會耗費企業許多開發人員、時間成本,一開始可能會因為AI大模型很火而對向量數據庫產生興趣,但能否真正在業務中落地還是個未知數。因此,長期付費意愿還有較大的不確定性。

另一股積極參與的新勢力,就是公有云廠商。

從2017年到2019年,于向量數據庫的發展而言,是一段更為重要的時間。騰訊云、百度智能云、京東科技等也恰都是在這個時間段將向量數據庫的相關組件應用到具體的業務之上。

實際上,這段時間所對應的背景也正是,非結構化數據需求的激增。

一個具有代表性的事件是,2017年,短視頻的爆火,催生了新媒體行業,各種結構數據也隨之出現。這一現象就導致了不同結構數據的處理需求。

除此之外,京東、騰訊和百度的內部產品也有更多類似的需求。而向量化引擎也正是從這一時間點開始萌芽。

事實上,不是所有企業都有能力自建大模型所需要的基礎設施,通過MaaS(模型即服務)業務來訓練應用大模型,是更靈活的選擇。此外,很多政企客戶往往會選擇公有云或行業云來滿足其業務需求,對云數據庫的關注度和接受度上升,而這些用戶在探索大模型時,會傾向于以整體解決方案的形式來交付,這就給了云廠商參與到此賽道機會,同時也要求云廠商提供向量數據庫的全棧支持。

如今頭部云廠商基本建立了全生命周期AI化的向量數據庫。有數據顯示,企業原先接入一個大模型需要花1個月左右時間,使用某公有云的向量數據庫后,3天時間即可完成,極大降低了企業的接入成本。

更何況,前不久火山引擎、阿里云、百度智能云等都圍繞大模型API價格,打起了互相抄底的“價格戰”,意味著AI創新門檻的降低,而AI應用市場的用戶規模擴大,也會帶動向量數據庫的使用需求。

綜合來看,整個云AI市場的格局還在快速變化之中,風物長宜放眼量,AI Native的向量數據庫,前景仍然值得期待。

向量數據庫,展望AGI時代

從某種程度上而言,無論是向量數據庫,還是大模型,歸根結底,大家在追捧它時的心態,焦慮大于需求。而這種焦慮則來源于“害怕被落下”。

大模型、多模態等新技術、新應用的出現,正在迅速刷新著人們對AGI時代的期待,仿佛它下一刻就會到來。

而向量數據庫的熱潮,在一定程度上“外化”了人們的焦慮。但這并不能否定向量數據庫的實際價值,甚至更長遠的價值。

雖然,目前向量數據庫仍處于發展初期,但可以確定的是,向量數據庫與大模型一定是捆綁關系。因此,未來其演進方向也一定隨著大模型能力的演進而發生變化。

騰訊云數據庫副總經理羅云認為,向量數據庫幫助大模型解決在專有領域知識不足的問題。通用大模型是基于海量的互聯網業務和數據去訓練的,但對于一些細分的垂直行業缺少知識。而向量數據庫可以幫助企業打通企業私有知識庫和大模型的連接,幫助企業更好地利用大模型等AI新技術去實現企業的降本增效,推動企業從“數字化”到“數智化”的躍升,這就是向量數據庫在AI時代的重要的定位和價值。


而在具體的演進方向上,向量數據庫一定會考慮多模態數據的表達以及數據的智能化管理。

首先,在大模型應用百花齊放的背景下,向量數據庫對于多模態數據的處理意義,變得十分重要。

羅云進一步舉例,比如某教育客戶,把一些線下的教育課程,甚至老師上課的教育提綱,全部作為向量,存儲到騰訊云的向量數據庫里。當家長想要去咨詢某節課老師講了什么,就可以把存儲在向量數據庫里面內容檢索出來,再交給大模型按照人們能理解的語言來回答,這就將向量數據庫與大模型進行了很好的匹配。

如果沒有向量數據庫參與,以及沒有合理的多模態數據處理方式,這種情況下是無法查詢出這些數據的。

但隨著多模態數據規模上的提升,另一個問題也隨之出現。不同數據庫中數據如何將其統一管理并讓數據流通起來,這就涉及到的智能化管理也是向量數據庫未來的發力點。

向量數據庫作為處理多樣性和復雜性數據挑戰的得力工具,為各行業提供了高效、靈活的數據管理解決方案。其高維索引、相似性查詢、向量聚合等特點,使其在推薦系統、搜索引擎、社交媒體分析、生物信息學和圖像視頻分析等多個領域得到了成功應用。

不可否認,向量數據庫的未來既蘊含著廣闊的發展空間,也面臨著諸多挑戰。得益于大模型火熱,向量數據庫已逐漸成為資本市場的青睞之選。在未來的AGI道路上,向量數據庫仍需要砥礪前行。

【關于科技云報到】

企業級IT領域Top10新媒體。聚焦云計算人工智能、大模型、網絡安全、大數據、區塊鏈等企業級科技領域。原創文章和視頻獲工信部權威認可,是世界人工智能大會、數博會、國家網安周、可信云大會與全球云計算等大型活動的官方指定傳播媒體之一。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據庫
    +關注

    關注

    7

    文章

    4019

    瀏覽量

    68339
  • 大模型
    +關注

    關注

    2

    文章

    3650

    瀏覽量

    5179
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    艾體寶干貨 | 多模型數據庫解決的到底是什么問題?

    數據庫選型的專業討論中,“多模型數據庫”已逐步成為熱點概念,但行業對其認知仍存在偏差——要么被曲解為“無所不能的萬能數據庫”,要么被簡化為“圖數據
    的頭像 發表于 02-03 16:08 ?313次閱讀

    2025開放原子開發者大會AI時代數據庫創新實踐分論壇成功舉辦

    11月21日,2025開放原子開發者大會——AI時代數據庫創新實踐分論壇成功舉辦。論壇以“構建AI時代智能數據底座”為核心主題,匯聚OpenTenBase、Apache Doris、KWDB
    的頭像 發表于 11-27 14:56 ?586次閱讀

    華納香港服務器數據庫索引優化策略

    )實施有效的索引優化策略。無論您是IT管理員還是開發人員,了解這些技巧都能幫助您優化數據庫效率,確保業務高效運轉。下面,華納(hncloud)將通過結構化分析,一步步解析香港服務器數據庫索引優化的最佳實踐。
    的頭像 發表于 10-16 17:06 ?518次閱讀

    數據庫數據恢復—服務器異常斷電導致Oracle數據庫故障的數據恢復案例

    Oracle數據庫故障: 某公司一臺服務器上部署Oracle數據庫。服務器意外斷電導致數據庫報錯,報錯內容為“system01.dbf需要更多的恢復來保持一致性”。該Oracle數據庫
    的頭像 發表于 07-24 11:12 ?637次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—服務器異常斷電導致Oracle<b class='flag-5'>數據庫</b>故障的<b class='flag-5'>數據</b>恢復案例

    三款主流國產數據庫的技術特點

    隨著數字經濟的快速發展和數據安全要求的提升,國產數據庫正迎來前所未有的發展機遇。在信創浪潮推動,達夢數據庫、TiDB、華為高斯數據庫等國產
    的頭像 發表于 07-14 11:08 ?1146次閱讀

    企業級MySQL數據庫管理指南

    在當今數字化時代,MySQL作為全球最受歡迎的開源關系型數據庫,承載著企業核心業務數據的存儲與處理。作為數據庫管理員(DBA),掌握MySQL的企業級部署、優化、維護技能至關重要。本文
    的頭像 發表于 07-09 09:50 ?717次閱讀

    milvus向量數據庫的主要特性和應用場景

    Milvus 是一個開源的向量數據庫,專門為處理和分析大規模向量數據而設計。它適用于需要高效存儲、檢索和管理向量
    的頭像 發表于 07-04 11:36 ?1068次閱讀
    milvus<b class='flag-5'>向量</b><b class='flag-5'>數據庫</b>的主要特性和應用場景

    數據庫數據恢復—MongoDB數據庫文件丟失的數據恢復案例

    MongoDB數據庫數據恢復環境: 一臺操作系統為Windows Server的虛擬機上部署MongoDB數據庫。 MongoDB數據庫故障: 工作人員在MongoDB服務仍
    的頭像 發表于 07-01 11:13 ?638次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—MongoDB<b class='flag-5'>數據庫</b>文件丟失的<b class='flag-5'>數據</b>恢復案例

    數據庫數據恢復—SQL Server數據庫被加密如何恢復數據

    SQL Server數據庫故障: SQL Server數據庫被加密,無法使用。 數據庫MDF、LDF、log日志文件名字被篡改。
    的頭像 發表于 06-25 13:54 ?672次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—SQL Server<b class='flag-5'>數據庫</b>被加密如何恢復<b class='flag-5'>數據</b>?

    oracle數據恢復—oracle數據庫誤執行錯誤truncate命令如何恢復數據

    oracle數據庫誤執行truncate命令導致數據丟失是一種常見情況。通常情況,oracle數據庫誤操作刪除數據只需要通過備份恢復
    的頭像 發表于 06-05 16:01 ?1061次閱讀
    oracle<b class='flag-5'>數據</b>恢復—oracle<b class='flag-5'>數據庫</b>誤執行錯誤truncate命令如何恢復<b class='flag-5'>數據</b>?

    MySQL數據庫是什么

    開發、企業應用和大數據場景。以下是其核心特性和應用場景的詳細說明: 核心特性 關系型數據庫模型 數據以 表(Table) 形式組織,表由行(記錄)和列(字段)構成。 通過 主鍵、外鍵
    的頭像 發表于 05-23 09:18 ?1206次閱讀

    HarmonyOS5服務技術分享--數據庫使用指南

    ? 華為數據庫(CloudDB)在HarmonyOS中的使用指南 ? ??嗨,開發者朋友們!?? 今天咱們來聊聊華為數據庫(CloudDB)在HarmonyOS應用中的集成和使用技
    發表于 05-22 18:29

    不用編程不用聯網,PLC和儀表直接對SQL接數據庫,有異常時還可先將數據緩存

    不用PLC編程也不用聯網,還不用電腦,采用IGT-DSER智能網關實現PLC和儀表直接對SQL接數據庫。 跟服務端通訊有異常時還可以先將數據暫存,待故障解除后自動重新上報到數據庫;也可
    發表于 04-12 10:47

    數據庫數據恢復——MongoDB數據庫文件拷貝后服務無法啟動的數據恢復

    MongoDB數據庫數據恢復環境: 一臺Windows Server操作系統虛擬機上部署MongoDB數據庫。 MongoDB數據庫故障: 管理員在未關閉MongoDB服務的
    的頭像 發表于 04-09 11:34 ?864次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復——MongoDB<b class='flag-5'>數據庫</b>文件拷貝后服務無法啟動的<b class='flag-5'>數據</b>恢復

    科技報到:“小力出奇跡”的DeepSeek,也難逃大模型安全短板?

    科技報到:“小力出奇跡”的DeepSeek,也難逃大模型安全短板?
    的頭像 發表于 03-06 10:17 ?640次閱讀