伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

垂直大模型競爭,能突破數據“卡點”嗎?

科技云報到 ? 來源:jf_60444065 ? 作者:jf_60444065 ? 2023-05-19 14:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

科技云報道原創。

AI大模型火遍全球,中國產業也激發了對人工智能應用的新熱情。

隨著各大廠商參與競逐,市場正在分化為通用與垂直兩大路徑,兩者在參數級別、應用場景、商業模式等方面差異已逐步顯現。

企業涌入垂直大模型賽道

通用AI大模型像ChatGPT,能夠處理各種領域和場景的自然語言,但由于需要巨大的計算資源和數據量,已經成為國內外大廠的重點項目。

這類企業往往有著強大的技術團隊和資金支持,且有著自己的場景和流量優勢。比如百度、阿里、騰訊、字節、華為等,在搜索、社交、電商、辦公等領域都有著自己的通用AI大模型。

相較之下,創業公司、細分領域企業很難在這樣的競爭中獲得先發優勢或者差異化優勢。

而垂直AI大模型只關注某個特定的領域或者場景,它能夠利用行業的數據和知識,提供更精準和高效的解決方案,更好地滿足用戶在某個領域或者場景下的需求和期待,如:醫療、金融、教育等。

同時,它可以利用一些開源或者閉源的通用AI大模型作為基礎,然后在其上進行指令微調(instruction tuning),來適應自己的目標領域或者場景。

因此,它的參數規模比通用大模型低一個量級,如果讓數據飛輪和模型訓練能夠很好結合,在某些特定領域甚至比通用大模型的效果更好、成本更低。

在這樣的背景下,越來越多的企業加入了垂直大模型的賽道。

5月18日,深信服發布國內首個自研安全大模型,成為安全領域GPT技術應用首秀;

5月5日,學而思宣布正在進行自研數學大模型的研發,命名為MathGPT,面向全球數學愛好者和科研機構;

3月,達觀數據公布正在開發曹植系統,專注于金融、政務、制造等垂直領域的大語言模型。

明確的商業化落地場景和更低的算力成本,為各類企業打開了進軍垂直大模型的大門。

垂直大模型的考驗

垂直大模型的優勢在于不夠大:算力不夠大、算法難度低,但并不代表垂直大模型誰都能做。

眾所周知,AI大模型三要素:算力、算法、數據,都是喂養AI的“飼料”。

先說算力。

大模型之所以“大”,就是因為參數眾多和數據量龐大。AI大模型所需要的計算量,大致上相當于參數量與數據量的乘積。

過去5年,AI大模型的參數量幾乎每年提升一個數量級,例如GPT-4參數量是GPT-3的16倍,達到1.6萬億個。

隨著圖像、音視頻等多模態數據的引入,大模型的數據量也在飛速膨脹。這意味著想要玩轉大模型,必須擁有大算力。

而一套垂直大模型的訓練和推理成本,做個參考,在數字人垂類技術場景中,可以做到比Open AI同參數規模的模型低一個量級,像啟元世界的戰略總監王思捷就曾提到:先構建更小的垂類模型(比如百億參數、十億參數),讓數據飛輪和模型訓練能夠很好結合,垂類模型在某些領域可能比Open AI的效果更好成本更低。

即便垂直大模型在算力要求上已遠遠低于通用大模型,但對算力基礎設施的投入依然會阻擋部分小公司的入局。

再說算法。

在三要素中,算法的研發難度相對較低,每家公司都有自己實現大模型的路徑算法,且有眾多開源項目可作為參考,中國公司最容易縮短甚至抹平差距。

最后說數據。

高質量的數據是助力AI訓練與調優的關鍵,足夠多、足夠豐富的數據,是AI大模型的根基。

OpenAI此前披露,為了AI像人類那樣流暢交談,研發人員給GPT-3.5提供多達45TB的文本語料,相當于472萬套中國“四大名著”。這些語料的來源包括維基百科、網絡文章、書籍期刊等,甚至還將代碼開源平臺Github納入其中。

但是聚焦到細分行業,數據的獲取就沒那么容易了。

興業證券公開表示,要訓練專業的行業大模型,優質的行業數據、公共數據至關重要。

就國內數據市場而言,據發改委官方批露,我國政府數據資源占全國數據資源的比重超過3/4,但開放規模不足美國的10%,個人和企業可以利用的規模更是不及美國的7%。

而行業數據更是非常核心的私域數據,私域數據量越大,質量越高,就越有價值。

比如,一個醫療公司擁有大量醫療數據、病例數據,那么它就能開發出醫療垂直大模型類的產品。同理,建筑行業的項目數據、金融行業的用戶畫像數據、海運行業的船位數據等,都是賦能垂直大模型的關鍵。

但是這些私域數據都攥在企業自己手中,而且為了數據安全和合規,絕大部分機構是要本地化部署才會嘗試大模型訓練,很難想象企業會把自己的核心數據拿給別人去訓練。

此外,如何合理地給數據打上分級標簽、做好標注也非常重要。數據分級分類能夠幫助產品提效,而高精度的標注數據能夠進一步提升大模型的專業表現。

但現階段垂直行業想要獲取高精度標注數據的成本較高,而在公開數據庫中,行業專業數據也較少,因此對垂直大模型的建構提出了很高的要求。

總體而言,想要做好垂直大模型,數據的重要性,遠超過算力和算法。

數據,已成為企業突破垂直大模型的“卡點”。

手握行業數據領先一步

垂類大模型講求應用與場景先行的邏輯,而在國內更是強調產業側的價值。

一方面,在當前中國的智能化浪潮下,產業側數字化革新本就有廣闊的市場需求;另一方面,在toB生態下,基于垂直應用的實踐也有利于形成數據飛輪與場景飛輪。

而這一切的前提,是推出垂類大模型的公司在該行業已建立技術壁壘與護城河,即“人無我有”的競爭優勢。

如此看來,在垂直行業深耕多年的企業或將有更大的贏面。

這類企業在數據層面、大模型以及知識圖譜方面都有較為深厚的積累,對于大模型的優化更具優勢。同時,它們對于to B客戶需求和落地場景有很深的理解,能夠更好地保證垂直大模型產品的可信和可靠,滿足企業級對于安全可控合規的需求。

目前,已有一些垂類大模型在金融、教育、醫藥、營銷等場景中得到試煉。

例如,彭博社利用自身豐富的金融數據源,基于開源的GPT-3框架再訓練,開發出了金融專屬大模型BloombergGPT;

網易有道則面向教育場景,推出自研的類ChatGPT模型“子曰”;

在ChatGPT發布后僅幾周,谷歌公布了一個專門用于回答醫療保健相關問題的大型醫用語言模型Med-PaLM......

相信隨著越來越多企業入局,垂直大模型在各個行業和細分領域中將大量涌現。而那些能將一個垂直領域做專、做透,用高質量的數據持續優化模型,跑通商業閉環,構建起產業生態的企業,最終將把價值鏈做到足夠長。

【關于科技云報道】

專注于原創的企業級內容行家——科技云報道。成立于2015年,是前沿企業級IT領域Top10媒體。獲工信部權威認可,可信云、全球云計算大會官方指定傳播媒體之一。深入原創報道云計算、大數據、人工智能、區塊鏈等領域。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7341

    瀏覽量

    94897
  • AI
    AI
    +關注

    關注

    91

    文章

    40260

    瀏覽量

    301867
  • ChatGPT
    +關注

    關注

    31

    文章

    1598

    瀏覽量

    10329
  • 大模型
    +關注

    關注

    2

    文章

    3687

    瀏覽量

    5213
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    云知聲成功中標全國首個省級醫保垂直模型項目

    2026年開年,智慧醫保領域迎來里程碑式突破——云知聲智能科技股份有限公司成功中標全國首個省級醫保垂直模型項目“江蘇省醫保垂直模型及智能
    的頭像 發表于 01-23 17:16 ?786次閱讀

    英泰斯特獲評2025年武漢市垂直行業優秀模型

    2025年12月15日,武漢市經濟和信息化局發布《2025年武漢市垂直行業模型擬認定名單》,英泰斯特自主研發的“智能車聯網故障預警大模型”,憑借其領先的技術創新性和廣泛的應用前景成功入選,并獲評優秀
    的頭像 發表于 12-22 11:17 ?683次閱讀

    模型物資需求精準預測與采購系統:功能特點與平臺架構解析

    ? ? 大模型物資需求預測與采購智能化:核心功能與價值解析 ? ?大模型物資需求精準預測與采購系統通過深度整合多源數據、構建動態預測
    的頭像 發表于 12-16 11:54 ?352次閱讀

    安森美垂直GaN技術賦功率器件應用未來

    在傳統橫向結構的GaN器件中,電流沿芯片表面流動。而垂直 GaN 的 GaN 層生長在氮化鎵襯底上,其獨特結構使電流直接從芯片頂部流到底部,而不是僅在表面流動。這種垂直電流路徑讓器件能夠承受更高的電壓和更大的電流,從而實現更高
    的頭像 發表于 12-04 09:28 ?1970次閱讀
    安森美<b class='flag-5'>垂直</b>GaN技術賦<b class='flag-5'>能</b>功率器件應用未來

    成都匯陽投資關于國產開源模型持續突破,國產AI 競爭力增強

    ? ? ? ?國產開源模型領跑 ,AI 生態有望加速繁榮 根據獨立 AI 基準測試與分析平臺 Artificial Analysis 最新榜單 , 國產模型 KimiK2Thinking
    的頭像 發表于 11-24 14:01 ?618次閱讀

    安森美入局垂直GaN,GaN進入高壓時代

    電子發燒友網綜合報道 近日,安森美發布器垂直GaN功率半導體技術,憑借 GaN-on-GaN 專屬架構與多項性能突破,為全球高功率應用領域帶來革命性解決方案,重新定義了行業在效、緊湊性與耐用性上
    的頭像 發表于 11-10 03:12 ?7590次閱讀

    安森美推出垂直氮化鎵功率半導體

    隨著全球能源需求因 AI 數據中心、電動汽車以及其他高能耗應用而激增,安森美(onsemi)推出垂直氮化鎵(vGaN)功率半導體,為相關應用的功率密度、效和耐用性樹立新標桿。這些突破
    的頭像 發表于 10-31 13:56 ?2232次閱讀

    端到端語音交互數據 精準賦語音大模型進階

    在語音大模型從“識別”向“懂語境”跨越的關鍵階段,高質量場景化語音數據已成為制約技術突破的核心瓶頸。傳統語音識別數據集采用孤立標注,在語音
    的頭像 發表于 09-11 17:17 ?783次閱讀

    模型工具的 “京東答案”

    隨著大模型技術的迅猛發展,AI工具已成為重要的輔助生產力工具和工作伙伴。它能夠顯著提升工作效率、幫助解決業務痛,甚至通過知識延展與智能協同,幫助團隊突破傳統認知邊界。掌握大
    的頭像 發表于 08-25 16:09 ?616次閱讀

    垂直GaN迎來新突破

    電子發燒友網綜合報道 最近垂直GaN功率器件又迎來新進展。7月10日,廣東致CEO黎子蘭博士,在瑞典舉辦的全球氮化物半導體頂尖會議ICNS(國際氮化物半導體會議)上發表邀請報告,首次報道了廣東致
    發表于 07-22 07:46 ?5040次閱讀
    <b class='flag-5'>垂直</b>GaN迎來新<b class='flag-5'>突破</b>!

    【「DeepSeek 核心技術揭秘」閱讀體驗】第三章:探索 DeepSeek - V3 技術架構的奧秘

    融入 Transformer,通過替換 FFN 層、多機多訓練等策略,試圖拓展模型能力。看到模型容量因專家數量增加而擴展,處理更復雜任務,讓我感受到創新的潛力。但同時,通信成本高、
    發表于 07-20 15:07

    數據標注與大模型的雙向賦:效率與性能的躍升

    ??在人工智能蓬勃發展的時代,大模型憑借其強大的學習與泛化能力,已成為眾多領域創新變革的核心驅動力。而數據標注作為大模型訓練的基石,為大模型性能提升注入關鍵動力,是
    的頭像 發表于 06-04 17:15 ?2072次閱讀
    <b class='flag-5'>數據</b>標注與大<b class='flag-5'>模型</b>的雙向賦<b class='flag-5'>能</b>:效率與性能的躍升

    如何賦醫療AI大模型應用?

    “百模大戰”。不僅如此,這些通用AI大模型還逐漸滲透到各個垂直行業中,其中生命科學和醫療健康行業成為了拓展速度較快的一個領域。從2023年2月至10月初,國內市場上
    的頭像 發表于 05-07 09:36 ?729次閱讀
    如何賦<b class='flag-5'>能</b>醫療AI大<b class='flag-5'>模型</b>應用?

    絕味20歲生日會,鴨廠鵝廠聯手發布中國零售連鎖AI垂直場景大模型

    絕味×騰訊,首個中國零售連鎖AI垂直場景大模型的破殼之路
    的頭像 發表于 04-23 19:18 ?1469次閱讀
    絕味20歲生日會,鴨廠鵝廠聯手發布中國零售連鎖AI<b class='flag-5'>垂直</b>場景大<b class='flag-5'>模型</b>

    模型時代 垂直化是數據市場發展趨勢 解決單點難題是核心競爭

    數據,作為一種革命性的生產資源,與算力、算法共同構成了人工智能產業的三大要素。受益于人工智能的蓬勃發展,人類加速進入到由數據驅動的數字化時代,數據作為核心要素的作用越來越重要。 01 大模型
    的頭像 發表于 04-09 11:48 ?479次閱讀