国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

OpenAI“政變”進行時,“百模大戰”接下來該戰什么?

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2023-11-21 18:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

這兩天AI圈最熱鬧的消息,應該就OpenAI高層內訌,標志性人物、原CEO Sam Altman被董事會解雇,數位科學家和高層離職。

關于“政變”的原因,坊間有很多傳言,比如商業化和非營利原則的矛盾。總之,事件相關者在輿論場拉扯,吃瓜群眾則瞪大了眼睛看戲。這場風波會給全球AI研發,尤其是大模型帶來什么影響,還是未知數。

有人做了一個梗圖,大模型廠商亂成一鍋粥,只有賣卡的英偉達穩坐釣魚臺。

wKgaomVchGuAfhtEAADmoZ6UD6w515.jpg

任它天邊云卷云舒,可以肯定的是,中國的AI大模型在取得廣泛成就的基礎上,會繼續向前發展,釋放產業價值,并且不會一味照搬海外,尤其是OpenAI的模式。

帶著這份淡定,我們將目光聚焦在國產大模型,會發現“百模大戰”熱潮中,還缺乏對各類大模型全面、分層、真實的能力評估。

通用大模型、行業大模型,都在比拼參數規模,但訓練數據質量不確定,僅憑參數,行業客戶和用戶也難以選對適合的大模型。

那么看榜單呢?基準測試benchmark和標準化數據集,可以針對性調優,榜單無法反映實際應用效果差距。

而且大模型在不同任務場景下,表現的區分度很大。一位開發者說,“現在就是告訴你都有哪些大模型,實際效果還是得靠自己測測看”。

據中國信通院的數據顯示,目前的大模型測試方法和數據集已有200多個。想要一個個測過來,會給用戶帶來非常繁重的工作量。

“百模大戰”亂花漸欲迷人眼,那么,除了“跑分”打榜和參數“碾壓”,還有什么辦法來真實且有效地評判一個大模型的水平呢?

有必要來聊聊,“百模大戰”,不同賽道都在戰什么?

大模型,不看高分看高能

所謂“百模大戰”,并不是每個大模型都在做著同樣的事。其中,既有想做基座模型basemodle的通用大模型,如百度的文心、阿里的通義、騰訊的混元、華為的盤古、訊飛的星火、智譜的ChatGLM等,也有面向行業、場景的垂直大模型,目前在金融、教育、工業、傳媒、政務等多個領域都大量涌現。

不同賽道的大模型,其核心競爭力也不一樣。比如一味拼算法的打榜,對于行業大模型來說,可以作為一種宣傳手段和“炫技”,但實際效果才是用戶最關注的。

目前不少開發者反映,各類大模型都存在各自的問題。

1.基座模型,本身能力有限制。

提到通用大模型,大家可能第一時間想到的就是推理能力,這也是大模型基準測試的主要指標。但在實際應用中,尤其是文科類型任務,大家不會沒事出“腦筋急轉彎”來測試通用大模型的邏輯推理能力,而是更希望大模型在復雜任務和上下文長度上,有更可靠的表現。

比如寫一篇演講文稿,篇幅一長就開始胡說八道或泛泛而談,文本的采用率下降;為AIGC配字幕,不能整篇生成,還需要人工將文案切割成片;編寫一個程序,半路開始network error……這些都是實際應用中,大家比較關注的通用大模型的能力。

2.行業大模型,領域壁壘難翻越。

“百模大戰”進行到當下,很多行業開發者和企業都意識到,獨有的數據和場景,才是自己的護城河,開始打造定制化的大模型,而領域知識不夠,難以形成滿足某一領域需求的行業向產品。

比如大模型與行業知識不匹配、許多行業know-how還沒有知識化、傳統的知識圖譜與大模型的協同設計等,知識計算的能力不夠強,就無法真正撼動領域壁壘,讓大模型解決實際的業務問題。

3.有用性,ROI是個謎。

大模型的實際應用效果難以評估,其中一個主要原因,就是模型生成結果的有用性(采用率、可用率等指標),涉及大量多模態數據。

金融、醫藥、交通、城市等產業中,存在著大量多模態信息,比如客服電話的語音、醫學影像圖片、傳感器數據等,大語言模型必須具備多模態理解能力,將多模態信息與語言進行綜合分析處理,才能保證較高質量的輸出。

在實際任務中,上述三種問題可能會同時存在,要同時解決。

一位醫藥專家告訴我,在研發醫學影像的算法時,就需要基座大模型在預訓練階段就具備多模態理解能力、醫學影像知識,可以執行通用任務。同時,行業側還需要根據知識設計目標函數,在特征抽取、相似性度量、迭代優化算法等,都要貢獻好各自的知識,才可能訓練出一個對醫務工作者友好的領域大模型,不需要專業知識,也不需要建模,就能上手使用。

就像工業革命的開始,是因為瓦特改良了蒸汽機。在此之前,蒸汽機早已被發明出來了,但一直沒有解決大規模高可用的問題,大模型也是如此。

大模型產業化,必須從基準測試的“跑高分”,向可信賴的“高能力”進化。

百模大戰,究竟在戰哪些能力?

從高分到高能,讓大模型具有與行業結合的可行性,也讓“百模大戰”正在進入新的階段。

從產業實際需求來看,可用且有效的大模型,至少應該具備幾個核心能力:

1.長文能力。

大語言模型的技術特點,被認為是“鸚鵡學舌”,將輸入信號拼湊成有一定語法結構的句子,也就是文本補全能力。而大模型都有“幻覺”,上下文窗口的長度增加,邏輯幻覺就可能越嚴重,“鸚鵡學舌”開始變得吃力。

在很多垂直行業應用中,如金融、法律、財務、營銷等,長文檔的分析處理和生成能力是剛需。

在長文中保持邏輯的連貫性、合理性,考驗著大模型的綜合能力,比如對復雜語句的理解及記憶能力,生成的可靠性,這也是大模型走向產業化的核心。

目前,無論開源、閉源大模型,都將長文能力作為一個核心競爭力。比如流行的開源大模型Llama 2,就將上下文長度擴展至 128k,而基于LLaMA架構的零一萬物的Yi系列大模型,此前曾宣稱拿下了全球最長上下文窗口寶座,達到200K,可直接處理40萬漢字超長文本輸入。閉源大模型中,GPT-4 Turbo支持了比ChatGPT更長的上下文(128k tokens),百度的文心大模型通過對話增強,提升上下文理解能力。

2.知識能力。

大模型“大力出奇跡”的模式,忽略了模型準確感知和理解注入知識的能力,目前已經凸顯了很多問題。比如不理解領域知識,在實際業務中表現不佳,無法滿足ToB用戶的需求。因此,當歐美科技公司依然在執著追求更大參數時,百度、華為等國內大模型廠商,開始轉向了行業場景,將強業務知識引入文心、盤古的行業大模型之中,來提升大模型在行業任務中的應用效果。

具體是怎么做的呢?以“行業知識增強”為核心特色的文心,是在預訓練大模型的基礎上,進一步融合大規模知識圖譜,挖掘行業應用場景中大量存在的行業特色數據與知識,再結合行業專家的知識,從大規模知識和海量數據中融合學習,把知識內化至模型參數中。

當用戶輸入問題時,文心4.0會拆解回答問題所需的知識點,進而在搜索引擎、知識圖譜、數據庫中查找準確知識,再將知識組裝進Prompt送入大模型。另一方面,大模型還將對輸出結果進行反思,從生成結果總結知識點,進而通過以上方式進行確認驗證,對結果差錯進行修正。

目前來看,在同等參數規模下,知識增強的深度語意理解,效果大幅超越了純粹用深度學習的方法,推理效率更高,并且可解釋性更強,更符合產業對可信AI的需求。

目前,知識+大模型還有許多細節有待解決,比如知識體系的構建,知識的持續獲取,知識應用和推理等,這些問題的攻克都會給行業認知智能帶來重大機會。

3.多模態能力。

2022年我參加華為云AI院長峰會,一位科學家提到,大模型有一個問題,就是有很多符號領域,大模型根本就不理解。他認為,大模型是數據與知識雙輪驅動的,雙輪驅動是未來人工智能發展的重要模式。

前面我們說了知識能力的重要性,那么“數據”究竟拼的是什么呢?就是多模態能力。

把大模型應用到領域的時候,會發現問題非常多,根本達不到預期的效果。一個主要原因,大語言模型完全是基于語言的,而真實世界的復雜任務,有大量的數值、圖表、語音、視頻等多模態數據,數據的多模態特性增加了模型處理、建模和推理的復雜性。

一位醫療模型的開發者告訴我,醫療任務分析非常繁雜,數量級很多,有不同模態、病種,每一種模態有不同的診療任務,要把文本、圖像等多模態包容過來,而醫療領域非常缺少多模態的預訓練模型。

大模型要在實際業務中達到與人更接近的能力,也需要跨模態建立統一認知。

舉個例子,AIGC生成營銷活動物料,根據文字描述生成圖像、視頻,既要精確理解提示詞的語義,還要符合領域規范,不能出現不合規的素材,同時要控制生成內容的質量,保持跨模態的語義一致性。

國產大模型在多模態領域也做了很多差異化探索,除了大家熟悉的以文生圖,在醫療影像、遙感、抗體藥物、交通等領域,跨模態技術融合也在快速開展,未來會是基座大模型和行業大模型的亮點。

從這些產業需要的能力來看,大模型的產業屬性和價值已經清晰展露了出來。

大模型,絕不是聊聊天、搞怪圖片那么膚淺,技術覆蓋區域是很廣闊的,技術應用價值已經足夠具有說服力。

但也必須承認,目前,絕大多數產業所獲取的技術能力和技術深度,都還遠遠不夠。一方面受限于上游的基座大模型能力,同時也缺乏深度定制化的中游服務商,導致用戶大多只能調用簡單化、標準化的API,而難以將領域知識、多模態數據與大模型深度結合。

未來,從高分到高能,國產大模型一定會依靠自身的差異化技術路線,以及中國豐富多樣的產業需求,從懵懂走向成熟,甚至先于歐美,走向千行百業

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301406
  • OpenAI
    +關注

    關注

    9

    文章

    1245

    瀏覽量

    10070
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    政變壓設備局放監測:智能監測體系

    的早期預警。本文聚焦脈沖電流法在市政變壓設備局放監測中的應用原理與技術特點,解析其作為主流檢測方法的科學性與實用性。脈沖電流法基于電磁感應原理,通過高頻電流傳感器采集
    的頭像 發表于 02-28 10:17 ?115次閱讀
    市<b class='flag-5'>政變</b>壓設備局放監測:智能監測體系

    內存條崩了?漲了十倍的內存顆粒賣給誰?內存芯片接下來怎么玩?

    內存條
    芯廣場
    發布于 :2026年01月26日 17:48:21

    ABB ACS880變頻器預充電的三種方法

    如果是已經生產或通過電的設備,那就要根據生產手冊或者出廠試車標簽確定最后通電時間。不管是新舊設備,這個未通電持續時間(非運行時間)很關鍵,它決定了接下來是用什么方式進行預充電。
    的頭像 發表于 11-06 14:54 ?1001次閱讀
    ABB ACS880變頻器預充電的三種方法

    NVIDIA攜手OpenAI構建AI基礎設施

    NVIDIA 首席執行官黃仁勛、OpenAI 首席執行官 Sam Altman 和 OpenAI 總裁 Greg Brockman 宣布了一項新的合作伙伴關系,旨在推動 OpenAI 的發展,并支持幾乎所有行業和用戶大規模使用
    的頭像 發表于 09-23 14:38 ?913次閱讀

    【匠芯創D133CBS KunLun Pi開發板試用體驗】匠芯創D133CBS KunLun Pi LVGL GPIO 按鍵 音頻測試

    ,也說明了這款cpu的性能如何,這個板子也提供相當多的資料與示例demo可供開發者迅速上手開發,可以應用相當多領域 接下來我給硬件接上喇叭 通過1.25mm端子喇叭接入可以選擇4歐或者8歐,最后我把
    發表于 09-05 22:59

    開疆智能Ethernet轉ModbusTCP網關連接UR機器人配置案例

    關鍵,以確保通信測試的正常進行。 1、首先,在PLC設置中,選擇“以太網端口”選項。 IP及網絡配置 接下來進行IP地址、子網掩碼及默認網關的配置,以確保通信的準確性與穩定性。 2、接下來
    的頭像 發表于 08-14 18:24 ?855次閱讀
    開疆智能Ethernet轉ModbusTCP網關連接UR機器人配置案例

    【EASY EAI Orin Nano開發板試用體驗】04-編譯及安裝帶有RKMPP的ffmpeg

    前言 在上一篇試用報告中已經將QT安裝完畢,并正常啟動了,接下來我們進行安裝ffmpeg,但是如果我們直接使用apt來進行安裝的話,那么其并不帶有瑞芯微的硬編解碼,所以需要我們來自己編譯ffmpeg
    發表于 07-20 19:21

    人工碼垛已成為過去式接下來就是碼垛機器人的主場了

    自動化
    jf_73817765
    發布于 :2025年06月03日 10:52:30

    【RA-Eco-RA4M2開發板評測】RA-Eco-RA4M2 移植FreeRTOS

    報錯與警告,說明生成工程成功。 Figure 2?11 編譯Log信息 接下來就可以基于FreeRTOS進行開發了。
    發表于 05-03 23:24

    12芯光纜多和單模怎么區分

    12芯光纜的多(Multi-Mode, MM)和單模(Single-Mode, SM)主要通過傳輸模式、光纖結構、標識顏色、應用場景等方面進行區分,以下是具體說明: 1. 傳輸模式 多光纜:允許
    的頭像 發表于 04-27 09:44 ?2452次閱讀
    12芯光纜多<b class='flag-5'>模</b>和單模怎么區分

    Omdia 林麟:2025 年 AI 眼鏡市場將呈現大戰

    大戰”。 ? 在這場“大戰”中,中國廠商是重要的力量。根據Omdia的統計數據,2024年全球AI眼鏡的出貨量大概是190 萬副,2025年將增長到約 680 萬副。其中,Meta將是全球AI眼鏡發展的領軍者,預計將會占據
    發表于 04-16 15:06 ?637次閱讀

    EMC整改中共電感的使用原理

    電感這種連接下,兩條線互感形成的磁通是同一方向。 交變電流形成的磁場與磁鐵的固有磁場形成對抗,相互抑制,才能實現濾波功能。 純分享貼,有需要可以直接下載附件獲取完整文檔! (如果內容有幫助可以關注、點贊、評論支持一下哦~
    發表于 04-09 11:12

    AI眼鏡大模型激戰:多大模型協同、交互時延低至1.3S

    電子發燒友網報道(文/莫婷婷)“大戰”開始時,也是AI大模型在智能眼鏡端加速落地的開始,一場關于智能眼鏡的“大戰”也同步
    的頭像 發表于 03-20 08:59 ?2716次閱讀
    AI眼鏡大模型激戰:多大模型協同、交互時延低至1.3S

    迅為RK3568開發板篇Openharmony配置HDF控制UART-實操-HDF驅動配置UART-UART應用開發-編寫應用測試 APP

    使用 UART 的一般流程如下所示: 接下來編寫應用測試文件 uart_test.c,完整代碼如下所示: 接下來編寫應用 APP 的 GN 文件 BUILD.gn,代碼內容如下所示:
    發表于 03-19 14:41