近日,在2024中國移動全球合作伙伴大會上,一項關于大模型評測體系建設的新成果——《通用大模型評測標準》正式發布。這一標準由中國移動攜手工信部中國電子技術標準化研究院、中國電信、國家電網、中國石油以及科大訊飛等產業各方共同推出。
《通用大模型評測標準》旨在為產業界提供一個重要的參考依據,幫助各方遴選出優質的AI大模型。隨著人工智能技術的快速發展,大模型在各個領域的應用日益廣泛,因此建立一個統一、權威的評測標準顯得尤為重要。
此次發布的評測標準將有力推動AI大模型技術的規范化發展,促進產業界的技術交流與合作,為人工智能技術的進一步創新和應用奠定堅實基礎。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
中國移動
+關注
關注
22文章
5714瀏覽量
78105 -
人工智能
+關注
關注
1817文章
50098瀏覽量
265394 -
科大訊飛
+關注
關注
19文章
860瀏覽量
63728
發布評論請先 登錄
相關推薦
熱點推薦
百度正式發布并開源新一代文檔解析模型PaddleOCR-VL-1.5
1 月 29 日,百度正式發布并開源新一代文檔解析模型 PaddleOCR-VL-1.5。該模型以僅 0.9B 參數的輕量架構,在全球權威文檔解析評測榜單 OmniDocBench V
云知聲山海知音大模型2.0重磅發布
隨著智能體時代到來,云知聲在“山海·Atlas”通用智算基座持續演進基礎上,年前實現了“山海·知醫”5.0醫療大模型升級,今天迎來了“山海·知音”2.0的重磅發布,正在完成“一基兩翼”技術戰略升級的能力拼圖。
上海交大發布國產光學大模型Optics GPT
原理,為科研、設計與教學提供智能化助力。 ? 目前,通用人工智能模型雖功能多樣,但在光學這類需要深厚專業知識和精密計算的硬科技領域,往往難以深入理解。上海交通大學“光生未來”項目組經過深入研究,成功打造出這款“光學原生”的專業模型
商湯科技日日新V6.5榮獲2025年多模態大模型全國第一
近日,權威大模型評測基準 SuperCLUE 發布《中文多模態視覺語言模型測評基準12月報告》,商湯日日新V6.5(SenseNova V6.5 Pro)以75.35的總分位列國內第一
VESA發布DisplayPort汽車擴展標準合規測試規范模型
,VESA重點介紹了其于2025年5月發布的DP AE合規測試規范模型。這一完全可執行的Linux C模型包含500多項功能安全與信息安全合規測試,使芯片制造商能夠基于VESA DP AE標準
OpenAI發布2款開源模型
OpenAI開源了兩款高性能權重語言模型gpt-oss-120b和gpt-oss-20b,OpenAI CEO Sam Altman表示:「gpt-oss 發布了!我們做了一個開放模型,性能達到
螞蟻數科正式發布金融推理大模型
7月26日,以“智能時代,同球共濟”為主題的2025世界人工智能大會在上海開幕;亮點很多。我們看到在世界人工智能大會論壇上,螞蟻數科正式發布了金融推理大模型Agentar-Fin-R1,金融推理
軟通動力助力軟件智能化領域標準化建設邁上新臺階
近日,由人工智能關鍵技術和應用評測重點實驗室牽頭編寫的《軟件智能化成熟度模型 通用能力要求》(AIIA/T 0223-2025 )正式發布。作為核心參編單位,軟通動力深度參與
大華問數智能體一體機通過中國信通院權威評測認證
日前,由中國通信標準化協會主辦的2025數據智能大會在北京召開。會上,中國信息通信研究院(以下簡稱“中國信通院”)發布了2025年上半年“大模型驅動的智能數據分析工具” 專項測試結果,大華問數智能體一體機順利通過該權威
深蘭科技醫療大模型榮獲MedBench評測第一
近日,國內權威醫療大模型評測平臺MedBench在官網更新了榜單,多個知名醫療AI產品及研究團隊入榜,其中深蘭DeepBlue-MR-v1醫療大模型以復雜醫學推理評測第一的成績領跑Me
云知聲深度參與三項大模型國家標準編寫
在人工智能技術加速落地的當下,標準化建設已成為推動行業高質量發展的關鍵因素。近日,云知聲參與編寫的3項人工智能大模型國家標準:20231736-T-469《人工智能 大模型第1部分:
商湯“日日新”融合大模型登頂大語言與多模態雙榜單
據弗若斯特沙利文(Frost & Sullivan, 簡稱“沙利文”)聯合頭豹研究院發布的《2025年中國大模型年度評測》結果顯示:在語言和多模態核心能力測評中,商湯“日日新”融合大模型
通用大模型評測標準正式發布
評論