IBM Granite 模型系列在斯坦福大學(xué)發(fā)布的 2025年“基礎(chǔ)模型透明度指數(shù)”(Stanford Foundation Model Transparency Index)名列第一,并創(chuàng)下該指數(shù)的歷史最高分。
基礎(chǔ)模型如今無處不在,正在改變商業(yè)和日常生活的更多領(lǐng)域,比如,為聊天機(jī)器人、代碼助手和地理空間模型等各類AI工具提供動(dòng)力。值得一問的是:我們真的了解它們是如何構(gòu)建的嗎?
這正是斯坦福大學(xué)基礎(chǔ)模型研究中心所探索的問題。日前,該中心發(fā)布了第三份年度基礎(chǔ)模型透明度指數(shù)報(bào)告(Stanford Foundation Model Transparency Index,F(xiàn)MTI)。IBM 于 2024年開源了其 Granite 花崗巖模型,但對(duì)開發(fā)者和最終用戶來說,開放性本身并不等同于透明度。FMTI 根據(jù)數(shù)據(jù)來源、風(fēng)險(xiǎn)評(píng)估、開放權(quán)重、外部可復(fù)現(xiàn)性、事件報(bào)告協(xié)議和數(shù)據(jù)使用政策等 100項(xiàng)指標(biāo),對(duì)主流基礎(chǔ)模型的透明度進(jìn)行評(píng)分。斯坦福團(tuán)隊(duì)根據(jù)評(píng)估框架對(duì)主要 AI 公司的模型進(jìn)行評(píng)分,并在 FMTI 發(fā)布前給予公司回應(yīng)評(píng)級(jí)的機(jī)會(huì)。
今年斯坦福評(píng)估了 13家公司的模型,綜合所有領(lǐng)域得分后,IBM Granite 3.3 以 95% 的透明度得分高居榜首,領(lǐng)先第二名23個(gè)百分點(diǎn),較 41% 的平均分高出 54個(gè)百分點(diǎn)。

FMTI 從上游、模型和下游三大領(lǐng)域?qū)δP瓦M(jìn)行評(píng)分,IBM Granite 在每個(gè)領(lǐng)域及總分上均處于領(lǐng)先地位。
在 15個(gè)主要透明度維度中,IBM Granite 有 10個(gè)維度獲得滿分 100分,包括數(shù)據(jù)獲取、計(jì)算能力和下游緩解措施。
對(duì) IBM 而言,將透明度融入模型核心不僅是道德決策,更是明智的商業(yè)選擇。IBM 模型始終將透明度前置,并貫穿其生命周期。就像全球企業(yè)的供應(yīng)鏈決策一樣,企業(yè)需要確保其使用的產(chǎn)品值得信賴。FMTI 結(jié)果揭示了這一趨勢(shì),即企業(yè)級(jí)模型往往更具透明度。
此外,今年 FMTI 的整體平均分下降了 17分,這意味著其他頭部 AI 公司的模型透明度有所降低。IBM 院士、IBM 研究院人工智能安全負(fù)責(zé)人 Kush Varshney表示:"盡管許多 AI 公司對(duì)模型透明度的重視不足,IBM 始終甚至更加專注于透明度。"數(shù)據(jù)對(duì)比鮮明:在數(shù)據(jù)屬性(Data Properties)維度,IBM 獲得了滿分 100分,而其他八家公司得分為零,該類別平均分僅為 14分。
除總分下降外,F(xiàn)MTI 報(bào)告還揭示另一趨勢(shì):2025年發(fā)布模型透明度報(bào)告的公司數(shù)量比 2024年減少了一半。斯坦福大學(xué)基礎(chǔ)模型研究中心自行收集了其余數(shù)據(jù)。

在 FMTI 的 14個(gè)主要透明度維度中,IBM Granite 有 10個(gè)維度獲得滿分。在全部 14個(gè)維度上,其得分均超過所有評(píng)估模型平均值。
今年的 FMTI 結(jié)果新增了AI 智能體的信息檢索能力標(biāo)準(zhǔn),并首次納入中國公司的模型。指數(shù)編制團(tuán)隊(duì)指出,F(xiàn)MTI 還進(jìn)行了模型的開放性評(píng)估,不僅包括模型的訪問路徑數(shù)量,還包括是否支持第三方的模型風(fēng)險(xiǎn)研究、跨智能體的互操作性協(xié)議等。
IBM 是與斯坦福大學(xué)合作提供模型信息的公司之一。在提交 Granite 3.3 的相關(guān)數(shù)據(jù)后,IBM 已發(fā)布新一代 Granite 4.0 系列模型。后者基于標(biāo)準(zhǔn)Apache 2.0許可證開源,是全球首個(gè)獲得ISO 42001認(rèn)證的開放模型,并進(jìn)行了加密簽名,確保其符合國際公認(rèn)的安全、治理和透明度最佳實(shí)踐。
斯坦福大學(xué) Hazy Research 實(shí)驗(yàn)室的一項(xiàng)近期研究表明,開源的 Granite 4.0 微型和小型模型在消費(fèi)級(jí)硬件上運(yùn)行時(shí),也能高效地處理多種 AI 任務(wù)。在他們看來,IBM Granite 4.0 系列模型指明了 AI 行業(yè)的發(fā)展方向。
IBM 院士、IBM 研究院人工智能安全負(fù)責(zé)人 Kush Varshney表示:"正如我們不愿食用成分不明的食品或飲料,各行業(yè)企業(yè)都應(yīng)該確保大語言模型的透明度。IBM Granite 所提供的正是‘從農(nóng)場(chǎng)到餐桌‘的透明度體驗(yàn)。"
關(guān)于 IBM
IBM 是全球領(lǐng)先的混合云、人工智能及企業(yè)服務(wù)提供商,幫助超過 175個(gè)國家和地區(qū)的客戶,從其擁有的數(shù)據(jù)中獲取商業(yè)洞察,簡(jiǎn)化業(yè)務(wù)流程,降低成本,并獲得行業(yè)競(jìng)爭(zhēng)優(yōu)勢(shì)。金融服務(wù)、電信和醫(yī)療健康等關(guān)鍵基礎(chǔ)設(shè)施領(lǐng)域的超過 4000家政府和企業(yè)實(shí)體依靠 IBM 混合云平臺(tái)和紅帽 OpenShift 快速、高效、安全地實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型。IBM 在人工智能、量子計(jì)算、行業(yè)云解決方案和企業(yè)服務(wù)方面的突破性創(chuàng)新為我們的客戶提供了開放和靈活的選擇。對(duì)企業(yè)誠信、透明治理、社會(huì)責(zé)任、包容文化和服務(wù)精神的長期承諾是 IBM 業(yè)務(wù)發(fā)展的基石。
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
31073瀏覽量
222162 -
IBM
+關(guān)注
關(guān)注
3文章
1868瀏覽量
76994 -
模型
+關(guān)注
關(guān)注
1文章
3751瀏覽量
52097
原文標(biāo)題:創(chuàng)造歷史!IBM Granite 登頂斯坦福大學(xué)基礎(chǔ)模型透明度指數(shù)
文章出處:【微信號(hào):IBMGCG,微信公眾號(hào):IBM中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
IBM發(fā)布2026年X-Force威脅情報(bào)指數(shù)報(bào)告
松下透明導(dǎo)電薄膜:先進(jìn)的透明電磁屏蔽解決方案
云知學(xué)院攜手合作伙伴構(gòu)建AI人才生態(tài)
第四屆飛行器健康管理技術(shù)國際高端論壇暨青年科學(xué)家論壇:昊衡科技,歡迎您來!
斯坦福團(tuán)隊(duì)開發(fā)新型鐵基電池材料推動(dòng)儲(chǔ)能技術(shù)發(fā)展
2025年哈薩克斯坦國際電力能源博覽會(huì)
Vicor電源模塊突破數(shù)據(jù)中心AI電力困境
斯坦福(Stanford)鎖相放大器故障修復(fù)
IBM發(fā)布2025年第二季度業(yè)績報(bào)告
小設(shè)備大模型 創(chuàng)盈芯特邀中南大學(xué)何世文教授、博導(dǎo)揭秘AI新趨勢(shì)
IBM發(fā)布2025年第一季度業(yè)績報(bào)告
IBM發(fā)布2025年X-Force威脅情報(bào)指數(shù)報(bào)告
詳解《斯坦福 AI 報(bào)告 2025》:國產(chǎn)模型崛起、清華論文領(lǐng)先
斯坦福大學(xué)發(fā)布《2025 年人工智能指數(shù)報(bào)告》
IBM Granite登頂斯坦福大學(xué)2025年基礎(chǔ)模型透明度指數(shù)報(bào)告
評(píng)論