據(jù)了解,國際知名人工智能社區(qū)MLCommons近期推出了AI Safety人工智能安全基準測試的v0.5版,該測試由多領(lǐng)域?qū)<覉F隊共同打造,以識別并防范AI應(yīng)用中的潛在風(fēng)險。
隨著AI技術(shù)的快速發(fā)展,相關(guān)安全問題也日益凸顯。僅過去數(shù)周內(nèi),便有LastPass公司遭遇音頻深度偽造攻擊等案例浮出水面。為了應(yīng)對這一挑戰(zhàn),新推出的AI Safety基準測試將成為模型開發(fā)者的有力工具,助力他們構(gòu)建更為穩(wěn)固的安全防線。
AI Safety基準測試主要通過大型語言模型對各類危險提示詞的反應(yīng)來評估其安全性。該測試的v0.5版已開始收集社區(qū)反饋,預(yù)計將于今年晚些時候推出正式的v1.0版。
v0.5版的AI Safety基準測試主要關(guān)注通用聊天文本模型,而v1.0版則將加入針對圖像生成模型的測試內(nèi)容,并初步探討交互式代理模型的安全測試方法。
該測試涵蓋了超過43000個測試提示詞,采用Meta公司的Llama Guard對大模型的危險提示響應(yīng)進行評估。這些提示詞包括常見模板及危險場景描述短語,覆蓋七類安全危害類型,未來還將進一步擴展至至少十三類。
最后,AI Safety基準測試將根據(jù)測試結(jié)果給出五個安全評級,以便用戶更好地理解和使用。
-
人工智能
+關(guān)注
關(guān)注
1817文章
50098瀏覽量
265343 -
模型
+關(guān)注
關(guān)注
1文章
3752瀏覽量
52106 -
ai技術(shù)
+關(guān)注
關(guān)注
1文章
1313瀏覽量
25746
發(fā)布評論請先 登錄
請問VisionFive 2 的熱安全性如何?
大模型 ai coding 比較
應(yīng)對車輛AI安全性挑戰(zhàn),ISO/PAS 8800標準深度拆解
嵌入式軟件單元測試中AI自動化與人工檢查的協(xié)同機制研究:基于專業(yè)工具的實證分析
請問CW32L052C8T6這種安全性低功耗MCU的安全固件部分怎么實現(xiàn)?
軟包電池測試全指南:性能、安全與可靠性全面解析
邊聊安全 | 智能駕駛時代的新挑戰(zhàn):AI功能安全
有哪些技術(shù)可以提高邊緣計算設(shè)備的安全性?
如何驗證硬件加速是否真正提升了通信協(xié)議的安全性?
如何利用硬件加速提升通信協(xié)議的安全性?
AI安全基準測試 v0.5: 聚焦通用聊天文本模型安全性
評論