国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

新型威脅:探索LLM攻擊對網絡安全的沖擊

jf_WZTOguxH ? 來源:AI前線 ? 2023-10-11 16:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來自卡內基梅隆大學(CMU)的研究人員發布了 LLM Attacks,這是一種可以針對各種大型語言模型(LLM)構建對抗性攻擊的算法,包括 ChatGPT、Claude 和 Bard。這些自動生成的攻擊,在 GPT-3.5 和 GPT-4 上的成功率為 84%,在 PaLM-2 上的成功率為 66%。

與大多數“越獄”攻擊通過試錯手工構建不同,CMU 的團隊設計了一個三步流程來自動生成提示后綴,它們可以繞過 LLM 的安全機制,導致有害的響應。而且,這些提示還是可轉移(transferrable)的,也就是說,一個給定的后綴通常可以用于許多不同的 LLM,甚至是閉源模型。為了衡量算法的有效性,研究人員創建了一個名為 AdvBench 的基準測試;在此基準測試上進行評估時,LLM 攻擊對 Vicuna 的成功率為 88%,而基線對抗算法的成功率為 25%。根據 CMU 團隊的說法:

最令人擔憂的也許是,目前尚不清楚 LLM 提供商是否能夠完全修復此類行為。在過去的 10 年里,在計算機視覺領域,類似的對抗性攻擊已經被證明是一個非常棘手的問題。有可能深度學習模型根本就無法避免這種威脅。因此,我們認為,在增加對此類人工智能模型的使用和依賴時,應該考慮到這些因素。

隨著 ChatGPT 和 GPT-4 的發布,出現了許多破解這些模型的技術,其中就包括可能導致模型繞過其保護措施并輸出潛在有害響應的提示。雖然這些提示通常是通過實驗發現的,但 LLM Attacks 算法提供了一種自動創建它們的方法。第一步是創建一個目標令牌序列:“Sure, here is (content of query)”,其中“content of query”是用戶實際輸入的提示,要求進行有害的響應。

接下來,該算法會查找可能導致 LLM 輸出目標序列的令牌序列,基于貪婪坐標梯度(GCG)算法為提示生成一個對抗性后綴。雖然這確實需要訪問 LLM 的神經網絡,但研究團隊發現,在許多開源模型上運行 GCG 所獲得的結果甚至可以轉移到封閉模型中。

在 CMU 發布的一條介紹其研究成果的新聞中,論文合著者 Matt Fredrikson 表示:

令人擔憂的是,這些模型將在沒有人類監督的自主系統中發揮更大的作用。隨著自主系統越來越真實,我們要確保有一種可靠的方法來阻止它們被這類攻擊所劫持,這將非常重要……現在,我們根本沒有一個令人信服的方法來防止這種事情的發生,所以下一步,我們要找出如何修復這些模型……了解如何發動這些攻擊通常是建立強大防御的第一步。

論文第一作者、CMU 博士生 Andy Zou 在推特上談到了這項研究。他寫道:

盡管存在風險,但我們認為還是應該把它們全部披露出來。這里介紹的攻擊很容易實現,以前也出現過形式類似的攻擊,并且最終也會被致力于濫用 LLM 的團隊所發現。

劍橋大學助理教授 David Krueger 回復了 Zou 的帖子,他說:

在圖像模型中,10 年的研究和成千上萬的出版物都未能找出解決對抗樣本的方法,考慮到這一點,我們有充分的理由相信,LLM 同樣會如此。

在 Hacker News 上關于這項工作的討論中,有一位用戶指出:

別忘了,本研究的重點是,這些攻擊不需要使用目標系統來開發。作者談到,攻擊是“通用的”,他們的意思是說,他們可以在自己的計算機上完全使用本地模型來生成這些攻擊,然后將它們復制并粘貼到 GPT-3.5 中,并看到了有意義的成功率。速率限制并不能幫你避免這種情況,因為攻擊是在本地生成的,而不是用你的服務器生成的。你的服務器收到的第一個提示已經包含了生成好的攻擊字符串——研究人員發現,在某些情況下,即使是對 GPT-4,成功率也在 50% 左右。

GitHub 上提供了代碼,你可以在 AdvBench 數據上重現 LLM Attacks 實驗。項目網站上還提供了幾個對抗性攻擊的演示。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 網絡安全
    +關注

    關注

    11

    文章

    3489

    瀏覽量

    63411
  • GitHub
    +關注

    關注

    3

    文章

    488

    瀏覽量

    18661
  • LLM
    LLM
    +關注

    關注

    1

    文章

    346

    瀏覽量

    1329

原文標題:新型威脅:探索 LLM 攻擊對網絡安全的沖擊

文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    國產網絡安全整機在工控網絡安全上的保護策略

    網絡安全是指網絡系統的硬件、軟件及其系統中的數據受到保護,不因偶然的或者惡意的原因而遭受到破壞、更改、泄露,確保系統連續可靠正常地運行,網絡服務不中斷。
    的頭像 發表于 01-27 10:27 ?118次閱讀
    國產<b class='flag-5'>網絡安全</b>整機在工控<b class='flag-5'>網絡安全</b>上的保護策略

    科技云報到:2026網絡安全六大新趨勢:AI重構攻防,信任成為新防線

    技術的復合AI。 AI的爆發式增長在重塑生產力的同時,也催生了AI Agent身份冒充、API規模化攻擊、AI瀏覽器和AI手機“黑箱”風險等新型威脅,推動網絡安全從“邊界防護”全面轉向
    的頭像 發表于 12-24 14:55 ?429次閱讀

    網絡攻擊形態持續升級,哪些云安全解決方案更能應對 DDoS 等復雜威脅

    在云計算和數字化業務高度普及的今天,網絡攻擊早已不再是偶發事件,而成為企業運營中必須長期應對的現實風險。從最初的大規模 DDoS 攻擊,到如今更加隱蔽、持續、自動化的攻擊形態,
    的頭像 發表于 12-17 09:53 ?406次閱讀

    人工智能時代,如何打造網絡安全“新范式”

    在當今信息化迅速發展的時代,5G、大數據、云計算、深度學習等新興技術的廣泛應用,帶來了前所未有的網絡安全挑戰。人工智能技術的崛起,為網絡安全領域提供了新的解決方案,尤其在威脅識別、告警分析、態勢感知
    的頭像 發表于 12-02 16:05 ?479次閱讀

    2026年十二大網絡安全關鍵趨勢:AI 驅動、量子威脅與深度偽造

    聯網生態的擴張,使攻擊面急劇擴大。與此同時,更嚴格的新法規與網絡安全要求,正在重塑企業在合規、數據保護和風險治理方面的戰略布局。要在2026年保持防御優勢,傳統工具
    的頭像 發表于 11-19 16:57 ?1492次閱讀
    2026年十二大<b class='flag-5'>網絡安全</b>關鍵趨勢:AI 驅動、量子<b class='flag-5'>威脅</b>與深度偽造

    在物聯網設備面臨的多種安全威脅中,數據傳輸安全威脅和設備身份安全威脅有何本質區別?

    在物聯網設備面臨的多種安全威脅中,數據傳輸安全威脅和設備身份安全威脅有何本質區別,實際應用中哪一
    發表于 11-18 06:41

    攻擊逃逸測試:深度驗證網絡安全設備的真實防護能力

    。 基于測試結果的持續優化,使雙方共同構建起能夠應對新型威脅的主動防御體系,實現安全防護能力的螺旋式上升。 攻擊逃逸:深度隱匿的網絡安全
    發表于 11-17 16:17

    華為亮相2025國家網絡安全宣傳周

    2025國家網絡安全宣傳周(以下簡稱“網安周”)在昆明正式開幕。今年大會主題為“網絡安全為人民,網絡安全靠人民”,網安周以會議、論壇、競賽、展覽等多種形式著力展示創新成果。大會期間,華為眾多重磅
    的頭像 發表于 09-16 15:12 ?1111次閱讀
    華為亮相2025國家<b class='flag-5'>網絡安全</b>宣傳周

    恩智浦通過全球醫療健康網絡安全認證

    現代醫療保健行業已全面擁抱數字化變革。如今,醫院和臨床環境高度依賴互聯醫療設備,實現高效的診斷、監測和治療。然而,這種廣泛的連接也增加了攻擊面。醫院網絡中新增的每一臺設備,都是潛在的網絡攻擊
    的頭像 發表于 09-12 17:46 ?2162次閱讀

    蔚來汽車入選工信部護航新型工業化網絡安全典型案例

    近日,國家工業和信息化部公布「護航新型工業化」網絡安全典型案例和成效突出地區名單。蔚來汽車「車聯網網絡安全防護典型案例」通過嚴格遴選獲評全國車聯網安全領域的示范和標桿之一,也是全球智能
    的頭像 發表于 09-01 17:51 ?1223次閱讀

    為您揭秘工業網絡安全

    隨著數字連接技術的普及,帶寬不斷提升,從工廠車間到生產流程的每個角落都能實時訪問更深層次的信息。然而,這種技術紅利也帶來了日益嚴峻的網絡安全風險。新型工業以太網技術基礎設施通過為每個節點分配IP地址并移除網關設備,極大地簡化了系統架構,因此,保護設備和系統免受
    的頭像 發表于 05-17 11:17 ?1050次閱讀
    為您揭秘工業<b class='flag-5'>網絡安全</b>

    直面網絡安全挑戰,“明陽安全自組網” 打造全方位防御體系

    帶來的安全隱患,僅僅是網絡安全風險的冰山一角。網絡安全困局與“安全自組網”破局之道隨著網絡技術的發展和應用場景的拓展,
    的頭像 發表于 04-27 10:55 ?1166次閱讀
    直面<b class='flag-5'>網絡安全</b>挑戰,“明陽<b class='flag-5'>安全</b>自組網” 打造全方位防御體系

    華為聯合發布2024年全球DDoS攻擊態勢分析報告

    在智能化轉型的浪潮中,企業對網絡的依賴程度與日俱增。與此同時,DDoS攻擊以其迅猛的增長態勢、復雜的攻擊手法,成為2024年突出的網絡安全威脅
    的頭像 發表于 04-10 09:59 ?999次閱讀

    智慧路燈網絡安全入侵監測

    ,成為物聯網領域重要的信息采集來源,對智能照明、社會安防、智慧交通、信息發布等方面發揮著關鍵作用。然而,智慧路燈的網絡安全問題也日益凸顯,成為影響其穩定運行和城市安全的重要因素。 叁仟智慧路燈面臨的網絡安全
    的頭像 發表于 04-01 09:54 ?747次閱讀

    戴爾科技如何助力企業網絡安全

    數據安全如同懸在企業頭頂的“達摩克利斯之劍”,隨著新技術的飛速發展,企業運營愈發依賴網絡與數據,然而這也為網絡威脅攻擊敞開了大門,特別是勒
    的頭像 發表于 03-10 15:51 ?847次閱讀