国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

由合成數據支持的可解釋人工智能

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-05-30 09:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數據是模型可解釋性的核心。可解釋人工智能( XAI )是一個快速發展的領域,旨在深入了解人工智能算法的復雜決策過程。

在人工智能對個人生活有重大影響的領域,如信用風險評分,管理者和消費者都有權要求深入了解這些決策。領先的金融機構已經在利用 XAI 驗證其模型。同樣,監管機構也要求深入了解金融機構的算法環境。但在實踐中如何做到這一點呢?

潘多拉的封閉盒子

人工智能越先進,對可解釋性來說,數據就越重要。

現代的 ML 算法有集成方法和深度學習,即使沒有數百萬個模型參數,也會產生數千個。當應用于實際數據時,如果不看到它們的實際作用,就不可能掌握它們。

甚至在培訓數據敏感的情況下,廣泛訪問數據的必要性也是顯而易見的。用于信用評分和保險定價的金融和醫療數據是人工智能中使用最頻繁、但也是最敏感的數據類型。

這是一個相互矛盾的難題:你想要數據得到保護,你想要一個透明的決策。

可解釋的 AI 需要數據

那么,這些算法如何變得透明呢?你如何判斷機器做出的模型決策?考慮到它們的復雜性,披露數學模型、實現或完整的訓練數據并不能達到目的。

相反,您必須通過觀察各種實際案例中的決策來探索系統的行為,并探索其對修改的敏感性。這些基于示例的假設探索有助于我們理解是什么驅動了模型的決策。

這種簡單而強大的概念,即在給定輸入數據變化的情況下,系統地探索模型輸出的變化,也稱為 local interpretability ,可以在域和 model-agnostic 按比例 中執行。因此,同樣的原則可以應用于幫助解釋信用評分系統、銷售需求預測、欺詐檢測系統、文本分類器、推薦系統等。

然而,像 SHAP 這樣的局部可解釋性方法不僅需要訪問模型,還需要訪問大量具有代表性和相關的數據樣本。

圖 1 顯示了一個在模型上進行的基本演示,該演示預測了客戶對金融行業內營銷活動的反應。查看相應的 Python 調用可以發現需要經過訓練的模型,以及執行這些類型分析的代表性數據集。然而,如果該數據實際上是敏感的,并且無法被 AI 模型驗證器 訪問,該怎么辦?

poYBAGKUHy2ACkMBAACHb8tSQIQ037.png

圖 1 :。使用實際數據通過 SHAP 解釋模型的示例

用于跨團隊擴展 XAI 的合成數據

在人工智能采用的早期,通常是同一組工程師開發模型并對其進行驗證。在這兩種情況下,他們都使用了真實的生產數據。

考慮到算法對個人的現實影響,現在越來越多的人認識到,獨立小組應該檢查和評估模型及其影響。理想情況下,這些人會從工程和非工程背景中提出不同的觀點。

與外部審計師和認證機構簽訂合同,以建立額外的信心,確保算法是公平、公正和無歧視的。然而,隱私問題和現代數據保護法規(如 GDPR )限制了對代表性驗證數據的訪問。這嚴重阻礙了模型驗證的廣泛開展。

幸運的是,模型驗證可以使用高質量的人工智能生成的 synthetic data 來執行,它可以作為敏感數據的高度準確、匿名的替代品。例如, AI 的 綜合數據平臺 主要使組織能夠以完全自助、自動化的方式生成合成數據集。

圖 2 顯示了使用合成數據對模型執行的 XAI 分析。比較圖 1 和圖 2 時,結果幾乎沒有任何明顯的差異。同樣的見解和檢查也可以通過利用 AI 的隱私安全合成數據來實現,這最終使真正的協作能夠在規模和連續的基礎上執行 XAI 。

poYBAGKUHzWAToJHAACNHCZ-myc173.png

圖 2 :。使用合成數據通過 SHAP 解釋模型的示例

圖 3 顯示了跨團隊擴展模型驗證的過程。組織在其受控的計算環境中運行最先進的合成數據解決方案。它不斷生成其數據資產的合成副本,可以與內部和外部 AI 驗證器的不同團隊共享。

poYBAGKUHz2AVsKOAACZMhZvtYg286.png

圖 3 :。通過合成數據進行模型驗證的流程

使用 GPU 擴展到真實數據量

GPU 加速的庫,如 RAPIDS 和 Plotly ,能夠以實際遇到的實際用例所需的規模進行模型驗證。這同樣適用于生成合成數據,其中以 AI 為動力的合成解決方案(主要是 AI )可以通過在全棧加速計算平臺上運行而受益匪淺。有關更多信息,請參閱 加速信用風險管理的可信 AI 。

為了證明這一點,我們參考了房利美(Fannie Mae,FNMA)發布的抵押貸款數據集,目的是【VZX19】。我們首先生成一個具有統計代表性的訓練數據合成副本,由數千萬個合成貸款組成,由幾十個合成屬性組成(圖4)。

所有數據都是人工創建的,沒有一條記錄可以鏈接回原始數據集中的任何實際記錄。然而,數據的結構、模式和相關性被忠實地保留在合成數據集中。

這種捕獲數據多樣性和豐富性的能力對于模型驗證至關重要。該過程旨在驗證模型行為,不僅針對占主導地位的多數階級,還針對人口中代表性不足和最脆弱的少數群體。

poYBAGKUH0SAHnozAAFqlyWTHoA180.png

圖 4 :。真實和合成數據樣本的快照

給定生成的合成數據,然后可以使用 GPU 加速的 XAI 庫來計算感興趣的統計信息,以評估模型行為。

例如,圖 5 顯示了 SHAP 值的并列比較:貸款拖欠模型在真實數據上解釋,在合成數據上解釋之后。通過使用高質量的合成數據作為敏感原始數據的替代品,可以可靠地得出關于該模型的相同結論。

pYYBAGKUH02AVgcmAAEmMNRjMSA538.png

圖 5 :。貸款拖欠 ML 模型的 SHAP 值

圖 5 顯示,合成數據可以作為解釋模型行為的實際數據的安全替代品。

此外,合成數據生成器生成任意數量新數據的能力使您能夠顯著改進較小組的模型驗證。

圖 6 顯示了數據集中特定郵政編碼的 SHAP 值的并排比較。雖然原始數據在給定地理位置的貸款不到 100 筆,但我們利用 10 倍的數據量來檢查該區域的模型行為,從而實現更詳細和更豐富的見解。

pYYBAGKUH1WAVfIyAADvszyZZ9s677.png

圖 6 :。通過使用合成過采樣進行模型驗證,獲得更豐富的見解

使用合成樣品進行單獨水平檢驗

雖然匯總統計和可視化是分析一般模型行為的關鍵,但我們對模型的理解還可以通過逐個檢查單個樣本獲得更多好處。

XAI 工具揭示了多個信號對最終模型決策的影響。只要合成數據真實且具有代表性,這些案例不一定是實際案例。

圖 7 顯示了四個隨機生成的合成案例,以及它們的最終模型預測和每個輸入變量的相應分解。這使您能夠在不暴露任何個人隱私的情況下,深入了解對無限潛在案例的模型決策有多大影響的因素和方向。

pYYBAGKUH1-AIueyAAEAh5pXEuk774.png

圖 7 :。檢驗四個隨機抽樣合成記錄的模型預測

利用合成數據進行有效的 AI 治理

人工智能驅動的服務越來越多地出現在私營和公共部門,在我們的日常生活中發揮著越來越大的作用。然而,我們只是在人工智能治理的黎明。

雖然像歐洲提議的人工智能法案這樣的法規需要時間才能體現出來,但開發人員和決策者今天必須負責任地采取行動,并采用 XAI 最佳實踐。合成數據支持廣泛的協作環境,而不會危及客戶的隱私。它是一個強大、新穎的工具,可以支持開發和治理公平、健壯的人工智能。

關于作者

Jochen Papenbrock 位于德國法蘭克福,在過去的15年中,Jochen一直在金融服務業人工智能領域擔任各種角色,擔任思想領袖、實施者、研究者和生態系統塑造者。

Alexandra 是金融服務業的綜合數據專家,在隱私、公平和負責任的人工智能方面擁有深厚的專業知識。作為主要人工智能的首席信托官,她參與了有關隱私、道德人工智能和新興合成數據領域的公共政策討論,并定期在國際人工智能和銀行會議上發言,討論如何協調個性化與隱私,確保算法的公平性,以及如何克服數字轉型帶來的數據挑戰。除此之外, Alexandra 還是數據民主化播客的主持人,她邀請一些最大銀行的高管討論隱私和道德 AI 最佳實踐。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135432
  • AI
    AI
    +關注

    關注

    91

    文章

    39763

    瀏覽量

    301366
  • 人工智能
    +關注

    關注

    1817

    文章

    50094

    瀏覽量

    265302
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    淺談人工智能(2)

    。 強人工智能(Strong AI),又稱通用人工智能(Artificial General Intelligence)或完全人工智能,指的是可以勝任人類所有工作的人工智能。 超
    的頭像 發表于 02-22 08:24 ?115次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    開發智能體配置-內容合規

    智能體上架前,需完成“人工智能生成合成內容標識”和“大模型備案信息”填寫 ,以供平臺審核;可在智能體【配置】-【內容合規】中填寫。 人工智能
    發表于 02-07 11:44

    傲琪人工合成石墨片: 破解智能手機散熱困境的創新解決方案

    帶來更加流暢和舒適的使用體驗。 未來,人工智能計算、增強現實和虛擬現實等應用的普及,將對設備散熱提出更高要求,而傲琪的技術積累和創新能力,正為迎接這些挑戰做好充分準備。 傲琪人工合成石墨片特性:1
    發表于 09-13 14:06

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    應用。 為什么選擇 Neuton 作為開發人員,在產品中使用邊緣人工智能的兩個最大障礙是: ML 模型對于您所選微控制器的內存來說太大。 創建自定義 ML 模型本質上是一個手動過程,需要高度的數據科學知識
    發表于 08-31 20:54

    NVIDIA GR00T-Dreams助力光輪智能革新合成數據

    人工演示或遙操作的數據收集方式,效率低下且受限于物理世界的諸多約束。而如今,光輪智能借助 NVIDIA GR00T-Dreams,成功開創了一個全新的合成數據生成體系,賦能具身 AI
    的頭像 發表于 08-20 14:29 ?1540次閱讀

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    應用場景。從數據采集,到模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實訓,讓你深度體驗AI技術的魅力 。 四、九門課程全覆蓋,滿足多元學習需求 對于高校教學或者技術學習來說,課程覆蓋的廣度
    發表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    應用場景。從數據采集,到模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實訓,讓你深度體驗AI技術的魅力 。 四、九門課程全覆蓋,滿足多元學習需求 對于高校教學或者技術學習來說,課程覆蓋的廣度
    發表于 08-07 14:23

    破解數據瓶頸:智能汽車合成數據架構與應用實踐

    合成數據因可控等特性,已成為智能汽車感知系統數據成本高、場景覆蓋不足等困境的突破方向!。本文探討其體系原則、分層結構,聚焦艙外道路感知與艙內乘員識別場景,闡述生成流程與實踐,助力感知系統開發!
    的頭像 發表于 07-16 10:31 ?1066次閱讀
    破解<b class='flag-5'>數據</b>瓶頸:<b class='flag-5'>智能</b>汽車<b class='flag-5'>合成數據</b>架構與應用實踐

    破解數據瓶頸:智能汽車合成數據架構與應用實踐

    智能汽車感知系統面臨數據困境,如結構復雜、成本高昂、覆蓋受限、合規性與隱私風險突出。合成數據作為新型數據生成方式,以高度可配置性、自動化、可復現為特點,有望解決這些問題。
    的頭像 發表于 07-15 11:48 ?651次閱讀
    破解<b class='flag-5'>數據</b>瓶頸:<b class='flag-5'>智能</b>汽車<b class='flag-5'>合成數據</b>架構與應用實踐

    51Sim利用NVIDIA Cosmos提升輔助駕駛合成數據場景的泛化性

    輔助駕駛領域的經驗成功拓展到了具身智能領域,為端到端輔助駕駛仿真測試與具身智能機器人訓練提供了海量高置信度的合成數據,目前相關成果已在多個主機廠和智能裝備企業中實現落地應用。
    的頭像 發表于 06-26 09:09 ?1391次閱讀

    人工合成石墨片與天然石墨片的差別

    程度天然高達98%以上,無需額外高溫處理,保留了自然形成的層狀晶體結構,適合對成本敏感的傳統工業場景。 人工合成石墨則是科技創新的產物。傲琪采用聚酰亞胺膜等含碳化合物,通過炭化、高溫石墨化及精密壓延工藝
    發表于 05-23 11:22

    技術分享 | 高逼真合成數據助力智駕“看得更準、學得更快”

    自動駕駛研發如何高效獲取海量訓練數據?高逼真合成數據技術正在提供新解法。通過仿真平臺可生成多場景、多傳感器的精準標注數據。文章詳解如何構建符合nuScenes標準的數據集,覆蓋復雜交通
    的頭像 發表于 04-29 10:47 ?3521次閱讀
    技術分享 | 高逼真<b class='flag-5'>合成數據</b>助力智駕“看得更準、學得更快”

    開售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網,WiFi,USB 擴展/重力感應/RS232/RS485/IO 擴展/I2C 擴展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個全新八核擁有超強性能的人工智能
    發表于 04-23 10:55

    技術分享 | AVM合成數據仿真驗證方案

    AVM 合成數據仿真驗證技術為自動駕駛環境感知發展帶來助力,可借助仿真軟件配置傳感器、搭建環境、處理圖像,生成 AVM 合成數據,有效加速算法驗證。然而,如何利用仿真軟件優化傳感器外參與多場景驗證,顯著提升AVM算法表現?
    的頭像 發表于 03-19 09:40 ?3734次閱讀
    技術分享 | AVM<b class='flag-5'>合成數據</b>仿真驗證方案

    支持實時物體識別的視覺人工智能微處理器RZ/V2MA數據手冊

    。此外,利用了 DRP技術高靈活性特點的 OpenCV 加速器,除了可進行人工智能推理的圖像預處理之外,還能在單芯片上實現人工智能范疇之外的高速圖像處理。 *附件:支持實時物體識別的視覺人工智
    的頭像 發表于 03-18 18:12 ?916次閱讀
    <b class='flag-5'>支持</b>實時物體識別的視覺<b class='flag-5'>人工智能</b>微處理器RZ/V2MA<b class='flag-5'>數據</b>手冊