国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

合成數據對于 AI 開發至關重要

靚仔峰 ? 來源:靚仔峰 ? 作者:靚仔峰 ? 2022-07-20 10:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今天的高級人工智能開發仍然深深植根于 1950 年代的計算機科學哲學,包括“垃圾進,垃圾出”這句話。這句格言提醒我們,人工智能模型的好壞取決于它所訓練的數據。

從晚期癌癥篩查到推薦一部新電影,數據科學家需要大量多樣的數據集來訓練 AI 模型。對于現實世界的數據來說,這可能是一個重大挑戰。通常出于隱私原因受到保護,真實數據可能很難獲得,而且獲取成本也很高,而且可能不像預期的那樣多樣化。

pYYBAGLO7-aARthzAANkRyCROAU889.jpg


Rev Lebaredian(來源:英偉達

幸運的是,人工智能可以通過合成數據集自行救援——計算機生成的模擬可確保提供充足的多樣化和匿名訓練數據。數據是完全匿名的,可以使用各種方法創建,例如通用對抗網絡或使用更多非 AI 程序的模擬器,以確保與真實數據非常相似。通過使用合成數據集,人工智能開發人員可以從更高性能和更健壯的模型中受益。

數據的騙局

隨著開發人員達到現成數據的極限,他們很快將需要尋找其他地方來改進他們的模型。合成數據是計算機模擬或算法生成的信息,可替代現實世界的數據,以填補模型需求和數據可用性之間的差距。

數據科學家有很多方法可以生成合成數據。模擬和 3D 渲染是很好的起點。例如,一輛自動駕駛汽車通常是通過讓它在真正的道路上行駛之前駕駛數千英里的虛擬道路來訓練的。通用對抗網絡,即創建新數據的生成模型,也可用于數據生產。多虧了這些,合成數據收集變得比以往任何時候都更容易獲得和更有效。

分析公司 Gartner 最近報告*,合成數據正處于從一個雜耍變成未來人工智能背后的主要力量的軌道上。Gartner 在一項研究中指出,“合成數據通過允許較小的組織在沒有大量數據的情況下創建 AI 模型,有效地解決了他們的冷啟動問題,從而使競爭環境民主化?!?/p>

人工數據滿足 AI 的關鍵需求
AI 已經無處不在,因為它已經通過智能設備和技術融入我們的生活,涵蓋醫療保健、零售、娛樂、自動駕駛汽車、智能空間等領域,這些智能設備和技術正在加速我們走向未來。

將人工智能用作數字鏡子是其發展的下一步。然而,特定環境中的變化可能是無數的。襯衫的顏色可能有多種色調和色調。房間的燈光隨著太陽的移動或燈具的開啟而變化。


這個隧道中車輛的場景使用了間接照明。這是一個難以實時準確渲染的場景示例,但在 Nvidia Drive Sim 中由 Nvidia Omniverse RTX 渲染器啟用(來源:Nvidia)

捕捉條件的復雜性使得各種合成數據集對于 AI 模型制作至關重要。與從主要來源收集數據所需的時間和費用相比,可以收集合成數據為數字雙胞胎提供動力。這可以最大限度地訪問大量不同的數據,并增加免于隱私問題的好處。

Gartner 注意到這一人工智能資產的重要性,還指出,“合成數據通常被視為質量較低的替代品,只有在真實數據難以獲取、價格昂貴或受到監管限制時才有用。這錯過了合成數據的真正潛力。事實是,如果沒有合成數據,您將無法構建高質量、高價值的 AI 模型?!?/p>

現實真的很隨機

多樣化的訓練數據集是構建 AI 模型的關鍵,但現實世界的數據可能不足。域隨機化的內置功能使機器人模擬應用程序和合成數據生成工具 Nvidia Isaac Sim 能夠隨機改變模擬中的紋理、顏色、照明和位置。

Nvidia Drive Sim 也是如此,這是一個用于測試自動駕駛汽車的模擬平臺。它能夠改變路牌的大小或語言或太陽的位置。

O'Reilly Media 的報告“使用合成數據加速 AI ”中強調了這些功能,該報告強調安全和效率是模擬中的優先事項。根據該報告,“使用合成數據可以解決的一些問題成本太高或太危險(例如,在訓練模型控制自動駕駛汽車的情況下),無法使用更傳統的方法解決,或者根本無法解決。”


Nvidia Isaac 模擬引擎創建了更好的逼真環境,并簡化了合成數據生成和域隨機化,為工程師和開發人員在廣泛的應用程序中訓練和部署機器人構建數據集(來源:Nvidia)

隨機化條件(例如照明、顏色和對象放置)對于創建各種合成訓練數據以實現更準確的 AI 模型至關重要。這些數字世界的變化反映了現實生活中經常出現的意外和不可預測的變化。

例如,在工廠中,當不同的工人處理同一個物體時,一個工人處理的物體可能最終處于不同的位置。在訓練機器人如何使用合成數據和模擬在真實工廠中工作時,環境條件(如定位)的變化非常重要。這些能力使強大的智能工廠和城市的生產成為可能。

圖形與人工智能之間的關鍵環節

除了虛擬城市和工廠,合成數據為計算機圖形學的復興鋪平了道路,因為模擬 3D 世界現在是訓練 AI 模型的關鍵組成部分。在 3D 世界中,物體應該下落,身體部位應該彎曲,皮膚應該被貼上紋理以與人類的所有運動部位非常相似。

個人在虛擬世界中出現的不同方式,具有自然的身體變化、面部特征和行為,說明了合成數據的真正力量。多樣化的合成數據可以準確地彌合虛擬世界和現實世界之間的差距,其特征從萬有引力定律到身體動作再到皮膚紋理。

人類因不同的膚色、反應和表情而彼此不同,這些都可以在媒體制作和數字復制品中展示。數字人類只是難題的一部分,因為照明和物體定位等環境條件在計算機圖形和模擬中同樣重要。

例如,自動駕駛汽車需要能夠在太陽低落時做出反應,這可能會妨礙能見度。合成數據可以通過創建更真實的虛擬環境來幫助改善模擬世界,這些虛擬環境是真正的數字雙胞胎。生成物理上準確的、基于物理的環境和人類極具挑戰性,需要高級模擬、高性能計算資源和大量數據。


Nvidia Drive Sim 使用高保真和物理精確的模擬來創建一種安全、可擴展且具有成本效益的方式,將自動駕駛汽車帶到我們的道路上(來源:Nvidia)

人工智能推進自己的未來

人工智能使用合成數據進行自我改進的能力使其成為一項獨特而強大的技術。綜合數據是提高用于高級模型和模擬的穩健訓練數據的質量和數量的關鍵。

每一波人工智能創新都建立在上一波的基礎上。合成數據的機會將超越其在當前人工智能應用中的應用,擴展到農業、自動駕駛汽車、醫療保健、機器人等行業。

在為 AI 開發數據源時,不要讓“人工”和“合成”這兩個詞阻止您。數據可能是人為創建的,但結果對于真正的成功至關重要。很快,將出現一個極其精確的數字現實鏡像,使用合成數據高效準確地構建。

——Rev Lebaredian 是 Nvidia 的仿真技術副總裁

*Gartner,“Maverick Research:忘記你的真實數據——合成數據是 AI 的未來”,Leinar Ramos,Jitendra Subramanyam,2021 年 6 月 24 日。


審核編輯 黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301424
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265393
  • 先進技術
    +關注

    關注

    0

    文章

    24

    瀏覽量

    6418
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    高通安蒙:個人AI設備邊緣數據價值至關重要

    行業芯事行業資訊
    電子發燒友網官方
    發布于 :2026年01月08日 13:50:14

    利用NVIDIA Cosmos開放世界基礎模型加速物理AI開發

    NVIDIA 最近發布了 NVIDIA Cosmos 開放世界基礎模型(WFM)的更新,旨在加速物理 AI 模型的測試與驗證數據生成。借助 NVIDIA Omniverse 庫和 Cosmos,開發者可以大規模生成基于物理學的
    的頭像 發表于 12-01 09:25 ?1137次閱讀

    NVIDIA GR00T-Dreams助力光輪智能革新合成數據

    人工演示或遙操作的數據收集方式,效率低下且受限于物理世界的諸多約束。而如今,光輪智能借助 NVIDIA GR00T-Dreams,成功開創了一個全新的合成數據生成體系,賦能具身 AI 的快速發展。
    的頭像 發表于 08-20 14:29 ?1545次閱讀

    破解數據瓶頸:智能汽車合成數據架構與應用實踐

    合成數據因可控等特性,已成為智能汽車感知系統數據成本高、場景覆蓋不足等困境的突破方向!。本文探討其體系原則、分層結構,聚焦艙外道路感知與艙內乘員識別場景,闡述生成流程與實踐,助力感知系統開發!
    的頭像 發表于 07-16 10:31 ?1069次閱讀
    破解<b class='flag-5'>數據</b>瓶頸:智能汽車<b class='flag-5'>合成數據</b>架構與應用實踐

    合成纖維升級秘籍:Canopen轉Profinet網關

    在現代合成纖維制造過程中,不同工業網絡協議之間的互聯互通至關重要。特別是CANopen和PROFINET,這兩種廣泛應用于自動化領域的通訊標準,它們之間的高效轉換對于生產線的穩定和優化運行具有重大意義。小疆智控CANopen轉P
    的頭像 發表于 07-15 17:22 ?502次閱讀
    <b class='flag-5'>合成</b>纖維升級秘籍:Canopen轉Profinet網關

    破解數據瓶頸:智能汽車合成數據架構與應用實踐

    智能汽車感知系統面臨數據困境,如結構復雜、成本高昂、覆蓋受限、合規性與隱私風險突出。合成數據作為新型數據生成方式,以高度可配置性、自動化、可復現為特點,有望解決這些問題。
    的頭像 發表于 07-15 11:48 ?653次閱讀
    破解<b class='flag-5'>數據</b>瓶頸:智能汽車<b class='flag-5'>合成數據</b>架構與應用實踐

    51Sim利用NVIDIA Cosmos提升輔助駕駛合成數據場景的泛化性

    51Sim 利用 NVIDIA Cosmos 的生成式世界基礎模型,對現有的合成數據進行大規模泛化,在確保物理真實性的前提下,大幅提升了數據的豐富度。同時依托 NVIDIA Issac Sim,將
    的頭像 發表于 06-26 09:09 ?1397次閱讀

    7個挑選工控核心板要點,最后一點至關重要

    在工業控制領域,核心板是系統運行的“心臟”,其選擇至關重要。今天,就來聊聊如何挑選一款合適又靠譜的工控核心板,讓你的產品在性能、穩定性等方面都能脫穎而出。1.處理器處理器,是核心板的關鍵,包括處理器
    的頭像 發表于 06-25 11:36 ?726次閱讀
    7個挑選工控核心板要點,最后一點<b class='flag-5'>至關重要</b>

    康謀分享| 揭秘C-NCAP :合成數據如何助力攻克全球安全合規難關?

    C-NCAP 2024新規將DMS、RFR納入評分體系,推動中國汽車安全從被動向主動轉型。車企面臨成本、惡劣環境可靠性等挑戰。如何通過虛擬仿真和合成數據技術,助力車企大幅提升驗證效率,滿足合規標準?
    的頭像 發表于 06-18 10:07 ?2038次閱讀
    康謀分享| 揭秘C-NCAP :<b class='flag-5'>合成數據</b>如何助力攻克全球安全合規難關?

    明遠智睿SSD2351開發板:語音機器人領域的變革力量

    開發板支持浮點運算,這對于語音信號處理中的精確計算至關重要。在語音識別過程中,需要對語音信號的頻率、幅度等參數進行精確計算和分析,浮點運算能夠確保計算結果的準確性,從而提高語音識別的精度。全開
    發表于 05-28 11:36

    技術分享 | 高逼真合成數據助力智駕“看得更準、學得更快”

    自動駕駛研發如何高效獲取海量訓練數據?高逼真合成數據技術正在提供新解法。通過仿真平臺可生成多場景、多傳感器的精準標注數據。文章詳解如何構建符合nuScenes標準的數據集,覆蓋復雜交通
    的頭像 發表于 04-29 10:47 ?3527次閱讀
    技術分享 | 高逼真<b class='flag-5'>合成數據</b>助力智駕“看得更準、學得更快”

    NVIDIA推出開源物理AI數據

    標準化合成數據的初始版本預計將成為世界上最大的此類數據集,目前已作為開源版本提供給機器人開發人員。
    的頭像 發表于 03-24 17:52 ?1036次閱讀

    Cadence顛覆AI數據中心設計

    ,當今新型數據中心(AI 工廠)的建設正面臨著如何處理其巨大的功耗和散熱問題的嚴峻挑戰,數字孿生技術在這場變革中扮演著至關重要的角色。
    的頭像 發表于 03-21 15:43 ?1164次閱讀

    【Android開發者必看】使用JetBrains TeamCity為Android項目構建CI/CD管道詳細指南

    【CI/CD】定義明確的構建、測試和部署工作流對Android應用的開發至關重要。JetBrains TeamCity是一個用于構建可靠管道的CI/CD平臺,可與流行的Android開發工具無縫集成,具有人性化的界面來配置構建和測試的各個階段。
    的頭像 發表于 03-21 15:42 ?1205次閱讀
    【Android<b class='flag-5'>開發</b>者必看】使用JetBrains TeamCity為Android項目構建CI/CD管道詳細指南

    技術分享 | AVM合成數據仿真驗證方案

    AVM 合成數據仿真驗證技術為自動駕駛環境感知發展帶來助力,可借助仿真軟件配置傳感器、搭建環境、處理圖像,生成 AVM 合成數據,有效加速算法驗證。然而,如何利用仿真軟件優化傳感器外參與多場景驗證,顯著提升AVM算法表現?
    的頭像 發表于 03-19 09:40 ?3740次閱讀
    技術分享 | AVM<b class='flag-5'>合成數據</b>仿真驗證方案