NVIDIA 的數據工廠團隊為NVIDIACosmos Reason 等 AI 模型奠定了基礎,該模型近日在 Hugging Face 的物理推理模型排行榜中位列榜首。
AI 模型正以驚人的速度與規模不斷發展。
但它們缺少了人類與生俱來的哪種能力呢?答案是“常識”。常識是一種通過現實生活經驗形成的認知:比如鳥類無法倒著飛、鏡子能夠反射、冰會融化成水。
對人類而言,這些常識顯而易見。但對于需要精準回答復雜問題、在工業倉庫或道路等不可預測的物理環境中運行的 AI 模型來說,這些知識必須通過“教學”才能掌握。
為解決這一難題,NVIDIA 正在開發一套測試方案,旨在教會 AI 模型認知物理世界的運行邊界。簡言之,就是教會 AI 常識。
這些測試被用于開發推理模型,比如NVIDIA Cosmos Reason。這是一款用于物理 AI 應用的開源視覺語言推理模型(VLM),能夠生成具有時間關聯性的響應。目前,Cosmos Reason 已在 Hugging Face 的物理推理模型排行榜中位居第一。
相較于傳統視覺語言模型,NVIDIACosmos Reason 的獨特價值在于:它專為加速機器人、自動駕駛汽車及智能空間等物理 AI 的開發而設計,能夠基于物理常識知識,對之前沒有經歷過的場景進行推理。
要讓 AI 模型真正理解工業空間、實驗室等復雜環境,需從基礎認知開始構建。例如,在下方展示的測試中,NVIDIACosmos Reason 需要回答關于視頻中和相對運動有關的選擇題。
NVIDIACosmos Reason 評估數據集的示例
什么是 AI 模型的推理能力?
為提升模型的推理能力,NVIDIA 采用?強化學習?的方式,讓模型學習關于現實世界的物理常識。
舉例說明,機器人無法憑直覺分辨左、右、上、下,它們需要通過訓練才能理解這些時空概念;用于安全測試,比如汽車碰撞測試的 AI 驅動機器人,也必須經過訓練才能理解自身物理形態如何與周圍環境互動。
如果在訓練過程中沒有教會機器人常識,在實際部署時就可能出現問題。
NVIDIA Cosmos Reason 研究科學家 Yin Cui 表示:“如果缺乏對物理世界的基礎認知,機器人可能跌倒,或者導致意外損毀物品,進而對人員及環境的安全構成威脅。”
NVIDIA 正通過將人類對物理世界的常識“注入”AI 模型,推動下一代 AI 的發展。
NVIDIA 數據工廠團隊由來自生物工程、商業和語言學等多元背景的全球分析師構成,他們致力于開發、分析并整合數十萬條數據單元,為生成式 AI 的推理訓練提供核心數據支撐。
數據整理流程
NVIDIA 數據工廠團隊的核心項目之一,是開發面向物理 AI 應用的世界基礎模型。這些虛擬環境能構建深度學習神經網絡,基于仿真場景為推理模型訓練提供更安全、更高效的支持。
NVIDIA 數據標注團隊率先啟動流程,他們基于真實世界視頻數據設計問答對。視頻內容涵蓋各類場景,從雞在雞舍中活動,到汽車在鄉間道路行駛。
例如,某個標注員可能會針對下面的視頻提出問題:“畫面中的人是用哪只手切意大利面?”
NVIDIACosmos Reason 評估數據集的示例
隨后,標注員會給出 A、B、C、D 四個選項。模型獲取這些數據后,進行推理并選擇正確答案。
Yin Cui 表示:“我們本質上是在給模型設計測試題。所有問題都采用選擇題形式,就像學生在學校考試中遇到的題目一樣。”
這些問答對隨后由 Michelle Li 等 NVIDIA 的分析師進行質量檢查。
Li 擁有公共衛生和數據分析學背景,這讓她能夠從更宏觀的角度看待所分析的數據。
她說:“對于物理 AI ,我們的特定目標是訓練模型理解物理世界,這一目標讓我在審核問答對和問題類型時,始終保持全局視角。我會問自己,這些問答對是否符合項目的目標和準則要求?”
之后,數據會由項目的數據工廠負責人審核,確保其符合質量標準并可交付至NVIDIACosmos Reason 研究團隊。科學家們隨后將數十萬條數據單元(即問答對)輸入模型,通過強化學習訓練其理解物理世界的邊界和限制。
推理型 AI 有哪些應用場景?
推理模型的優勢在于,它們既能理解自身所處的時空環境,也能預測結果。這類模型可分析情境,生成可能結果的邏輯思維網絡,并推斷出最可能的場景。
簡而言之,推理式 AI 展現了類似人類的思維。它會展示思考過程,讓用戶能夠理解其響應背后的邏輯。
用戶可要求模型分析視頻內容,如兩輛車在路上行駛的場景。當被問到“如果這兩輛車在同一車道上相向而行會發生什么?”時,模型能夠推理并判定該假設情景的最可能結果,比如兩車相撞。
NVIDIA Cosmos Reason 團隊首席研究科學家 Tsung-Yi Lin 表示:“我們正在開發一種以物理 AI 為核心的突破性推理模型。“
隨著 NVIDIA 持續推進推理模型創新,數據工廠團隊的高質量數據生產能力,將對開發能安全與現實世界交互的自主的智能體以及物理 AI 系統起到關鍵作用。
您可以在 Hugging Face 和 GitHub 預覽或下載 NVIDIA Cosmos-Reason1 模型。
-
NVIDIA
+關注
關注
14文章
5592瀏覽量
109721 -
AI
+關注
關注
91文章
39768瀏覽量
301370 -
模型
+關注
關注
1文章
3752瀏覽量
52099
原文標題:人類如何教會 AI 模型學會推理?
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
華為破解HBM依賴!AI推理黑科技UCM上線,9月正式開源
大模型 ai coding 比較
AI推理芯片需求爆發,OpenAI欲尋求新合作伙伴
使用NORDIC AI的好處
AI端側部署開發(SC171開發套件V3)2026版
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片
信而泰×DeepSeek:AI推理引擎驅動網絡智能診斷邁向 “自愈”時代
大模型推理顯存和計算量估計方法研究
基于RAKsmart云服務器的AI大模型實時推理方案設計
首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手
谷歌第七代TPU Ironwood深度解讀:AI推理時代的硬件革命
什么是AI模型的推理能力
評論