Google LLC今天推出了新版本的Open Images(其用于人工智能研究的照片數據集),其中添加了數百萬個其他數據點,并提供了一個被稱為“本地化敘事”的功能,旨在幫助學術項目。
Open Images于2016年首次發布,其中包含900萬張帶有描述性標簽的照片。此類數據集在AI生態系統中起著重要作用。研究人員使用它們來開發用于目標識別和自動駕駛等任務的新型機器學習模型。
除了提供可免費使用的照片外,Open Images還包含數百萬條對AI培訓有價值的注釋。未經訓練的神經網絡無法自行識別照片中的對象,因此需要諸如注釋之類的元數據來了解屏幕上的內容。元數據越詳細,AI可以學習的越好。
今天發布的新版本的“開放圖像”增加了2350萬張“照片級”標簽,這些標簽已經過人類驗證,可以對圖像中發生的事情提供一般描述。該數據庫現在總共有5990萬個這樣的標簽。Google還添加了更多情境注釋,包括250萬個用于描述照片中人物所執行動作的標簽,以及另外391,000個用于描述對象之間關系的標簽。
但是,主要亮點是Google的本地化敘述。這些是搜索巨頭開發的一種新型注釋,它希望AI模型能夠比舊的注釋方法收集更多有關圖像的信息。
Google通過讓人類注釋者將鼠標懸停在照片中的每個對象上并使用自己的文字進行描述來生成本地化的敘事。然后將光標移動的記錄與自然語言描述配對,以便每個單詞都可以與其所應用的對象相關聯。谷歌說,這種方法將使AI模型在Open Images數據集上進行訓練時可以更有效地學習。
“為了了解這些本地化敘述所代表的更多數據量,鼠標軌跡的總長度約為6400公里,如果不停地大聲朗讀,所有敘述都將花費約1.5年的時間來聆聽,” Google研究科學家Jordi Pont-Tuset在博客文章中進行了詳細介紹。
到目前為止,Google已經為約500,000個Open Images文件創建了本地化的敘述。Pont-Tuset寫道,此次更新代表著“在改善圖像分類,物體檢測,視覺關系檢測和實例分割的統一注釋方面,邁出了重要的定性和定量步驟。” “我們希望Open Images V6能夠進一步刺激人們對真實場景的理解。”
-
Google
+關注
關注
5文章
1807瀏覽量
60535 -
神經網絡
+關注
關注
42文章
4838瀏覽量
107844 -
生態系統
+關注
關注
0文章
711瀏覽量
21586
發布評論請先 登錄
蔚來世界模型NWM全新版本使用指南
蔚來世界模型NWM全新版本正式推送
如何使用新版本J-Flash編程CW32 MCU
【直播預告】RT-Trace 全新版本發布|ITM輸出 MemoryWatch 功能首發實測! | 問學直播
如何使用新版本J-Flash編程CW32 MCU?
戴爾數據保護軟件迎來全新版本
谷歌推出Gemini 2.5 Pro預覽版(I/O版本)
樹莓派新版 OS 發布! bookworm 版本將成為歷史?
普華基礎軟件開源汽車操作系統新版本代碼上線
普華基礎軟件開源車用操作系統迎來全新版本
網絡傳輸利器索尼NXL-ME80 V1.2新版本發布
SOA架構開發小助手PAVELINK.SOA-Converter 2.1.2新版本發布
Google LLC推出了新版本的Open Images
評論