2023久久香蕉国产线看,午夜理论片日韩蜜桃优播久久,久久rr

Google LLC今天推出了新版本的Open Images（其用于人工智能研究的照片數據集），其中添加了數百萬個其他數據點，并提供了一個被稱為“本地化敘事”的功能，旨在幫助學術項目。

Open Images于2016年首次發布，其中包含900萬張帶有描述性標簽的照片。此類數據集在AI生態系統中起著重要作用。研究人員使用它們來開發用于目標識別和自動駕駛等任務的新型機器學習模型。

除了提供可免費使用的照片外，Open Images還包含數百萬條對AI培訓有價值的注釋。未經訓練的神經網絡無法自行識別照片中的對象，因此需要諸如注釋之類的元數據來了解屏幕上的內容。元數據越詳細，AI可以學習的越好。

今天發布的新版本的“開放圖像”增加了2350萬張“照片級”標簽，這些標簽已經過人類驗證，可以對圖像中發生的事情提供一般描述。該數據庫現在總共有5990萬個這樣的標簽。Google還添加了更多情境注釋，包括250萬個用于描述照片中人物所執行動作的標簽，以及另外391，000個用于描述對象之間關系的標簽。

但是，主要亮點是Google的本地化敘述。這些是搜索巨頭開發的一種新型注釋，它希望AI模型能夠比舊的注釋方法收集更多有關圖像的信息。

Google通過讓人類注釋者將鼠標懸停在照片中的每個對象上并使用自己的文字進行描述來生成本地化的敘事。然后將光標移動的記錄與自然語言描述配對，以便每個單詞都可以與其所應用的對象相關聯。谷歌說，這種方法將使AI模型在Open Images數據集上進行訓練時可以更有效地學習。

“為了了解這些本地化敘述所代表的更多數據量，鼠標軌跡的總長度約為6400公里，如果不停地大聲朗讀，所有敘述都將花費約1.5年的時間來聆聽，” Google研究科學家Jordi Pont-Tuset在博客文章中進行了詳細介紹。

到目前為止，Google已經為約500，000個Open Images文件創建了本地化的敘述。Pont-Tuset寫道，此次更新代表著“在改善圖像分類，物體檢測，視覺關系檢測和實例分割的統一注釋方面，邁出了重要的定性和定量步驟。” “我們希望Open Images V6能夠進一步刺激人們對真實場景的理解。”

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴