国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

圖像捕獲是AI中最難的問題之一

倩倩 ? 來源:新經網 ? 作者:新經網 ? 2020-10-15 14:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

長期以來,AI的目標就是準確地描述圖像,而不僅僅是像笨拙的機器人。谷歌在2016年表示,其人工智能可以為人類提供幾乎與人類一樣的字幕圖像,準確度達到94%。現在,微軟表示,它走得更遠:它的研究人員建立了一個AI系統,甚至比人類更準確-以至于現在坐上了榜首的nocaps圖像字幕標桿。微軟聲稱其自2015年以來一直使用的圖像字幕模型要好兩倍。

盡管這本身就是一個顯著的里程碑,但微軟不僅僅是將這項技術保留在自己手中。現在,它作為Azure認知服務的一部分提供了新的字幕模型,因此任何開發人員都可以將其引入他們的應用程序中。今天,它也可以在Seeing AI中使用,Seeing AI是面向盲人和視障用戶的Microsoft應用程序,可以描述周圍的世界。今年下半年,字幕模型還將改善您在PowerPoint中針對Web,Windows和Mac的演示文稿。它還會在桌面平臺的Word和Outlook中彈出。

Azure AI的CVP Eric Boyd在接受Engadget采訪時說:“圖像捕獲是AI中最難的問題之一。它不僅代表理解場景中的對象,還包括它們之間的交互方式,以及如何描述它們。”精細的字幕技術可以為每個用戶提供幫助:它使在搜索引擎中查找所需圖像變得更加容易;對于視障用戶,它可以使瀏覽網絡和軟件變得更加出色。

看到公司吹捧他們的AI研究創新并不少見,但是將這些發現迅速部署到運輸產品中卻很少見。Azure AI認知服務的CTO Huang Xuedong出于對用戶的潛在好處,推動將其迅速集成到Azure中。他的團隊使用標記有特定關鍵字的圖像對模型進行了訓練,這有助于使它成為大多數AI框架所沒有的視覺語言。通常,這些類型的模型是使用圖像和完整標題訓練的,這使得模型更難于學習特定對象的交互方式。

“視覺詞匯預訓練本質上是訓練系統所需的教育;我們正在嘗試教育這種運動記憶,”黃在博客文章中說。這就是這種新模型在nocaps基準測試中的優勢,該基準測試側重于確定AI可以如何為字幕創建字幕,這些字幕從未見過。

但是,盡管要打破基準很重要,但微軟新模型的真正考驗將是它在現實世界中的功能。據博伊德說,Seeing AI開發人員Saqib Shaik也在自己的盲人手中推動了Microsoft的更大可訪問性,他說這是對他們先前產品的巨大改進。既然微軟已經設定了一個新的里程碑,那么有趣的是,看看來自Google和其他研究人員的競爭模型也將如何競爭。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6741

    瀏覽量

    107854
  • 機器人
    +關注

    關注

    213

    文章

    31077

    瀏覽量

    222203
  • AI
    AI
    +關注

    關注

    91

    文章

    39774

    瀏覽量

    301372
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    使用NORDIC AI的好處

    提升能效,適合音頻、圖像和高采樣率傳感器等更重的 AI 負載。[Axon NPU 技術頁] 模型更小、更快、更省電 Neuton 模型相較 TensorFlow Lite:* 內存占用可小 10
    發表于 01-31 23:16

    格科微電子推出1200萬像素AI眼鏡圖像傳感器GC12C1

    AI眼鏡市場正在迎來第輪爆發。Sigmaintell數據顯示,2025年全球AI智能眼鏡出貨量同比增長預計超過110%。“解放雙手”拍照與錄像是AI眼鏡最獨特的體驗
    的頭像 發表于 01-30 09:11 ?1783次閱讀

    瑞芯微SOC智能視覺AI處理器

    : 支持4K@60fps H.265/H.264解碼,以及1080p@60fps編碼。豐富接口: 這是其核心優勢之一,支持PCIe 2.1, SATA 3.0, USB 3.0, 雙千兆以太網等,非常適合
    發表于 12-19 13:44

    當銷冠變成AI員工:深度智聯如何重構地產生產力?

    AI落地最難的行業,正被數字員工悄悄改造
    的頭像 發表于 12-18 22:02 ?7239次閱讀
    當銷冠變成<b class='flag-5'>AI</b>員工:深度智聯如何重構地產生產力?

    【飛凌OK-MX9596-C開發板試用】③云端AI拍照識別

    【飛凌OK-MX9596-C開發板試用】②體驗WIFI、藍牙、音頻、視頻,為AI應用打下基礎 - 飛凌嵌入式 - 電子技術論壇 - 廣受歡迎的專業電子論壇! 在上帖子中,我們測試了攝像頭拍照
    發表于 11-01 22:12

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰

    AI的應用多種多樣。比如:DALL-E2、Midjourney、Stable Diffusion等,不僅包括對話功能,還包括生成圖像、視頻、語音和程序代碼等功能。 竟然連代碼都可以生成,會取代程序員
    發表于 09-12 16:07

    【Sipeed MaixCAM Pro開發板試用體驗】基于MaixCAM-Pro的AI生成圖像鑒別系統

    能夠有效捕捉AI生成圖像與真實手繪掃描圖像在紋理、筆觸、光影、全局致性等方面的細微差異。 邊緣端部署:將模型量化、編譯,最終高效運行在算力有限的MaixCAM-Pro開發板上。 實時
    發表于 08-21 13:59

    AI 芯片浪潮下,職場晉升新契機?

    芯片設計為例,從最初的架構選型,到算法適配、性能優化,每個環節都考驗著工程師的專業素養。在設計款面向智能安防領域的 AI 芯片時,需要深入研究安防場景下圖像識別算法的特點,針對性地優化芯片架構,提升
    發表于 08-19 08:58

    NVIDIA RTX AI加速FLUX.1 Kontext系列圖像模型

    Black Forest Labs,作為全球頂尖 AI 研究實驗室之一,為圖像生成領域帶來顛覆性變革。
    的頭像 發表于 08-05 16:27 ?1229次閱讀
    NVIDIA RTX <b class='flag-5'>AI</b>加速FLUX.1 Kontext系列<b class='flag-5'>圖像</b>模型

    示波器波形捕獲率的定義和作用

    波形捕獲率(Waveform Capture Rate)是數字示波器的關鍵指標之一,指單位時間內示波器能夠捕獲并顯示波形的次數,通常以“次/秒”或“幀/秒”為單位。其本質是衡量示波器在單位時間內對信號變化的響應能力。
    的頭像 發表于 08-04 15:20 ?1501次閱讀

    最新人工智能硬件培訓AI基礎入門學習課程參考2025版(離線AI語音視覺識別篇)

    端側離線 AI 智能硬件作為 AI 技術的重要載體之一,憑借其無需依賴網絡即可實現智能功能的特性,在些網絡條件受限或對數據隱私有較高要求的場景中,發揮著不可或缺的作用。本章基于CSK
    發表于 07-04 11:14

    CX3顯示RAW12圖像錯誤的原因?

    我想通過CX3065從FPGA捕獲MIPI圖像,我可以切換4種分辨率并通過開始捕獲顯示圖像,但片刻之后,我的UVC_App顯示的圖像是錯誤的
    發表于 05-16 07:49

    泰克MDO3052示波器波形捕獲率評測

    能力,為用戶提供選型參考。 、波形捕獲率的核心價值與技術原理 波形捕獲率是示波器在單位時間內捕獲并處理波形的次數,直接影響異常信號的捕獲
    的頭像 發表于 04-02 11:49 ?973次閱讀
    泰克MDO3052示波器波形<b class='flag-5'>捕獲</b>率評測

    芯原推出新代集成AI的ISP9000圖像信號處理器,賦能智能視覺應用

    芯原股份今日發布其ISP9000系列圖像信號處理器(ISP)IP——面向日益增長的智能視覺應用需求而打造的新AI ISP解決方案。ISP9000采用靈活的AI優化架構,提供卓越的
    的頭像 發表于 04-02 10:43 ?913次閱讀

    中科億海微SoM模組——AI圖像推理解決方案

    隨著AI技術的快速發展,AI圖像推理作為種高效、智能的圖像處理技術,已成為推動各行業數字化轉型和智能化升級的關鍵。它憑借強大的
    的頭像 發表于 03-27 13:48 ?842次閱讀
    中科億海微SoM模組——<b class='flag-5'>AI</b><b class='flag-5'>圖像</b>推理解決方案