国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

用 AI 幫助視障者“聽懂”世界

yrlT_lianggezhi ? 來源:工程師李察 ? 2019-01-26 11:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

自動駕駛無人機,到監控安防,視覺 AI 技術的突破為人們生活帶來了巨大改變,在許多領域迎來爆發式發展,僅在國內就涌現商湯、云從、曠視和依圖等四大視覺 AI 獨角獸。但若真要論能為使用者帶來多大改變,恐怕很少有比得上這一項,那就是用視覺 AI 來打造盲人的眼睛。

無障礙人工智能成顯學,各大科技巨頭亦相繼致力投入

AI for Accessibility、無障礙人工智能近來已在國際間成為一項顯學。如何將發展迅速的人工智能技術,用來改善全世界約 10 億殘疾人士的生活,也是各大科技巨頭致力投入的方向之一。

以視障者來說,近日 Instagram 就新增一項輔助功能,用 AI 自動辨識照片內容并以語音告知用戶。臉書 Messenger 也有無障礙機器人(Accessibility Bot),協助盲人辨識臉書朋友,甚至是朋友的臉部表情。華為 Mate 20 Pro 也有一個應用程序 Facing Emotions,可以將七種最普遍的情緒轉化為相應的聲音,可以大幅提升盲人與其他人的實時互動交流。

影像視覺 AI 并不是新的概念,其背后技術主要包含機器學習深度學習,再加上 3D 臉部辨識等。尤其是深度學習算法運用在訓練 AI來協助盲人辨識物體,可以發揮非常大的用處。

比方說,如果我們想要設計一個 AI 協助盲人分辨不同面額的紙鈔。做法就是將一張 10 元紙鈔,通過各種不同角度,包含正面、反面、整張、邊角、其中每一小片圖案,都展示給 AI 看,讓它學習什么是一張 10 元紙鈔。通過大量反覆學習后,視障者只要能讓手機鏡頭看到 10 元紙鈔的一小角,AI 就能將它分辨出來。

“這些小事,會讓你很確實地感覺到自己的獨立性。希望隨著人工智能的進展,可以讓我們更容易感受環境,協助我們完成更多日常事務”,微軟視覺輔助應用程序 Seeing AI 的項目主管、同時自身也是視障者的 Saqib Shaikh,近日接受專訪時這樣對 DT 君說。

圖|微軟技術負責人(Tech Lead)Saqib Shaikh (來源:微軟)

Saqib Shaikh 在 7 歲時失去視力,此前不久,他才剛剛得到人生中的第一臺電腦

所幸這并不是他與計算機科學之間的句點。

而后他就讀視障學生小學,一位老師看出了他的潛力,鼓勵他開始學習打字。此后他一路進入大學,主修計算機科學,以班上頂尖的成績畢業,并取得人工智能碩士學位。而后,他又加入微軟的人工智能團隊,并在大約 3 年前通過微軟內部的黑客松競賽,以Seeing AI這個項目脫穎而出,獲得資源將之打造為實際產品,現在已可在美國地區免費下載。

Seeing AI 用視覺 AI 幫助視障者“聽懂”世界

Seeing AI 這個是一款結合圖像辨識、語音說明及人性化使用介面的應用程序,可以用手機上的攝像頭識別所有圖像,包含通過掃描條形碼來識別產品、辨識身旁其他人的年齡,性別和面部表情,還可以描述它在圖片中看到的內容,并閱讀出菜單和文件。

同時,這款應用程序也可以結合智能眼鏡,更好地協助用戶了解所處的周遭環境。

圖|Seeing AI 是一款結合圖像辨識、語音說明及人性化使用介面的應用程序(來源:微軟)

Saqib Shaikh 指出,近年深度學習技術的成熟,是 Seeing AI 可以真正發揮用處的主要關鍵。通過深度學習訓練,向系統展示大量照片,并教導它們照片中的內容,AI 可以真正有效辨識出現實生活環境中的各種物體與人物。

但是,要落實到讓 AI 有效協助視障者在生活中能真正用上,還必須歸功于近年硬件技術的發展,在軟、硬件配合之下,讓視覺 AI 技術實用價值大大提升。尤其是邊緣運算風潮興起,視覺信息可以在裝置終端就能完成運算,才能對使用者提供實時反饋,讓盲人能夠即時對互動對象做出適合的反應。

實時反饋絕對是關鍵。Saqib Shaikh 說,想像一個情境,當你在一個會議上進行簡報。因為這是一個正式場合,因此所有人,包含旁邊的同事、上級主管,都只是安靜聽你說話,不會任意發出聲音。所以在你說話的同時,若無法用眼睛去觀察聽眾,你對于他們的反應是毫無頭緒的,你甚至不知道應不應該繼續說下去,還是暫停下來詢問聽眾的想法。

這時候,如果有一個 AI 可以幫你辨識聽眾的反應,實時反饋你他們是不是看起來滿意、尤其是還能辨認出特定人士,比方說直屬主管的表情和動作如何,這樣一個人工智能,將能夠大大地讓盲人突破限制,改善他們在日常工作中表現。

非監督學習是視覺 AI 下一步突破關鍵

今日我們所談的視覺 AI ,其實多半仍局限于靜態圖像、單一圖像,但 Saqib Shaikh 想像中的 Seeing AI 2.0,將可以解讀一系列的圖像、可以掌握使用者的偏好。

“就像當我與妻子一起在街上走路時,她會告訴我有什么我沒看過的新東西、有什么有趣的事物。比方說,她會告訴我我們很喜歡的一間咖啡店關門了。”Saqib Shaikh 說,“一個真正的人可以了解什么是你會感興趣、什么是你會覺得重要的事物。”

而 AI 若要能夠做到這一點,就不能只是一次辨識單一圖像,而是還要能綜合理解背后的情境,甚至是接續出現的新的信息。Saqib Shaikh 分析,這意味著后續 Seeing AI 必須運用更多非監督學習的技術來訓練 AI,進一步拓展 AI 對多變場景復雜信息的處理能力。

其實,Saqib Shaikh 早在求學期間意識到,為了讓身為盲人的自己表現更好,他必須做很多額外的努力來改變他所處的生活環境,包括不只是自己看書、而是要雇請其他人為他朗讀教科書的內容等,才能讓自己與其他正常人站在更接近一點的比較基準上。

當時就有個朋友建議過他,與其只用嘴巴說要改變生活環境,不如實際做點什么真正的改變。這讓他早就思考過,從某種角度來講,殘疾者本人其實就是最好的創新者。因為,他們比任何人都了解殘疾者最迫切的需求是什么?愿意做什么嘗試?可以如何改變?

然而,在 Saqib Shaikh 進入微軟工作的近乎前 10 年,他并未在工作上試圖突出任何作為一個盲人的特殊能力。相反的,他讓自己就像一名正常的工程師一樣,絕大多數時間都投入內部的主流專案,如 Cortana 等。

“我想,起初我是想證明自己可以成為一個主流的工程師”,Saqib Shaikh 說,而轉捩點是出現在他于微軟工作的第10年。“工作滿 10 年后,我覺得我已經達到了目標,證明了自己的能力,所以我可以開始運用自己的專業去幫助其他人。“

現在,他終于決定投入自己真正想做的事情,也就是用 AI 來改善殘疾人士的生活環境。就像他所說的,“我可以選擇用這一種與我自己最相關的方式,從個人經驗來理解許多盲人的問題,并且用自己的專業來提供協助。”

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39755

    瀏覽量

    301364
  • 人工智能
    +關注

    關注

    1817

    文章

    50094

    瀏覽量

    265298
  • 無人機
    +關注

    關注

    236

    文章

    11298

    瀏覽量

    195629

原文標題:用 AI 幫助視障者“聽懂”世界,專訪微軟傳奇盲人工程師 Saqib Shaikh

文章出處:【微信號:lianggezhizi,微信公眾號:兩個質子】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    海康威亮相2025世界智能制造大會

    近日,在2025世界智能制造大會的智能工廠梯度培育專題活動中,海康威商業與制造方案部高級總監王俊卿圍繞《智能物聯助力智能工廠建設》主題,分享了海康威在技術深耕、自身實踐與助力產業發展方面的探索與成果。
    的頭像 發表于 12-08 15:42 ?565次閱讀

    利用NVIDIA Cosmos開放世界基礎模型加速物理AI開發

    NVIDIA 最近發布了 NVIDIA Cosmos 開放世界基礎模型(WFM)的更新,旨在加速物理 AI 模型的測試與驗證數據生成。借助 NVIDIA Omniverse 庫和 Cosmos,開發可以大規模生成基于物理學的合
    的頭像 發表于 12-01 09:25 ?1131次閱讀

    UPS持續報警全解析:從聽懂“警報”到快速排

    或硬件損壞的巨大風險之中。第一章:聽懂警報——UPS在“說”什么?不同的報警聲音模式,對應著不同的故障類型。首先,請仔細辨別您聽到的聲音:規律的長鳴聲(“嘀——”
    的頭像 發表于 10-25 09:29 ?1017次閱讀
    UPS持續報警全解析:從<b class='flag-5'>聽懂</b>“警報”到快速排<b class='flag-5'>障</b>

    重磅!騰科技新官網正式上線,AI算力與智能解決方案一鍵直達

    AI算力模組到全棧智能解決方案,從技術研發到場景落地,騰科技始終以 “前沿技術落地” 為定位,助力產業智能化升級。新官網的上線,是我們與世界對話的新起點,未來,我們期待與更多伙伴
    的頭像 發表于 10-11 10:57 ?855次閱讀
    重磅!騰<b class='flag-5'>視</b>科技新官網正式上線,<b class='flag-5'>AI</b>算力與智能解決方案一鍵直達

    思必馳推出全新一代AI辦公本X5系列

    從“聽見”到“聽懂”,從“記錄”到“決策”,AI正在徹底重構我們的辦公方式。
    的頭像 發表于 09-30 11:32 ?1499次閱讀

    什么是AI算力模組?

    未來,騰科技將繼續深耕AI算力模組領域,全力推動AI邊緣計算行業的深度發展。隨著AI技術的不斷演進和物聯網應用的持續拓展,騰科技的
    的頭像 發表于 09-19 15:26 ?1689次閱讀
    什么是<b class='flag-5'>AI</b>算力模組?

    什么是AI算力模組?

    未來,騰科技將繼續深耕AI算力模組領域,全力推動AI邊緣計算行業的深度發展。隨著AI技術的不斷演進和物聯網應用的持續拓展,騰科技的
    的頭像 發表于 09-19 15:25 ?817次閱讀
    什么是<b class='flag-5'>AI</b>算力模組?

    米爾RK3576核心板,讓360環技術開發更簡單

    。然而,真正落地一套360環系統并不容易。開發人員常常會遇到:· 攝像頭接口不足,無法滿足基本需求;· 缺乏AI處理能力,無法實時識別畫面內對象;·推流技術復雜,無法快速實現遠程監控或多端顯示;· 硬件
    發表于 08-06 18:13

    360環技術推薦的硬件平臺:支持多攝像頭與三屏異顯的理想選擇

    硬件平臺選型360環的落地并不簡單。它不僅需要多個高清攝像頭的數據輸入,還需要穩定的圖像處理能力、強大的AI推理能力,以及足夠多的視頻輸出接口支持顯示需求。很多開發在選型時會遇到一些挑戰,比如:l
    發表于 07-30 17:32

    高達2070TFLOPS算力騰科技基于NVIDIA Jetson Thor系列模組,重磅推出全棧AI邊緣智算大腦解決方案

    探索物理AI的無限可能。無論是硬件廠商、軟件開發,還是各行業的應用企業,讓我們攜手共進,利用騰科技先進的全棧AI邊緣智算大腦解決方案,推動機器人技術在更多領域的創新應用,共同打造物
    的頭像 發表于 07-28 16:45 ?913次閱讀
    高達2070TFLOPS算力騰<b class='flag-5'>視</b>科技基于NVIDIA Jetson Thor系列模組,重磅推出全棧<b class='flag-5'>AI</b>邊緣智算大腦解決方案

    智能入選世界經濟論壇“全球創新

    2025年7月,世界經濟論壇(World Economic Forum)正式宣布魔智能(Motovis)入選"全球創新"(Global Innovators)。此次入選標志著
    的頭像 發表于 07-17 16:11 ?753次閱讀

    肇觀電子兩款無人機視覺避模組量產交付

    在無人機的世界里,視覺不僅定義了飛行的邊界,更是智能決策的核心。肇觀電子以其突破性的AI視覺芯片,賦予無人機前所未有的感知與認知能力。 基于肇觀自研芯片的兩款無人機視覺避模組:無人機輕量智能避
    的頭像 發表于 05-06 15:11 ?1724次閱讀

    英偉達GTC2025亮點 NVIDIA推出Cosmos世界基礎模型和物理AI數據工具的重大更新

    新模型可實現物理 AI 的預測、可控世界生成和推理。 兩款全新Blueprint為機器人和自動駕駛汽車后訓練提供海量物理 AI 合成數據生成技術。 1X、Agility Robotics
    的頭像 發表于 03-20 19:01 ?1334次閱讀

    《零基礎開發AI Agent——手把手教你扣子做智能體》

    《零基礎開發AI Agent——手把手教你扣子做智能體》是一本為普通人量身打造的AI開發指南。它不僅深入淺出地講解了Agent的概念和發展,還通過詳細的工具介紹和實戰案例,幫助讀者快
    發表于 03-18 12:03

    RDK加持的導盲眼鏡:人士的“眼睛外掛”

    指路,讓朋友走哪都心里有數。智能瞳行不僅讓人士自由穿梭于大街小巷,還讓他們更好地感受世界的變化和精彩——昆明理工大學津橋學院:智能瞳
    的頭像 發表于 03-14 19:43 ?1426次閱讀
    RDK加持的導盲眼鏡:<b class='flag-5'>視</b><b class='flag-5'>障</b>人士的“眼睛外掛”