国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于 MediaPipe 的手語接口現對開發者開放

Tensorflowers ? 來源:TensorFlow ? 作者:TensorFlow ? 2021-06-08 18:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

客座博文,發布人:SignAll | MediaPipe 團隊

請注意,以下內容中體現的信息、用途及應用完全是 SignAll 客座作者的觀點。

SignAll SDK:使用 MediaPipe 的手語接口現對開發者開放

當 Google 發布第一個基于 MediaPipe 的設備端手部追蹤技術時,它便成為了開發者構建手語識別解決方案應用的基礎。Google 之后對這個手部跟蹤解決方案的進一步更新,將其準確率提升至其他技術所無法達到的水平。

SignAll 是一家研發手語翻譯技術的初創公司,致力于為失聰人士普及手語翻譯,讓他們能夠與聽力正常的人群以及計算機進行交流。SignAll 的產品采用了復雜的多攝像頭設置和帶有彩色標記的手套,廣泛用于美國的通信和教育領域。

雖然手語的復雜性不僅限于手形(還包括面部特征、肢體、語法等),但準確追蹤手部確實已經給預處理程序(即計算機視覺)造成了巨大阻礙。MediaPipe 為 SignAll 的解決方案提供了更多可能性,不僅能夠免除手套,還可以使用單攝像頭設置。SignAll 已經宣布針對此類型開放首版 SDK,所以開發者現在能夠在自己的應用中啟用手語輸入。

SignAll

https://www.signall.us/

開放首版 SDK

https://signall.us/sdk

近期,該公司在 App Store 上發布了一個互動式教育應用,該應用可以讓用戶通過即時反饋來練習手語,還能夠展現出 SDK 的潛力。

SignAll 與 MediaPipe Hands

我們的系統在手語識別方面采用多個數據層,各層數據的抽象性越來越高。低級數據層從 2D 和 3D 攝像頭中提取關鍵的手部、軀體和面部數據。在我們的第一個實現中,此數據層會檢測手套的顏色,并創建 3D 手部數據。將其替換為 MediaPipe Hands(MediaPipe Pose 和 MediaPipe Face Mesh 作為補充)具有顛覆性的重要意義,因為你不再需要手套或特殊光線來使用我們的系統。

MediaPipe Hands

https://google.github.io/mediapipe/solutions/hands.html

MediaPipe Pose

https://google.github.io/mediapipe/solutions/pose.html

MediaPipe Face Mesh

https://google.github.io/mediapipe/solutions/face_mesh.html

如上文所述,我們使用了多個帶有深度傳感器的攝像頭,并在實際中對這些傳感器進行了校準。相較于本地攝像頭或張量空間,這種方法能夠實現更加準確的 3D 世界空間探測,但每個攝像頭都需要進行手部特征點檢測。攝像頭的位置和屏幕方向各不相同,因此可以實現更高的手部可視頻率,因為從一個攝像頭的角度來看,手部可能會被另外一只手遮擋,但從另一個攝像頭的角度來看,可能并不存在遮擋。

接下來的步驟是過濾數據,并進行數據平滑處理,以復制彩色手套標記提供的精確測量值。雖然 SignAll 的標記與 MediaPipe 提供的界標不同,但我們使用了手部模型并根據界標生成彩色標記。因此,新的動作捕捉數據與之前的數據完全兼容。

雖然我們主要關注手部,但我們同時整合了 MediaPipe Pose 和 MediaPipe Face Mesh。即便在彼此接觸,或距離很近的情況下,姿態界標都能提供準確的手部姿態信息。

雖然這兩個版本的動作捕捉是兼容的,但工件的性質不同:一種是直接測量各個標記,另一種是根據全局檢測的手部模擬標記。因為存在差異,所以我們必須在更高層級對參數進行優化。另一方面,我們仍可以利用我們的大型手語數據庫來進行無手套配置。我們可以通過替換低級數據,優化高級數據,以無手套形式測試我們的系統。實現無手套化,對于手語識別技術的全球推廣具有重要意義。

使用 MediaPipe 框架的 SignAll 系統

將 MediaPipe Hands 整合至系統后,我們還希望能夠利用 MediaPipe 框架在多個平臺上提供的自定義和擴容機會。這樣我們不僅可以用 Python 原型化我們的狀態研究方法,而且還可以為 Windows、iOSAndroid 甚至 Web 提供最終用戶解決方案。

由于我們的模塊圖系統和 MediaPipe 的計算圖之間具有相似性,現有的處理單元只需稍作修改就可以在這個新框架中重用。盡管如此,擴展平臺組還面臨著其他挑戰,例如在大多數情況下我們只能使用單個 2D 攝像頭而不是經過校準的多攝像頭系統。

我們開發并使用的模型、算法和技術,主要是為了在 3D 全局世界中處理動作捕捉數據。毫無疑問,從單攝像頭設置中提取的數據達不到同樣的詳細程度。所以我們必須對實現進行一些調整,微調算法并添加一些額外邏輯(例如,動態適應手持攝像頭用例導致的空間變化)。幸運的是,MediaPipe 框架讓我們能夠用 C ++ 實現核心處理單元,因此我們仍然可以從先前開發的運行時優化核心解決方案中受益。

為了更好地處理來自單個 2D 源的數據,一些基于 3D 數據訓練的高級模型需要重新訓練。MediaPipe 界標由 3D 坐標定義,因此可以重復使用現有的訓練方法和概念。另一方面,2D 信息的提取比三維坐標更為直接也更為穩定,在修改設計訓練時需要考慮到這一點。

幸運的是,我們無需為實現此目標而進行全新的數據記錄。我們仍然可以使用注釋詳細的大型視頻數據庫。預處理的動作捕捉數據可以從我們的記錄中提取,并在 3D 世界中解釋,從而用來模擬任何虛擬攝像頭視圖中的手部、骨架或面部界標檢測。

在虛擬攝像頭視圖的數據中,我們同時使用傳統的 2D 記錄,以足夠的比例覆蓋界標檢測的獨特噪點特征。由于大多數此類數據已經提前收集了,所以我們可以專注于嘗試最新技術并訓練新模型。

總結

在 MediaPipe 助力的改進,讓 SignAll 可以更改其模型。除了提供用于手語教學和翻譯的多合一產品之外,SignAll 現在也開始提供面向開發者的 SDK。此 SDK 的功能取決于攝像頭的類型和可用的算力。SDK 可以啟用的功能包括:

面向開發者的 SDK

https://signall.us/sdk

通過用手語表示聯系人的姓名來發起視頻通話

通過手語(與語音輸入相對應)在導航中添加地址,或在快餐店的信息亭或直通車道中進行點餐。

SignAll 的使命是讓手語能夠全方位替代語音,而我們非常高興看到越來越多的應用實現了此功能。

我們十分期待 MediaPipe 未來的更新,這些更新能夠幫助我們進一步實現終極目標——讓所有人在任何設備上都能使用我們的解決方案。最值得期待的更新是能夠建立自定義的 MediaPipe 圖,并添加我們自己的計算器,從而在 WebAssembly 技術的輔助下實現基于網絡的解決方案,這樣網站就能夠為失聰訪問者提供全新水平的無障礙功能。

TensorFlow

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 3D
    3D
    +關注

    關注

    9

    文章

    3011

    瀏覽量

    115015
  • C++
    C++
    +關注

    關注

    22

    文章

    2123

    瀏覽量

    77110
  • SDK
    SDK
    +關注

    關注

    3

    文章

    1101

    瀏覽量

    51713

原文標題:SignAll SDK:基于 MediaPipe 的手語接口現對開發者開放

文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    百度地圖開放平臺與400萬開發者共赴智能時空新未來

    二十年星辰大海,十五載開放引航。2025年,百度地圖迎來服務用戶的二十周年,其開放平臺亦走過了與開發者并肩同行的十五個春秋。在近期舉行的“2025百度地圖開發者盛典”上,百度地圖
    的頭像 發表于 01-23 09:03 ?689次閱讀
    百度地圖<b class='flag-5'>開放</b>平臺與400萬<b class='flag-5'>開發者</b>共赴智能時空新未來

    2025華為開發者大賽暨開發者年度會議成功舉辦

    12月27日-12月28日,以“成就AI原生時代先鋒開發者”為主題的2025華為開發者大賽暨開發者年度會議在上海華為練秋湖研發中心舉辦。本次會議旨在匯聚先鋒開發力量,搭建
    的頭像 發表于 12-31 13:32 ?650次閱讀

    九聯科技亮相2025開放原子開發者大會

    11月21-22日,以“AI共智,開源共享”為主題的2025開放原子開發者大會在北京盛大舉辦。作為開源鴻蒙生態的核心共建力量,九聯科技旗下子公司九聯開鴻受邀出席大會,與來自產學研用各領域的技術專家、企業代表、高校學者與開發者齊聚
    的頭像 發表于 11-27 15:04 ?381次閱讀

    2025開放原子開發者大會精彩回顧

    11月21日-22日,2025開放原子開發者大會在北京成功舉辦,大會以“一切為了開發者——AI共智,開源共享”為核心主題,匯聚政產學研用千余名代表,通過1場開幕式、15場前沿分論壇及開源市集交流區,集中釋放開源技術創新成果,全方
    的頭像 發表于 11-27 14:59 ?620次閱讀

    2025開放原子開發者大會旋武開源社區Rust分論壇成功舉辦

    11月22日,2025開放原子開發者大會——旋武開源社區Rust分論壇在北京順利召開。論壇以“共建中國Rust生態”為核心主題,匯聚京東、華為、vivo、阿里、毛豆教育、DORA社區及南京大學等企業與學術機構技術專家,及眾多Rust開發
    的頭像 發表于 11-27 14:55 ?657次閱讀

    2025開源鴻蒙開發者激勵計劃正式啟動

    11月21日,2025開放原子開發者大會盛大啟幕,聚焦“AI共智,開源共享”主題,吸引了來自全球的開發者、企業技術領袖、社區維護及高校科研力量參會。作為大會的重要組成部分,開源鴻蒙技
    的頭像 發表于 11-27 14:44 ?663次閱讀

    潤和軟件亮相2025開放原子開發者大會

    11月21-22日,2025開放原子開發者大會在北京圓滿舉行。大會以“一切為了開發者——AI共智,開源共享”為主題,聚焦人工智能與開源技術的深度融合,全面展現開源生態在推動產業創新、培育新質生產力方面的核心價值。
    的頭像 發表于 11-26 15:19 ?453次閱讀

    2025開放原子開發者大會AtomGit開源實踐交流分論壇成功舉辦

    11月21日,在2025開放原子開發者大會開幕式上,開放原子開源基金會聯合CSDN等伙伴,正式宣布新一代AtomGit平臺完成全面升級并上線運行。該平臺由AtomGit與GitCode深度融合而成
    的頭像 發表于 11-25 17:47 ?1190次閱讀

    2025開放原子開發者大會成功舉辦

    11月21日,2025開放原子開發者大會在京開幕。大會以“一切為了開發者——AI共智,開源共享”為主題,聚焦人工智能與開源技術的深度融合,全面展現開源生態在推動產業創新、培育新質生產力方面的核心價值。
    的頭像 發表于 11-25 17:19 ?894次閱讀

    deepin社區亮相2025開放原子開發者大會

    近日,以“一切為了開發者——AI共智,開源共享”為主題的2025開放原子開發者大會在京圓滿落幕。大會聚焦人工智能與開源技術的深度融合,展現了開源生態在推動產業創新、培育新質生產力方面的核心價值。
    的頭像 發表于 11-25 09:19 ?905次閱讀

    軟通動力攜手鴻湖萬聯亮相2025開放原子開發者大會

    11月21日,2025開放原子開發者大會以“AI共治,開源共享”為主題在北京召開,全面呈現廣大開發者在AI時代通過開源協作所取得的突破性成果。
    的頭像 發表于 11-24 17:29 ?770次閱讀

    2025開放原子開發者大會11月啟幕

    開發者年度盛會即將登場!2025開放原子開發者大會將于11月21-22日,在北京北人亦創國際會展中心盛大召開。大會以“一切為了開發者”為主題,匯聚全球開源智慧——國內外優秀
    的頭像 發表于 10-24 14:05 ?956次閱讀

    曙光網絡SugonRI開發者社區正式上線

    (sugonri.sugon.com),面向使用及計劃使用SugonRI的開發者,打造一個集學習、交流、案例分享與應用實踐于一體的開放平臺。
    的頭像 發表于 09-04 09:58 ?953次閱讀

    芯科科技亮相2025 Matter開放日和開發者大會

    2025年Matter開放日(MOD)和開發者大會(MDC)在上周6月12-13日圓滿成功舉辦,Silicon Labs(芯科科技)延續一直以來傾力支持Matter標準發展的策略,攜Matter最新演示與參考應用再次亮相今年的Matter
    的頭像 發表于 06-18 14:22 ?1219次閱讀

    層層剝開開鴻Bot,我們看到的是“開發者優先”

    對開源生態來說,社區先于代碼,開發者重于一切
    的頭像 發表于 05-27 09:23 ?2983次閱讀
    層層剝開開鴻Bot,我們看到的是“<b class='flag-5'>開發者</b>優先”