国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

聽障人士實現手語自由:手語AI平臺的產業狂想

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2022-03-04 22:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

盼望著,盼望著,春天的腳步近了,雪容融也終于正式上崗,迎來了自己的主場——2022北京冬殘奧會。

本屆冬奧會不僅是運動員們的競技舞臺,更是科技公司“秀肌肉”的絕佳舞臺。諸多科技亮點之中,大家可能都注意到了,冰墩墩和雪容融有一位共同的“同事”——手語數字人。

2月4日晚開幕的冬奧會上,央視新聞AI手語主播正式上崗,陪伴聽障人士見證了一場場精彩絕倫的比賽。即將開幕的冬殘奧會,這位手語數字人也義不容辭,將披掛上陣,讓聽障人士實時感受冰雪運動的魅力。

創造豐厚的冬奧遺產,為國家、主辦城市、人民群眾帶來長期的、積極的收益,也是成功辦奧的重要標志之一。在日常生活中,手語數字人能不能繼續發光發熱,為聽障人士提供服務呢?

我們關注到,3月3日,央視新聞AI手語主播的制作者——百度智能云曦,又推出“AI手語平臺”,通過分鐘級生成手語合成視頻、手語主播實時直播等能力,為手語服務的普及難題,提出了科技平臺化的新解法。

同時,百度智能云曦靈還發布了“AI手語平臺一體機”,讓一些需要硬件交互的場景,比如醫院、銀行、車站等公共場合,插電即可提供手語服務,快速部署無障礙窗口。

平臺化和軟硬協作的革新,正在讓手語數字人走上一條與社會價值長期對接、一同成長的進化之路。

科技巨頭們都在積極打造手語數字人,反映出哪些潮水的方向?數字生命與智能技術的溫情加速照進現實,這究竟意味著什么?

數字生命覺醒時:手語數字人的能力體系

百度智能云曦靈平臺賦予手語數字人哪些特殊能力?我們不妨以人類手語老師的標準來審視一下。

有一種“難”,叫朱廣權的手語老師,想要實時且準確地翻譯出朱廣權的妙語連珠,千挑萬選的央視手語老師有時也難免手忙腳亂。而在此前與朱廣權的在線pk中,這位由“百度智能云曦靈”打造的首個AI手語主播,面對朱廣權不斷拋出的超高速順口溜,立馬就能做出反應,表現出流暢、精準的業務能力。

綜合來看,手語主播的華麗炫技,以及冬奧會上的扎實服務,來自百度智能云曦靈平臺提供的三個方面的基礎能力:

1.理解能力。

真實世界中,很容易受到噪音干擾,人類手語老師必須聽清、聽懂新聞內容,不然翻譯出來也可能是錯誤的,一通比劃猛如虎,但無法真正投入使用。

想要聽清,需要領先的語音識別能力。百度智能云曦靈平臺融合了百度自然語言處理技術,成熟領先的全雙工ASR(Automatic Speech Recognition)語音識別模型,近場中文普通話的識別準確率,能夠達到98%以上。

輕松搞定各種語音內容,即使段子手朱廣權的神級語速也不在話下,這為后續數字人的手語翻譯打下了堅實的基礎,使得AI手語平臺一體機更好地應用于不同場景中。

2.翻譯能力。

感知之外,手語老師要分析、歸納重要信息,根據語句整體意思進行精煉和語序調整,將其轉換成手語語言。

一些廠商研發的手語數字人直接采用“手勢漢語語料”,好處是無需重新標注,節省時間,問題是生硬地按照說話順序將手語手勢連接起來,并不能算是“人類高質量手語”。

舉個例子,“我想回家”并不是將這四個漢字依次比劃出來,而是按照“家”、“回”、“我想”的順序來表達。

因此,想要翻得準,手語數字人必須學會自然手語語序。百度智能云曦靈平臺就基于“國家手語語法規則”,聯合手語語言學專家,特殊教育專家、天津理工大學等,邀請上百位聽障學生做數據標注,形成了近千萬的高質量訓練數據。

有了數據,接下來就是模型設定與訓練。基于百度多年積累的神經網絡翻譯技術,設計了從中文文本到手語符號的翻譯方法,打造出了業內首個基于神經網絡的精煉度可控手語翻譯模型,讓手語數字人的翻譯可懂度達到85%以上,媲美主流的中英,中日等方向的機器翻譯結果。

3.表達能力。

手語中,手勢必不可少,還需要表情、口型、動作等肢體語言的配合,幫助聽障人士更好地理解。比如疑問句“吃飯了嗎“,不僅要做出吃飯的手勢,還要配上疑惑的表情,眉頭皺起、眼睛睜大。

要讓手語數字人聲情并茂、手舞足蹈地表達,尤其是3D人像,有著不小的技術難度。一些手語數字人動作過快,有時又存在卡頓不連貫的情況。為了訓練手語數字人的“聲臺形表“,百度智能云曦靈平臺也是煞費苦心:

表情上,百度智能云用4D掃描數據,積累了超1萬個臉部面4D數據,借助高精數字人“文字到形狀的跨模態面部表情生成技術”,能夠準確生成微笑、開心笑、wink、吹泡泡、白眼、思考等表情。口型合成準確性達98.5%,a和e這樣發音時表情接近的字母,都可以細致的區分。

驅動時,通過個性化TTS,根據輸入的文本/語音信息來進行自適應,結合多種預置動作,驅動數字人的唇形、肢體、表情、手勢等自動生成。多模態的手語表達,能夠傳遞出更豐富、準確、易于理解的信息。

同時,百度智能云曦靈平臺搭載的開放域對話平臺PLATO-XL,是百度基于百億級訓練參數、多年搜索及知識圖譜積累而訓練出來的,被認為是當前最大規模的中英文對話模型。通過它可以快速驅動數字人實現直播、動畫等內容,達到多場景下的實時溝通。

縱觀手語數字人的能力體系,不難發現,頭部科技公司相繼推出了自己的手語機器人,除了體現科技的人文關懷之外,還隱藏著技術發展的必然。

必須在算力、數據、算法三方面都有強大的能力,在語音、視覺、NLP、知識圖譜等領域都有領先優勢,才能讓手語數字人真正覺醒在屏幕前、生活中。

百度作為國內AI 技術布局更完整的公司,能最快地實現手語數字人的大規模應用,原因正在于此。

數字生命的平臺化復制:手語數字人插上產業之翼

在冬奧會和即將到來的冬殘奧會上的大規模應用,幾乎代表了現階段數字虛擬人的最高水平,是典型的數字生命:具備完成復雜目標的能力(通過手語翻譯傳遞賽事信息),以及實時學習進化的能力(收集信息、實時互動、做出回應,而非提前錄制)。

正如未來生命研究所的創始人:邁克斯·泰格馬克所說,數字生命是一種能夠自我復制的信息處理系統,物理結構是其硬件,行為和“算法”是其軟件。這決定了,手語數字人必須向軟硬協作、規模復制的方向發展。

3月3日,百度智能云曦靈發布AI手語平臺和“AI手語平臺一體機”,或許正在為手語數字人插上產業騰飛的翅膀。

為什么這么說?手語數字人雖好,卻不能低估技術產業化的難度,至少有幾座大山橫亙在前面:

第一座大山,是效率之謎。

對于新興的手語數字人領域,制作難度大、周期長、技術門檻高,服務的群體相對較小,很多行業和企業在引入之前都會顧慮,會不會需要大量的人力財力成本,會不會效果不好沒人用,思前想后就是等等再說。要讓全社會聽障人士都享受到技術紅利,還是要尊重產業規律,降低新技術的應用門檻,真正讓手語數字人的制作“降本增效”。

百度智能云曦靈的手語數字人平臺,出現得恰逢其時。“AI手語平臺”具備“視頻手語合成”“直播手語合成”“文本轉手語”“語音轉手語”四大功能,可實現普通視頻合成為手語視頻、實時直播中增加手語畫面、文字翻譯為手語、語音實時翻譯為手語等多種效果。AI手語平臺可搭載在各類APP、網站、小程序中,讓聽障人士也能輕松實現線上社交、娛樂休閑、課程學習等各類需求。

同時,百度智能云曦靈還設置了三大平臺,讓手語數字人可以被快速、標準化、高效地生產和交付。比如在人設管理平臺上,根據不同的場景搭配設置不同的人設,比如銀行中引入的手語數字人可以專業、嚴謹,景區中使用的手語數字人則親和、活潑等,適應千行百業的需求。

平臺化、標準化、體系化的能力,使得AI驅動的2D數字人,生產周期只需要幾個小時,3D虛擬偶像一兩個星期就能開發出來,輕松飛越效率這座大山。

第二座大山,是體驗之困。

大家可能注意到了,在百度智能云曦靈發布 “AI手語平臺一體機”之前,幾乎所有的手語數字人都是以軟件形式存在的。專門打造一款手語數字人硬件,真的有必要嗎?

從根本上來說,我們所知的所有生命形式都有著生物“硬件”的載體,有技術人員認為,“生命3.0”階段的數字生命,不僅要具備設計自身軟件的進化能力,還能設計自身硬件。

很多銀行、醫院等都在引入人形智能機器人,來增加用戶的體驗感。具體到手語數字人,作為未來在社交、電商、直播、客服、導游等領域的服務載體,企業與聽障用戶交互的關鍵入口,如果只能通過軟件來互動,顯然是不夠方便。

但是,開發一個人形手語機器人又涉及到一個相當漫長且復雜的產業鏈,很容易讓企業望而卻步。

百度智能云曦靈此次發布的全離線一體機V3以及端云結合一體機P3,搭載了“AI手語平臺”的核心功能, AI手語數字人可以像手機電腦一樣被快速、批量生產,到線下生活的各個角落中服務聽障人群。

其中本地全離線一體機,在一些網絡情況不佳的區域,比如偏遠的山村、景區等地,依然能夠進行手語翻譯、人像渲染等操作,提供文本轉手語、語音轉手語等服務。

端云結合一體機,則通過云端計算+本地渲染的形式,也能靈活地實現手語服務。

第三座大山,則是進化之難。

衡量一個數字生命的標準之一,就是具備自主學習、自主適應、自我進化的能力,這需要全面的AI能力支撐。目前,整個手語機器人的產業鏈還沒有被完全打通,盡管一些企業打出了“手語數字人“的概念,但只能在部分場合、部分視頻中露臉。

推動手語數字人在真實的產業場景之中不斷升級,是AI產業化中必不可少的一種能力。在中國的AI科技企業當中,像百度這樣具備從底層算力、開發框架到產業解決方案的全棧AI能力的公司,并不多見。

目前看來,百度的全棧AI能力融入到百度智能云曦靈當中,給數字人升級能力帶來了無限潛力,也將加速手語數字人這一“新物種“的全場景覆蓋。

通過與產業的深度融合,手語數字人也將變得越來越復雜和聰明,進化成為真正的數字生命。

目前,我國有近2780萬聽障人士,而手語翻譯老師只有1萬人左右,許多場景中無法快速跟上手語服務,在飛速發展變化的社會中,很容易造成新的不公平。

而百度智能云曦靈的AI手語平臺,讓手語數字人的規模化復制變得更加可行;“AI手語平臺一體機”,讓數字人技術帶來的體驗更加豐富和多元。

數字生命的平臺化復制,是社會責任不會變成空談的前提,意味著商業價值與技術普惠的一次和解,也預示著手語數字人市場的快速打開。

AI產業的無形之變:手語數字人帶來的連鎖反應

平臺化和軟硬一體,規模復制的產業落地效率與直觀的體驗價值,讓百度智能云曦靈在手語數字人的競爭中,已經獲得了先發優勢。

技術無障礙除了讓殘障群體受益,還將給企業自身和整個產業帶來意想不到的收獲。手語數字人的普及,換來的是AI受眾的擴大和手語服務的延展,會讓許多我們習以為常的場景出現明顯的擴容與創新,并引發一系列連鎖反應。

首先,AI手語解決方案不斷復制到各行各業,讓聽障人士樂于去用,企業和機構樂于引入手語服務,讓手語數字人的落地場景會愈加豐富,在公益屬性、社交、傳播營銷等領域的價值將一一顯現。

其次,數字人作為公認的虛擬世界入口,帶來巨大的商業空間,已經成為互聯網科技企業的下一幕競爭焦點。搶占數字人規模化生產的機遇,培養B端市場的信任感與忠誠度,有助于在接下來的市場競爭中占據優勢。

更進一步,百度智能云曦靈在技術的領先性和全面性,決定了其有資格參與甚至主導數字人行業標準的建立,將吸引大量開發者和產業鏈上下游加速匯聚到生態體系內,推動技術不斷迭代和應用持續創新,預先探索數字人的商業模式,帶動云計算、AIoT等領域的增長,對于中國數字經濟的發展有著重要作用。

以前提到智能科技,大家可能更多地關注獨角獸、投融資、數字經濟等宏大概念,而現在,手語數字人這樣的智能新物種,正在給殘障群體日常生活中的“小事”帶來便利。

從冬奧主播到AI手語平臺,百度智能云曦靈向世界證明,只需要打開一個通道、接通一座橋梁,技術紅利就可以源源不斷地匯聚到那些需要它的人群當中。

許人類一個更美好的未來,這或許是AI故事里,最溫暖人心的章節。

審核編輯:符乾江

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39878

    瀏覽量

    301530
  • 人工智能
    +關注

    關注

    1817

    文章

    50106

    瀏覽量

    265561
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    邊緣AI算力臨界點:深度解析176TOPS香橙派AI Station的產業價值

    Jetson之外的國產算力選擇。 五、產業定位與橫向對比 在當前的AI硬件版圖中,OrangePi AI Station的定位非常清晰:填補了“AI PC”與“工業邊緣站”之間的空白。
    發表于 03-10 14:19

    靈境智源登陸香港國際AI藝術節,以具身智腦重構產業生態

    的國際盛會。靈境智源作為 專注具身智能算力底座系統的創新企業 亮相藝術節,并于同期舉辦的“機器人產業AI投資論壇2025”中發聲,展現中國在具身智能核心賽道的技術思考與產業布局。 智腦賦能:當機械臂學會“
    的頭像 發表于 12-23 11:06 ?294次閱讀
    靈境智源登陸香港國際<b class='flag-5'>AI</b>藝術節,以具身智腦重構<b class='flag-5'>產業</b>生態

    多模態大模型驅動的復雜環境精準導航避系統平臺的應用

    多模態大模型驅動的復雜環境精準導航避系統平臺的應用
    的頭像 發表于 12-22 13:15 ?293次閱讀
    多模態大模型驅動的復雜環境精準導航避<b class='flag-5'>障</b>系統<b class='flag-5'>平臺</b>的應用

    2025廣州自由職業者AI智能體共創盛會圓滿落幕

    2025年12月6日,由自由職業者社群服務商自雇自足、AIoT平臺服務商機智云、扉行器無界社區3.0聯合發起的“AI共生&無界創想”自由職業者AI
    的頭像 發表于 12-09 11:20 ?703次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內容總覽

    ,其中第一章是概論,主要介紹大模型浪潮下AI芯片的需求與挑戰。第二章和第三章分別介紹實現深度學習AI芯片的創新方法和架構。以及一些新型的算法和思路。第四章是全面介紹半導體芯產業的前沿技
    發表于 09-05 15:10

    OpenAI開源模型登陸IBM watsonx.ai開發平臺

    OpenAI 已向公眾發布了兩款 AI 模型,允許開發者和企業可自由下載、運行并進行定制。其中一款模型現已部署在 IBM watsonx.ai 開發平臺上。
    的頭像 發表于 08-26 15:36 ?1026次閱讀

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    》,講述了AI芯片的基礎知識,包括原理、種類、廠商、產業等概況,展望新技術與研究應用。 《AI芯片:前沿技術與創新未來》出版后獲得了“憶阻器之父”蔡少棠教授的力薦,當時他認為“這是一本關于深度學習和神經形態
    發表于 07-28 13:54

    信而泰×DeepSeek:AI推理引擎驅動網絡智能診斷邁向 “自愈”時代

    網絡智能診斷平臺。通過對私有化網絡數據的定向訓練,信而泰打造了高性能、高可靠性的網絡診斷模型,顯著提升了AI輔助診斷的精準度與實用性。該方案實現了網絡全流量深度解析能力與AI智能推理分
    發表于 07-16 15:29

    CES Asia 2025蓄勢待發,聚焦低空經濟與AI,引領未來產業新變革

    Asia 2025 的舉辦,將為全球科技產業的發展注入新的動力。通過深入探討低空經濟與人工智能的技術突破、應用落地、政策監管與投資機遇,有望推動這兩大領域實現跨越式發展,引領未來產業的新變革。讓我們共同期待這場科技盛會的到來,
    發表于 07-09 10:29

    安森美展示專業數字助聽器和OTC輔設備解決方案

    隨著國內老齡化程度加劇以及對群體關懷的日益增強,功能更強大、體驗更人性化的助聽器正加速進入市場。智研咨詢公開資料顯示,當前我國助聽器市場規模已達約65億元。展望未來,隨著照護需
    的頭像 發表于 06-17 16:55 ?1549次閱讀
    安森美展示專業數字助聽器和OTC輔<b class='flag-5'>聽</b>設備解決方案

    實現生態與技術雙贏!CANN如何拿下AI開發平臺的深度較量

    AI
    腦極體
    發布于 :2025年06月13日 20:39:28

    【「零基礎開發AI Agent」閱讀體驗】+讀《零基礎開發AI Agent》掌握扣子平臺開發智能體方法

    儲備。然后介紹AI Agen的主流平臺,接著說明了扣子平臺開發AI Agent的流程和策略,然后對其插件、工作流、圖像流、知識庫等功能模塊進行了詳細概述。并就5大場景,11個開發案例分
    發表于 05-14 19:51

    大象機器人攜手進迭時空推出 RISC-V 全棧開源六軸機械臂產品

    集成于同一硬件平臺。內置RISC-V AI核,接入ONNXRuntime加速框架,可快速部署Transformer、CNN等主流算法,實現視覺跟蹤、語音交互與自主決策的一體化應用。 低門檻開發 提供
    發表于 04-25 17:59

    首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手

    應用開發不用“等平臺”,徹底釋放開發效率和模型接入自由度。 自DeepSeek橫空出世以來,這種更適合端側部署,回答效率更高效的訓練模式快速引爆了AI行業,主流大模型紛紛加強了推理能力。天璣A
    發表于 04-13 19:52

    RDK加持的導盲眼鏡:視人士的“眼睛外掛”

    指路,讓視朋友走哪都心里有數。智能瞳行不僅讓視人士自由穿梭于大街小巷,還讓他們更好地感受世界的變化和精彩——昆明理工大學津橋學院:智能瞳行團隊一、核心功能:Y
    的頭像 發表于 03-14 19:43 ?1442次閱讀
    RDK加持的導盲眼鏡:視<b class='flag-5'>障</b><b class='flag-5'>人士</b>的“眼睛外掛”