国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

阿里讀唇AI幫助5億聽障人士

汽車玩家 ? 來源:venturebeat ? 作者:venturebeat ? 2019-12-06 16:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

阿里又出黑科技。新的唇語閱讀 AI 系統在識別準確率表現上不僅超越基線標準,也優于專家級人類水平,有望為全球近 5 億聽障人士帶來福音。

阿里巴巴又出黑科技,AI 看唇語知內容!

實際上,能夠從視頻中讀取嘴唇的 AI 和機器學習算法并沒有什么不同。早在 2016 年,來自 Google 和牛津大學的研究人員就詳細介紹了一種系統,該系統可以 46.8% 的準確度注釋視頻錄像,這個表現明顯優于專業唇語識別人士 12.4% 準確度。但是,即使是最先進的系統,也難以克服唇語識別時的歧義問題,這使唇語 AI 的性能一直難以超越音頻語音識別

為了追求更好的性能,浙江阿里巴巴公司和史蒂文斯理工學院的研究人員聯合設計了一種方法,稱為 LIBS,該方法利用從語音識別器中提取的特征作為唇語識別時的補充信息。研究人員表示,LIBS 系統在兩個基準測試中都達到了業界領先的準確度,在識別字符錯誤率方面,LIBS 分別較基線性能高出 7.66% 和 2.75%。

LIBS 和其他類似的解決方案一樣,都可以幫助聽障人士觀看缺少字幕的視頻。據估計,全世界有 4.66 億人患有失能性聽力障礙,約占世界人口的5%。根據世界衛生組織的數據,到 2050 年,這一數字可能會超過 9 億。

LIBS 會從說話人的視頻中以多種不同尺度提取有用的音頻信息,包括序列級、上下文級和幀級。然后,系統會識別這些信息之間的對應關系,將數據與視頻數據進行對齊(由于開頭或結尾有時會出現采樣率不一致、視頻和音頻序列的長度不一致等情況),并利用過濾技術來優化蒸餾功能。


LIBS 系統架構示意圖

LIBS 的語音識別器和口語閱讀器組件均基于注意力的 seq2seq 體系結構,這是一種機器翻譯方法,可將序列的輸入(即音頻或視頻)映射到帶有標簽的輸出和注意力值上。研究人員對上述內容在 LRS2 和 CMLR 數據集上進行了訓練,LRS2 包含來自 BBC 的 45000 多個口語句子,CMLR 則是最大的中文普通話口語語料庫,包括了來自中國網絡電視臺網站的 10 萬余個自然句(包括 3000 多個漢字和 20000 多個短語)。

不過,研究團隊也表示,由于某些句子長度太短,該模型難以在 LRS2 數據集上實現“合理的”結果。(解碼器從少于 14 個字符的句子中提取相關信息時會遇到困難。)但是,一旦對最大長度為 16 個單詞的句子進行了預訓練,解碼器將可以通過對上下文級別的知識進行設置,提高 LRS2 數據中句子結尾部分的質量。

研究人員在描述其工作的論文中寫道:“ LIBS 減少了對無關框架的關注。” “幀級知識提煉進一步提高了視頻幀特征的可分辨性,使注意力更加集中。”

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39820

    瀏覽量

    301497
  • 語音識別
    +關注

    關注

    39

    文章

    1812

    瀏覽量

    116065
  • 阿里
    +關注

    關注

    6

    文章

    465

    瀏覽量

    34198
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    3800AI Infra!阿里CEO:AGI只是階段,ASI才是終極目標!

    電子發燒友網報道(文/梁浩斌)“大模型是下一代的操作系統,阿里選擇將通義千問打造成AI時代的安卓系統” “AI將會替代能源的地位,成為最重要的商品” “正如電曾經放大了人類物理力量的杠桿,ASI將
    的頭像 發表于 09-25 10:14 ?8336次閱讀
    3800<b class='flag-5'>億</b>投<b class='flag-5'>AI</b> Infra!<b class='flag-5'>阿里</b>CEO:AGI只是階段,ASI才是終極目標!

    阿里放大招:自研AI芯片100%國產,不用臺積電代工

    電子發燒友網報道(文 / 吳子鵬)8 月 31 日晚間,有消息稱阿里云通義千問大模型面臨算力缺口,阿里緊急追加寒武紀思元 370 芯片訂單至 15 萬片。然而,該消息隨后不久便被阿里云相關人士
    的頭像 發表于 09-03 09:17 ?1.1w次閱讀

    阿里、高盛唱衰AI基建,國產服務器產業鏈竟悶聲發大財

    的開發工具、操作系統以及數據管理工具等,都將因此而受益。 ? 不管是美國的5000美元的“星際之門”計劃,還是歐盟達到2000歐元的InvestAI計劃,亦或是日本的10萬億日元投資,以及國內超過萬億元的投入,都證明對AI
    的頭像 發表于 03-27 00:10 ?2781次閱讀

    比Google更快!阿里千問率先推出AI購物、點外賣,全面打通阿里生態

    1月15日,在阿里千問產品迭代發布會上,阿里巴巴集團副總裁、阿里千問C端事業群總裁吳嘉宣布,阿里千問App宣布全面接入淘寶、支付寶、淘寶閃購、飛豬、高德等
    的頭像 發表于 01-15 14:39 ?7350次閱讀
    比Google更快!<b class='flag-5'>阿里</b>千問率先推出<b class='flag-5'>AI</b>購物、點外賣,全面打通<b class='flag-5'>阿里</b>生態

    新大陸NLS Soldier300N工業碼器:AI賦能工業碼新標桿

    在工業自動化浪潮下,高效精準的碼需求日益迫切,新大陸NLSSoldier300N工業碼器作為一款性能卓越的AI智能讀碼器,正以強大實力重塑工業碼場景。這款工業級固定掃碼器憑借前沿
    的頭像 發表于 01-14 14:31 ?235次閱讀
    新大陸NLS Soldier300N工業<b class='flag-5'>讀</b>碼器:<b class='flag-5'>AI</b>賦能工業<b class='flag-5'>讀</b>碼新標桿

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦一下?

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦一下?直接發個安裝包,謝謝。比如deepseek、Chatgpt、豆包、阿里AI、百度AI
    發表于 07-09 18:30

    AI大模型加速上車,聯手高通,阿里有哪些策略?

    系列模型衍生數量超Llama,三大方向形成 阿里巴巴的“AI大模型” 通義千問大模型最初于2023年4月7日開始邀請測試,并在2023年4月11日的阿里云峰會上正式揭曉。徐棟在會議上提及,阿里
    的頭像 發表于 07-03 01:10 ?9091次閱讀
    <b class='flag-5'>AI</b>大模型加速上車,聯手高通,<b class='flag-5'>阿里</b>有哪些策略?

    阿里2025財年業績:凈利潤大漲77%,AI+云業務攬下千億收入

    (電子發燒友網綜合報道)6月26日,阿里巴巴發布了2025財年年報:2025財年,阿里巴巴營收達到9963.47元,同比增長6%;凈利潤達到1259.76元,同比大增長77%,創下
    的頭像 發表于 06-28 00:10 ?8575次閱讀
    <b class='flag-5'>阿里</b>2025財年業績:凈利潤大漲77%,<b class='flag-5'>AI</b>+云業務攬下千億收入

    安森美展示專業數字助聽器和OTC輔設備解決方案

    隨著國內老齡化程度加劇以及對群體關懷的日益增強,功能更強大、體驗更人性化的助聽器正加速進入市場。智研咨詢公開資料顯示,當前我國助聽器市場規模已達約65元。展望未來,隨著
    的頭像 發表于 06-17 16:55 ?1541次閱讀
    安森美展示專業數字助聽器和OTC輔<b class='flag-5'>聽</b>設備解決方案

    【「零基礎開發AI Agent」閱讀體驗】+《零基礎開發AI Agent》掌握扣子平臺開發智能體方法

    儲備。然后介紹AI Agen的主流平臺,接著說明了扣子平臺開發AI Agent的流程和策略,然后對其插件、工作流、圖像流、知識庫等功能模塊進行了詳細概述。并就5大場景,11個開發案例分別從功能,使用場
    發表于 05-14 19:51

    阿里稱要把AI融入每一塊業務 蔡崇信稱電商和云+AI是方向

    阿里和馬云的消息總是被人關注,前幾天還有爆料稱馬云即將回歸阿里,后來被馬云辟謠。 現在我們看到一個關于阿里AI的消息,在第21個“阿里日”;
    的頭像 發表于 05-12 15:32 ?873次閱讀

    【「零基礎開發AI Agent」閱讀體驗】+關于AI Agent開發入門的第一印象與相關官方文檔和社區資料的內容補充

    今天有幸收到了電子發燒友寄來的由中國工信出版集團和電子工業出版社聯合出版的關于AI Agent開發的《零基礎開發AI Agent》的新書,不禁高興雀躍,以下是我拍下的書的頁封和背面: 大家可以看到
    發表于 04-22 18:16

    廣和通亮相阿里AI創造力大展

    4月9日-12日,2025 AI“巨”場· 中國AI創造力大展在北京首創·郎園Station盛大啟幕。作為阿里云的重要合作伙伴,廣和通攜融合通義千問本地端側與云端大模型的全棧式AI產品
    的頭像 發表于 04-12 14:09 ?1618次閱讀

    RDK加持的導盲眼鏡:視人士的“眼睛外掛”

    我國有超1700萬視人士,如何讓他們更安全、自主地出行?別擔心,智能瞳行來啦!這是一款“自帶外掛”的導航神器,集成了高精度視覺傳感和YOLO算法,實時識別障礙物、行人、交通標志,并通過語音播報精準
    的頭像 發表于 03-14 19:43 ?1439次閱讀
    RDK加持的導盲眼鏡:視<b class='flag-5'>障</b><b class='flag-5'>人士</b>的“眼睛外掛”

    Manus與阿里通義達成合作

    據媒體報道,火爆異常的AI Agent新秀Manus和阿里云旗下大語言模型通義千問達成合作。雙方將基于通義千問系列開源模型,在國產模型和算力平臺上實現Manus的全部功能;雙方將共同推動通用智能體
    的頭像 發表于 03-12 15:47 ?1489次閱讀