伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI為方,產業為向:京東云數字人的技術攀爬

腦極體 ? 來源: 腦極體 ? 作者: 腦極體 ? 2022-11-02 05:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今年11.11正如火如荼進行中,各大平臺的直播間,大家可能已經發現了一群新面孔——數字人主播。電商直播作為越來越強大的流量入口,幾乎已經成了零售品牌和商家們的必爭之地。而高昂的坑位費、主播參差不齊的業務能力、不確定的ROI、復雜的內容創作和監管機制……也都是直播經濟真實存在的另一面,讓商家們為之犯愁。

這時候,數字人就成了不錯的選擇。來看看下面兩位主播,你能分得清哪個是真人嗎?

0c306a0c223a4a88a45bce61e3df5e09~tplv-tt-shrink:640:0.image

這樣擬人化交互、24小時在崗、內容可控、可快速上線帶貨的數字主播,解決了許多商家備戰11.11的難題,也刷新了大眾對數字人的新認知。

近兩年來,很多企業都推出了各自的數字人及平臺,有強調技術優勢和大模型的云或AI公司,有占據終端交互入口的手機IoT廠商,也有強調內容創作能力的虛擬偶像公司……

百花齊放的數字人,逐漸開始同質化競爭,這時候,企業往往會結合各自的核心能力,為數字人選擇不同的發展策略和市場動作。

在11月1日,2022京東云城市峰會上海站正式舉行,京東云宣布數智供應鏈正加速落地十大產業場景,其中服務場景就是京東云言犀的主場。可以看到,與數智供應鏈融合是AI走向產業的必經之路,也為言犀平臺的一百多個數字人員工,創造了在產業中發光發熱的機會。

大浪淘沙的競爭中,數字人正在命運的分岔路口,奔赴各自的前程。我們不妨借著11.11的契機,來共同審視一下數字人產業,在消費之余,收獲一些關于未來的重要線索。

走出恐怖谷,數字人才有可能

如果你認為大多數數字人都能應聘上崗、獲得產業客戶的認可,那絕對是太樂觀了。高度擬人化、交互性的數字人,需要同時具備語音語義、視覺、情感、自然語言處理、知識圖譜、對話交互等綜合能力,不能有短板,這是數字人能夠長期發展的前提和基礎,也是極少數數字人能夠達到的能力。

大家可能聽說過“恐怖谷效應”,就是一些形象上酷似真人的機器人或智能體,但實際交互能力卻很差,經常出現答非所問等問題。對下當下的數字人產業的發展,大家肯定希望它們在外形上具有更高的擬真度,同時在交互體驗上也具備較強的宜人性,即能夠理解用戶、擁有人類一樣的情感和表達。

言犀數字人虛擬主播為什么能夠做到真人主播的效果呢?就源自京東云言犀團隊執著地解決著數字人的核心技術問題,從兩個方面取得突破:

惟妙惟肖之身——多模態智能技術。也就是語音、文字、表情、手勢、肢體等多模態,能夠一體化協同,這樣能讓數字人的擬真度更高,避免一些明顯的違和感。面容上,言犀自研的3DNeuralRender神經渲染器,可以高保真地合成主播面部細節,達到以假亂真的效果;動作上,言犀研發的動作合成方案,基于RIFE插幀多插入點的快速動作過渡,可以讓數字人的動作更加流暢自然;互動中,2D及超寫實、高精度3D數字員工驅動方案,可以實現音唇精準同步,數字人說話時,牙齒甚至牙縫都要精準地對齊口型,這樣才不會看著別扭。可以說,惟妙惟肖的數字人需要多模態的綜合性技術能力。

善解人意之心——實時人機交互技術。數字人也不能只是“花瓶”,還要能夠與用戶實時互動,做出合乎邏輯的反應,這種數字人則更加稀少了,因為難度也高了一個數量級。首先,實時交互需要快速的動作、表情渲染,對AI生成的速度和質量要求非常高;其次,實時互動意味著很多反應不能事先生成,而要真正理解用戶的想法和需求,給出精準的回答,這就要求數字人具備豐富且細粒度的知識突破、自然語言理解、情感計算等能力。比如用戶想了解A商品和B商品的異同,需要數字人主播精準地抓住顧客心理、比對信息、找到賣點,生成有吸引力的文案。為此,基于京東云言犀人工智能應用平臺,在智能多模態對話與交互領域提出了理解準確度、知識覆蓋度、交互流暢度、情感關懷度、任務完成度5維為標準的“新圖靈測試”體系,作為人機交互服務機器人的標準,也是數字人的核心能力。

走向產業,數字人才有價值

只有一個技術支點,能撬動起數字人的市場價值嗎?至少在京東云言犀團隊看來,數字人與產業需求相結合,才能真正成為游戲規則的改變者。京東集團副總裁、智能產品與服務部總裁,IEEE Fellow何曉冬博士指出,數字人作為一種AIGC內容生產模式,目前成本還是比較高的,把數字人能力下放到每一個商家手中,這是AIGC的機會所在。

從實驗室到產業,需要邁過三個門檻。

第一重門檻:技術的可用性。

言犀數字人虛擬主播關鍵技術都達到國際的領先水平,包括多粒度韻律增強的語音合成、知識指導的多模態可控文本生成、可解釋的多輪對話決策推理,取得過多項AI學術比賽冠軍。但這只是數字人產業化的第一步。在現實業務場景中,會出現各種意想不到的情況。這時候,京東云技術在京東內外部多種大規模業務中經受過考驗,就發揮了非常重要的試煉作用,讓數字人技術能夠真正為產業所用。

比如2021年12月,江南農商銀行與京東云共同合作推出的VTM數字銀行柜員,不僅形象要好,還要懂銀行基本業務,這就需要金融類知識計算;銀行作業環境噪音比較大,來辦理業務的當地用戶有的帶有方言口音。另外,銀行柜員需要跟客戶實時交互,需要處理動態文本數據,依靠靜態數據庫訓練出來的算法可能魯棒性不足……

言犀歷經數十年京東618、11.11等大規模交互場景考驗,沉淀了業界超大的場景知識圖譜,模型遷移速度快,穩定性高,這也使得該VTM數字銀行柜員順利落地,具有極強的適配性,可以獨立閉環完成銀行業務交易場景的自助應答、業務辦理、主動服務、風控合規等全流程服務,幫助銀行解決柜員接待能力不足的問題。

還有一些問題是落地之后發現的,數字人的自然語音語義交互需要綜合深度的技術突破才能解決。言犀為大同12345提供政務熱線解決方案的過程中,就發現實際交互是很復雜的,比如為了避免數字人搶話,一般會讓來電者說完,數字人再接著說,但停頓時間又不能太長,讓對方覺得互動不及時。但實際接聽市民熱線時發現,很多老年市民停頓很長,說著說著就停頓一下,數字人問“昨天有沒有打疫苗”,對方回答“昨天啊……(停頓一秒)好像沒有”,這個一秒的停頓對于數字人來說都是理解上的挑戰,言犀技術團隊就嘗試通過跨模態技術,在斷斷續續的情況下也能準確地理解用戶意圖,技術創新領先于國際一流的學術型AI機構。所以說,從產業中來、到產業中去的數字人,才能真正為產業所用。

第二重門檻:技術的可控性。

是不是各類比賽中分數越高的AI就越厲害,打造的數字人就更強呢?其實比起技術收益有多大,技術風險的可控反而是企業更在意的,尤其是直播、問答這樣實時性非常強的內容型互動,對于AIGC內容生成的可控性要求非常高,數字人主播如果說錯了信息,導致丟單或直播中斷,都是企業不希望看到的。如何保證數字人的輸出是可控的?言犀從京東復雜業務場景中深度解耦而來,京東云花了很多精力讓言犀數字人虛擬主播的各類AI模型真正可控、可解釋。目前,言犀已經累計生成了30億字的文字,人工審核通過率95%。言犀平臺的言犀數字人虛擬主播就具備很好的可解釋性,能夠為商品生成長文案和直播劇本,除此之外,言犀多模態數字人平臺還有100多款虛擬數字人形象,在銀行業務辦理、政務服務等場景大規模落地,這些場景都對技術可控性要求很高。

可以說,比起實驗室里神乎其神的屠龍術,可控可解釋的數字人,才是產業和企業更歡迎的務實型員工。

第三重門檻:技術的投入產出比。

數字人進入產業是要幫助企業降本增效、帶來正收益的,如果資源消耗巨大、開發成本高、維護費心費力,也會阻礙數字人走向產業的腳步。為了降低數字人規模化落地的成本,讓企業輕輕松松就能用上數字人,京東云言犀做了兩件事:一是建立完善的形象庫,擁有包括2D真人、3D卡通、超寫實等多種數字人形象。基于基礎建模,就可以快速生成各類個性化數字人,帶貨各種各樣的商品,美妝、母嬰、電子3C等類型主播應有盡有,大大解決了優質主播數量不足、直播時間有限等限制。

0d41a2cc646d464ebd9f14d2424d9aac~tplv-tt-shrink:640:0.image

二是堅實的人工智能應用平臺。京東云言犀人工智能應用平臺,承載著語音與聲學、視覺感知、情感計算、語義理解與生成、知識圖譜、多輪對話等六個核心領域的技術能力,通過API和產品化等多種形式向外規模化輸出,就保障了技術的可用性和低成本。

走向云宇宙,數字人的未來

元宇宙本質上是多種數字虛擬技術的集合體,作為一個略宏觀和遙遠的概念,何曉冬直言,我們在解決產業元宇宙的技術挑戰,還處于比較早期的階段。

對于產業元宇宙,京東云的技術人員是篤定地,也是低調的。

篤定,可能來自兩方面的原因:一是數字人之于數智供應鏈的價值。作為更懂產業的云,京東云致力推動數智供應鏈服務于千行百業,推動實體經濟與數字經濟的融合與協同發展。數字人作為交互入口,可以應用在大量數實融合的業務場景,實現數字世界和物理世界的無縫融合,比如數字主播、智能客服、工業人機互動、景區導游、社區養老服務員等等,數智供應鏈為數字人提供了獨一無二的產業土壤。

二是數智供應鏈之于產業的價值。數智供應鏈是京東19年轉型實踐反復驗證和凝練的一套完整的能力體系,本身涉及的產業環節足夠多,需要用到大量綜合性技術,比如京東的智能云倉,就需要AI、大數據、云計算來一起聯合運作。越來越多的企業借由數智供應鏈開展數字化,自然也讓數字人有了更多用武之地,有機會孕育出更多顛覆性創新,進一步放大了言犀數字人的技術優勢和商業價值。

而低調,則源于京東云對產業元宇宙的理性預期。目前,產業元宇宙尚處于早期階段,用何曉冬的話來說:我們在地平線上看到了元宇宙的曙光,但抵達的過程中還有很多技術鴻溝,有時候需要很大的技術突破才能解決。所以,京東云更希望著重于底層能力和行業應用的建設,以供應鏈為主軸,積累和打磨產業元宇宙所需要的各類數字技術。顯然,數字人作為一個深度學習、多模態學習、人機交互等技術的綜合產物,將在京東云技術研發戰略中占據重要位置,成為產業元宇宙技術創新的策源地之一。

從這個角度看,產業元宇宙和言犀數字人,將在數智供應鏈的牽引下彼此靠攏、相互成就,最終融于一體、密不可分。攜帶著產業勢能與技術進化的言犀多模態數字人,自然有能力走得更遠、更久。

百花齊放的數字人,將在同質化競爭加劇的時刻走到分岔路口,沿著各自的選擇走出差異化的道路。接下來,大家可能會看到同為數字人,卻是截然不同的存在,有的作為網紅明星曇花一現,有的在產業世界里靜水流深,成為數字生活不可或缺的一部分。

岔路口的差異化選擇,將決定不同數字人的終局。而京東云言犀,正在向產業加速飛奔。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人機交互
    +關注

    關注

    12

    文章

    1294

    瀏覽量

    58057
  • AI
    AI
    +關注

    關注

    91

    文章

    40538

    瀏覽量

    302144
  • 人工智能
    +關注

    關注

    1819

    文章

    50200

    瀏覽量

    266371
  • 京東
    +關注

    關注

    2

    文章

    1124

    瀏覽量

    50133
  • 元宇宙
    +關注

    關注

    13

    文章

    1411

    瀏覽量

    12742
  • 數字人
    +關注

    關注

    0

    文章

    159

    瀏覽量

    2580
  • 京東云
    +關注

    關注

    0

    文章

    211

    瀏覽量

    268
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    華為架構大調整,波及千名員工,All in AI能否扭虧

    )產品線下的盤古大模型相關部門被明確撤銷。 ? 與此同時,有消息顯示,調整后的華為將聚焦3+2+1業務,其中3通算、智算、存儲,2AI PaaS、數據庫,1
    的頭像 發表于 08-26 09:22 ?7746次閱讀

    邊緣AI算力臨界點:深度解析176TOPS香橙派AI Station的產業價值

    310P芯片的底層架構,深度剖析這款產品的技術細節、算力門檻及其在實際產業落地中的真實價值。 一、176TOPS的產業門檻:為何這是邊緣算力的新起點? AI硬件的核心指標始終是算力,但
    發表于 03-10 14:19

    華為推動電信加速AI基礎設施演進

    AI Native新范式。Linux基金會、CNCF、ETSI、TM Forum等組織已相繼開展相關研究與標準制定,持續完善技術框架與產業生態,A
    的頭像 發表于 02-27 09:43 ?335次閱讀

    2025年曙光以全棧可信平臺行業智能化鋪就安全之路

    2025年,隨著“十四五”規劃走向縱深,各關鍵行業智能化轉型進入攻堅階段。圍繞政企客戶在AI創新、安全合規、遷移適配等方面的核心需求,曙光以全棧能力基石,以場景化解決方案
    的頭像 發表于 01-07 09:36 ?423次閱讀

    3D-Micromac CEO展望2026半導體:AI 核,激光微加工賦能先進封裝

    封裝等代表的技術創新,和以 AI 數據中心、具身智能、新能源汽車、工業智能、衛星通信、AI 眼鏡等代表的新興應用,開啟了新一輪的
    發表于 12-24 10:00 ?5011次閱讀
    3D-Micromac CEO展望2026半導體:<b class='flag-5'>AI</b> <b class='flag-5'>為</b>核,激光微加工賦能先進封裝

    高壓放大器在機器攀爬速度測試實驗中的應用

    實驗名稱: 機器攀爬速度測試實驗 研究方向: 機器創新攀爬機制、柔性驅動與機身設計、精密制造工藝開發 實驗目的: 本實驗是對制造出的柔性爬桿機器
    的頭像 發表于 11-26 10:48 ?325次閱讀
    高壓放大器在機器<b class='flag-5'>人</b><b class='flag-5'>攀爬</b>速度測試實驗中的應用

    BOE(京東方)“煥新2026”年終媒體智享會首站落地上海 AI煥新重塑顯示行業新范式

    智而行”,深度解析BOE(京東方)AI技術賦能研發、制造、產品與運營全鏈路的實踐成果,不僅為后續系列活動的展開奠定了堅實基礎,更向行業清晰傳遞了BOE(京東方)以
    的頭像 發表于 11-21 12:04 ?444次閱讀
    BOE(<b class='flag-5'>京東</b>方)“煥新2026”年終媒體智享會首站落地上海 <b class='flag-5'>AI</b>煥新重塑顯示行業新范式

    一文讀懂京東技術發展簡史

    文章目錄 前言 京東發展歷程 京東商城技術的演進 京東自研技術 京東前端框架Nerv
    的頭像 發表于 11-10 13:53 ?1020次閱讀

    AI算力數字標牌D77:營銷活動注入智慧大腦

    AI算力數字標牌D77在流量紅利見頂的今天,營銷活動就像一場戰役,品牌無不絞盡腦汁,追求精準觸達、高效轉化與效果可衡量,然而,傳統的數字標牌,更像是一塊單向播放的屏幕,而非一個能夠感
    的頭像 發表于 09-26 17:48 ?1795次閱讀
    <b class='flag-5'>AI</b>算力<b class='flag-5'>數字</b>標牌D77:<b class='flag-5'>為</b>營銷活動注入智慧大腦

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+半導體芯片產業的前沿技術

    我們重點介紹了AI芯片在封裝、工藝、材料等領域的技術創新。 一、摩爾定律 摩爾定律是計算機科學和電子工程領域的一條經驗規律,指出集成電路上可容納的晶體管數量每18-24個月會增加一倍,同時芯片大小也
    發表于 09-15 14:50

    全棧AI智而生 | 拓維信息攜手芯鴻數智亮相2025世界智能產業博覽會

    9月5日-9月8日,2025世界智能產業博覽會(簡稱:智博會)在重慶成功舉行。本屆智博會以“智匯八,博采眾長”理念,聚焦“人工智能+”與“智能網聯新能源汽車”主題,既是全球智能產業
    的頭像 發表于 09-09 18:34 ?1595次閱讀
    全棧<b class='flag-5'>AI</b>,<b class='flag-5'>向</b>智而生 | 拓維信息攜手芯鴻數智亮相2025世界智能<b class='flag-5'>產業</b>博覽會

    睿海光電800G光模塊助力全球AI基建升級

    在全球數字化轉型加速的背景下,超高速光模塊作為數據中心與AI算力網絡的核心部件,正經歷從400G800G、1.6T的迭代浪潮。在這一賽道中,深圳市睿海光電科技有限公司(以下簡稱“睿海光電”)憑借
    發表于 08-13 19:05

    睿海光電以高效交付與廣泛兼容助力AI數據中心800G光模塊升級

    400G/800G光模塊已實現規模化量產,并基于AI工廠與AI的核心需求進行深度優化: 速率突破:采用PAM4調制技術,單通道速率達100Gbps,整模塊實現800Gbps傳輸能力,
    發表于 08-13 19:01

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    的應用。 對半導體芯片產業前沿技術的講解也緊密聯系產業實際,技術從業者提供實踐指導,同時科研
    發表于 07-28 13:54

    廣汽集團與阿里、華為展開深度合作

    AI+”技術正快速汽車產業滲透,廣汽集團通過與阿里、華為等優秀科技企業展開深度合作,持續構建“廣汽
    的頭像 發表于 05-28 15:33 ?1140次閱讀