国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

跨越專業翻譯的語言之墻:百度翻譯的技術攀登

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2022-12-06 09:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作為一個科技從業者,閱讀AI頂會的最新論文、瀏覽國內外創新的最新動向,是我工作的重要部分。平時接觸的開發者、科學家、企業研究人員等,工作生活中也涉及大量專業閱讀。

于是乎,我就會經常聽到這樣的抱怨:

PDF格式的論文,很多翻譯軟件需要手動復制粘貼,效率還不如直接查字典;

不動腦子按段落甚至句子直譯,信達雅一個都沒有,機翻完我還要花時間二次review;

海外開發社區的技術文檔專業詞匯太多,翻譯得不準,好幾天的代碼都白寫了……

這可能是AI技術里非常容易讓人迷惑的地方。近幾年隨著AI技術快速進步,機器翻譯水平也大幅提升,結果一遇到外文文獻、外刊投稿、辦公文檔、商業報告、海外網站技術文檔之類的專業翻譯需求,很多產品還是不能滿足。

這些問題說明,總體可讀可懂,滿足出國旅游、購物娛樂等日常溝通的場景,只是機器翻譯的基本功能。進一步的市場需求,是深度專業內容的跨語言交流,讓商業、科研、技術等專業信息可以實現無縫對接。

跨越這堵語言之墻,也成為一場NLP領域的全球競賽。一直深耕機器翻譯的百度翻譯團隊,從來沒有停止過攀登的腳步。

我們從機器翻譯的新技術動向說起,聊聊百度給機器翻譯帶來的新可能。

機器翻譯的技術攀登:百度引領NMT革新

跨越語言之墻還需要哪些技術突破?想要回答這個問題,有必要先回答:機器翻譯今天發展到哪一步了。

過去幾十年間,人們一直在探索如何使得機器翻譯達到人類的翻譯水平,翻譯方法不斷迭代。基于規則的機器翻譯,依靠人工編纂的雙語詞典和專家總結的規則進行翻譯;基于實例的機器翻譯,從雙語對照的實例庫中選擇與原文相似度高的實例,通過模仿和修改進行翻譯;基于統計的機器翻譯,對翻譯過程進行數學建模,并從大量的訓練數據中自動學習翻譯知識。

變革發生在2014年,通過循環神經網絡(RNN)來對語言向量進行編碼解碼,并且使用長短期記憶網絡(LSTM)來增強長句翻譯能力的神經機器翻譯(NMT),為機器翻譯領域帶來新的研發范式。百度、谷歌、微軟等一批NLP領域的優等生推進深度學習在機器翻譯領域的研發和應用,百度翻譯在2015年發布了全球首個互聯網NMT系統,領先谷歌1年多。現在,大家用翻譯軟件進行日常交流、旅游商務等活動,已經基本沒有問題了。

而專業領域的翻譯想要令人驚喜的進展,總的來說需要做到兩件事:

一是技術突破。推動機器翻譯不斷接近專業翻譯能力。頭部廠商主要從幾個方面努力:1. 預訓練大模型,例如文心、GPT-3、BERT;2. 多語言統一建模和翻譯;3. 面向垂直領域的高精度翻譯模型。其中,百度作為更早進入NMT時代的科技企業,就在機器翻譯技術上取得了國際領先的成果。2020 年,咨詢機構Gartner在 《Hype Cycle for Natural Language Technologies》報告中,就將百度翻譯列為神經網絡機器翻譯標桿機構。

二是產品設計。技術有所突破,還要通過成熟的產品設計和應用體驗,讓用戶感知到專業機器翻譯的價值。一些機器翻譯產品可能技術很強,但由技術人員來主導產品設計,導致用戶體驗很糟糕。在這方面,具備互聯網產品設計相關經驗的廠商,自然能夠更好地實現技術落地。比如百度翻譯就打造了非常豐富的產品矩陣,支持PC端、移動端等各類終端設備,面向C端、B端的多種應用;支持文本、文檔、圖片、語音等多模態翻譯,全方位滿足各種翻譯需求。百度翻譯的產品優勢,讓普通用戶可以低門檻、更便捷地用上專業機器翻譯能力,目前日均響應的翻譯請求已達千億字符

從這個角度來看,百度翻譯是國內少有的,能夠同時占據技術和產品兩個機器翻譯高地的科技企業。那么,百度翻譯究竟是如何翻越專業翻譯的語言之墻?

聳立的語言墻:機器翻譯進入專業領域的三道門檻

你可能會問,機器翻譯都搞了快七十年,怎么專業領域的語言之墻依舊沒有被攻克?

專業信息、學術資源、商業文件等翻譯需求,是一塊巨大的商業蛋糕,同時也是從未被徹底解決的痛點。這是因為專業領域的翻譯,存在“三高”的要求:內容安全要求高、翻譯準確率要求高、翻譯效率與體驗要求高。

內容安全要求高:專業文檔往往涉及到科研創新、商業往來等信息,翻譯過程中需要上傳到云端或軟件服務商的服務器進行操作,一旦硬件來源或軟件使用權受限,或者服務不穩定,都會給專業用戶帶來麻煩和風險。

翻譯準確率要求高:信達雅,信(即翻譯準確率)排在第一位,專業翻譯中存在大量專業單詞、復雜長句子,容易出現歧義,軟件翻譯失之毫厘,內容準確度就謬以千里。

翻譯效率與體驗要求高:翻譯軟件的效率、易用性,直接影響到用戶體驗。很多人可能有這樣的經歷,有的軟件不支持整篇文檔翻譯,手動復制粘貼連分段都不準確,翻譯效果難以直視;有的PDF文檔翻譯成word后,原本的排版被打亂,還需要自己手動調整……這些都給用戶帶來了額外的負擔。

所以,我們就從安全可靠、效果、效率這三個方面,來評測一下百度翻譯的解決思路。

首先,安全可靠。

作為一名知識內容生產者,文檔承載的是我安身立命之本,所以,數據安全幾乎是我是否使用一款翻譯工具的首要考量因素。同理,論文數據之于科研工作者、商業報告之于企業從業者、技術文檔之于工程人員,安全隱私都是至關重要的。

深度學習平臺是每個神經網絡機器翻譯模型的底層技術框架,市面上相當一部分翻譯廠商的底層技術框架仍然使用TensorFlow(美國谷歌)和PyTorch(美國臉書)為代表的海外框架。非國產自研,可能在未來遭遇無硬件可搭載和無框架使用的窘境。

比如在使用海外平臺DeepL的過程中,我就會經常遇到加載緩慢、連接不上的問題。海外翻譯軟件往往需要上傳到海外企業的服務器,比如DeepL上傳的文檔會被發送到美國的Adobe公司。

0a3e42787a2c4c3e8cbac2233560ce4a~tplv-tt-shrink:640:0.image

與之相比,國內翻譯產品就不會遇到這個困擾。以百度翻譯為例,產品基于全面自研的飛槳深度學習框架,同時采用多種措施來保障數據安全,獲得ISO27001等多項國內外權威信息安全管理認證。存儲前,會先進行安全的加密操作;數據傳輸中,采用安全傳輸層協議(TLS),保障保密性和數據完整性,并提供完備的密鑰管理機制和加密措施;用戶刪除數據后,后臺將同步刪除相關內容,不會留存。總體來說,在可靠性和安全性上更有保障。

第二,翻譯效果。

專業翻譯最終要靠結果的“信、達、雅”說話。包括專業術語翻譯是否準確,語序是否流暢連貫,一些特定文化背景的表達是否地道……

可以看到,百度翻譯通過多個專業領域模型,有效增強翻譯準確度。我們隨機選取了《自然》雜志的一篇生物領域論文《A pan-cancer compendium of chromosomal instability染色體不穩定性的泛癌癥綱要》,選擇百度翻譯的“生物醫藥“模型后,結合上下文語義給出了準確的翻譯。可以看到,生物醫藥這類充滿大量專業術語的領域,百度翻譯的結果并沒有讓人失望。

c00cdd27ce7f477cac8369465eef4bf5~tplv-tt-shrink:640:0.image

對于學術文章中復雜的長句子和特定格式,百度翻譯能夠識別論文格式中的各種基本要素,如正文、引用、尾注等,避免錯譯、漏譯。以這篇AAAI 2022的頂會論文《Meta-Learning for Online Update of Recommender Systems》為例,百度翻譯就準確保留了參考文獻引用信息,這對閱讀專業文獻非常有幫助。

3f5b2eef4aeb48ea8c548616da5681bf~tplv-tt-shrink:640:0.image

第三,翻譯效率。

專業領域的機器翻譯,用戶的一個關鍵痛點是:很多地方需要用戶“不厭其煩”地手動操作或反復修改。而擁有十多年翻譯產品經驗的百度,自然也在應用能力上游刃有余。百度翻譯將這些“煩點”一一消解,提升翻譯效率和文檔的可讀性、易讀性,從而減少用戶手動調整、修改的麻煩,將時間精力放在更有創造力的事情上。

首先,百度翻譯支持多種格式文檔,一鍵上傳就能進行全篇翻譯。像PDF這種不能編輯的文檔,可以完整地保留樣式和排版,不需要用戶手動將文字復制粘貼到翻譯軟件中,并且提供整頁預覽模式、逐句對照模式等,不同需求的用戶可以自主選擇來提升效率。

比如下面這份《英國人工智能研發商業化和標準》,這類咨詢機構的商業報告,是很多產業研究者、高校師生、政策制定者等工作學習中的參考讀物,快捷、高效地閱讀體驗,能夠幫大家節省不少時間。將PDF文件一鍵上傳到百度翻譯,就能快速得到準確地譯文,排版格式也與原文保持高度一致,大大方便了閱讀。

d1d0d8bb6c9e4f9aa9d5577785fa1ec9~tplv-tt-shrink:640:0.image

輸入數據的準確性對翻譯結果起到至關重要的影響,文本糾錯是機器翻譯的關鍵能力之一。專業領域容易遇到一些佶屈聱牙、拼寫復雜的專用術語、學術名詞等,百度翻譯的智能糾錯,可以對語句自動檢查、實時提示、自動糾錯,減少人工校驗成本。

此外,百度翻譯通過人機共譯智能增強,語料自動沉淀,機器自動學習,翻譯模型實時增強,逐漸縮小機器翻譯與理想譯文之間的差距,實現越翻越省力,真正提升效率。

英國詩人塞繆爾·約翰遜曾說過,語言是科學的唯一工具。整體來看,百度翻譯已經在專業論文、學術文獻等領域,展現出了強大的翻譯能力,幫專業人士翻越了語言這堵高墻,把語言這個工具交到了每一個需要在專業領域跨語言協作的人手中。

翻山越嶺之后,語言墻背后的宏大場景

從百度翻譯的技術體系和產品設計中,可以看到,機器翻譯要進入專業領域,不光要有技術,還要有較強的產品設計能力,考驗的是企業的綜合實力。機器翻譯進入專業領域,也推動翻譯應用來到了新的賽點。

重建巴別塔。專業領域的語言壁壘,為知識、信息、資源的流動樹立起極高的門檻,比如目前全球有六成以上各類文獻資料和科研論文都是用英文撰寫,其他語種也蘊含著大量的知識寶藏。越來越多的人使用百度翻譯來突破語言的阻礙,讓專業領域的協作沒有障礙,將大大促進全球的知識交流與傳播,支撐科技創新、實現知識公平。

重塑機翻格局。專業領域的機器翻譯,相比生活化場景,有著更高的壁壘與更強勁的需求,無論市場容量、付費意愿、付費潛力,以及用戶忠誠度,都是非常高的。百度翻譯憑借優秀的專業翻譯能力,可以建立起差異化優勢,進入商業化的良性循環,在機器翻譯市場格局中進一步領先。

借助翻譯,人類社會從相互阻隔走向了相互交往。今天,世界科技、經濟與文化更為頻繁地展開交流,面對浩如煙海的信息與知識,僅靠數量有限的專業翻譯人士,很難滿足大眾對專業翻譯的需求。幸好,機器翻譯開辟了一條新的跨語言溝通之路。七十年來,機器翻譯技術不斷迭代,有著旺盛的生命力,那是一代又一代技術人,在為重建巴別塔的理想而不斷努力。

隨著百度翻譯等產品推動機器翻譯向專業領域不斷深入,人們可以展開更專業、更精深的跨語言交流,機器翻譯正成為助力全球交流的一股重要力量。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39758

    瀏覽量

    301366
  • 百度
    +關注

    關注

    9

    文章

    2377

    瀏覽量

    94865
  • 機器翻譯
    +關注

    關注

    0

    文章

    141

    瀏覽量

    15526
  • NMT
    NMT
    +關注

    關注

    0

    文章

    7

    瀏覽量

    3837
  • rnn
    rnn
    +關注

    關注

    0

    文章

    92

    瀏覽量

    7345
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    谷歌推出TranslateGemma全新開放翻譯模型系列

    我們已正式推出 TranslateGemma,這一全新的開放翻譯模型系列基于 Gemma 3 構建,并提供 4B、12B 和 27B 三種參數規模。TranslateGemma 的問世標志著開放翻譯領域邁出了重要一步,它可幫助人們跨越
    的頭像 發表于 02-26 10:22 ?494次閱讀

    百度文心大模型5.0正式版上線

    今天,在百度文心Moment大會現場,文心大模型5.0正式版上線。
    的頭像 發表于 01-23 16:48 ?1286次閱讀

    視美泰發布AI即時翻譯機解決方案,硬核配置+多語種覆蓋破解跨語言溝通難題

    在全球化深入推進與AI技術規模化商用的雙重驅動下,跨語言溝通需求正迎來爆發式增長。近日,視美泰正式發布AI即時翻譯機解決方案,以“核心硬件+智能算法+多模態交互”的完整技術矩陣,依托在
    的頭像 發表于 12-03 10:50 ?1069次閱讀
    視美泰發布AI即時<b class='flag-5'>翻譯</b>機解決方案,硬核配置+多語種覆蓋破解跨<b class='flag-5'>語言</b>溝通難題

    百度世界大會亮點 五年五芯 百度宣布打造最硬AI云

    自2006年以來,百度世界大會已連續舉辦近20屆,百度世界大會是百度每年面向行業、媒體、合作伙伴和廣大用戶的最高級別盛事,作為百度年度最重要的的戰略、
    的頭像 發表于 11-13 15:47 ?1600次閱讀

    百度世界2025進行中 百度昆侖芯超節點亮相 性能巨幅提升

    百度世界大會是百度每年面向行業、媒體、合作伙伴和廣大用戶的最高級別盛事,作為百度年度最重要的的戰略、技術、產品發布會,自2006年以來已連續舉辦19年,持續為行業搭建起交流前沿
    的頭像 發表于 11-13 11:51 ?1244次閱讀

    聲智科技AI翻譯耳機重塑智能聽覺體驗

    在日益緊密的全球化浪潮中,跨語言溝通的障礙正在被前沿的聲學AI技術逐步瓦解。聲智AI翻譯耳機,憑借深厚的聲學AI積累,率先實現了“跨語種音色與情感復刻技術”在實時
    的頭像 發表于 10-21 15:28 ?967次閱讀
    聲智科技AI<b class='flag-5'>翻譯</b>耳機重塑智能聽覺體驗

    國慶出國游,時空壺新T1翻譯機,首個端側模型突破助力跨語言交流

    國慶將至,眾多游客計劃出國旅行,跨語言交流的順暢與否成為影響旅行體驗的重要因素。時空壺新T1翻譯機作為行業技術領先產品,憑借其獨特優勢,為游客在海外的溝通交流保駕護航。新T1作為時空壺翻譯
    的頭像 發表于 09-12 12:20 ?1016次閱讀
    國慶出國游,時空壺新T1<b class='flag-5'>翻譯</b>機,首個端側模型突破助力跨<b class='flag-5'>語言</b>交流

    翻譯失去網絡,時空壺新T1翻譯機開創首個離線模型賦能全球溝通新體驗

    全球首創的離線端側AI翻譯模型,這一技術突破堪稱行業變革性創舉。與傳統依賴網絡或僅靠靜態離線語言包的翻譯設備不同,T1的離線模型基于先進的端側大模型輕量化
    的頭像 發表于 09-08 16:52 ?1202次閱讀
    當<b class='flag-5'>翻譯</b>失去網絡,時空壺新T1<b class='flag-5'>翻譯</b>機開創首個離線模型賦能全球溝通新體驗

    聲智科技出席2025年北京市多語種AI語音翻譯大賽

    8月20日,由北京市科委、中關村管委會主辦,北京語言大學、北京第二外國語學院、北京市翻譯協會、中國人工智能人會共同承辦的“2025年北京市多語種AI語音翻譯大賽”在中關村展示中心順利
    的頭像 發表于 08-25 17:18 ?1236次閱讀

    水表界的“翻譯官”:讓CCLinkIE和Modbus TCP“無障礙聊天”!

    。別急,這位“雙語翻譯官”——耐達訊通信技術協議轉換網關,能讓它們秒變“知己”! 專業翻譯,消除“語言壁壘” 耐達訊通信技術協議轉換網關堪稱
    發表于 07-10 15:43

    百度地圖重磅發布地圖AI開放平臺

    近日,在WGDC25全球時空智能大會上,百度地圖重磅發布地圖AI開放平臺。百度地圖深耕20年的數據能力、引擎能力與AI技術全面開放,向開發者深度開放四大核心能力和五大場景解決方案。
    的頭像 發表于 05-26 11:26 ?1745次閱讀

    百度在AI領域的最新進展

    近日,我們在武漢舉辦了Create2025百度AI開發者大會,與全球各地的5000多名開發者,分享了百度在AI領域的新進展。
    的頭像 發表于 04-30 10:14 ?1331次閱讀

    上汽大眾與百度地圖達成戰略合作

    近日,上海國際車展期間,百度地圖與上汽大眾舉行科技X生態戰略合作伙伴簽約儀式,雙方將基于百度領先的車道級地圖產品,為上汽大眾千萬車主打造更安全、高效的智能化出行體驗。上汽大眾總經理陶海龍、百度副總裁尚國斌等出席簽約儀式。
    的頭像 發表于 04-29 17:28 ?1230次閱讀

    百度AI榮獲2025愛迪生獎金獎和銀獎

    剛剛,百度AI在「2025愛迪生獎」中獲得一金一銀兩項大獎。
    的頭像 發表于 04-08 15:43 ?973次閱讀

    百度地圖在汽車智能化領域的應用實踐

    近日,在中國電動汽車人會論壇(2025)的智能汽車創新技術與產業論壇,百度地圖事業部副總經理劉增剛發表主旨演講,分享了百度地圖在汽車智能化浪潮中價值思考和應用實踐。他表示:“25年汽
    的頭像 發表于 04-03 15:02 ?2303次閱讀