国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

介紹三個NLP領域的熱門詞匯

8g3K_AI_Thinker ? 來源:lp ? 2019-04-17 10:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

編者按:在過去的一段時間,自然語言處理領域取得了許多重要的進展,Transformer、BERT、無監督機器翻譯,這些詞匯仿佛在一夜之間就進入了人們的視野。你知道它們具體都是什么意思嗎?今天,我們就將為大家介紹三個NLP領域的熱門詞匯。

Transformer

Transformer 在2017年由Google在題為《Attention Is All You Need》的論文中提出。Transformer 是一個完全基于注意力機制的編解碼器模型,它拋棄了之前其它模型引入注意力機制后仍然保留的循環與卷積結構,而采用了自注意力(Self-attention)機制,在任務表現、并行能力和易于訓練性方面都有大幅的提高。

在 Transformer 出現之前,基于神經網絡的機器翻譯模型多數都采用了 RNN 的模型架構,它們依靠循環功能進行有序的序列操作。雖然 RNN 架構有較強的序列建模能力,但是存在訓練速度慢,訓練質量低等問題。

與基于 RNN 的方法不同,Transformer 模型中沒有循環結構,而是把序列中的所有單詞或者符號并行處理,同時借助自注意力機制對句子中所有單詞之間的關系直接進行建模,而無需考慮各自的位置。

具體而言,如果要計算給定單詞的下一個表征,Transformer 會將該單詞與句子中的其它單詞一一對比,并得出這些單詞的注意力分數。注意力分數決定其它單詞對給定詞匯的語義影響。之后,注意力分數用作所有單詞表征的平均權重,這些表征輸入全連接網絡,生成新表征。

由于 Transformer 并行處理所有的詞,以及每個單詞都可以在多個處理步驟內與其它單詞之間產生聯系,它的訓練速度比 RNN 模型更快,在翻譯任務中的表現也比 RNN 模型更好。

除了計算性能和更高的準確度,Transformer 另一個亮點是可以對網絡關注的句子部分進行可視化,尤其是在處理或翻譯一個給定詞時,因此可以深入了解信息是如何通過網絡傳播的。

之后,Google的研究人員們又對標準的 Transformer 模型進行了拓展,采用了一種新型的、注重效率的時間并行循環結構,讓它具有通用計算能力,并在更多任務中取得了更好的結果。

改進的模型(Universal Transformer)在保留Transformer 模型原有并行結構的基礎上,把 Transformer 一組幾個各異的固定的變換函數替換成了一組由單個的、時間并行的循環變換函數構成的結構。

相比于 RNN一個符號接著一個符號從左至右依次處理序列,Universal Transformer 和 Transformer 能夠一次同時處理所有的符號,但 Universal Transformer 接下來會根據自注意力機制對每個符號的解釋做數次并行的循環處理修飾。

Universal Transformer 中時間并行的循環機制不僅比 RNN 中使用的串行循環速度更快,也讓 Universal Transformer 比標準的前饋 Transformer 更加強大。

預訓練 Pre-train

目前神經網絡在進行訓練的時候基本都是基于后向傳播(Back Propagation,BP)算法,通過對網絡模型參數進行隨機初始化,然后利用優化算法優化模型參數。

但是在標注數據很少的情況下,通過神經網絡訓練出的模型往往精度有限,“預訓練”則能夠很好地解決這個問題,并且對一詞多義進行建模。

預訓練是通過大量無標注的語言文本進行語言模型的訓練,得到一套模型參數,利用這套參數對模型進行初始化,再根據具體任務在現有語言模型的基礎上進行精調。

預訓練的方法在自然語言處理的分類和標記任務中,都被證明擁有更好的效果。目前,熱門的預訓練方法主要有三個:ELMo,OpenAI GPT 和 BERT。

在2018年初,艾倫人工智能研究所和華盛頓大學的研究人員在題為《Deep contextualized word representations》一文中提出了ELMo。

相較于傳統的使用詞嵌入(Word embedding)對詞語進行表示,得到每個詞唯一固定的詞向量,ELMo 利用預訓練好的雙向語言模型,根據具體輸入從該語言模型中可以得到在文本中該詞語的表示。在進行有監督的 NLP 任務時,可以將 ELMo 直接當做特征拼接到具體任務模型的詞向量輸入或者是模型的最高層表示上。

在ELMo的基礎之上,OpenAI的研究人員在《Improving Language Understanding by Generative Pre-Training》提出了OpenAI GPT。

與ELMo為每一個詞語提供一個顯式的詞向量不同,OpenAI GPT能夠學習一個通用的表示,使其能夠在大量任務上進行應用。

在處理具體任務時,OpenAI GPT 不需要再重新對任務構建新的模型結構,而是直接在 Transformer 這個語言模型上的最后一層接上 softmax 作為任務輸出層,再對這整個模型進行微調。

ELMo和OpenAI GPT這兩種預訓練語言表示方法都是使用單向的語言模型來學習語言表示,而Google在提出的BERT則實現了雙向學習,并得到了更好的訓練效果。

具體而言,BERT使用Transformer的編碼器作為語言模型,并在語言模型訓練時提出了兩個新的目標:MLM(Masked Language Model)和句子預測。

MLM是指在輸入的詞序列中,隨機的擋上 15% 的詞,并遮擋部分的詞語進行雙向預測。為了讓模型能夠學習到句子間關系,研究人員提出了讓模型對即將出現的句子進行預測:對連續句子的正誤進行二元分類,再對其取和求似然。

圖片來源:Google AI Blog

無監督機器翻譯

Unsupervised Machine Translation

現有的機器翻譯需要大量的翻譯文本做訓練樣本,這使得機器翻譯只在一小部分樣本數量充足的語言上表現良好,但如何在沒有源翻譯的情況下訓練機器翻譯模型,即無監督訓練,成為了目前熱門的研究話題。

Facebook 在 EMNLP 2018 上的論文《Phrase-Based & Neural Unsupervised Machine Translation》利用跨字嵌入(Cross Word Embedding),提升了高達 11 BLEU,那么 Facebook 是如何實現的呢?

第一步是讓系統學習雙語詞典。系統首先為每種語言中的每個單詞訓練詞嵌入,訓練詞嵌入通過上下文來預測給定單詞周圍的單詞。

不同語言的詞嵌入具有相似的鄰域結構,因此可以通過對抗訓練等方法讓系統學習旋轉變換一種語言的詞嵌入,以匹配另一種語言的詞嵌入。

基于這些信息,就可以得到一個相對準確的雙語詞典,并基本可以實現逐字翻譯。在得到語言模型和初始的逐字翻譯模型之后,就可以構建翻譯系統的早期版本。

然后將系統翻譯出的語句作為標注過的真實數據進行處理,訓練反向機器翻譯系統,得到一個更加流暢和語法正確的語言模型,并將反向翻譯中人工生成的平行句子與該語言模型提供的校正相結合,以此來訓練這個翻譯系統。

通過對系統的訓練,形成了反向翻譯的數據集,從而改進原有的機器翻譯系統。隨著一個系統得到改進,可以使用它以迭代方式在相反方向上為系統生成訓練數據,并根據需要進行多次迭代。

逐字嵌入初始化、語言建模和反向翻譯是無監督機器翻譯的三個重要原則。將基于這些原理得到的翻譯系統應用于無監督的神經模型和基于計數的統計模型,從訓練好的神經模型開始,使用基于短語模型的其它反向翻譯句子對其進行訓練,最終得到了一個既流暢,準確率又高的模型。

對于無監督機器翻譯,微軟亞洲研究院自然語言計算組也進行了探索。研究人員利用后驗正則(Posterior Regularization)的方式將 SMT(統計機器翻譯)引入到無監督NMT的訓練過程中,并通過EM過程交替優化 SMT 和 NMT 模型,使得無監督 NMT 迭代過程中的噪音能夠被有效去除,同時 NMT 模型也彌補了 SMT 模型在句子流暢性方面的不足。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4838

    瀏覽量

    107794
  • 機器翻譯
    +關注

    關注

    0

    文章

    141

    瀏覽量

    15527
  • nlp
    nlp
    +關注

    關注

    1

    文章

    491

    瀏覽量

    23280

原文標題:請收下這份 NLP 熱門詞匯解讀

文章出處:【微信號:AI_Thinker,微信公眾號:人工智能頭條】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    駿馬奔騰,芯向未來:SiC功率器件的“三個必然”與丙午馬年的產業躍遷

    駿馬奔騰,芯向未來:SiC功率器件的“三個必然”與丙午馬年的產業躍遷 日期: 2026年 丙午馬年 除夕 主題: 傾佳電子楊茜“三個必然”戰略論斷與基本半導體碳化硅技術的產業替代邏輯 關鍵詞
    的頭像 發表于 02-15 10:33 ?46次閱讀
    駿馬奔騰,芯向未來:SiC功率器件的“<b class='flag-5'>三個</b>必然”與丙午馬年的產業躍遷

    altium designer 如何畫短路兩或者三個網絡的封裝?

    如何我畫了一天線,有3引腳,TX1,TX2,GND, 但實際上這三個引腳是連在一起的。我導入pcb后,會報DRC警告,這個該怎么解決?
    發表于 02-12 19:30

    三個經典開關電源實際問題解析

    下面三個關于多路輸出電源連續工作模式的問題,測試一下您的電源設計知識。然后核對您的答案。
    的頭像 發表于 01-22 16:08 ?1910次閱讀
    <b class='flag-5'>三個</b>經典開關電源實際問題解析

    MDD從工程故障看極管三個極的設計誤區與失效案例

    一、為什么極管問題總是“看起來很隨機”?在FAE現場支持中,經常遇到如下問題:-同一電路,有的板子正常,有的異常-高溫下工作不穩定-更換批次后性能漂移這些問題,90%都與三個極的設計與使用方式有關
    的頭像 發表于 01-19 11:48 ?204次閱讀
    MDD從工程故障看<b class='flag-5'>三</b>極管<b class='flag-5'>三個</b>極的設計誤區與失效案例

    束管式光纜最簡單三個步驟

    束管式光纜的安裝或施工可簡化為以下三個核心步驟,確保光纖傳輸性能穩定且操作高效: 第一步:路由規劃與準備 路徑勘察 確定光纜敷設路線,避開強電磁干擾源(如高壓線)、尖銳物體或易受外力破壞的區域(如
    的頭像 發表于 01-07 10:12 ?241次閱讀

    未來工業AI發展的三個必然階段

    與優化 能力的深層革命。 未來十年,工業AI的發展將經歷三個清晰的階段:? 智能輔助 → 智能決策 → 自主優化 。這次進化,構成了工業從“人控機器”到“機器共智”的核心路徑。 一、第一階段:智能輔助(AI for Assistance) 時間窗口:
    的頭像 發表于 10-27 15:47 ?455次閱讀
    未來工業AI發展的<b class='flag-5'>三個</b>必然階段

    DIY 流體模擬吊墜(二):第二、第三個、更多的吊墜......

    “ ?上文?DIY 流體模擬吊墜(一):理論與第一吊墜的制作?介紹了流體模擬的理論并打造了第一吊墜,現在繼續制造第二、三個吊墜......? ” 第二
    的頭像 發表于 09-17 23:17 ?2236次閱讀
    DIY 流體模擬吊墜(二):第二<b class='flag-5'>個</b>、第<b class='flag-5'>三個</b>、更多的吊墜......

    請問K230D的三個相機能同步采樣嗎?

    如題 K230D的三個相機能同步采樣嗎?
    發表于 08-04 06:32

    七百多頁電機中英文詞匯收藏分享

    本書共收錄了50000余詞條,除重點涵蓋了發電機和電動機產品從設計、工藝、生產制造、試驗到安裝運行等方面的專業技術詞匯外,還兼收了一些近年新涌現出來的新能源、新技術方面的詞匯。此外,為滿足讀者翻譯
    發表于 07-17 14:23

    怎么結合嵌入式,Linux,和FPGA三個方向達到一均衡發展?

    在嵌入式領域,不少人都懷揣著讓嵌入式、Linux 和 FPGA 三個方向實現均衡發展的夢想,然而實踐中卻面臨諸多挑戰。就像備受矚目的全棧工程師稚暉君,他從大學玩單片機起步,憑借將智能算法融入嵌入式而
    的頭像 發表于 06-25 10:08 ?868次閱讀
    怎么結合嵌入式,Linux,和FPGA<b class='flag-5'>三個</b>方向達到一<b class='flag-5'>個</b>均衡發展?

    突破LuatOS開發瓶頸:三個二次開發必備知識揭秘!

    遇到LuatOS開發難題?或許你忽略了這三個關鍵常識。它們看似簡單,卻能破解資源管理、效率提升等瓶頸問題,為你的項目注入新活力,實現技術躍遷。 本期一起來了解LuatOS開發需要熟悉的幾個常識
    的頭像 發表于 06-23 15:05 ?412次閱讀
    突破LuatOS開發瓶頸:<b class='flag-5'>三個</b>二次開發必備知識揭秘!

    請問并聯三個LT3092擴展電流是否可行?

    使用LT3092作為脈沖電流源驅動150mA使用,現在需要擴展電流至400~500mA。電流需求穩定。①請問并聯三個LT3092擴展電流是否可行。電路設計中是否需要注意其他事項。②如下圖,手冊給出2種2路并聯的方案,路并聯選擇哪種電路較合適?③脈沖開關如何添加?
    發表于 06-19 07:13

    SOLIDWORKS軟件——設計領域熱門選擇

    在快速發展的設計領域,SOLIDWORKS軟件憑借其強大的功能、直觀的用戶界面和廣泛的應用領域,已成為數百萬工程師和設計師的首要選擇工具。無論是機械設計、工業設計、汽車制造還是航空航天領域,SOLIDWORKS都以其優越的性能和
    的頭像 發表于 05-16 08:48 ?845次閱讀
    SOLIDWORKS軟件——設計<b class='flag-5'>領域</b>的<b class='flag-5'>熱門</b>選擇

    半導體制造過程中的三個主要階段

    前段工藝(Front-End)、中段工藝(Middle-End)和后段工藝(Back-End)是半導體制造過程中的三個主要階段,它們在制造過程中扮演著不同的角色。
    的頭像 發表于 03-28 09:47 ?7340次閱讀
    半導體制造過程中的<b class='flag-5'>三個</b>主要階段

    如何檢測極管的三個

    可以用萬用表來初步確定極管的好壞及類型 (NPN 型還是 PNP 型 ),并辨別出e(發射極)、b(基極)、c(集電極)三個電極。
    發表于 03-08 16:40