久久好色,国产精品久久久对白,另类TS人妖一区二区三区

編者按：近日，OpenAI在博客上宣布，他們用可擴展的多任務(wù)系統(tǒng)，在多語言任務(wù)上取得了良好的成績。研究人員結(jié)合了transformer和無監(jiān)督預(yù)訓(xùn)練這兩種現(xiàn)有方法。結(jié)果證明，監(jiān)督學習方法和無監(jiān)督預(yù)訓(xùn)練結(jié)合得非常好。以下是論智對原博文的編譯。

我們的系統(tǒng)工作分為兩個階段：首先，我們在大量數(shù)據(jù)上訓(xùn)練一個transformer模型，利用語言建模作為訓(xùn)練信號，然后在稍小的監(jiān)督數(shù)據(jù)集上對模型進行微調(diào)，以幫助解決特殊任務(wù)。

在此之前我們曾發(fā)布了一篇有關(guān)“情感神經(jīng)元”的研究，其中我們注意到無監(jiān)督學習技術(shù)能產(chǎn)生非常明顯的特定。這里，我們想將這一技術(shù)進一步拓展：是否能創(chuàng)建一個模型，將其在大量數(shù)據(jù)上進行無監(jiān)督訓(xùn)練，之后再在多種不同任務(wù)上進行微調(diào)？結(jié)果證明，這一方法非常有效。模型只需要微小調(diào)整就能適應(yīng)多種任務(wù)。

這項工作建立在論文Semi-supervised Sequence Learning所提出的方法上，它展示了如何用LSTM的無監(jiān)督預(yù)訓(xùn)練以及監(jiān)督式的微調(diào)提高文本分類的性能。它還擴展了ULMFiT，該研究展示了單一無數(shù)據(jù)集的LSTM語言模型可以在多種文本分類數(shù)據(jù)集上微調(diào)后達到最優(yōu)性能。

而我們的研究展示了一個基于Transformer的模型可以通過這種方法做到除了文本分類以外的事，例如常識推理、語義相似度、閱讀理解。它也有點像ELMo，同樣也是加入預(yù)訓(xùn)練，再用特定任務(wù)框架得到最優(yōu)結(jié)果。

為了達到我們的結(jié)果只需要微調(diào)，并且所有數(shù)據(jù)集只用了一個前向語言模型，沒有任何集成，并且大部分結(jié)果用的參數(shù)都是相通的。

令人激動的是，我們的方法在COPA、RACE和ROCStories三個數(shù)據(jù)集上都表現(xiàn)的很好，這三種數(shù)據(jù)集是用來測試常識推理和閱讀理解的。我們的模型在這些數(shù)據(jù)集上表現(xiàn)出了頂尖的結(jié)果，與其他方法的對比十分明顯。通常人們認為這些數(shù)據(jù)集需要多語句推理和豐富的知識，這也表明我們的模型只能靠無監(jiān)督學習提升水準。這也意味著未來也許能通過無監(jiān)督技術(shù)讓模型理解復(fù)雜語言。

為什么用無監(jiān)督學習？

監(jiān)督學習最近在機器學習的很多方面都取得了成功。然而，成功的背后需要大型、經(jīng)過清洗的數(shù)據(jù)集。無監(jiān)督學習不會有這些問題，也是它受歡迎的原因。由于無監(jiān)督學習無需人類對數(shù)據(jù)進行標注，所以在目前計算量增加并且有可用元數(shù)據(jù)的趨勢下，它仍然適應(yīng)得很好。無監(jiān)督學習是很受歡迎的研究領(lǐng)域，但是付諸實踐的卻很少。

最近我們嘗試用無監(jiān)督學習增強系統(tǒng)，進一步研究語言能力。無監(jiān)督技術(shù)訓(xùn)練能通過含有巨大信息量的數(shù)據(jù)庫訓(xùn)練單詞的表示，與監(jiān)督學習結(jié)合后，模型的性能會進一步提高。最近，這些NLP領(lǐng)域的無監(jiān)督技術(shù)（例如GLoVe和word2vec）利用了簡單模型（詞向量）和訓(xùn)練信號。Skip-Thought向量是一種是對這種提升的早期展示。但是目前在用的技術(shù)讓性能得到了進一步提升。這些都包括了使用預(yù)訓(xùn)練句子的模型表示、語境化的詞向量、用定制架構(gòu)連接無監(jiān)督預(yù)訓(xùn)練和監(jiān)督微調(diào)的方法。

在大量文本語料上對模型進行預(yù)訓(xùn)練顯著提高了它在自然語言處理上的表現(xiàn)

我們還注意到，我們可以用基礎(chǔ)的語言模型直接執(zhí)行任務(wù)，不用訓(xùn)練它們。例如，隨著基礎(chǔ)語言模型的升級，選擇題模型的表現(xiàn)也有了提升。雖然這種方法和監(jiān)督方法相比結(jié)果還是有差距，但是無監(jiān)督學習方法能在多種任務(wù)上執(zhí)行任務(wù)已經(jīng)很讓人興奮了。

我們還能用模型中現(xiàn)有的語言功能執(zhí)行情感分析。斯坦福的Sentiment Treebank數(shù)據(jù)集中包含了許多積極和消極的電影評論，如果在一句話的結(jié)尾添加“very”這個詞，我們可以用語言模型猜測評論的屬性。這種方法完全沒用對模型進行適應(yīng)調(diào)整，最終達到了約80%的準確度。

我們的方法也是驗證transformer架構(gòu)的魯棒性和有用性的標準，這說明想在多種任務(wù)上達到頂尖的結(jié)果，同時不需要定制化或調(diào)參是非常靈活的。

目前存在的缺點

這一項目同時還存在著一些不足之處：

計算需求：此前NLP任務(wù)中的許多方法都是從零開始在單個GPU上訓(xùn)練，模型比較小。我們的方法在預(yù)訓(xùn)練時需要一個月左右的時間，并且要用8個GPU。幸運的是，預(yù)訓(xùn)練只要做一次。不過跟之前的其他工作相比，這算是比較大的計算量和內(nèi)存了。我們用了一個37層的Transformer架構(gòu)，訓(xùn)練了最多有512個token的序列，大多數(shù)都是在4個或8個GPU系統(tǒng)上進行的。模型可以快速地針對新問題進行微調(diào)，這也減少了額外所需要的資源。

在學習時通過文本對世界的理解有偏差和偏見：網(wǎng)絡(luò)上所能看見的書或文字也許不能涵蓋世界所有的信息，也許不準確。最近的研究表明，用文本和通過數(shù)據(jù)分布建立的模型學習特定的信息很困難。

生成時很脆弱：雖然我們的方法在很多任務(wù)中都提高了性能，目前的深度學習NLP模型仍然表現(xiàn)出令人驚訝的反常行為，尤其是系統(tǒng)地進行對抗測試時更加明顯。但是我們的方法在這些測試面前很脆弱，盡管有一些進步。對比之前完全用神經(jīng)網(wǎng)絡(luò)的方法，我們的方法在詞匯魯棒性上更勝一籌。在Glockner等人的數(shù)據(jù)集上，我們的模型達到了83.75%的方法，和KIM接近。

未來方向

擴展我們的方法：我們看到在語言模型和其相關(guān)的模型上已經(jīng)有了很大提升。目前我們正在用一個8個GPU的機器和含有上千本書的訓(xùn)練集進行實驗，說明還有很大的擴展空間。

改進微調(diào)方法：我們的方法目前很簡潔。也許未來我們會用更加復(fù)雜的調(diào)整和遷移技術(shù)進行改進。

深入了解為什么生成預(yù)訓(xùn)練很有幫助：雖然我們對研究成果做出了解釋，但是只有對比其他實驗和研究才能有更清晰的認知。例如，技術(shù)提升后到底有多少好處？

具體案例

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴