国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Byte Cup 2018國際機器學習競賽奪冠記

IEEE電氣電子工程師 ? 來源:lq ? 2019-02-14 09:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

9月份,我們兩位同學一起組隊,參加Byte Cup 2018國際機器學習競賽。本次比賽由中國人工智能學會和字節跳動主辦,IEEE中國代表處聯合組織。比賽的任務是文章標題自動生成。最終,我們隊伍獲得了第一名。

1.比賽介紹

本次比賽的任務是給定文章文本內容,自動生成標題。本質上和文本摘要任務比較類似。本次比賽有100多萬篇文章的訓練數據。

1.1數據介紹

詳細參見:https://biendata.com/competition/bytecup2018/data/。

本次競賽使用的訓練集包括了約130萬篇文本的信息,驗證集1000篇文章,

測試集800篇文章。

1.2數據處理

文章去重,訓練數據中包含一些重復數據,清洗,去重;

清洗非英文文章。

1.3評價指標

本次比賽將使用Rouge(Recall-Oriented Understudy for Gisting Evaluation)作為模型評估度量。Rough是評估自動文摘以及機器翻譯的常見指標。它通過將自動生成的文本與人工生成的文本(即參考文本)進行比較,根據相似度得出分值。

2.模型介紹

本次比賽主要嘗試了seq2seq的方法。參考的模型包括Transformer模型和pointer-generator模型。

模型如下圖:

(其實就是將pointer-generator的copy機制加到transformer模型上)。

同時,嘗試了將ner-tagger和pos-tagger信息加入到模型中,如下圖所示:

3.問題分析

最開始我們嘗試了最基本的transformer模型,通過查看數據,遇到以下幾類明顯錯誤:

OOV(out of vocabulary);

數字,人名,地名預測錯誤;

詞形預測錯誤。

OOV問題,主要原因是數據集詞表太大,但是,模型能夠實際使用的詞表較小;數字,人名,地名預測錯誤,主要原因是低頻詞embedding學習不充分;詞形預測錯誤,主要原因是模型中沒有考慮詞的形態問題(當然,如果訓練數據足夠大,是能避免這個問題的)。

為了解決這些問題,我們嘗試了以下方法。

4.重要組件

4.1copy機制

對于很多低頻詞,通過生成式方法生成,其實是很不靠譜的。為此,我們借鑒Pointer-generator的方法,在生成標題的單詞的時候,通過Attention的概率分布,從原文中拷貝詞。

4.2subword

為了避免oov問題,我們采用subword的方法,處理文本。這樣,可以將詞表大小減小到20k,同時,subword會包含一些單詞詞形結構的信息。

4.3ner-tagger和pos-tagger信息

因為baseline在數字,人名,地名,詞形上預測錯誤率較高,所以我們考慮能不能將ner-tagger和pos-tagger信息加入到模型中。如上圖所示。實驗證明通過加入這兩個序列信息能夠大大加快模型的收斂速度(訓練收斂后,指標上基本沒差異)。

4.4Gradient Accumulation

在實驗過程中,我們發現transformer模型對batch_size非常敏感。之前,有研究者在機器翻譯任務中,通過實驗也證明了這一觀點。然而,對于文章標題生成任務,因為每個sample的文章長度較長,所以,并不能使用超大batch_size來訓練模型,所以,我們用Gradient Accumulation的方法模擬超大batch_size。

4.5ensemble

采用了兩層融合。第一層,對于每一個模型,將訓練最后保存的N個模型參數求平均值(在valid集上選擇最好的N)。第二層,通過不同隨機種子得到的兩個模型,一個作為生成候選標題模型(選擇不同的beam_width, length_penalty), 一個作為打分模型,將候選標題送到模型打分,選擇分數最高的標題。

5.失敗的方法

將copy機制加入到transformer遇到一些問題,我們直接在decoder倒數第二層加了一層Attention層作為copy機制需要的概率分布,訓練模型非常不穩定,并且結果比baseline還要差很多;

我們嘗試了bert,我們將bert-encoder抽出的feature拼接到我們模型的encoder的最后一層,結果并沒有得到提升;

word-embedding的選擇,我們使用glove和fasttext等預訓練的詞向量,模型收斂速度加快,但是,結果并沒有random的方法好。

6.結束語

非常感謝主辦方舉辦本次比賽,通過本次比賽,我們探索,學習到了很多算法方法和調參技巧。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265381
  • 機器翻譯
    +關注

    關注

    0

    文章

    141

    瀏覽量

    15526
  • 數據集
    +關注

    關注

    4

    文章

    1236

    瀏覽量

    26196

原文標題:Byte Cup 2018國際機器學習競賽奪冠記

文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    太燃了!人形機器人1500米比賽,這家奪冠!更有機器人全程自主奔跑

    人民政府、世界機器人合作組織和亞太機器人世界杯國際理事會聯合主辦,吸引了來自16個國家的280支隊伍,500余臺人形機器人齊聚一堂,共同角逐競技賽、表演賽、場景賽和外圍賽四大類共26個
    的頭像 發表于 08-17 06:21 ?9706次閱讀
    太燃了!人形<b class='flag-5'>機器</b>人1500米比賽,這家<b class='flag-5'>奪冠</b>!更有<b class='flag-5'>機器</b>人全程自主奔跑

    人工智能與機器學習在這些行業的深度應用

    自人工智能和機器學習問世以來,多個在線領域的數字化格局迎來了翻天覆地的變化。這些技術從誕生之初就為企業賦予了競爭優勢,而在線行業正是受其影響最為顯著的領域。人工智能(AI)與機器學習
    的頭像 發表于 02-04 14:44 ?476次閱讀

    機器學習和深度學習中需避免的 7 個常見錯誤與局限性

    無論你是剛入門還是已經從事人工智能模型相關工作一段時間,機器學習和深度學習中都存在一些我們需要時刻關注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發諸多麻煩!只要我們密切關注數據、模型架構
    的頭像 發表于 01-07 15:37 ?192次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>中需避免的 7 個常見錯誤與局限性

    思嵐科技亮相2025日本東京國際機器人展覽會

    12月6日,作為全球規模最大、歷史最悠久的機器人專業展會之一的第26屆日本國際機器人展(IREX 2025)在東京國際展覽中心圓滿收官。
    的頭像 發表于 12-16 11:36 ?1689次閱讀
    思嵐科技亮相2025日本東京<b class='flag-5'>國際</b><b class='flag-5'>機器</b>人展覽會

    東莞理工學院“小眼睛科技杯”第四屆集成電路設計與創新應用競賽圓滿落幕

    、教務部(招生辦公室)、科研部、研究生院、校學生會、校研究生會主辦,集成電路學院(國際微電子學院)團委、學生會承辦,深圳市小眼睛科技有限公司冠名贊助。本屆競賽自2025
    的頭像 發表于 12-08 08:03 ?420次閱讀
    東莞理工學院“小眼睛科技杯”第四屆集成電路設計與創新應用<b class='flag-5'>競賽</b>圓滿落幕

    思嵐科技邀您相約2025日本東京國際機器人展覽會

    第26屆日本東京國際機器人展覽會(iREX 2025)將于12月3日-6日在東京國際展覽中心(Tokyo Big Sight)盛大啟幕。作為全球最具影響力、規模最大的機器人專業展會之一
    的頭像 發表于 12-03 17:44 ?1273次閱讀

    廣和通斬獲具身智能家務機器人黑客松競賽二等獎

    近日,廣和通受邀參加由 Hugging Face、NVIDIA 與 Seeed Studio 聯合舉辦的“具身智能家務機器人黑客松”競賽。在本次前沿賽事中,廣和通團隊成功開發、部署并演示了“雙臂協作家務機器人系統”,憑借其創新的
    的頭像 發表于 11-08 14:51 ?1703次閱讀

    普渡樓宇配送機器人榮獲2025年IDEA國際設計卓越獎

    近日,普渡樓宇配送機器人“閃電匣”憑借其卓越的產品設計與創新理念,成功斬獲美國IDEA國際設計大獎(International Design Excellence Awards) !這是全球設計業內
    的頭像 發表于 10-15 17:58 ?1202次閱讀

    舍弗勒攜手英飛凌共赴智能汽車競賽

    此前,2025年8月18-20日,第二十屆全國大學生智能汽車競賽(以下簡稱“競賽”)全國總決賽在杭州電子科技大學舉辦并圓滿落幕,是國內最具影響力的大學生學科競賽之一。在本屆競賽中,來自
    的頭像 發表于 09-04 14:34 ?942次閱讀

    第六屆TE Connectivity AI Cup全球競賽圓滿收官

    近日,在全球行業技術領先企業TE Connectivity(以下簡稱“TE”)主辦的第六屆TE AI Cup全球競賽中,中國西南財經大學團隊與華南理工大學團隊憑借出色表現雙雙奪冠。作為聚焦培養高校
    的頭像 發表于 08-25 14:13 ?0次閱讀

    中國兩大高校團隊斬獲第六屆TE Connectivity AI Cup全球競賽桂冠

    中國上海,2025年8月4日 ——近日,在全球行業技術領先企業TE Connectivity(以下簡稱“TE”)主辦的第六屆TE AI Cup全球競賽中,中國西南財經大學團隊與華南理工大學團隊憑借
    的頭像 發表于 08-05 15:03 ?1068次閱讀
    中國兩大高校團隊斬獲第六屆TE Connectivity AI <b class='flag-5'>Cup</b>全球<b class='flag-5'>競賽</b>桂冠

    FPGA在機器學習中的具體應用

    隨著機器學習和人工智能技術的迅猛發展,傳統的中央處理單元(CPU)和圖形處理單元(GPU)已經無法滿足高效處理大規模數據和復雜模型的需求。FPGA(現場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發表于 07-16 15:34 ?2891次閱讀

    Python從入門到精通背手冊

    電子發燒友網站提供《Python從入門到精通背手冊.pdf》資料免費下載
    發表于 03-28 17:43 ?108次下載

    普渡機器人榮獲ISO 56005國際標準知識產權體系認證

    近日,深圳市普渡科技有限公司(簡稱:普渡機器人)正式通過《創新管理·知識產權管理指南(ISO 56005: 2020)》國際標準認證,榮獲《創新與知識產權管理能力》等級證書(1級)。該標準是由我
    的頭像 發表于 03-19 15:37 ?835次閱讀

    請問STM32部署機器學習算法硬件至少要使用哪個系列的芯片?

    STM32部署機器學習算法硬件至少要使用哪個系列的芯片?
    發表于 03-13 07:34