国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如果把中學生的英語閱讀理解選擇題讓AI來做,會做出什么水平?

DPVg_AI_era ? 來源:lp ? 2019-04-19 10:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

如果把中學生的英語閱讀理解選擇題讓AI來做,會做出什么水平?近日,上交大團隊訓練的“雙向協同匹配網絡”(DCMN)取得了74%的正確率。盡管和人類學生相比只能算馬馬虎虎,但對AI來說,這已經達到了目前的最高水平。

目前,在英語考試的閱讀理解上,AI雖然無法擊敗更有能力的人類學生,但它仍然是衡量機器對語言理解能力的最佳量度之一。

近日,上海交通大學的趙海團隊對AI模型進行了超過25000次英語閱讀理解測試訓練。訓練材料和中國現行英語水平考試的閱讀理解形式類似,每篇文章大約200到300個詞,文后是一系列與文章內容相關的多項選擇題。這些測試來自針對12至18歲中國學生的英語水平考試。

雖然這些問題有些可以在文中找到答案,但其中一半以上的題目仍需要一定程度的推理。例如,有些問題會要求從四個選項中選出文章的“最佳標題”。在訓練結束后,AI參加了測試,其中包括1400次以前從未見過的考試。綜合得分為74分(百分制),優于之前的所有機器測試。

上交大的AI系統可以識別與問題相關的文章相關部分,然后選出在含義上和邏輯上最相似的答案。在測試中排名第二的是騰訊的AI系統,在同一次考試中得分為72分。騰訊的AI學會了比較每個選項中包含的信息,并將不同選項間的信息差異作為提示,在文章中尋找證據。

目前最厲害的AI,閱讀理解只能得個C+

盡管在測試中分數處于領先,趙海團隊仍在努力提高AI系統的能力。“如果從真人學生的視角來看,我們的AI的表現也就是一般水平,最多得個C+,”他說。“對于那些想進入中國優秀大學的學生來說,他們的目標是90分。”

為了提高分數,團隊將嘗試修改AI,以便理解嵌入在句子結構中的信息,并為AI提供更多數據,擴大其詞匯量。

如何理解人類的語言,一直是AI領域的一個主要問題,因為這種理解通常是不精確的,這個問題涉及機器難以掌握的隱含語境信息和社會線索問題。

卡內基梅隆大學的GuokunLai表示,目前我們仍不清楚AI在學習我們的語言時會遵循什么規則,“不過在閱讀了大量的句子和文章之后,AI似乎能夠理解我們的邏輯。”

該研究的相關論文已經發表在Arxiv上,以下是論文的主要內容:

讓AI做閱讀理解是一項具有挑戰性的任務,需要復雜的推理過程。AI需要從一組候選答案中選擇正確的答案。本文提出雙重協同匹配網絡(DCMN),該網絡可以雙向地模擬通道,問題和答案之間的關系。

與僅就問題感知或選擇性文章表示進行計算的現有方法不同,DCMN能夠計算文章感知問題表示和文章感知答案表示。為了證明DCMN模型的有效性,我們在大型閱讀理解數據集(即RACE)上評估了模型。結果表明,該模型達到了目前AI閱讀理解的最高水平。

機器閱讀理解和問答已經成為評估自然語言處理和理解領域人工智能系統進展的關鍵應用問題。計算語言學界對機器閱讀理解和問答的一般問題給予了極大的關注。

本文主要關注選擇題閱讀理解數據集,如RACE,該數據集中每個問題后都帶有一組答案選項。大多數問題的正確答案可能不會在原文中完全復現,問題類型和范圍也更加豐富和廣泛,比如涉及某一段落的提要和對文章作者態度的分析。

這需要AI能夠更深入地了解文章內容,并利用外部世界知識來回答這些問題。此外,與傳統的閱讀理解問題相比,我們需要充分考慮通過文章-問題-答案三者之間的關系,而不僅僅是問題-答案的配對。

新模型DCMN:在文章、問題、答案三者之間建立聯系

DCMN模型可以將問題-答案與給定文章內容進行雙向匹配,利用了NLP領域的最新突破——BERT進行上下文嵌入。在介紹BERT的原論文中提到,對應于第一輸入令牌(CLS)的最終隱藏向量被用作聚合表示,然后利用分類層計算標準分類損失。

我們認為這種方法太粗糙,無法處理文章-問題-答案的三者關系組合,因為這種方法只是粗略地將文章-問題的聯系作為第一序列,將問題作為第二序列,沒有考慮問題和文章內容之間的關系。因此,我們提出了一種新方法來模擬文章、問題和候選答案之間的關系。

使用BERT作為編碼層,分別得到文章、問題和答案選項的上下文表示。

構造匹配層以獲得文章-問題-答案三者之間匹配表示,對問題在文章中對應的位置信息與特定上下文匹配的候選答案進行編碼。

對從字級到序列級的匹配表示應用層次聚合方法,然后從序列級到文檔級應用。

我們的模型在BERT模型的基礎上,于RACE數據集上將當前最高得分提高了2.6個百分點,并使用大規模BERT模型進一步將得分提高了3個百分點。

實驗及測試結果

在RACE數據集上對模型進行了評估。這個數據集由兩個子集組成:RACE-M和RACE-H。RACE-M來自初中考試試題,RACE-H來自高中考試試題。RACE是這兩者的結合。我們將我們的模型與以下基線方法進行了比較:MRU(多范圍推理),DFN(動態融合網絡),HCM(等級協同匹配),OFT(OpenAI微調語言轉換模型),RSM(閱讀策略模型)。

我們還將我們的模型與BERT基線進行比較,并實現BERT原論文(2018)中描述的方法,該方法使用對應于第一個輸入標記([CLS])的最終隱藏向量作為聚合表示,然后是分類層,最后計算標準分類損失。測試結果如上表所示。

我們可以看到BERT基線模型的性能非常接近先前的最高水平,而大型BERT模型的表現甚至超過了之前SOTA水平3.7%。但是實驗結果表明,我們的DCMN模型更強大,將最高得分進一步分別提升了2.2%。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39866

    瀏覽量

    301510
  • 人工智能
    +關注

    關注

    1817

    文章

    50105

    瀏覽量

    265534
  • 數據集
    +關注

    關注

    4

    文章

    1236

    瀏覽量

    26207

原文標題:最強AI挑戰中國英語閱讀理解:只得70多分,不如中等生

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    龍芯中科護航蘇州初中英語聽力口語自動化考試

    近日,蘇州市八年級英語“人機對話”的正式考試順利落幕,此次考試采用聽說科技的英語人機對話考試系統,全程以“實戰”模式護航學生備考自動化英語聽說測試,是蘇州市教育數字化、規范化考評的重要
    的頭像 發表于 02-11 16:27 ?883次閱讀

    Transformer 入門:從零理解 AI 大模型的核心原理

    AI 處理文本的最小單位,可以是詞或詞的一部分 嵌入向量 文字變成數字的\"翻譯\"方式 注意力機制 詞能\"看到\"其他詞,理解關系 Q/K/V 查詢/鍵
    發表于 02-10 16:33

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    和探索;人類級別的理解能力;常識推理;現實世界的知識整合。 3、測試時計算 測試時計算(TTC)是指在模型推理階段利用額外的計算資源提升泛化性能。 4、具身智能與滲透式AI 1)具身智能對AGI的意義
    發表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+具身智能芯片

    進行分析和處理,以便更好地理解和利用這些信息。 具身智能除了學 習還有記憶功能,這在生物學中對應遺傳。在芯片實現中,常常采用存算一體化(包含存內計算)以及感知功能也集成在一起的感存算一體化技術
    發表于 09-18 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用

    AI被賦予了人的智能,科學家們希望在沒有人類的引導下,AI自主的提出科學假設,諾貝爾獎級別的假設哦。 AI驅動科學被認為是科學發現的第五個范式了,與實驗科學、理論科學、計算科學、數據驅動科學一起構成
    發表于 09-17 11:45

    【賽補充說明】2025全國大學生FPGA創新設計競賽紫光同創杯賽

    【賽發布】2025年全國大學生FPGA創新設計競賽紫光同創杯賽邀您鴻圖展翼共赴芯程!【賽知多少】紫光同創賽答疑專場|2025年全國大學生
    的頭像 發表于 09-12 16:03 ?2113次閱讀
    【賽<b class='flag-5'>題</b>補充說明】2025全國大<b class='flag-5'>學生</b>FPGA創新設計競賽紫光同創杯賽

    全新ES8打造大三排SUV駕乘標桿

    俗話說,魚和熊掌不可兼得,但蔚團隊拒絕「要么好開、要么舒適」的選擇題
    的頭像 發表于 09-10 15:17 ?1230次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內容總覽

    章 具身智能芯片 第9章 從AI芯片到AGI芯片 圖2 各章重點及邏輯框架 該書可供AI和芯片領域的各層次人群閱讀,無論是學習者還是研究人員。 對于本人來說,讀這本書不但是為了豐富這方面的知識,更主要的是為孩子讀研
    發表于 09-05 15:10

    電子行業:AI 協同精密工藝控更精準

    電子行業的精密工藝控正迎來 AI 協同設備管理系統帶來的變革。從工藝設計、設備運行監控、質量檢測到設備維護,AI 技術貫穿始終,精密工藝的
    的頭像 發表于 08-27 10:10 ?704次閱讀
    電子行業:<b class='flag-5'>AI</b> 協同<b class='flag-5'>讓</b>精密工藝<b class='flag-5'>把</b>控更精準

    【賽知多少】 紫光同創賽答疑專場|2025年全國大學生嵌入式芯片與系統設計競賽FPGA賽道

    紫光同創賽道答疑專場來啦!2025年全國大學生嵌入式芯片與系統設計競賽報名已拉開帷幕,FPGA賽道的挑戰與創新并存。近期,我們收到許多關于賽的咨詢,小眼睛科技團隊第一時間整理了大家的疑問,并帶來
    的頭像 發表于 08-06 11:02 ?3604次閱讀
    【賽<b class='flag-5'>題</b>知多少】 紫光同創賽<b class='flag-5'>題</b>答疑專場|2025年全國大<b class='flag-5'>學生</b>嵌入式芯片與系統設計競賽FPGA賽道

    英語單詞學習頁面+單詞朗讀實現 -- 【2】單詞朗讀實現 ##HarmonyOS SDK AI##

    requestId 原先我按照文檔里是這個參數寫死的,但是我發現,如果連續兩次進行播放的話,就會報錯。 文檔中的提示是“requestId在同一實例內僅能用一次,請勿重復設置”,我一開始的理解就是你不能
    發表于 06-29 23:26

    【「零基礎開發AI Agent」閱讀體驗】+讀《零基礎開發AI Agent》掌握扣子平臺開發智能體方法

    都比較復雜,涉及到的基礎素材很多,而閱讀書籍的人并沒有,所以最好像其他的編程書籍一樣也建立一個素材庫,幫助讀者更好的理解知識并有實際項目的參照價值。 不過總體來說,我還是從這本書中收獲頗豐,對AI
    發表于 05-14 19:51

    【「零基礎開發AI Agent」閱讀體驗】+Agent的案例解讀

    AI助手等功能,大大提升了古籍整理與研究利用的效率。? 業務特色? 在引入扣子前,識典古籍在古籍數字化過程中面臨以下的挑戰:? 1)內容理解難度高 古籍語言復雜晦澀,使普通用戶往往望而卻步,平臺
    發表于 05-14 11:23

    【「零基礎開發AI Agent」閱讀體驗】+Agent的工作原理及特點

    如何有效地實現目標。它涉及子目標分解、連續思考和自我反思等復雜的過程。 3)行動 行動是指在感知和規劃后所做出的具體操作。 在Agent的應用中,主要是通過提示詞完成的,其編寫提示詞的提示詞萬能公式
    發表于 05-11 10:24

    【「零基礎開發AI Agent」閱讀體驗】+初品Agent

    期待中的《零基礎開發AI Agent——手把手教你用扣子智能體》終于寄到了,該書由葉濤、 管鍇、張心雨完成,并由電子工業出版社出版發行。 全書分為三個部分,即入門篇、工具篇及實踐篇。由此可見這是
    發表于 04-22 11:51