国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌重磅發布自然問題數據集

電子工程師 ? 來源:cc ? 2019-01-28 15:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌重磅發布自然問題數據集(Natural Questions),包含30萬個自然發生的問題和人工注釋的答案,16000個示例,并發起基于此數據集的問答系統挑戰賽。有望成為自然語言理解領域的SQuAD!

開放領域問題回答(QA)是自然語言理解(NLU)中的一項基準任務,它的目的是模擬人類如何查找信息,通過閱讀和理解整個文檔來找到問題的答案。

比如,給定一個用自然語言表達的問題“為什么天空是藍色的?”("Why is the sky blue?”),QA系統應該能夠閱讀網頁(例如“天空漫射”的維基百科頁面)并返回正確的答案,即使答案有些復雜和冗長。

然而,目前還沒有可以用于訓練和評估QA模型的大型、公開的自然發生問題(即由尋求信息的人提出的問題)和答案數據集。

這是因為構建用于QA任務的高質量數據集需要大量的真實問題來源,并且需要大量人力來為這些問題尋找正確答案。

為了促進QA領域的研究進展,谷歌今天發布自然問題數據集(Natural Questions, NQ),這是一個用于訓練和評估開放領域問答系統的新的、大規模語料庫,也是第一個復制人類查找問題答案的端到端流程的語料庫。

Natural Questions數據集

NQ的規模非常龐大,包含30萬個自然發生的問題,以及來自Wikipedia頁面的人工注釋答案,用于訓練QA系統。

此外,NQ語料庫還包含16000個示例,每個示例都由5位不同的注釋人提供答案(針對相同的問題),這對于***的QA系統的性能非常有用。

Natural Questions數據集中的示例

由于回答NQ中的問題比回答瑣碎問題(這些問題對計算機來說已經很容易解決)需要有更深入的理解,谷歌還發起了一項基于此數據集的挑戰賽,以幫助提高計算機對自然語言的理解。

NQ挑戰賽排行榜

NQ數據集包含307K訓練示例、8K開發示例和8K測試示例。

目前,NQ挑戰賽排行榜上只有谷歌的BERT模型和DecAtt-DocReader模型的成績。在論文中,谷歌證明在長答案選擇任務上的人類的最優成績為87% F1,在短答案選擇任務上人類的最優成績為76%。

來自谷歌搜索的真實問題

NQ是第一個使用自然發生的查詢創建的數據集,并專注于通過閱讀整個頁面來查找答案,而不是從一個短段落中提取答案。

為了創建NQ,我們從用戶提交給Google搜索引擎的真實、匿名、聚合的查詢開始。

然后,我們要求注釋者通過通讀整個維基百科頁面來找到答案,就好像這個問題是他們自己提出的一樣。注釋者需要找到一個長答案和一個短答案,長答案涵蓋推斷問題所需的所有信息,短答案需要用一個或多個實體的名稱簡潔地回答問題。

對NQ語料庫的注釋質量進行評估,顯示準確率達到90%。

注釋包含一個長答案和一個短答案

研究人員在論文《自然問題:問答研究的基準》(Natural Questions: a Benchmark for Question Answering Research)中對數據收集的過程進行了全面描述,論文已發表在《計算語言學協會會刊》(Transactions of the Association for computing Linguistics)。大家也可以在NQ網站上查看更多來自數據集的示例。

自然語言理解挑戰

NQ的目的是使QA系統能夠閱讀和理解完整的維基百科文章,其中可能包含問題的答案,也可能不包含問題的答案。

系統首先需要確定這個問題的定義是否足夠充分,是否可以回答——許多問題本身基于錯誤的假設,或者過于模糊,無法簡明扼要地回答。

然后,系統需要確定維基百科頁面中是否包含推斷答案所需的所有信息。我們認為,相比在知道長答案后在尋找短答案,長答案識別任務——找到推斷答案所需的所有信息——需要更深層次的語言理解。

我們希望NQ的發布以及相關的挑戰賽將有助于推動更有效、更強大的QA系統的開發。我們鼓勵NLU社區參與進來,并幫助縮小目前最先進方法的性能與人類上限之間的巨大差距。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6254

    瀏覽量

    111373
  • 人工智能
    +關注

    關注

    1817

    文章

    50094

    瀏覽量

    265299

原文標題:NLP新基準!谷歌重磅發布開放問答數據集,30萬自然提問+人工注釋答案

文章出處:【微信號:aicapital,微信公眾號:全球人工智能】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    芯賽場,云力量!小眼睛科技遠程AI實驗平臺重磅發布助力2026創賽!

    新歲策馬向繁花FPGA遠程AI實驗平臺重磅發布賦能未來創芯者,小眼睛科技FPGA遠程AI實驗平臺助力2026創賽!2026,小眼睛科技重磅推出全新FPGA遠程AI實驗平臺!該平臺將作
    的頭像 發表于 03-05 13:01 ?535次閱讀
    芯賽場,云力量!小眼睛科技遠程AI實驗平臺<b class='flag-5'>重磅</b><b class='flag-5'>發布</b>助力2026<b class='flag-5'>集</b>創賽!

    智多晶重磅發布HQPEP功耗評估工具

    FPGA功耗受工藝、電壓、溫度、資源占用等多重因素影響,傳統評估依賴后期板級實測,易引發電源重構、散熱返工等風險。為此,智多晶重磅發布HQPEP(HqFpga Power Estimation Platform)功耗評估工具,聚焦FPGA設計早期的功耗評估需求,為工程師打
    的頭像 發表于 01-23 16:01 ?1055次閱讀
    智多晶<b class='flag-5'>重磅</b><b class='flag-5'>發布</b>HQPEP功耗評估工具

    谷歌評論卡,碰一碰即可完成谷歌評論 #谷歌評論卡 #NFC標簽 #nfc卡

    谷歌
    深圳市融智興科技有限公司
    發布于 :2026年01月15日 17:02:00

    重磅更新 | 先楫半導體HPM_APPS v1.10.1發布

    重磅更新 | 先楫半導體HPM_APPS v1.10.1發布
    的頭像 發表于 12-26 08:33 ?860次閱讀
    <b class='flag-5'>重磅</b>更新 | 先楫半導體HPM_APPS v1.10.1<b class='flag-5'>發布</b>

    偉創力重磅發布全球首款面向千兆瓦級數據中心的AI基礎設施平臺

    偉創力重磅發布全球首款面向千兆瓦級數據中心的AI基礎設施平臺,平臺集成了電源和冷卻產品、計算能力和服務,專為AI和高性能計算而設計,幫助數據中心運營商將部署速度提升高達30%,大幅降低
    的頭像 發表于 10-23 15:08 ?782次閱讀

    匯川技術17款新品重磅發布

    今天,匯川技術 2025 年度爆品發布會以 “數自融合 軟件定義自動化” 為主題,面向全球重磅發布
    的頭像 發表于 09-02 15:58 ?3960次閱讀

    AI Cube如何導入數據

    我從在線平臺標注完并且下載了數據,也按照ai cube的要求修改了文件夾名稱,但是導入提示 不知道是什么原因,我該怎么辦? 以下是我修改后的文件夾目錄
    發表于 08-11 08:12

    云訓練平臺數據過大無法下載數據至本地怎么解決?

    起因是現在平臺限制了圖片數量,想要本地訓練下載數據時發現只會跳出網絡異常的錯誤,請問這有什么解決辦法?
    發表于 07-22 06:03

    使用AICube導入數據點創建后提示數據不合法怎么處理?

    重現步驟 data目錄下 labels.txt只有英文 **錯誤日志** 但是使用示例的數據可以完成訓練并部署
    發表于 06-24 06:07

    數據下載失敗的原因?

    數據下載失敗什么原因太大了嗎,小的可以下載,想把大的下載去本地訓練報錯網絡錯誤 大的數據多大?數據量有多少?
    發表于 06-18 07:04

    百度地圖重磅發布地圖AI開放平臺

    近日,在WGDC25全球時空智能大會上,百度地圖重磅發布地圖AI開放平臺。百度地圖深耕20年的數據能力、引擎能力與AI技術全面開放,向開發者深度開放四大核心能力和五大場景解決方案。
    的頭像 發表于 05-26 11:26 ?1745次閱讀

    重磅更新 | 先楫半導體HPM_APPS v1.9.0發布

    重磅更新 | 先楫半導體HPM_APPS v1.9.0發布
    的頭像 發表于 05-13 11:29 ?1784次閱讀
    <b class='flag-5'>重磅</b>更新 | 先楫半導體HPM_APPS v1.9.0<b class='flag-5'>發布</b>

    華為兆瓦超充重磅產品全新發布

    近日,上海車展同期,華為智能充電網絡正式發布華為兆瓦超充等重磅新品,從乘用車的“一秒一公里*”到電動重卡的“充電五分鐘,行駛百公里*”。華為數字能源副總裁、華為數字能源數據中心能源及關鍵供電產品線
    的頭像 發表于 04-25 16:54 ?1349次閱讀

    谷歌發布混合量子模擬方法

    據外媒報道,谷歌發布了一種混合量子模擬方法;論文已經在Nature正式發表,谷歌混合量子模擬器的核心在于將模擬和數字技術相結合;是全新的模擬-數字方案,可在保持速度的同時增強可控制性,這一方案顛覆了
    的頭像 發表于 04-22 17:17 ?818次閱讀

    請問NanoEdge AI數據該如何構建?

    我想用NanoEdge來識別異常的聲音,但我目前沒有辦法生成模型,我感覺可能是數據的問題,請問我該怎么構建數據?或者生成模型失敗還會有哪些原因?
    發表于 03-10 08:20