国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

IQ測(cè)試是否能測(cè)量AI的推理能力?

mK5P_AItists ? 來(lái)源:未知 ? 作者:胡薇 ? 2018-07-17 14:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

阿基米德基于對(duì)物體體積的抽象理解,悟到了物體的體積與物體浮力之間的關(guān)系。這就是抽象推理的魔力。基于神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)模型取得了驚人的成績(jī),但是測(cè)量其推理抽象概念的能力卻是非常困難的。雖然人工智能已經(jīng)可以在策略游戲的對(duì)戰(zhàn)中戰(zhàn)勝人類,但是卻在一些簡(jiǎn)單任務(wù)方面“無(wú)能為力”,特別是需要在新環(huán)境中發(fā)現(xiàn)并重新構(gòu)建抽象概念。

舉個(gè)例子,如果你只訓(xùn)練AI計(jì)算三角形的屬性,那么,你訓(xùn)練的AI系統(tǒng)永遠(yuǎn)無(wú)法計(jì)算正方形或者其他沒(méi)有訓(xùn)練過(guò)的形狀的屬性。

又比如下邊這道簡(jiǎn)單的IQ測(cè)試題。

IQ測(cè)試給了DeepMind靈感,是不是也能用其測(cè)量AI的推理能力呢?

在以往解決通用學(xué)習(xí)系統(tǒng)努力的基礎(chǔ)上,DeepMind最新論文提出了一種如何測(cè)量機(jī)器模型認(rèn)知能力的方法,并表達(dá)了關(guān)于泛化的一些重要見解。

要構(gòu)建更好、更智能的系統(tǒng),使得神經(jīng)網(wǎng)絡(luò)能夠處理抽象概念,需要對(duì)其進(jìn)行改進(jìn)。

此方法的靈感來(lái)源于IQ測(cè)試。

創(chuàng)建抽象推理數(shù)據(jù)集

標(biāo)準(zhǔn)的人類智商測(cè)試中,通常要求測(cè)試者通過(guò)應(yīng)用他們?nèi)粘=?jīng)驗(yàn)學(xué)習(xí)的原則來(lái)解釋感知上簡(jiǎn)單的視覺(jué)場(chǎng)景。

例如,人類測(cè)試者可能已經(jīng)通過(guò)觀察植物或建筑物的增長(zhǎng),通過(guò)在數(shù)學(xué)課上學(xué)習(xí)加法,或通過(guò)跟蹤銀行余額獲取利息增長(zhǎng)的情況來(lái)了解“漸進(jìn)”(一些屬性能夠增加的概念)。

然后把這些感性認(rèn)識(shí)上升到理性認(rèn)識(shí),從而對(duì)測(cè)試題進(jìn)行推斷預(yù)測(cè),例如圖形的數(shù)量、大小,甚至沿著序列增加顏色強(qiáng)度。

現(xiàn)在機(jī)器學(xué)習(xí)仍然無(wú)法理解一些看似簡(jiǎn)單的“日常體驗(yàn)”,這意味著,人類無(wú)法輕易地衡量AI將知識(shí)從現(xiàn)實(shí)世界轉(zhuǎn)移到視覺(jué)推理測(cè)試的能力。

基于此認(rèn)知,DeepMind設(shè)計(jì)一個(gè)實(shí)驗(yàn),希望使人類視覺(jué)推理測(cè)試得到很好的利用。這一研究不是從日常生活到視覺(jué)推理問(wèn)題(如人類測(cè)試)的知識(shí)轉(zhuǎn)移,而是研究知識(shí)從一組受控的視覺(jué)推理問(wèn)題轉(zhuǎn)移到另一組問(wèn)題。

為實(shí)現(xiàn)這一目標(biāo),DeepMind構(gòu)建了一個(gè)用于創(chuàng)建矩陣問(wèn)題的生成器,涉及一組抽象因子,包括“漸進(jìn)”之類的關(guān)系以及“顏色”和“大小”等屬性。 雖然問(wèn)題生成器使用了一小組潛在因子,但它仍然會(huì)產(chǎn)生大量獨(dú)特的問(wèn)題。

接下來(lái),DeepMind約束生成器可用的因子或組合,以便創(chuàng)建用于訓(xùn)練和測(cè)試模型的不同問(wèn)題集,以度量模型可以推廣到留存的測(cè)試集的程度。

例如,創(chuàng)建了一組謎題訓(xùn)練集,其中只有在應(yīng)用于線條顏色時(shí)才會(huì)遇到漸進(jìn)關(guān)系,而在應(yīng)用于形狀大小時(shí)會(huì)遇到測(cè)試集。如果模型在該測(cè)試集上表現(xiàn)良好,它將提供推斷和應(yīng)用抽象概念的能力的證據(jù),即使在之前從未見過(guò)進(jìn)展的情況下也是如此。

有希望的抽象推理證據(jù)

在機(jī)器學(xué)習(xí)評(píng)估中應(yīng)用的典型的泛化機(jī)制中,訓(xùn)練和測(cè)試數(shù)據(jù)來(lái)自于相同的基礎(chǔ)分布,測(cè)試的所有網(wǎng)絡(luò)都表現(xiàn)出良好的泛化誤差,其中一些在略高于75%的情況下實(shí)現(xiàn)了令人印象深刻的絕對(duì)性能。性能最佳的網(wǎng)絡(luò)明確地計(jì)算了不同圖像面板之間的關(guān)系,并且并行地評(píng)估了每個(gè)潛在答案的適用性。DeepMind將此架構(gòu)稱為Wild RelationNetwork(WReN)。

當(dāng)需要在先前看到的屬性值之間使用屬性值“插值”來(lái)推理,以及在不熟悉的組合中應(yīng)用已知的抽象關(guān)系時(shí),模型的泛化效果顯著。然而,在“外推”機(jī)制中,同樣的網(wǎng)絡(luò)表現(xiàn)得糟糕得多,在這種情況下,測(cè)試集中的屬性值并不與訓(xùn)練中看到的值處于相同的范圍內(nèi)。

這種事情發(fā)生在當(dāng)訓(xùn)練集中有深顏色的物體而測(cè)試集中是淺顏色的物體的謎題中。當(dāng)模型被訓(xùn)練來(lái)應(yīng)用以前所見的關(guān)系(比如形狀的數(shù)量)到一個(gè)新的屬性(如大小)時(shí),泛化性能也會(huì)更糟。

最后,當(dāng)訓(xùn)練模型不僅預(yù)測(cè)正確的答案,而且還預(yù)測(cè)答案的“原因”(即應(yīng)該考慮解決這個(gè)難題的特定關(guān)系和屬性)時(shí),DeepMind稱觀察到了改進(jìn)的泛化性能。

有趣的是,在中性分割中(the neutral split),模型的準(zhǔn)確性與它推斷矩陣下正確關(guān)系的能力密切相關(guān):當(dāng)解釋正確時(shí),模型會(huì)選擇當(dāng)時(shí)正確的答案的概率為87%,但當(dāng)它的解釋錯(cuò)誤時(shí),性能下降到只有32%。這表明,當(dāng)模型正確地推斷出任務(wù)背后的抽象概念時(shí),能夠獲得更好的性能。

更微妙的泛化方法

目前的文獻(xiàn)關(guān)注于基于神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)方法的優(yōu)缺點(diǎn),通常是基于它們的能力或泛化的失敗。DeepMind的結(jié)果表明,得出關(guān)于泛化的普遍結(jié)論可能是沒(méi)有幫助的:測(cè)試的神經(jīng)網(wǎng)絡(luò)在某些泛化狀態(tài)下表現(xiàn)得很好,而在其他狀態(tài)下表現(xiàn)得很差。

它們的成功是由一系列因素決定的,包括所使用的模型的架構(gòu),以及模型是否被訓(xùn)練為其選擇的答案提供可解釋的“原因”。在幾乎所有的情況下,當(dāng)需要推斷出超出其經(jīng)驗(yàn)的輸入或處理完全陌生的屬性時(shí),系統(tǒng)表現(xiàn)很差;在這個(gè)至關(guān)重要的研究領(lǐng)域?yàn)槲磥?lái)的工作創(chuàng)造一個(gè)清晰的重點(diǎn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107753
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39757

    瀏覽量

    301366
  • DeepMind
    +關(guān)注

    關(guān)注

    0

    文章

    131

    瀏覽量

    12285

原文標(biāo)題:學(xué)界 | DeepMind想用IQ題測(cè)試AI的抽象思維能力,進(jìn)展還不錯(cuò)

文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    華為破解HBM依賴!AI推理黑科技UCM上線,9月正式開源

    8月12日,在2025金融AI推理應(yīng)用落地與發(fā)展論壇上,華為公司副總裁、數(shù)據(jù)存儲(chǔ)產(chǎn)品線總裁周越峰宣布,華為此次和銀聯(lián)聯(lián)合創(chuàng)新,推出AI推理創(chuàng)新技術(shù)UCM(
    的頭像 發(fā)表于 08-13 08:58 ?1.1w次閱讀
    華為破解HBM依賴!<b class='flag-5'>AI</b><b class='flag-5'>推理</b>黑科技UCM上線,9月正式開源

    AI推理芯片需求爆發(fā),OpenAI欲尋求新合作伙伴

    領(lǐng)域占據(jù)主導(dǎo),其GPU憑借強(qiáng)大的海量數(shù)據(jù)處理能力,成為全球AI爆炸式增長(zhǎng)的重要基石。但隨著AI不斷演進(jìn),重點(diǎn)正從大規(guī)模訓(xùn)練轉(zhuǎn)向?qū)σ延?xùn)練模型的推理和推斷,
    的頭像 發(fā)表于 02-03 17:15 ?1987次閱讀

    使用NORDIC AI的好處

    ,時(shí)延更低,系統(tǒng)在網(wǎng)絡(luò)不穩(wěn)定甚至離線時(shí)也繼續(xù)工作。[Edge AI 概述] 提升隱私與可靠性 原始傳感器數(shù)據(jù)(如運(yùn)動(dòng)、生理信號(hào)等)可以留在本地,只上傳推理結(jié)果,有利于隱私與數(shù)據(jù)安全。 本地決策
    發(fā)表于 01-31 23:16

    思必馳場(chǎng)景化推理AI重塑智能交互

    AI技術(shù)從“感知”走向“認(rèn)知”的今天,推理能力正成為推動(dòng)人工智能向更高階躍遷的核心引擎。
    的頭像 發(fā)表于 12-12 11:31 ?740次閱讀

    華為數(shù)據(jù)存儲(chǔ)與「DaoCloud 道客」發(fā)布AI推理加速聯(lián)合解決方案

    AI產(chǎn)業(yè)已從“追求模型能力極限”轉(zhuǎn)向“追求推理體驗(yàn)最優(yōu)化”,推理體驗(yàn)決定用戶與AI的交互質(zhì)感。當(dāng)前推理
    的頭像 發(fā)表于 11-28 10:03 ?400次閱讀
    華為數(shù)據(jù)存儲(chǔ)與「DaoCloud 道客」發(fā)布<b class='flag-5'>AI</b><b class='flag-5'>推理</b>加速聯(lián)合解決方案

    什么是AI模型的推理能力

    NVIDIA 的數(shù)據(jù)工廠團(tuán)隊(duì)為 NVIDIA Cosmos Reason 等 AI 模型奠定了基礎(chǔ),該模型近日在 Hugging Face 的物理推理模型排行榜中位列榜首。
    的頭像 發(fā)表于 09-23 15:19 ?1266次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    和探索;人類級(jí)別的理解能力;常識(shí)推理;現(xiàn)實(shí)世界的知識(shí)整合。 3、測(cè)試時(shí)計(jì)算 測(cè)試時(shí)計(jì)算(TTC)是指在模型推理階段利用額外的計(jì)算資源來(lái)提升泛
    發(fā)表于 09-18 15:31

    github 上的 nano版本已經(jīng)更新到了4.1.1,是否能提供4.1.1版本的mdk pack包?

    github 上的 nano版本已經(jīng)更新到了4.1.1,是否能提供4.1.1版本的mdk pack包, 會(huì)方便很多
    發(fā)表于 09-17 06:36

    進(jìn)行時(shí)鐘維持能力測(cè)試時(shí),如何判斷裝置是否符合IEC標(biāo)準(zhǔn)?

    判斷電能質(zhì)量在線監(jiān)測(cè)裝置的時(shí)鐘維持能力是否符合 IEC 標(biāo)準(zhǔn),需依據(jù) IEC 61000-4-30:2025《電磁兼容性 第 4-30 部分:測(cè)試測(cè)量技術(shù) 電能質(zhì)量
    的頭像 發(fā)表于 09-03 17:34 ?789次閱讀
    進(jìn)行時(shí)鐘維持<b class='flag-5'>能力</b><b class='flag-5'>測(cè)試</b>時(shí),如何判斷裝置<b class='flag-5'>是否</b>符合IEC標(biāo)準(zhǔn)?

    MTA Studio:從測(cè)量測(cè)試執(zhí)行到數(shù)據(jù)價(jià)值洞察,全程賦

    本文導(dǎo)讀致遠(yuǎn)儀器MTAStudio是一款面向電力電子測(cè)試測(cè)量應(yīng)用的綜合性軟件平臺(tái)。它集儀器管理、執(zhí)行測(cè)試與歷史數(shù)據(jù)深度分析等功能于一體,顯著提升測(cè)試
    的頭像 發(fā)表于 08-21 11:34 ?875次閱讀
    MTA Studio:從<b class='flag-5'>測(cè)量</b><b class='flag-5'>測(cè)試</b>執(zhí)行到數(shù)據(jù)價(jià)值洞察,全程賦<b class='flag-5'>能</b>

    華為亮相2025金融AI推理應(yīng)用落地與發(fā)展論壇

    近日,2025金融AI推理應(yīng)用落地與發(fā)展論壇在上海舉行。中國(guó)銀聯(lián)執(zhí)行副總裁涂曉軍、華為數(shù)字金融軍團(tuán)CEO曹沖出席本次論壇并發(fā)表致辭。論壇上,華為公司副總裁、數(shù)據(jù)存儲(chǔ)產(chǎn)品線總裁周躍峰博士發(fā)布AI
    的頭像 發(fā)表于 08-15 09:45 ?1219次閱讀

    PCIe協(xié)議分析儀測(cè)試哪些設(shè)備?

    /ASIC加速器 測(cè)試場(chǎng)景:分析專用AI推理加速器與主系統(tǒng)的PCIe通信,優(yōu)化數(shù)據(jù)傳輸和指令下發(fā)效率。 應(yīng)用價(jià)值:提高推理吞吐量,確保加速器在低延遲場(chǎng)景(如實(shí)時(shí)
    發(fā)表于 07-25 14:09

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    DeepSeek-R1:強(qiáng)大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開發(fā)的新一代AI大模型。其核心優(yōu)勢(shì)在于強(qiáng)大的推理引擎
    發(fā)表于 07-16 15:29

    谷歌第七代TPU Ironwood深度解讀:AI推理時(shí)代的硬件革命

    谷歌第七代TPU Ironwood深度解讀:AI推理時(shí)代的硬件革命 Google 發(fā)布了 Ironwood,這是其第七代張量處理單元 (TPU),專為推理而設(shè)計(jì)。這款功能強(qiáng)大的 AI
    的頭像 發(fā)表于 04-12 11:10 ?3721次閱讀
    谷歌第七代TPU Ironwood深度解讀:<b class='flag-5'>AI</b><b class='flag-5'>推理</b>時(shí)代的硬件革命

    當(dāng)SC18IS604的GPIO引腳配置為僅輸入時(shí),它們是否能承受5V電壓?

    配置為僅輸入時(shí),它們是否能承受 5V 電壓? 2. SDA 和 SCL 線路的輸入/輸出是否具有容錯(cuò)能力?如果 VDD 為3.3V、是否可以將 I2C 總線上拉至5V?
    發(fā)表于 03-20 07:20