国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

心智理論測試:人工智能擊敗人類

AI智勝未來 ? 來源:悅智網(wǎng) ? 2024-11-08 10:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

測試結(jié)果并不一定意味著人工智能可以“理解”人。

心智理論是指可以理解他人心理狀態(tài)的能力,正是它驅(qū)使著人類社會運轉(zhuǎn)。它幫助你決定在緊張的情況下該說什么、猜測其他車輛的駕駛員將要做什么,以及與電影中的角色產(chǎn)生共鳴。一項最新的研究表明,ChatGPT等工具所使用的大語言模型在模仿這一典型人類特征方面表現(xiàn)得非常出色。

“在進行這項研究之前,我們都相信大語言模型無法通過這些測試,特別是那些判斷不易察覺的心理狀態(tài)能力的測試。”該研究的合著者克里斯蒂娜?貝奇奧(Cristina Becchio)說,她是德國漢堡-埃彭多夫大學醫(yī)學中心的認知神經(jīng)科學教授。這項她認為“出乎意料和令人驚訝”的研究結(jié)果發(fā)表在2024年5月20日的《自然?人類行為》雜志中。

貝奇奧和她的同事并不是首先提出證據(jù)表明大語言模型的反應能夠表現(xiàn)這種推理能力的人。在2023年發(fā)表的一篇預印本論文中,斯坦福大學心理學家邁克爾?科辛斯基(Michal Kosinski)報告了幾個模型在幾種常見心智理論測試中的測試情況。他發(fā)現(xiàn),其中最好的是OpenAI的GPT-4,它正確完成了75%的任務,他說,這相當于過去研究中6歲兒童的表現(xiàn)。不過,這項研究中的方法遭到了其他研究人員的批評,他們進行了后續(xù)實驗,并得出結(jié)論,大語言模型之所以能得出正確答案,往往是基于“淺顯的啟發(fā)”和捷徑,而不是真正基于心智理論推理。

本研究的作者很清楚這種爭論。“在論文中,我們的目標是使用廣泛的心理測試,以更加系統(tǒng)的方式來應對機器心智理論的評估挑戰(zhàn)。”該研究的合著者詹姆斯?斯特拉坎(James Strachan)說,他是一名認知心理學家,目前是漢堡-埃彭多夫大學醫(yī)學中心的訪問科學家。他指出,進行嚴謹?shù)难芯恳馕吨獪y試人類和大語言模型處理相同任務的能力,這項研究比較了1907個人與幾個流行的大語言模型的能力。

大語言模型和人類都完成了5種典型的心智理論測試,前3種是理解暗示、反語和失禮。此外,他們還回答了“錯誤信念”問題,這些問題通常用于確定幼兒心智理論的發(fā)展程度。這些問題是這樣的:如果愛麗絲在鮑勃不在房間的時候移動了某樣東西,那么鮑勃回來后應該去哪里找這個東西?最后,他們回答了“奇怪故事”中一些相當復雜的問題,這些故事中的人物相互撒謊、操縱并產(chǎn)生了很多誤解。

總體而言,GPT-4占據(jù)了優(yōu)勢。它的得分在錯誤信念測試中與人類相當,在反語、暗示和奇怪故事方面的總分高于人類,只在失禮測試中表現(xiàn)不如人類。為了理解失禮測試結(jié)果有所不同的原因,研究人員對該模型進行了一系列后續(xù)測試,探索了幾種假設。他們得出的結(jié)論是,GPT-4能夠?qū)τ嘘P失禮的問題給出正確答案,但在固執(zhí)己見方面受到“極端保守”編程的限制。斯特拉坎指出,OpenAI在模型周圍設置了許多圍欄,“旨在保持模型真實、誠實和正確”,他認為,旨在防止GPT-4產(chǎn)生幻覺(即編造內(nèi)容)的策略可能會妨礙它對一些問題輸出觀點,比如故事角色是否在高中同學聚會上無意間侮辱了老同學。

研究人員很謹慎。他們沒有說自己的研究結(jié)果表明大語言模型實際上擁有心智理論能力,而是說大語言模型“在心智理論任務中的表現(xiàn)與人類行為沒有區(qū)別”。這就引出了一個問題:如果一個仿品和真品一樣好,那你怎么知道它不是真品?斯特拉坎說,這是一個社會科學家以前從未嘗試回答的問題,因為對人類的測試會假設這種品質(zhì)在某種程度上是存在的。“我們目前還沒有一種方法甚至是一種理念來測試心智理論的存在,這是一種現(xiàn)象學品質(zhì)。”他說。

華盛頓大學計算語言學教授艾米麗?本德(Emily Bender)因堅持揭露人工智能行業(yè)的膨脹炒作而成為了該領域的傳奇人物。她對這個激勵著研究人員的問題提出了異議。“面對相同問題,文本處理系統(tǒng)能否產(chǎn)生與人類相似的答案為什么如此重要?”她問道,“我們能夠了解大語言模型內(nèi)部是如何運作的嗎?它們可能有什么用處,又可能帶來哪些危險?”

本德對論文中的擬人化表示擔憂,論文研究人員說大語言模型有認知、推理和作出選擇的能力,還使用了“大語言模型和人類參與者之間的物種公平比較”這一措辭。本德說,這“完全沒有將軟件囊括在內(nèi)”。

漢堡-埃彭多夫大學醫(yī)學中心團隊的研究結(jié)果可能并不表明人工智能真的能理解我們,但值得思考的是,人工智能能夠做出令人信服的行為,這會帶來什么影響。雖然這種大語言模型在與人類用戶交互和預測用戶需求方面會做得更好,但它們也可能更多地用于欺騙和操縱。它們會引來更多的擬人化,讓人類用戶相信用戶界面的另一端是有思想的。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265372

原文標題:人工智能在心智理論測試中戰(zhàn)勝人類

文章出處:【微信號:AI智勝未來,微信公眾號:AI智勝未來】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    淺談人工智能(2)

    。 強人工智能(Strong AI),又稱通用人工智能(Artificial General Intelligence)或完全人工智能,指的是可以勝任人類所有工作的
    的頭像 發(fā)表于 02-22 08:24 ?120次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    世界移動通信大會|開啟無線測試人工智能融合的未來篇章

    專為當下至關重要的無線技術——Wi-Fi 8、6G以及基于開放式無線接入網(wǎng)(Open RAN)的5G基礎設施——精心打造測試解決方案。這些技術對于在邊緣計算場景中實現(xiàn)人工智能應用起著決定性作用。穩(wěn)固可靠的連接性是人工智能驅(qū)動型應
    的頭像 發(fā)表于 02-12 14:34 ?505次閱讀

    開發(fā)智能體配置-內(nèi)容合規(guī)

    智能體上架前,需完成“人工智能生成合成內(nèi)容標識”和“大模型備案信息”填寫 ,以供平臺審核;可在智能體【配置】-【內(nèi)容合規(guī)】中填寫。 人工智能生成合成內(nèi)容標識 “
    發(fā)表于 02-07 11:44

    自然智能與人工智能融合如何重塑芯片設計

    人類大腦是所有處理器中最復雜的,能夠構(gòu)思出不可思議的創(chuàng)意,解決復雜、微妙的問題。相比之下,人工智能擅長快速分析海量數(shù)據(jù)并高效執(zhí)行任務。當自然智能人工智能融合的結(jié)果,就是芯片設計領域正
    的頭像 發(fā)表于 01-15 13:58 ?511次閱讀

    物理人工智能面臨的安全風險

    機器人,再到常見的掃地機器人,物理人工智能系統(tǒng)正變得越來越智能,也越來越貼近人類生活。先進的3D傳感器、人工智能攝像頭、語音接口
    的頭像 發(fā)表于 11-17 10:54 ?901次閱讀
    物理<b class='flag-5'>人工智能</b>面臨的安全風險

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進的邊緣設備上進行人工智能處理。在這篇博文中,我們將介紹這對開發(fā)人員意味著什么,以及使用 Neuton 模型如何改進您的開發(fā)和終端
    發(fā)表于 08-31 20:54

    人工智能+”,走老路難賺到新錢

    昨天的“人工智能+”刷屏了,這算是官方第一次對“人工智能+”這個名稱定性吧?今年年初到現(xiàn)在,涌現(xiàn)出了一大批基于人工智能的創(chuàng)業(yè)者,這已經(jīng)算是AI2.0時代的第三波創(chuàng)業(yè)潮了,第一波是基礎大模型,第二波
    的頭像 發(fā)表于 08-27 13:21 ?724次閱讀
    “<b class='flag-5'>人工智能</b>+”,走老路難賺到新錢

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    家人們,最近在研究人工智能相關設備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實驗箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學,便捷拉滿 這個實驗箱真的是為使用者
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    家人們,最近在研究人工智能相關設備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實驗箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學,便捷拉滿 這個實驗箱真的是為使用者
    發(fā)表于 08-07 14:23

    超小型Neuton機器學習模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應用.

    Neuton 是一家邊緣AI 公司,致力于讓機器 學習模型更易于使用。它創(chuàng)建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進的邊緣設備上進行人工智能處理。在這篇博文中,我們將介紹
    發(fā)表于 07-31 11:38

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能
    發(fā)表于 07-14 11:23

    最新人工智能硬件培訓AI 基礎入門學習課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發(fā)展的當下,無論是探索未來職業(yè)方向,還是更新技術儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學術研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    開售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網(wǎng),WiFi,USB 擴展/重力感應/RS232/RS485/IO 擴展/I2C 擴展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個全新八核擁有超強性能的人工智能
    發(fā)表于 04-23 10:55

    迅為iTOP-RK3576人工智能開發(fā)板Android?系統(tǒng)接口功能測試

    迅為iTOP-RK3576人工智能開發(fā)板Android?系統(tǒng)接口功能測試
    的頭像 發(fā)表于 03-28 14:45 ?3801次閱讀
    迅為iTOP-RK3576<b class='flag-5'>人工智能</b>開發(fā)板Android?系統(tǒng)接口功能<b class='flag-5'>測試</b>

    NXP技術白皮書:AIoT人工智能物聯(lián)網(wǎng) 將人工智能與現(xiàn)實世界相連

    ? 分析師將人工智能物聯(lián)網(wǎng) (AIoT) 大致定義為人工智能 (AI) 與物聯(lián)網(wǎng)(IoT)的融合,利用AI讓物聯(lián)網(wǎng)設備變得更智能、更具自主性。但這是一個以設備為中心的“小數(shù)據(jù)”的定義。從戰(zhàn)略層面
    的頭像 發(fā)表于 03-28 11:53 ?2107次閱讀
    NXP技術白皮書:AIoT<b class='flag-5'>人工智能</b>物聯(lián)網(wǎng) 將<b class='flag-5'>人工智能</b>與現(xiàn)實世界相連