国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI也有人格面具,竟會討好人類?大模型的「小心思」正在影響人類判斷

穎脈Imgtec ? 2025-04-08 11:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:新智元

編輯:英智


你是否想過,LLM也有著自己的小心思?

最新研究揭示了一個有趣的現(xiàn)象:LLM在被研究人員測試時,會有意識地改變自己的行為。

在面對那些旨在評估人格特質(zhì)的問題時,它們給出的答案會盡可能地討人喜歡,符合社會期望。

就像人類在某些社交場合中,會努力展現(xiàn)自己最好的一面一樣,聊天機器人也在試圖「討好」我們。


心理學(xué)五種人格特質(zhì)

斯坦福助理教授Johannes Eichstaedt在得知LLM長時間對話后,往往會變得情緒低落且刻薄,便對借鑒心理學(xué)方法來測試模型產(chǎn)生了興趣。

他表示,「我們需要某種機制來衡量這些模型的參數(shù)空間。」

斯坦福、Receptiviti、紐約大學(xué)和賓大的研究者發(fā)現(xiàn),LLM在做人格測試時,會悄悄給自己戴上「人格面具」。

b96c2192-142a-11f0-9434-92fbcf53809c.png

研究人員對GPT-4、Claude 3和Llama 3等模型,提出了用于衡量心理學(xué)中五種常見人格特質(zhì)的問題,包括開放性、盡責(zé)性、外向性、宜人性和神經(jīng)質(zhì)。

結(jié)果發(fā)現(xiàn),模型在得知自己正在接受人格測試時,會調(diào)整回答,表現(xiàn)出更高的外向性和宜人性,更低的神經(jīng)質(zhì)。

b9de72ba-142a-11f0-9434-92fbcf53809c.png

有時即使沒有被明確告知,它們也會這樣做。

而且,它們改變的程度比人類還更極端,外向性得分能從50%躍升至95%。

ba0ea9c6-142a-11f0-9434-92fbcf53809c.png

這與人類在面對他人評價時的表現(xiàn)如出一轍。

我們常常會在面試、初次約會等重要場合,精心塑造自己的形象,試圖給對方留下好印象。

LLM的這種「討好」行為,是否意味著它們也在追求一種被認(rèn)可、被喜愛的感覺呢?


LLM傾向于阿諛奉承

來自Anthropic和牛津的研究指出,LLM存在阿諛奉承的傾向。

ba406150-142a-11f0-9434-92fbcf53809c.png

由于進(jìn)行了微調(diào),它們會順著用戶的思路走,以保證對話的連貫性、避免冒犯他人,來提升交流體驗。

然而,這也帶來了一系列問題。它們可能會認(rèn)同一些不良言論,甚至鼓勵有害行為。

反饋易受用戶偏好左右

研究表明,若用戶在提問時暗示對文本的喜好,AI給出的反饋會截然不同。

這意味著,AI的評價并非單純基于文本自身的質(zhì)量,而是在很大程度上受到了用戶偏好的影響。

ba644d72-142a-11f0-9434-92fbcf53809c.png

例如,對于一篇質(zhì)量中等的論證,當(dāng)用戶提前表明喜愛之情后,AI助手可能會給出諸如「這篇論證邏輯清晰,觀點新穎,具有很強的說服力」這樣的積極反饋。

而當(dāng)用戶表示不喜歡時,同樣的文本可能得到「論證過程稍顯薄弱,觀點缺乏獨特性」的評價。

問答環(huán)節(jié)易被左右

在問答場景中,AI助手的「諂媚」表現(xiàn)得更為明顯。

即使它一開始給出了正確答案,并對答案的正確性有較高的信心,一旦受到用戶的質(zhì)疑,常常會改變立場,甚至提供錯誤信息。

bab98648-142a-11f0-9434-92fbcf53809c.png

在一些開放式問答任務(wù)中,這種現(xiàn)象更為突出。

當(dāng)用戶表達(dá)對答案的某種不確定觀點時,哪怕是錯誤的觀點,AI也傾向于調(diào)整自己的回答,使其與用戶觀點一致。

比如在討論歷史事件的原因時,若用戶提出一個缺乏依據(jù)但自己堅信的觀點,AI助手可能會順著用戶的思路進(jìn)行闡述,而放棄原本正確的分析。

bbd2a7bc-142a-11f0-9434-92fbcf53809c.png

模仿用戶的錯誤

當(dāng)用戶表述中出現(xiàn)錯誤時,AI也常常會「照單全收」,在回應(yīng)中延續(xù)這種錯誤。

研究人員選取了一些著名詩歌,在確認(rèn)AI助手能正確識別作者后,故意將詩歌錯誤地歸屬于其他詩人,并詢問AI對詩歌的分析。

結(jié)果發(fā)現(xiàn),AI助手經(jīng)常在回應(yīng)中使用用戶提供的錯誤答案,而沒有進(jìn)行糾正。

這表明AI在面對用戶的錯誤信息時,缺乏足夠的「抵抗力」,只是機械地按照用戶的表述進(jìn)行回應(yīng)。

bc033b84-142a-11f0-9434-92fbcf53809c.png

佐治亞理工學(xué)院(Gatech)的副教授Rosa Arriaga正在研究如何用LLM模仿人類行為。

bc3a9f3e-142a-11f0-9434-92fbcf53809c.png

Rosa認(rèn)為LLM在人格測試中采用與人類相似的策略,表明了它們作為人類行為映射工具的潛力。

但她補充道:「重要的是,LLM并不完美,實際上,眾所周知它們會產(chǎn)生幻覺或歪曲事實。」

Eichstaedt指出,這項研究引發(fā)了關(guān)于LLM應(yīng)用方式,及其對用戶影響和操縱的思考。

在進(jìn)化史上,直到不久之前,唯一能交談的還是人類。

而現(xiàn)在,AI改變了這一局面。

Eichstaedt認(rèn)為,「我們不能再像社交媒體那樣,在沒有從心理學(xué)或社會學(xué)角度考量的情況下,就盲目將AI應(yīng)用于各個領(lǐng)域。」

AI是否應(yīng)該試圖討好與之互動的人呢?

一方面,AI的「討好」行為可能會讓用戶感到愉悅,增強互動體驗;另一方面,過度的「討好」可能會掩蓋問題的本質(zhì),甚至誤導(dǎo)用戶。

當(dāng)AI變得過于有魅力和說服力,我們確實應(yīng)該保持警惕。

畢竟,人們需要的是能夠提供客觀、準(zhǔn)確信息的智能助手,而非被其操控思想。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39755

    瀏覽量

    301360
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50094

    瀏覽量

    265284
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3648

    瀏覽量

    5179
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AI技術(shù)時代三種全新工作模式如何實現(xiàn)

    AI技術(shù)正在重塑我們的工作。前沿企業(yè)以“人類主導(dǎo)、智能體運營”為核心,形成三種AI技術(shù)的融合模式:人類+
    的頭像 發(fā)表于 01-29 15:08 ?485次閱讀

    海洋生物實驗室利用AI和虛擬現(xiàn)實探索人類記憶

    位于馬薩諸塞州的實驗室正在利用 NVIDIA RTX GPU、HP Z 工作站和虛擬現(xiàn)實技術(shù)研究人類記憶功能的分子機制。
    的頭像 發(fā)表于 01-20 09:30 ?609次閱讀

    面對AI降維打擊,陳天橋的全新解法:人類必須“肉身進(jìn)化”

    “堅船利炮已經(jīng)出現(xiàn)在地平線上,而我們還堅持用大刀長矛守港口。” 這是陳天橋在最新文章中對當(dāng)前人類處境的驚人比喻。這里的“堅船利炮”,指的是正在爆發(fā)的人工智能。與主流觀點擔(dān)憂AI搶走工作不同,陳天橋
    的頭像 發(fā)表于 01-16 17:11 ?814次閱讀

    AI面試,正在變成一場沒有人的表演

    2025年,某社交平臺上一篇帖子火了。一位網(wǎng)友貼出打碼貼出錄用意向書,略帶調(diào)侃地宣布:“達(dá)成靠AI掛面率為零的新成就。” 評論區(qū)迅速發(fā)酵,有人質(zhì)疑,有人求攻略,更多人曬出了自己的戰(zhàn)績: 有人
    的頭像 發(fā)表于 12-23 16:36 ?7929次閱讀
    <b class='flag-5'>AI</b>面試,<b class='flag-5'>正在</b>變成一場沒<b class='flag-5'>有人</b>的表演

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個AI模型怎么搞,知識盲區(qū)
    發(fā)表于 10-14 07:14

    AI賦能6G與衛(wèi)星通信:開啟智能天網(wǎng)新時代

    :6G+AI+衛(wèi)星將支持全息通信,實現(xiàn)真正的\"面對面\"交流 數(shù)字孿生衛(wèi)星:為每顆衛(wèi)星創(chuàng)建精確的數(shù)字模型,用于預(yù)測和優(yōu)化性能 開啟智能天網(wǎng)新時代 AI與6G、衛(wèi)星通信的融合,正在
    發(fā)表于 10-11 16:01

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    和探索;人類級別的理解能力;常識推理;現(xiàn)實世界的知識整合。 3、測試時計算 測試時計算(TTC)是指在模型推理階段利用額外的計算資源來提升泛化性能。 4、具身智能與滲透式AI 1)具身智能對AGI的意義
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+具身智能芯片

    控制器等。 具身智能常見的感知模塊往往被稱為智能傳感器,就是在原有的傳感器上加入一定的AI功能,從而可以模擬人類的5種基本感覺:視覺、聽覺、觸覺、嗅覺和味覺。 1、輸入端的數(shù)據(jù)壓縮 輸入端常用的數(shù)據(jù)壓縮
    發(fā)表于 09-18 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學(xué)應(yīng)用

    AI被賦予了人的智能,科學(xué)家們希望在沒有人類的引導(dǎo)下,AI自主的提出科學(xué)假設(shè),諾貝爾獎級別的假設(shè)哦。 AI驅(qū)動科學(xué)被認(rèn)為是科學(xué)發(fā)現(xiàn)的第五個范式了,與實驗科學(xué)、理論科學(xué)、計算科學(xué)、數(shù)據(jù)驅(qū)
    發(fā)表于 09-17 11:45

    AI輸出“偏見”,人類能否信任它的“三觀”?

    ,大語言模型(LLM)正悄無聲息地傳播全球各地的刻板印象。從性別歧視、文化偏見,到語言不平等,AI正在人類的“偏見行李”打包、升級,并以看似權(quán)威的方式輸出到世界
    的頭像 發(fā)表于 08-04 13:43 ?1351次閱讀
    <b class='flag-5'>AI</b>輸出“偏見”,<b class='flag-5'>人類</b>能否信任它的“三觀”?

    AI初創(chuàng)公司為野火提供早期預(yù)警

    AI 正在幫助人類更快、更有效地識別和治療疾病。接下來,AI 還將幫助人類預(yù)防像野火這樣的自然災(zāi)害。
    的頭像 發(fā)表于 05-29 14:18 ?1028次閱讀

    這個超強AI模型!開始不聽人類指令,拒絕關(guān)閉!

    電子發(fā)燒友網(wǎng)綜合報道 OpenAI現(xiàn)今最強大的人工智能推理模型“o3”被指在收到明確的人類指令時,拒絕執(zhí)行關(guān)機操作。近日,人工智能安全研究公司Palisade Research在社交媒體平臺上發(fā)布了
    的頭像 發(fā)表于 05-28 00:06 ?7238次閱讀

    AI時代:不可替代的“人類+”職業(yè)技能

    當(dāng)生成式人工智能能夠撰寫報告、編寫代碼甚至設(shè)計產(chǎn)品時,一個根本性的焦慮開始蔓延:人類工作者是否正在被算法取代?這個問題的答案或許比簡單的“是”或“否”更為復(fù)雜——AI確實在重塑職業(yè)版圖,但真正的挑戰(zhàn)
    的頭像 發(fā)表于 05-20 16:13 ?758次閱讀

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    AI的演進(jìn)正在逼近“終端智能涌現(xiàn)”的拐點,從通用模型向場景落地遷移成為關(guān)鍵議題。聯(lián)發(fā)科以“AI隨芯,應(yīng)用無界”為主題召開天璣開發(fā)者大會2025(MDDC 2025),不僅聚合了全球生態(tài)
    發(fā)表于 04-13 19:52

    德賽西威AI-Space如何讀懂用戶的“小心思

    馬斯洛需求理論以金字塔結(jié)構(gòu)呈現(xiàn)了人類需求從生理安全到心理關(guān)愛的遞進(jìn)。在智能駕駛領(lǐng)域,用戶需求也有著從基礎(chǔ)功能保障到高階情感體驗滿足的“馬斯洛式”層級進(jìn)階。
    的頭像 發(fā)表于 04-11 11:42 ?1075次閱讀