人類(lèi)和部分動(dòng)物都具有一種數(shù)量感知能力,不需要刻意數(shù)數(shù),就能憑借視覺(jué)對(duì)數(shù)量多少得出一個(gè)基本判斷,甚至直接抽象出具體數(shù)量。比如一張圖片中有 4 個(gè)蘋(píng)果和 4 只狗,人類(lèi)在觀察圖片并識(shí)別蘋(píng)果和狗的過(guò)程中,大腦自然而然就能形成 “兩類(lèi)物體都有 4 個(gè)” 這樣的抽象概念。
雖然這種數(shù)感能力的準(zhǔn)確率會(huì)隨著數(shù)量級(jí)的上升而下降——我們很難憑感覺(jué)判斷圖片中有 100 只狗,還是 98 只——但是在一張有 98 只狗和 50 個(gè)蘋(píng)果的圖片中,我們依然可以對(duì)誰(shuí)多誰(shuí)少有一個(gè)大致準(zhǔn)確的概念。
更重要的是,這種能力似乎源自于大腦中的視覺(jué)感知區(qū)域,其中的神經(jīng)元在受到視覺(jué)刺激的情況下,也可以同時(shí)激活一部分?jǐn)?shù)感機(jī)制。
那么問(wèn)題來(lái)了,我們發(fā)明的人工智能(AI),尤其是所謂的模擬大腦工作機(jī)制的神經(jīng)網(wǎng)絡(luò),是否也具備這種能力呢?換言之,一個(gè)受到視覺(jué)訓(xùn)練的神經(jīng)網(wǎng)絡(luò),是否可以形成類(lèi)似的數(shù)感機(jī)制?
近日,來(lái)自德國(guó)和美國(guó)的科學(xué)家就這一問(wèn)題展開(kāi)了研究,得出的結(jié)論是肯定的。他們?cè)谟?xùn)練圖像分類(lèi) AI 系統(tǒng)時(shí)發(fā)現(xiàn),一些神經(jīng)元的激活模式與猴腦神經(jīng)元處理數(shù)量信息時(shí)的激活模式非常相似,而且它們甚至還發(fā)展出了對(duì)特定數(shù)字的偏好,足以說(shuō)明神經(jīng)網(wǎng)絡(luò)可以從圖像中抽象出數(shù)量信息。
也就是說(shuō),在沒(méi)有進(jìn)行專(zhuān)門(mén)數(shù)數(shù)訓(xùn)練的情況下,神經(jīng)網(wǎng)絡(luò)僅憑視覺(jué)信息,就在一定程度上 “發(fā)展出” 了如何從中獲得數(shù)量信息,產(chǎn)生了類(lèi)似于人類(lèi)和動(dòng)物的數(shù)量感知能力。
證實(shí)數(shù)感能力的存在,或許可以證明我們對(duì)生物智能的復(fù)制在某些方面是富有成效的。該研究成果發(fā)表于期刊 Science Advances 上。
人與計(jì)算機(jī)的不同“腦回路”
剛剛提到,現(xiàn)有神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)是嘗試模擬人腦運(yùn)作機(jī)制的產(chǎn)物,但計(jì)算機(jī)和人類(lèi)的 “腦回路” 截然不同。
我們都知道,相比買(mǎi)菜找零都要算上幾秒鐘的人類(lèi),計(jì)算機(jī)的計(jì)算能力可以說(shuō)是碾壓般的存在,每秒鐘可以完成上億次的運(yùn)算,還能保證相當(dāng)高的精確度。當(dāng)然,這也是我們發(fā)明它的目的。
不過(guò),人類(lèi)的強(qiáng)大之處在于,可以通過(guò)直覺(jué)感知場(chǎng)景中物體的數(shù)量,還具有很強(qiáng)的抗干擾和類(lèi)比能力,計(jì)算機(jī)卻必須收到確切的計(jì)算指令,比如給出圖片中狗的數(shù)量,才能開(kāi)始執(zhí)行任務(wù)。
這種對(duì)于數(shù)量的感知能力也被稱(chēng)為“數(shù)量感”,指的是快速理解、估計(jì)和產(chǎn)生數(shù)量,并對(duì)數(shù)量進(jìn)行表征以及理解數(shù)量間關(guān)系的能力。
研究顯示,人類(lèi)和動(dòng)物的大腦中存在特殊神經(jīng)元,能夠?qū)?shù)量和數(shù)值產(chǎn)生反應(yīng)。因此通過(guò)視覺(jué)刺激,我們可以對(duì)物體特征進(jìn)行抽象并表征其數(shù)量信息,甚至不受物體大小、顏色和形狀的影響。
遵循這一思路,德國(guó)和美國(guó)的研究人員將目光轉(zhuǎn)換到神經(jīng)網(wǎng)絡(luò)上,看看是否可以從中挖掘出類(lèi)似的神經(jīng)元觸發(fā)機(jī)制。
無(wú)師自通的分類(lèi)模型
他們選擇了受生物特性啟發(fā)而成的分層卷積神經(jīng)網(wǎng)絡(luò)(HCNN)作為實(shí)驗(yàn)對(duì)象。該模型廣泛使用于計(jì)算機(jī)視覺(jué)應(yīng)用中,由多個(gè)前饋層和視網(wǎng)膜拓?fù)浣Y(jié)構(gòu)層組成,層中的每個(gè)網(wǎng)絡(luò)單元都可以模擬不同類(lèi)型的視覺(jué)神經(jīng)元。
整個(gè)模型包含兩套網(wǎng)絡(luò):一個(gè)是特征提取網(wǎng)絡(luò),可以將自然圖像轉(zhuǎn)化成(特征的)高級(jí)表示;另一個(gè)是圖像分類(lèi)網(wǎng)絡(luò),負(fù)責(zé)歸納和總結(jié)特征,將圖像按可能性分成不同類(lèi)別。這兩個(gè)網(wǎng)絡(luò)包含了卷積層和池化層。
圖 | 訓(xùn)練識(shí)別物體的 HCNN 模型
模型構(gòu)建完成后,研究人員使用了知名的 ImageNet 數(shù)據(jù)集進(jìn)行圖像分類(lèi)訓(xùn)練,其中約有 120 萬(wàn)張圖像。訓(xùn)練過(guò)程與數(shù)量感知毫無(wú)關(guān)系,HCNN 只是學(xué)習(xí)普通的圖像分類(lèi)任務(wù),其分類(lèi)準(zhǔn)確率約為 49.9%。
隨后,為了搞清楚神經(jīng)元的激活方式,并且判斷是否存在數(shù)感機(jī)制,他們移除了圖像分類(lèi)網(wǎng)絡(luò),僅保留了特征提取網(wǎng)絡(luò),而且模型的輸入圖片也從 ImageNet 變成了特制圖片。
研究團(tuán)隊(duì)開(kāi)發(fā)了三組用來(lái)刺激神經(jīng)元的圖像集,每一組都包含 30 張黑色圖片,上面分別有 1-30 個(gè)白點(diǎn)。第一組的每張圖片由大小不一的圓點(diǎn)組成。第二組每張圖片上所有圓點(diǎn)的總面積相同,因此隨著白點(diǎn)數(shù)量的增加,每個(gè)點(diǎn)的大小都會(huì)縮小。而第三組則包含了多種形狀,比如圓形,方形和三角形等。
圖 | 三組不同的刺激神經(jīng)元的圖像集
之所以選擇這些圖片,是因?yàn)樗鼈儙缀鯖](méi)有類(lèi)別可言,不適合進(jìn)行圖像分類(lèi)。可是如果將它們放入到 HCNN 分類(lèi)模型中,得到反饋結(jié)果,研究人員就可以更好地查看神經(jīng)元的激活方式是否與數(shù)感機(jī)制相關(guān)。
通過(guò)雙向方差分析(ANOVA),他們可以篩選出那些對(duì)數(shù)量敏感的網(wǎng)絡(luò)單元,同時(shí)避免對(duì)神經(jīng)元的刺激和交互過(guò)程造成較大影響。
最終,在超過(guò) 3.7 萬(wàn)個(gè)神經(jīng)元中,有 3601 個(gè)神經(jīng)元(約 9.6%)出現(xiàn)了數(shù)字選擇性,即出現(xiàn)了對(duì)某個(gè)數(shù)字的偏好,對(duì)相應(yīng)的視覺(jué)刺激(圖片)產(chǎn)生了反應(yīng)。
具體來(lái)說(shuō),一個(gè)神經(jīng)元只會(huì)對(duì)一個(gè)數(shù)字的刺激展現(xiàn)出最大的 “反應(yīng)(response)”,就好像是它“最喜歡的數(shù)字” 一樣。它的 “反應(yīng)” 還會(huì)隨著數(shù)字的不斷變化而逐漸衰退,兩個(gè)數(shù)字相差越大,“反應(yīng)”的衰減就越明顯。

圖 | 不同神經(jīng)元有自己 “喜歡” 和“不感興趣”的數(shù)字
舉個(gè)例子,一個(gè) “最喜歡” 數(shù)字 4 的神經(jīng)元,就會(huì)對(duì)一張包含 4 個(gè)白點(diǎn)的圖像展現(xiàn)出最激烈的“反應(yīng)”。如果給它看包含 12 個(gè)白點(diǎn)的圖片,它就會(huì)展現(xiàn)出不那么激烈的“反應(yīng)”。如果再增加到 30 個(gè)白點(diǎn),它甚至都不會(huì)有什么“反應(yīng)”。
將所有數(shù)據(jù)以曲線(xiàn)的形式表達(dá)出來(lái)后,研究人員發(fā)現(xiàn),神經(jīng)網(wǎng)絡(luò)中神經(jīng)元的激活模式與猴腦神經(jīng)元的激活模式高度相似,就連兩種神經(jīng)元的喜好分布規(guī)律都非常相近:更多的神經(jīng)元偏好小數(shù)字,其次是最大的數(shù)字,最后才是中間的數(shù)字,其中對(duì) 0-5 之間數(shù)字產(chǎn)生 “反應(yīng)” 的神經(jīng)元甚至超過(guò)六成。

圖 | B 組圖表:神經(jīng)網(wǎng)絡(luò)中神經(jīng)元的激活(響應(yīng))規(guī)律;C 組圖表:猴子大腦中神經(jīng)元的激活規(guī)律;D 組柱狀圖:神經(jīng)網(wǎng)絡(luò)中神經(jīng)元的偏好分布;E 組柱狀圖:猴子大腦中神經(jīng)元的偏好分布
這意味著,一套經(jīng)過(guò)視覺(jué)訓(xùn)練的圖像分類(lèi)神經(jīng)網(wǎng)絡(luò),在沒(méi)有接受任何計(jì)數(shù)訓(xùn)練和計(jì)算指令的情況下無(wú)師自通,其中的神經(jīng)元對(duì)不同數(shù)字發(fā)展出了不同的敏感度,運(yùn)作機(jī)制跟人類(lèi)和動(dòng)物大腦的數(shù)感機(jī)制十分相似。
該實(shí)驗(yàn)結(jié)果證明,數(shù)感能力天然存在于視覺(jué)系統(tǒng)的運(yùn)作機(jī)制當(dāng)中,伴隨著獲取視覺(jué)信息和視覺(jué)刺激,數(shù)量感就會(huì)以副產(chǎn)品的形式自然而然地出現(xiàn)。這或許也可以解釋為什么在未經(jīng)訓(xùn)練的情況下,嬰幼兒和野生動(dòng)物都會(huì)展現(xiàn)出數(shù)感。不過(guò)雖然數(shù)感能力可能是天生的,但它也是可以通過(guò)后天訓(xùn)練不斷加強(qiáng)的,兩者并不沖突。
另一方面,這項(xiàng)研究也證明了我們對(duì)神經(jīng)網(wǎng)絡(luò)的運(yùn)作機(jī)制并非完全了解,仍然有尚未發(fā)現(xiàn)的特征提取模式,比如提取不存在于圖像分類(lèi)訓(xùn)練中的高級(jí)數(shù)字特征,卻與人腦的數(shù)感機(jī)制類(lèi)似,說(shuō)明我們創(chuàng)造的神經(jīng)網(wǎng)絡(luò)可能比我們想象的更像人腦。
下一步,研究團(tuán)隊(duì)打算嘗試更多類(lèi)似的研究,試圖挖掘出更多未知的神經(jīng)網(wǎng)絡(luò)運(yùn)作機(jī)制,比如它會(huì)如何對(duì)待按數(shù)量多少順序排列的物體,能否建立起與人腦類(lèi)似的時(shí)間感知機(jī)制。這也是人類(lèi)在計(jì)數(shù)過(guò)程中所使用的能力:理解 “每個(gè)數(shù)字都是前面數(shù)字 + 1” 這樣的抽象概念,而不是單純地將每個(gè)數(shù)字視為獨(dú)立個(gè)體。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4838瀏覽量
107859 -
人工智能
+關(guān)注
關(guān)注
1817文章
50108瀏覽量
265565
原文標(biāo)題:最新研究顯示:AI自發(fā)激活了數(shù)量感,并會(huì)挑選“最喜歡”的數(shù)字
文章出處:【微信號(hào):deeptechchina,微信公眾號(hào):deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
Transformer 入門(mén):從零理解 AI 大模型的核心原理
銀基科技藍(lán)牙信道探測(cè)技術(shù)開(kāi)啟無(wú)感數(shù)字鑰匙新時(shí)代
激活函數(shù)ReLU的理解與總結(jié)
智能制造中,如何為物理AI挑選傳感器?
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+具身智能芯片
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)
視頻產(chǎn)業(yè)的創(chuàng)意活力,被百度蒸汽機(jī)這顆“動(dòng)力心臟”激活了
【書(shū)籍評(píng)測(cè)活動(dòng)NO.64】AI芯片,從過(guò)去走向未來(lái):《AI芯片:科技探索與AGI愿景》
華曦達(dá):以港股IPO為契機(jī),在智能家居賽道加速?zèng)_刺
小智AI語(yǔ)音助手調(diào)試成功,母親節(jié)祝福語(yǔ)演示來(lái)啦
愛(ài)芯元智助力融感科技打造AI 4D Sensor
智能眼鏡續(xù)航革新方案-自發(fā)電SOC芯片模塊
AI自發(fā)激活了數(shù)量感 挑選最喜歡的數(shù)字
評(píng)論