多年來(lái),研究人員知道我們可以通過嚙齒類動(dòng)物的叫聲來(lái)了解它們的感受。就像狗搖尾巴一樣,某些叫聲表明嚙齒動(dòng)物很快樂。反過來(lái),另一些叫聲表明嚙齒動(dòng)物有壓力,甚至抑郁。
但為什么研究人員會(huì)對(duì)嚙齒動(dòng)物的情緒感興趣呢?因?yàn)檠芯咳藛T想了解嚙齒動(dòng)物對(duì)各種刺激的反應(yīng)。這有助于研究人員找到幫助成癮者或抑郁者的最佳方法。通過簡(jiǎn)單分析嚙齒類動(dòng)物的交流方式,研究人員可以判斷治療是否有助于減輕抑郁情緒。
圖片來(lái)源:Alice Gray
由于嚙齒類動(dòng)物主要通過人耳聽不到的超聲波發(fā)聲(USV)進(jìn)行交流,因此很難破譯老鼠吱吱的叫聲。超聲波發(fā)聲的范圍為20千赫到115千赫,而人類通常可以聽到20赫到20千赫的聲音。
直到現(xiàn)在,研究人員在研究嚙齒動(dòng)物的叫聲時(shí),依然嚴(yán)重依賴耗時(shí)的人工分析。由于發(fā)聲頻率很高,研究人員不得不放慢播放錄音的速度,才能聽到叫聲。即使使用專門的麥克風(fēng),對(duì)錄音中的高音尖叫聲進(jìn)行標(biāo)記和分類也是很費(fèi)力費(fèi)時(shí)的。這些方法也容易導(dǎo)致人為錯(cuò)誤和誤解。
華盛頓大學(xué)精神病學(xué)和行為科學(xué)系教授John Neumaier博士告訴《數(shù)字趨勢(shì)》雜志:“過去,為了更好地了解動(dòng)物在行為測(cè)試中的情緒狀態(tài),研究人員將這些聲音記錄了下來(lái)。問題是,要對(duì)這些錄音進(jìn)行人工分析,就需要把它們放慢到人類可以聽到的頻率,這可能需要花費(fèi)10倍的時(shí)間來(lái)聽。這給研究人員帶來(lái)了非常大的工作壓力,使得他們不愿意用這種自然的方式來(lái)解讀動(dòng)物的情緒狀態(tài)。”
因此,這個(gè)研究小組借助于人工智能(AI)來(lái)實(shí)現(xiàn)這一過程的自動(dòng)化。他們的程序叫做DeepSqueak,因?yàn)檫@項(xiàng)程序基于一種叫做深度學(xué)習(xí)的人工智能形式。
利用深度學(xué)習(xí)分析超聲波發(fā)聲
兩位研究人員(華盛頓大學(xué)精神病學(xué)和行為科學(xué)系技術(shù)人員Russell Marx和華盛頓大學(xué)博士后研究員Kevin Coffey博士)與Neumaier教授合作開發(fā)了用于檢測(cè)和分析超聲波發(fā)聲的DeepSqueak軟件。他們的研究最近發(fā)表在《神經(jīng)心理藥理學(xué)自然雜志》上。
Coffey說(shuō):“我們可以訓(xùn)練這個(gè)軟件,以一種更類似于人類學(xué)習(xí)的方式來(lái)分析這些叫聲。我們用圖片和例子來(lái)說(shuō)明叫聲,而不是用數(shù)學(xué)來(lái)描述叫聲是什么。”
DeepSqueak將聲音問題轉(zhuǎn)化為圖像問題。
DeepSqueak的輸入是一個(gè)音頻文件(.wav或.flac)。DeepSqueak將音頻文件拆分為短的分段,然后將這些分段轉(zhuǎn)換為圖像(聲波圖)。下圖顯示了從原始音頻文件到經(jīng)過濾波的聲波圖的轉(zhuǎn)換。

圖片來(lái)源:Kevin R.Coffey、Russell G.Marx和John F.Neumair
將聲波圖輸入到一個(gè)深度學(xué)習(xí)人工智能程序中,這個(gè)程序可以對(duì)圖像進(jìn)行識(shí)別和分類,類似于自動(dòng)駕駛汽車中用來(lái)識(shí)別停車標(biāo)志和車道線的人工智能。它首先查看聲波圖中是否有吱吱聲。如果有的話,是什么類型的吱吱聲。
Marx說(shuō):“DeepSqueak使用仿生算法,這種仿生算法可以通過已經(jīng)標(biāo)記好的發(fā)聲和噪音的例子來(lái)學(xué)習(xí)分離發(fā)聲。”

圖片來(lái)源:Kevin R. Coffey、 Russell G. Marx和John F. Neumaier
該小組開始使用Deepsqueak時(shí),采用的是MathWorks網(wǎng)站的示例代碼Object Detection Using Faster R-CNN Deep Learning(使用Faster R-CNN深度學(xué)習(xí)進(jìn)行對(duì)象檢測(cè)):
在此基礎(chǔ)上,他們開發(fā)了DeepSqueak軟件包和MATLAB圖形用戶界面。DeepSqueak使用了Computer Vision System Toolbox(計(jì)算機(jī)視覺系統(tǒng)工具箱)、Curve Fitting Toolbox(曲線擬合工具箱)、Image Processing Toolbox(圖像處理工具箱)、Parallel Computing Toolbox(并行計(jì)算工具箱)和Deep Learning Toolbox(深度學(xué)習(xí)工具箱)。
該技術(shù)有助于開發(fā)更好的成癮治療方法
這個(gè)研究小組的重點(diǎn)是精神病學(xué)和行為科學(xué)。
這項(xiàng)無(wú)損傷性研究發(fā)現(xiàn),嚙齒類動(dòng)物在預(yù)期得到獎(jiǎng)勵(lì)(如,糖)或與同伴玩耍時(shí)最快樂。他們還發(fā)現(xiàn),當(dāng)雌性嚙齒動(dòng)物在附近時(shí),雄性嚙齒動(dòng)物的行為也不同。情況正如預(yù)期,并無(wú)意外。
Neumaier教授說(shuō),他的目標(biāo)是開發(fā)壓力失調(diào)和成癮的治療方法。DeepSqueak使超聲波發(fā)音的解碼破譯工作變得方便快捷,可以幫助實(shí)驗(yàn)室更快地實(shí)現(xiàn)目標(biāo)。
他說(shuō):“如果科學(xué)家能更好地理解藥物如何改變大腦活動(dòng),從而引起愉悅或不愉悅的感覺,我們就可以設(shè)計(jì)出更好的治療成癮的方法。”
該小組已經(jīng)向所有研究人員開放了DeepSqueak,他們可以創(chuàng)建自己的分析。代碼在Github上:
https://github.com/DrCoffey/DeepSqueak
該程序目前可以識(shí)別大約20種不同的超聲波發(fā)聲。該小組希望,當(dāng)其他人識(shí)別和標(biāo)記各種超聲波發(fā)聲時(shí),他們能夠?yàn)槔鲜蟮慕新晞?chuàng)建一個(gè)虛擬的“谷歌翻譯”。
相關(guān)閱讀:
直播預(yù)告 | MATLAB EXPO 2019,大師在線開講 >>
深度學(xué)習(xí)網(wǎng)絡(luò)到底在“看”哪里?
昆蟲大腦完勝機(jī)器學(xué)習(xí)
使用 MATLAB 圖像處理算法,視頻實(shí)時(shí)加持藍(lán)天背景
MATLAB 的藝術(shù)鑒賞的能力
-
超聲波
+關(guān)注
關(guān)注
63文章
3302瀏覽量
145366 -
網(wǎng)絡(luò)
+關(guān)注
關(guān)注
14文章
8265瀏覽量
94813 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5599瀏覽量
124400
發(fā)布評(píng)論請(qǐng)先 登錄
自然語(yǔ)言處理NLP的概念和工作原理
機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個(gè)常見錯(cuò)誤與局限性
【團(tuán)購(gòu)】獨(dú)家全套珍藏!龍哥LabVIEW視覺深度學(xué)習(xí)實(shí)戰(zhàn)課(11大系列課程,共5000+分鐘)
如何深度學(xué)習(xí)機(jī)器視覺的應(yīng)用場(chǎng)景
一文了解Mojo編程語(yǔ)言
【新啟航】深度學(xué)習(xí)在玻璃晶圓 TTV 厚度數(shù)據(jù)智能分析中的應(yīng)用
如何在機(jī)器視覺中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)
深度學(xué)習(xí)對(duì)工業(yè)物聯(lián)網(wǎng)有哪些幫助
自動(dòng)駕駛中Transformer大模型會(huì)取代深度學(xué)習(xí)嗎?
當(dāng)深度學(xué)習(xí)遇上嵌入式資源困境,特征空間如何破局?
深度操作系統(tǒng)deepin 25全面支持凹語(yǔ)言
存儲(chǔ)示波器的存儲(chǔ)深度對(duì)信號(hào)分析有什么影響?
用樹莓派搞深度學(xué)習(xí)?TensorFlow啟動(dòng)!
關(guān)于使用深度學(xué)習(xí)破譯老鼠的語(yǔ)言分析和介紹
評(píng)論