摘要:這篇論文提出了一種非手工設(shè)計的基于啟發(fā)式搜索算法在解空間搜索候選智能體的工程方法,該解空間由人工智能智能體在仿生學(xué)基礎(chǔ)上建模而形成。通過和以元學(xué)習(xí)為代表的人工設(shè)計方法以及以神經(jīng)架構(gòu)芯片為代表的仿生學(xué)方法進(jìn)行比較表明,該方法更加有望實現(xiàn)通用人工智能,并且和認(rèn)知神經(jīng)科學(xué)有更好的交互作用。同時,該工程方法基于一個理論假設(shè)即最終的學(xué)習(xí)算法在確定的場景中是穩(wěn)定的,并且可以泛化到不同的場景中。本文初步地討論了理論層面,并提出了該理論和不動點定理在數(shù)學(xué)上的可能聯(lián)系,但目前僅僅是個猜想。
鑒于當(dāng)前認(rèn)知神經(jīng)科學(xué)和人工智能工程所遇到的困難,華為2012實驗室的研究人員提出了一種新的通用人工智能工程方法:使用學(xué)習(xí)算法的穩(wěn)定性作為在特定場景中的適合度函數(shù)的啟發(fā)式搜索方法。論文將其方法與人工設(shè)計方法、仿生學(xué)方法進(jìn)行了對比,結(jié)果表明該方法更加有望實現(xiàn)通用人工智能,并且和認(rèn)知神經(jīng)科學(xué)有更好的交互作用。
作者指出雖然可以直接在這篇論文中提出其工程方法,但為了剛好地解釋這個方法的必要性和可行性,以及使無相關(guān)背景的讀者能更好地理解,因此介紹當(dāng)前的主流人工智能工程方法的背景,并指出其中面臨的挑戰(zhàn),以及這些挑戰(zhàn)對實現(xiàn)通用人工智能的阻礙是很有必要的。
因此,這篇論文只介紹了該方法的一般過程和方法論并忽略了進(jìn)一步的細(xì)節(jié),并且只對方法論做了粗略的分類。該論文首先介紹了認(rèn)知神經(jīng)科學(xué)的現(xiàn)狀,然后討論了兩種主流的工程方法:以元學(xué)習(xí)為代表的人工設(shè)計方法,和以神經(jīng)架構(gòu)芯片為代表的仿生學(xué)方法。
1.1認(rèn)知神經(jīng)科學(xué)的研究現(xiàn)狀
為了闡明當(dāng)前人工智能工程方法的局限性來源和它們與認(rèn)知神經(jīng)科學(xué)的聯(lián)系,作者首先了介紹了認(rèn)知神經(jīng)科學(xué)的研究現(xiàn)狀。
目前,認(rèn)知神經(jīng)科學(xué)在人類大腦微結(jié)構(gòu)(主要是神經(jīng)元和突觸)上的研究已經(jīng)比較全面,對其中的化學(xué)過程和電學(xué)性質(zhì)都得出了清晰的結(jié)論。對于神經(jīng)元,spiking模型是其中最重要的特征。而對于神經(jīng)突觸,由STDP和LTDP描述的特征也得到了充分的研究。
然而,在大腦宏觀結(jié)構(gòu)和其智能功能性上的研究仍然處于早期階段,目前對于人類大腦智能的機制仍未得到任何重要的結(jié)論。此外,在這個領(lǐng)域的主流研究方法也受到質(zhì)疑。基于MRI影像的方法在目前的神經(jīng)科學(xué)中是最重要的研究方法之一。在EricJonas和K.P.Cording的論文中,他們討論了基于MRI的方法是否可以用于分析電子芯片的理論[1],以此表明該方法無法從微觀行為特征得到關(guān)于宏觀功能性結(jié)構(gòu)的結(jié)論。
該論文還揭示了認(rèn)知神經(jīng)科學(xué)研究如果沒有程式化的理論指導(dǎo),無疑將很難研究諸如人類大腦這樣的復(fù)雜組織。因此,雖然認(rèn)知神經(jīng)科學(xué)啟發(fā)了人工智能的研究,但它同樣非常需要來自人工智能的研究以指導(dǎo)其研究方向,即它們可以互相促進(jìn)。
簡言之,當(dāng)前的認(rèn)知神經(jīng)科學(xué)無法為人工智能工程(無論是當(dāng)前還是可預(yù)見的將來)提供有價值的啟發(fā)。類似地,認(rèn)知神經(jīng)科學(xué)自身仍將處于成果匱乏的局面。
1.2人工設(shè)計方法
人工設(shè)計方法一般指的是元學(xué)習(xí)。元學(xué)習(xí)是一個很寬泛的概念,因為它還只處于早期發(fā)展階段,其中有很多種工程方法,但只有少數(shù)幾種的研究目標(biāo)和這篇論文所定義的人工智能是一致的。其中包括了:基于梯度預(yù)測的方法[2]、基于損失預(yù)測的方法和基于LSTM的更新方法[4]。
這些方法由深度學(xué)習(xí)、強化學(xué)習(xí)和其它傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法導(dǎo)出。在這些傳統(tǒng)學(xué)習(xí)算法中,反向傳播算法和策略梯度算法都獨立于神經(jīng)網(wǎng)絡(luò),并在網(wǎng)絡(luò)之外更新網(wǎng)絡(luò)連接權(quán)重,因此這和這篇論文的人工智能定義不一致。雖然上述的元學(xué)習(xí)方法和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法的建模方法是類似的,但它們還包括了在網(wǎng)絡(luò)結(jié)構(gòu)中更新網(wǎng)絡(luò)連接權(quán)重并將其作為學(xué)習(xí)的目標(biāo),從而其研究對象和這篇論文所定義的人工智能是一致的。
然而,這些方法在人工設(shè)計上是完全獨立的。人類大腦擁有幾百億個神經(jīng)元,平均每兩個神經(jīng)元之間有超過100個神經(jīng)連接。上述的當(dāng)前認(rèn)知神經(jīng)科學(xué)對于大腦的結(jié)構(gòu)和功能得到的結(jié)論還是很初級的,基本上不能提供認(rèn)識通用人工智能的決定性啟發(fā)。同時,人類大腦在自然選擇中已經(jīng)經(jīng)過了幾百萬年的進(jìn)化。即使人工設(shè)計方法在人類環(huán)境中不是最優(yōu)的解決方案,它們也是近似最優(yōu)的。還可以進(jìn)一步推斷出,即使通用人工智能的實現(xiàn)并不是基于100%模仿人類大腦認(rèn)知機制,至少該結(jié)構(gòu)將擁有近似的復(fù)雜度。從以上討論中作者得出,目前實現(xiàn)通用人工智能的方法等價于在一個巨大的搜索空間中利用非常有限的先驗知識尋找近似最優(yōu)解。如果依靠人工探索,很難想像在可預(yù)見的未來內(nèi)能找到正確的神經(jīng)網(wǎng)絡(luò)架構(gòu)和學(xué)習(xí)算法。
當(dāng)前這些方法生成的人工智能系統(tǒng)的實際性能在多樣性和魯棒性上仍遠(yuǎn)遠(yuǎn)落后于人類智能。依賴人工設(shè)計的另一個后果是無法與認(rèn)知神經(jīng)科學(xué)進(jìn)行交互并互相促進(jìn)發(fā)展。上述方法中,無論是微觀神經(jīng)元特征、宏觀網(wǎng)絡(luò)結(jié)構(gòu),甚至網(wǎng)絡(luò)的更新算法都和認(rèn)知神經(jīng)科學(xué)的研究相去甚遠(yuǎn)。
1.3仿生學(xué)方法
仿生學(xué)方法以神經(jīng)架構(gòu)芯片為代表,例如IBM的TrueNorth芯片[5],其使用了電子元件以部分地模擬人類大腦的生物學(xué)特征(比如spiking模型、神經(jīng)元突觸的可塑性,等等)。然而,由于對人類大腦的認(rèn)知神經(jīng)科學(xué)理解的限制,這些模擬仍然處于微觀層次,而不包含人類大腦神經(jīng)網(wǎng)絡(luò)的宏觀結(jié)構(gòu)。即使在微觀結(jié)構(gòu),對神經(jīng)元和其中連接的模擬也不能說是完整的。就是說,某些對于智能產(chǎn)生的關(guān)鍵特征可能被忽視了。
由于仿生學(xué)方法追求真實地模仿人類大腦的生物學(xué)特征,可視其為相對于人工設(shè)計方法的另一個極端。然而,這類方法的最大問題是它無法和認(rèn)知神經(jīng)科學(xué)進(jìn)行交互,因為它完全單向地依賴于認(rèn)知神經(jīng)科學(xué)研究的結(jié)果。
2本文使用的方法
鑒于在1.1節(jié)中所提到的當(dāng)前認(rèn)知神經(jīng)科學(xué)和人工智能工程所遇到的困難,本文提出了一種新的通用人工智能工程方法:使用學(xué)習(xí)算法的穩(wěn)定性作為在特定場景中的適合度函數(shù)(fitnessfunction)的啟發(fā)式搜索方法。
2.2模型
本文中使用的方法基于啟發(fā)式搜索算法,這是一種在解空間中使用的優(yōu)化算法,用于加速逼近最優(yōu)解的搜索過程,其中以遺傳算法(由J.D.Bagley提出)為代表[6]。此外,類似的算法還包括粒子群優(yōu)化算法、模擬退火算法、蟻群優(yōu)化算法等等。
雖然它們都屬于同一類算法,但都各有其不同的應(yīng)用領(lǐng)域。其中,模擬退火算法和蟻群優(yōu)化算法可以通過將為解決的問題映射到空間相關(guān)的問題中,并進(jìn)行搜索找到最優(yōu)解,所以它們更適合空間相關(guān)的問題。本文中的方法的目標(biāo)是搜索人工智能智能體,其問題特征并不和空間直接相關(guān),因此上述這些算法并不適用。而遺傳算法和粒子群優(yōu)化算法通過建模解決問題,然后通過適合度函數(shù)評估候選解。因此,它們更適合用于本文方法所能解決的問題。關(guān)于遺傳算法或粒子群優(yōu)化算法還是其它類似算法的使用,本文并沒有限制于工程需要或?qū)嶒灲Y(jié)果的層面。下圖以遺傳算法為例,描述了這種算法的工作流程:

圖1:遺傳算法的工作流程:問題建模;隨機生成初始群體;場景模擬;評估個體適應(yīng)性并分級;表現(xiàn)最好的個體是否達(dá)到需求;是,輸出結(jié)果;否,進(jìn)行選擇,交叉或突變操作以生成新的群體。
本文中提出的啟發(fā)式搜索算法主要由三部分構(gòu)成:問題建模、適合度函數(shù)定義和適合度函數(shù)的輸入(場景模擬)。
本文提出的方法基于問題導(dǎo)向建模的啟發(fā)式搜索算法和適應(yīng)性評估(例如遺傳算法或粒子群優(yōu)化算法)。因此,整個工作流程和圖1所示的很類似。在建模方面,該方法使用了全連接神經(jīng)網(wǎng)絡(luò)模型,以及認(rèn)知神經(jīng)科學(xué)中關(guān)于神經(jīng)網(wǎng)絡(luò)微結(jié)構(gòu)特征的先驗知識以模擬智能體;在適合度函數(shù)方面,作者主要測試了智能體在確定場景中執(zhí)行任務(wù)的可重復(fù)性和穩(wěn)定性。以相同的遺傳算法為例,本論文中的方法的完整工作流程如下圖所示,以圖1的每一步的具體實現(xiàn)目標(biāo)為對照:
-
問題建模:全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和微結(jié)構(gòu)特征的one-hot編碼字符串;
-
隨機生成初始群體:連接權(quán)重的隨機初始化和微結(jié)構(gòu)特征編碼的隨機初始化;
-
場景模擬:智能體行為和任務(wù)模擬的環(huán)境;
-
表現(xiàn)最好的個體是否達(dá)到需求:智能體是否能可重復(fù)地和穩(wěn)定地執(zhí)行任務(wù)?

圖4:本文方法的完整流程
論文:AHeuristicSearchAlgorithmUsingtheStabilityofLearningAlgorithmsastheFitnessFunctioninCertainScenarios:AnArtificialGeneralIntelligenceEngineeringApproach
-
華為
+關(guān)注
關(guān)注
218文章
36003瀏覽量
262083 -
人工智能
+關(guān)注
關(guān)注
1817文章
50094瀏覽量
265284 -
神經(jīng)
+關(guān)注
關(guān)注
0文章
46瀏覽量
12807
原文標(biāo)題:啟發(fā)式搜索:華為提出通用人工智能工程方法
文章出處:【微信號:gh_ecbcc3b6eabf,微信公眾號:人工智能和機器人研究院】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
混合啟發(fā)式算法在汽車調(diào)度中的應(yīng)用
大家來討論一下這樣一個簡單的局部搜索算法
改進(jìn)的雙向啟發(fā)式搜索算法主要流程是怎樣的?
一種無回溯的最長前綴匹配搜索算法
基于禁忌搜索的啟發(fā)式求解背包問題算法
一種改進(jìn)的快速搜索算法
深層次分類中候選類別搜索算法
激光散亂點云K最近鄰搜索算法
單規(guī)格一刀切矩形排樣的啟發(fā)式搜索算法
基于網(wǎng)頁排名算法面向論文索引排名的啟發(fā)式方法
基于并行搜索和快速插入的算法
一種路徑過濾性搜索算法
提出一種基于啟發(fā)式搜索算法在解空間搜索候選智能體的工程方法
評論