自從人工智能誕生以來,研究人員一直試圖通過讓機器與人類玩游戲來測試機器系統的智能。人們通常認為,人類智慧的標志之一是能夠創造性地思考,考慮各種可能性并在制定短期決策時牢記長期目標。如果計算機可以像人類一樣玩困難的游戲,那么它們肯定可以處理更復雜的任務。從1950年代開發的具有早期跳棋功能的機器人到如今具有深層學習能力的機器人,在象棋,圍棋和DOTA等游戲中甚至可以擊敗世界上最好的玩家,可以找到謎題解決方案的機器的想法早已古老。 AI本身,如果還不算老的話。
因此,組織開發的AI的核心模式之一就是目標驅動的系統模式,這是有道理的。像其他AI模式一樣,我們看到這種形式的人工智能用于解決一系列常見問題,這些問題原本需要人類的認知能力。在這種特定模式下,機器要解決的挑戰是找到問題的最佳解決方案的需求。問題可能是找到穿過迷宮的路徑,優化供應鏈或優化駕駛路線和空閑時間。無論有什么特殊需求,我們在這里尋找的力量都是通過反復試驗來學習,并確定解決問題的最佳方法的想法,即使這不是最顯而易見的。
通過反復試驗加強學習
增強學習是最有趣但使用最少的機器學習形式之一。 與監督學習的方法(其中機器通過人為訓練,具有良好標簽的數據進行培訓來學習)或無監督的學習方法(其中機器嘗試通過發現信息集群和其他分組來學習)不同,強化學習嘗試通過嘗試性學習來學習。錯誤,使用環境反饋和總體目標來迭代成功。
在不使用AI的情況下,組織依靠人類來創建基于程序和基于規則的系統,以指導軟件和硬件系統如何操作。如果計劃和規則在管理資金,員工,時間和其他資源方面可能有些有效,那么它們就會變得脆弱而僵化。這些系統僅與人類制定的規則一樣強大,并且機器根本沒有真正在學習。而是將人的智力納入規則中才能使系統正常工作。
另一方面,目標學習型AI系統只有很少的規則,需要通過迭代來學習該系統如何獨立工作。這樣,AI可以完全優化整個系統,而不必依賴于人類設定的易碎規則。目標驅動的系統已證明其價值,表明系統找到解決挑戰性問題的“隱藏規則”的超強能力。在必須進行資源優化的領域中,由目標驅動的系統多么有用就不足為奇了。
AI可以有效地用于場景模擬和資源優化。通過將這種通用方法應用于學習,可以將支持AI的系統設置為優化特定目標或方案,并找到許多解決方案,其中一些對于他們更具創造力的人類同行甚至都不是很明顯。這樣,盡管目標驅動的系統模式沒有像其他模式(例如識別,預測性分析或對話模式)那樣被廣泛實施,但在廣泛的行業中潛力卻是巨大的。
在金融領域,基于強化學習的目標驅動系統正在用于“機器人咨詢”等用例,“機器人咨詢”利用學習來識別可滿足個人特定需求的儲蓄和投資計劃。目標驅動系統模式的其他應用已用于交通信號燈系統的控制中,從而找到了控制交通信號燈而不引起中斷的最佳方法。供應鏈和物流行業的其他用途是尋找包裝和交付貨物的最佳方法。進一步的用途包括幫助訓練物理機器人,創建使機器人可以運行和跳躍的機制和算法。
目標驅動系統甚至被用于電子商務和廣告中,以找到商品的最佳價格并自動進行廣告空間的出價。目標驅動系統甚至在制藥行業中用于執行蛋白質折疊和發現疾病的新方法和創新方法。這些系統能夠選擇最佳的試劑和反應參數,以獲得所需的產品,從而使其成為復雜而精致的藥物或治療過程中的資產。
目標驅動的系統模式是人工智能(AGI)的關鍵嗎?
通過反復試驗學習的想法很有效,并且可以應用于任何問題。值得一提的是,DeepMind是一家將機器變成現實的組織,該組織可以解決一臺曾經被人類打敗的機器而無法解決的問題,該組織認為,強化學習型目標驅動系統可能是解鎖機器人最終目標的關鍵。一臺可以學到任何東西并完成任何任務的機器。“一般情報”的概念就像人類的大腦一樣。人工智能(AGI)不再像今天所有現實世界AI系統那樣專注于狹窄的單一學習任務,而是可以學習任何任務并將學習從一個領域應用于另一個領域,而無需進行大量的重新培訓。
深心,該公司在英國成立,并于2014年被Google收購,旨在通過突破目標驅動系統和其他AI模式的能力界限,解決一些最復雜的機器智能問題。從專門為學習如何與人類對手玩Go游戲而專門設計的AlphaGo開始,該公司迅速擴展了AlphaZero,后者可以從頭開始學習任何游戲。以前需要AlphaGo花費幾個月的時間來學習,現在AlphaZero可以使用增強型學習在短短幾天內完成。從零開始,以提高勝率的唯一目標,AlphaZero在所有100款測試游戲中均勝過AlphaGo。AlphaZero通過簡單地對自己玩游戲并通過反復試驗來實現這一目標。通過這種簡單的方法,通用學習系統不僅能夠創建模式,而且本質上可以為提供給它的任何輸入設計最佳條件和結果。可以預見,這成為DeepMind的最高榮耀,也是AI行業的圣杯。
自然,就像技術行業中的人們經常使用新技術一樣,他們將想法轉向可能的實際應用。AlphaZero是利用當時可用的最佳技術創建的,例如機器學習和應用其他領域,例如神經科學和行為心理學研究。這些技術被用于強大的通用學習算法的開發中,也許我們距離AGI研究的真正突破可能還需要幾年的時間。
人工智能行業在機器學習研究方面處于一個十字路口。當今使用最廣泛的算法正在解決重要但相對簡單的問題。盡管機器已經證明了它們能夠識別圖像,理解語音,查找模式,發現異常并做出預測的能力,但它們仍依賴于訓練數據和狹窄的學習任務來以任何精確度完成任務。在這種情況下,機器學習非常耗費數據,并且計算量很大。如果您有足夠復雜的學習任務,則可能需要PB或更多的訓練數據,數十萬美元的GPU密集型計算以及數月的訓練。顯然,僅靠暴力手段無法解決AGI。
目標驅動的系統模式雖然今天已成為七個模式中最少實施的模式之一,但它可能是掌握數據和計算密集型知識的關鍵。目標驅動的系統越來越多地在具有實際用例的項目中實施。因此,由于其潛在的前景,它是最有趣的模式之一。
-
機器人
+關注
關注
213文章
31097瀏覽量
222362 -
人工智能
+關注
關注
1817文章
50105瀏覽量
265534
發布評論請先 登錄
《國際人工智能安全報告》發布首份關鍵更新
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片
《AI芯片:科技探索與AGI愿景》—— 勾勒計算未來的戰略羅盤
《AI芯片:科技探索與AGI愿景》—— 深入硬件核心的AGI指南
利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能
挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器
挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!
超小型Neuton機器學習模型, 在任何系統級芯片(SoC)上解鎖邊緣人工智能應用.
最新人工智能硬件培訓AI 基礎入門學習課程參考2025版(大模型篇)
Ampere如何解決人工智能背后的能源困境
開售RK3576 高性能人工智能主板
NVIDIA RTX 5880 Ada GPU賦能達卯智能能源大模型
目標驅動的系統模式是人工智能(AGI)的關鍵嗎?
評論