MIT的研究人員使用貝葉斯推理,讓計算機程序編寫專門為數(shù)據(jù)分析設計的新程序。其目的是減輕那些本身不是人工智能專家的數(shù)據(jù)科學家的負擔。
最近有個非常流行的話題:如何讓普通人(普通人指既不是程序員,也不是IT管理員,更不是機器學習科學家的人群)更容易接近人工智能?
比較流行的一種方法是將所有的復雜性抽象到云計算操作中。
然而,本周MIT提出了另一種方法:讓機器學習自己完成更多的工作,發(fā)明自己的程序,在時間序列分析等特定應用程序中處理數(shù)據(jù)。
這本身就是人工智能的一個熱門領域,讓機器建立模型,進而從數(shù)據(jù)中歸納出答案。
計算機程序設計自動化方法中,“第一個概率程序的貝葉斯合成”
研究人員描述了一種自動創(chuàng)建推斷數(shù)據(jù)模式的程序的方法,這意味著數(shù)據(jù)科學家不再需要找出適合所研究數(shù)據(jù)的“模型”。
這項工作發(fā)表在計算機協(xié)會網站上的一篇論文中,題為《用于自動數(shù)據(jù)建模的貝葉斯合成概率程序》(Bayesian Synthesis of Probabilistic Programs for Automatic Data Modeling)。
其作者分別是MIT的Feras A. Saad、Marco F. Cusumano-Towner、Ulrich Schaechtle、Martin C. Rinard和Vikash K. Mansinghka。
Saad和他的同事們所要攻克的問題是:找到正確的程序來分析給定的數(shù)據(jù)集所需的所有工作。
正如他們在文章當中所述,要解決這個問題,將面臨如下方面的困難:
用戶需要手動選擇模型或程序結構;
需要大量的建模專業(yè)知識;
建模能力有限;
如果用戶沒有探索足夠廣泛的模型或程序結構,可能會丟失數(shù)據(jù)的重要方面。
為了解決這個問題,他們打算讓計算機做決定。
Saad和他的同事們繼承了近年來“合成”計算機程序的傳統(tǒng),讓一個程序生成另一個程序。
在這方面,有很多值得借鑒的例子,例如Google DeepMind科學家2014年為建立“神經圖靈機”所做的努力。 該項目使用所謂的“循環(huán)神經網絡”來發(fā)現(xiàn)簡單的計算機算法,例如復制和粘貼文本。
作者的同事通過設計“概率”程序而不是經典的“確定性”程序來做區(qū)分。
這意味著在給定特定輸入的情況下,程序不一定會產生可預測的輸出。相反,程序的輸出將反映輸入它們的數(shù)據(jù)的噪聲和不確定性。
為了實現(xiàn)這一點,作者使用了貝葉斯統(tǒng)計方法。他們對大量的計算機程序進行取樣,并對每個程序的可能性進行評分,以此作為處理想要研究的數(shù)據(jù)的可能解決方案。
正如作者所說,在所有的計算機程序設計自動化方法中,他們的方法是“第一個概率程序的貝葉斯合成”。
“領域特定語言”構建的程序是關鍵
幫助研究人員實現(xiàn)這一壯舉的是他們做出的一個關鍵選擇:他們開始構建,或“合成”,不僅僅是任意一般類型的計算機程序,而是由“領域特定語言”構建的程序。

MIT的研究人員描述了他們的貝葉斯推理方法在特定領域的語言中搜索表達式的過程,以組合一組可以分析特定類型數(shù)據(jù)的算法。
DSL是在某種程度上可以匹配它們處理數(shù)據(jù)的語言。例如,有一些“數(shù)據(jù)建模”語言可以幫助表示數(shù)據(jù)中的關系。Yang就是這樣一種數(shù)據(jù)建模語言的名稱,用于計算機網絡的建模。
通過將他們的方法限制在DSL上,作者適當縮小了計算機程序的“搜索空間”,從而提高了他們找到解決方案的幾率,而不是像神經圖靈機那樣采用更通用的方法。
一旦貝葉斯推理過程裝配了一些Winning Program,這些程序就能夠對數(shù)據(jù)進行推理。
例如,作者描述了適合分析多年飛行里程的程序。這是一個時間序列分析問題,所謂的高斯統(tǒng)計過程是合適的。
因此,他們的貝葉斯推斷綜合了包含高斯過程操作的算法,以找到那些有可能擬合數(shù)據(jù)的算法組合。
與“卷積神經網絡”等一些通用機器學習模型不同,這種方法的一大好處是,合成的程序在某種意義上是可以解釋的,它們不是AI中令人恐懼的“黑匣子”。
這是因為程序是特定于領域的,所以它們的操作會“泄露”它們在數(shù)據(jù)中發(fā)現(xiàn)的內容。
正如作者所描述的,“領域特定語言中合成的程序提供了緊湊的數(shù)據(jù)模型,使定性屬性在程序的表面語法中變得明顯。”
同時,作者還展示了如何使這些DSL程序能夠對新數(shù)據(jù)進行泛化。
他們使用一個解釋器程序將單個算法轉換成一種叫做Venture的東西,這是一種更加廣泛和通用的概率編程語言。然后Venture就可以在更廣泛的應用程序中對數(shù)據(jù)進行推斷。
當然,這項工作有進一步的方向。研究人員特別指出,他們的工作在未來可能會納入用戶對數(shù)據(jù)應如何處理或分析的具體要求。
這意味著人類對數(shù)據(jù)的智能與機器技能的融合,或許是人與人工智能的理想結合。
-
人工智能
+關注
關注
1817文章
50095瀏覽量
265307 -
機器學習
+關注
關注
66文章
8553瀏覽量
136935 -
數(shù)據(jù)分析
+關注
關注
2文章
1516瀏覽量
36215
原文標題:MIT實現(xiàn)機器自動建模,數(shù)據(jù)分析分分鐘搞定
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
龍芯主板讓工控計算機擁有安全可信的核心
上位機程序編寫
【作品合集】賽昉科技VisionFive 2單板計算機開發(fā)板測評
加固計算機是用來干什么的?
工業(yè)計算機的重要性
自動化計算機經過加固后有什么好處?
AI數(shù)據(jù)分析儀設計原理圖:RapidIO信號接入 平板AI數(shù)據(jù)分析儀
自動化計算機的功能與用途
工業(yè)計算機與商用計算機的區(qū)別有哪些
大模型推理顯存和計算量估計方法研究
利用邊緣計算和工業(yè)計算機實現(xiàn)智能視頻分析
一文帶你了解工業(yè)計算機尺寸
AWG全新DDS固件如何提升量子計算機的開發(fā)效率?
NVIDIA GTC2025 亮點 NVIDIA推出 DGX Spark個人AI計算機
NVIDIA 宣布推出 DGX Spark 個人 AI 計算機
MIT使用貝葉斯推理讓計算機程序編寫專門為數(shù)據(jù)分析設計的新程序
評論