感知能力,才是AI強大的原因
我們在社會中看到,由人工智能技術(shù)控制的自主系統(tǒng)開始出現(xiàn),包括自動駕駛汽車、無人機、虛擬助手。幾乎在任何你與科技互動的地方,現(xiàn)在都有人工智能的融入。
這實際上是學(xué)術(shù)研究團體的一個真正的轉(zhuǎn)變,從學(xué)術(shù)界到現(xiàn)實世界的轉(zhuǎn)變,原因很簡單:因為現(xiàn)在機器終于能夠“聽到”和“看到”這個世界了,這實際上是一個很重要的進步。
人工智能領(lǐng)域開始于20世紀50年代晚期,大約是60或70年前。
在20世紀60年代早期,人工智能研究人員主要關(guān)注于能否讓電腦看見,簡單來說就是要有一個攝像頭,解讀圖像、識別物體。這是人很自然就能夠做到的事情,但是對于機器卻非常困難,我們花了50多年的時間進行研究,最終才做出了能夠真正解釋圖像、能夠看到周圍、識別物體、理解和解釋語音信號的系統(tǒng),這些都是人類的感知的一部分。
隨著時間的推移,我們發(fā)展出了各種各樣的技術(shù)、推理、規(guī)劃、決策等等。這些技術(shù)都是在不能聽到和看到的情況下發(fā)展起來的,電腦無法聽到或看到我們,所以能夠聽到和看到是一個不可思議的改變,它會改變我們建造這些系統(tǒng)的方式。
沒有攝像頭的無人車
斯坦福的Stanley
2005年斯坦福大學(xué)的Stanley,是一個表現(xiàn)非常不錯的自動駕駛技術(shù)。這輛自動駕駛的汽車實際上什么也看不見,Stanley沒有安裝攝像機。當開發(fā)人員問,我們應(yīng)該在車上放個攝像頭嗎?他們得到的回復(fù)是——不必了,沒有什么用。
那么Stanley是怎么運行的呢?它是使用GPS和光線技術(shù),這是一種類似于激光的物體探測機制,但不是真正的計算機視覺。
而現(xiàn)在,這種情況已經(jīng)完全改變了。特斯拉以及其他的自動駕駛技術(shù)都是基于計算機視覺的,汽車開始擁有“看”的能力。人工智能系統(tǒng)正逐漸根植于人類世界,它們開始了解我們,開始能夠與我們互動,這也是讓人工智能技術(shù)發(fā)揮作用的關(guān)鍵——AI必須與人互動,必須理解人類看待世界的方式,理解人類與世界互動的方式,理解人類的意圖、情感等等,所有這些正在變?yōu)榭赡堋?/p>
這種轉(zhuǎn)變讓AI在我們的社會中成為了一種新技術(shù),正如你在本次大會上看到的,它將會驅(qū)動教育的轉(zhuǎn)型,這也是我們正在努力的方向。
我想簡單介紹一下為什么這個領(lǐng)域發(fā)生了這樣的變化。
2005年的計算機視覺圖像識別任務(wù)
這是一個2005年的計算機視覺圖像識別任務(wù),你拍一張這樣的照片,我們在這里看到了一盞燈,這邊的不易發(fā)現(xiàn),是一架攝像機,這里有個半人雕塑。
當我們看照片的時候,我們能識別出物體,但這對機器來說是非常困難的。這就是我們所說的標記的數(shù)據(jù),是人類標記的結(jié)果。
在2005年計算機視覺能做到哪一步呢?你可以看到,臺燈完全是破碎的,燈幾乎和雕像連起來了,各種各樣的物體都混在一起。所以一旦從這張圖片為起點做對物體的解讀,識別對象就會變得非常困難。在視覺上,電腦并不能識別出圖片里的東西。
如果我們跳到15年后,這是我們現(xiàn)在擁有的自動駕駛汽車的技術(shù),我特別想給你們看這個圖像,這個標簽問題和我之前展示的標簽問題非常相似,我們必須對道路、人行道做出標記。你可以看到打了標簽的圖片,幾乎都完美標記出來了,達到超人的水平,也就是說,計算機視覺已經(jīng)比人類做得更好。
另一件令人驚訝的事情是,我們現(xiàn)在有了超越人類的交通標志識別技術(shù),人類都很難識別所有的交通標志,而電腦并沒有困難。
自動駕駛汽車的深度學(xué)習(xí)
你的電腦可以讀取這些交通信號,這是在非常糟糕的駕駛條件下,在所有移動的汽車周圍都有框,這在十年前是完全不可能的。
這就是我們所設(shè)想的,車可以實時觀察周圍,比人類司機有更好的視野。我們預(yù)計車禍數(shù)量將會減少90%,甚至是95%。在美國,每年有大約三萬人死于交通事故,我們希望這個數(shù)字能降到五千甚至三千以下。
AI推動人類社會極速進化
2005年 Stanley這輛自動駕駛汽車誕生了,它并不能完全匹敵人類司機,但這是一個重要的里程碑。
人工智能里程碑始于90年代末
IBM沃森則是玩了一款在美國很受歡迎的游戲,它是一個能夠擊敗最優(yōu)秀的人類的系統(tǒng)。這是一個令人驚訝的事件,因為人們認為它是一項非常困難的游戲,所以作為人類世界冠軍的人實際上享有很高的聲望,但是IBM沃森系統(tǒng)可以擊敗人類對手。
2011年到2012年,我們進入了深度學(xué)習(xí)時代。深度學(xué)習(xí)先驅(qū)杰弗里?辛頓、約書亞?本吉奧、楊樂昆獲得了圖靈獎,這是計算機科學(xué)領(lǐng)域的最高獎項。他們開啟了人工智能的深度學(xué)習(xí)的新篇章,讓計算機視覺和語音識別成為可能。
Alpha Go打敗了人類棋手,而圍棋是一種非常難的游戲,比國際象棋的難度高了幾個數(shù)量級。當時我們不認為這種情況會在10到20年內(nèi)發(fā)生,但是有了深度學(xué)習(xí),這件事在2016年就發(fā)生了。
美國人工智能協(xié)會現(xiàn)任主席Yolanda Gil和我牽頭了《美國人工智能研究20年路線圖》,近一百名頂尖的AI研究人員參與其中。我想強調(diào)的是,醫(yī)療健康是驅(qū)動商業(yè)、科學(xué)發(fā)現(xiàn)和社會公正的動力,而教育和培訓(xùn)是這一路線圖的關(guān)鍵驅(qū)動因素之一。
我們建議建立一個大型的研究中心,目前美國正在做,包括中國在內(nèi)的很多國家都在建立自己的研究中心,聚力研究使這些領(lǐng)域發(fā)展得更快,我們稱之為任務(wù)驅(qū)動的人工智能中心,這個中心的其中一項使命就是圍繞教育的。
美國人工智能研究的20年社區(qū)發(fā)展路線圖
我們都認為教育可以從人工智能中獲益,關(guān)鍵在于個性化和定制化的學(xué)習(xí)。AI系統(tǒng)可以向?qū)W生學(xué)習(xí),并能了解學(xué)生所處的狀態(tài),也可以確定學(xué)生需要改進的地方,然后將重點放在這些方面的培訓(xùn)和教育上,因此它將是一個與人類教師一起工作的高度專注的教師。
我想強調(diào)一下合作的部分,只有AI系統(tǒng)是不行的,必須是人類教師、AI系統(tǒng)和學(xué)生之間的合作,這種合作將改變教育。
很多工作都是所謂的數(shù)據(jù)驅(qū)動,也就是說,有了一百萬張經(jīng)過標記的照片就可以訓(xùn)練AI系統(tǒng)。但在教育領(lǐng)域,另一個因素也非常重要。世界不只是關(guān)乎數(shù)據(jù)的,知識更為重要。數(shù)據(jù)和知識有什么區(qū)別呢?數(shù)據(jù)包括做了標記的圖片、圖表、工資表,各種各樣的調(diào)查都是很基本的數(shù)據(jù)。
知識是經(jīng)過處理的數(shù)據(jù),牛頓定律就是知識的一個例子,整個物理學(xué)都是建立在非常少的幾個原則基礎(chǔ)上的,但不可思議的結(jié)果也由此產(chǎn)生。數(shù)學(xué)是由一些基本原理驅(qū)動的,但豐富的數(shù)學(xué)體系也因此隨之而來。
人工智能和終身教育與培訓(xùn)
所以從某種意義上說,知識是一種更緊湊的數(shù)據(jù)形式。教育最終是關(guān)于知識的,這是我們正在見證的一個轉(zhuǎn)變,數(shù)據(jù)驅(qū)動很重要,而補充深度學(xué)習(xí)方法的技術(shù)更多地是由知識和推理驅(qū)動的,這使它成為一個非常令人興奮的研究領(lǐng)域。
我即將上任人工智能發(fā)展協(xié)會主席,協(xié)會正在進行一個重大獎項的評選工作,主要表彰應(yīng)用人工智能技術(shù)對社會公益做出貢獻的企業(yè)和研究。除了教育公正之外,更可以提高生活水平。
在這個領(lǐng)域,我們?nèi)詫⒖吹皆S多新的發(fā)展,其關(guān)鍵就在于對人類的補充,對AI系統(tǒng)的補充。這是人工智能和教育的先鋒時代,它們的結(jié)合將是我們這個時代最令人興奮的新發(fā)展之一。
-
人工智能
+關(guān)注
關(guān)注
1817文章
50105瀏覽量
265560 -
無人機
+關(guān)注
關(guān)注
236文章
11308瀏覽量
195803 -
自動駕駛
+關(guān)注
關(guān)注
794文章
14890瀏覽量
180035
發(fā)布評論請先 登錄
AI如何重塑互聯(lián)網(wǎng)與物聯(lián)網(wǎng)的融合邊界
58倍視界 定義AI感知新精度:CM8258E-IOS+CM2001M鑄就智能之眼
SLAM如何為自動駕駛提供空間感知能力?
基于NVIDIA VLA模型打造通用人形機器人能力
如何在NVIDIA Jetson Thor上提升機器人感知效率
四川大學(xué):研究一種具有四重感知能力的柔性機器人傳感器
瑞聲科技為豆包AI手機提供核心感知能力支撐
加速邊緣AI應(yīng)用落地,Synaptics 重磅發(fā)布Astra SL2610
RK3576機器人核心:三屏異顯+八路攝像頭,重塑機器人交互與感知
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+具身智能芯片
聲智科技聲學(xué)模型賦予AI感知物理世界
智能照明系統(tǒng):具備認知能力的“光神經(jīng)網(wǎng)絡(luò)”
【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗】+Agent的工作原理及特點
涂鴉打造超強AI IPC技術(shù)!深度融合視覺+聽覺感知能力,顛覆傳統(tǒng)IPC交互玩法
感知能力,才是AI強大的原因
評論