人工智能時(shí)代,數(shù)據(jù)是關(guān)鍵。但是,擁有大量數(shù)據(jù)的公司會(huì)在人工智能時(shí)代變得更加強(qiáng)大嗎?近日,A16Z合伙人Benedict Evans近日在其博客上發(fā)表了一篇文章,對(duì)這個(gè)問題進(jìn)行了回答。他認(rèn)為,普遍情況下,人工智能只會(huì)讓大公司更適合成為大公司。人工智能是否具備贏家通吃效應(yīng),還要看情況。原題為“Does AI make strong tech companies stronger?”希望能夠?yàn)槟銕韱l(fā)。
機(jī)器學(xué)習(xí),可能是當(dāng)今所有的技術(shù)中最重要的。
由于機(jī)器學(xué)習(xí)的基礎(chǔ)是數(shù)據(jù)——大量的數(shù)據(jù)——所以人們經(jīng)常聽到這樣的說法,即已經(jīng)擁有大量數(shù)據(jù)的公司會(huì)變得更加強(qiáng)大。
這有一定道理,但只是在小范圍內(nèi)可以這樣說。與此同時(shí),我們也能看到,機(jī)器學(xué)習(xí)會(huì)帶來能力擴(kuò)散,整個(gè)過程中,它帶來的去中心化和集中化一樣多。
首先,機(jī)器學(xué)習(xí)是關(guān)于數(shù)據(jù)的。這意味著什么?
由于機(jī)器學(xué)習(xí)的學(xué)術(shù)氛圍,幾乎所有的基礎(chǔ)技術(shù)突破,在發(fā)現(xiàn)之后都會(huì)立即發(fā)表出版。每個(gè)人都能讀到關(guān)于這些突破的論文,甚至有代碼,可以復(fù)現(xiàn)這一突破。
在過去,軟件工程師想要?jiǎng)?chuàng)建一個(gè)系統(tǒng)來識(shí)別某些東西,他們要寫邏輯步驟(“規(guī)則”)。
為了識(shí)別圖片中的貓,你需要寫一些規(guī)則來識(shí)別貓的輪廓、皮毛、腿、眼睛、尖耳朵等等,然后把它們打包在一起,希望它能起作用。
問題在于,盡管這在理論上可行,但在實(shí)踐中,就相當(dāng)于試圖制造一匹機(jī)械馬,它所需要的復(fù)雜性邏輯是不切實(shí)際的。我們無法描述我們識(shí)別貓的所有邏輯步驟。
使用機(jī)器學(xué)習(xí),你只需要給統(tǒng)計(jì)引擎提供例子(很多例子),這個(gè)引擎會(huì)生成一個(gè)模型來區(qū)分這些例子中的不同之處。
你給它100000張貼有“貓”標(biāo)簽的照片和100000張貼有“不是貓”標(biāo)簽的照片,機(jī)器就能找出區(qū)別。
機(jī)器學(xué)習(xí),用從數(shù)據(jù)中自動(dòng)確定的模式代替了手寫的邏輯步驟。對(duì)于一些非常廣泛的問題,它的效果更好。一些簡(jiǎn)單的應(yīng)用是在計(jì)算機(jī)視覺、語言和語音方面,但它的用例要廣泛得多。
你需要多少數(shù)據(jù)是不斷變化的:有一些研究路徑,可以讓機(jī)器學(xué)習(xí)處理小得多的數(shù)據(jù)集。但現(xiàn)在,還是數(shù)據(jù)越多越好。
因此,問題是:如果用機(jī)器學(xué)習(xí)讓做新的重要的事情,而且機(jī)器學(xué)習(xí)需要越多數(shù)據(jù)越好,這是否意味著那些已經(jīng)很大并且擁有大量數(shù)據(jù)的公司會(huì)變得更強(qiáng)大?贏家通吃效應(yīng)有多嚴(yán)重?
不難想象,會(huì)有一個(gè)良性循環(huán),來強(qiáng)化贏家的主導(dǎo)地位:
更多數(shù)據(jù)=更精確的模型=更好的產(chǎn)品=更多用戶=更多數(shù)據(jù)。
基于此,得出像“谷歌/ Facebook /亞馬遜擁有大量數(shù)據(jù)”或者“中國擁有大量數(shù)據(jù)”,將會(huì)在人工智能領(lǐng)域占據(jù)上風(fēng)的觀點(diǎn),會(huì)變得很容易。
好吧,也可以這樣說。
首先,雖然機(jī)器學(xué)習(xí)需要大量的數(shù)據(jù),但是你使用的數(shù)據(jù)要非常適合你試圖解決的問題。
通用電氣有大量來自燃?xì)鉁u輪機(jī)的遙測(cè)數(shù)據(jù),谷歌有大量搜索數(shù)據(jù),美國運(yùn)通有大量信用卡欺詐數(shù)據(jù)。
但你不能用渦輪機(jī)數(shù)據(jù)來訓(xùn)練模型,去發(fā)現(xiàn)欺詐交易,也不能用網(wǎng)絡(luò)搜索數(shù)據(jù)訓(xùn)練模型去發(fā)現(xiàn)即將失效的燃?xì)鉁u輪機(jī)。
也就是說,機(jī)器學(xué)習(xí)是一種可推廣的技術(shù)——你可以將其用于欺詐檢測(cè)或面部識(shí)別——但是你用它構(gòu)建的應(yīng)用程序并不具備可推廣性。
你訓(xùn)練的每一個(gè)模型只能做一件事。
這與之前的自動(dòng)化浪潮非常相似:就像洗衣機(jī)只能洗衣服,不能洗碗做飯,象棋程序不能交稅一樣,機(jī)器學(xué)習(xí)翻譯系統(tǒng)也不能識(shí)別貓。
你構(gòu)建的應(yīng)用程序和你需要的數(shù)據(jù)集,都與你試圖解決的任務(wù)強(qiáng)相關(guān)(盡管這也是一個(gè)不斷變化的目標(biāo),有研究試圖讓機(jī)器學(xué)習(xí)模型在不同的數(shù)據(jù)集之間更容易遷移)。
這意味著機(jī)器學(xué)習(xí)的實(shí)現(xiàn)的分布將會(huì)非常廣泛。
谷歌不會(huì)“擁有所有的數(shù)據(jù)”——谷歌會(huì)擁有所有的谷歌數(shù)據(jù)。谷歌給出更相關(guān)的搜索結(jié)果,通用電氣將會(huì)有更好的渦輪機(jī)遙測(cè)技術(shù),沃達(dá)豐將會(huì)有更好的呼叫模式分析和網(wǎng)絡(luò)規(guī)劃,這些都是不同公司建立的不同東西。
谷歌會(huì)越來越擅長成為谷歌,但這并不意味著它在其他方面也做得越來越好。
接下來,人們可能會(huì)爭(zhēng)辯說,這只是意味著每個(gè)行業(yè)中的大公司變得更加強(qiáng)大——沃達(dá)豐、通用電氣和美國運(yùn)通都擁有它們做的任何事情的“所有數(shù)據(jù)”,從而形成了抵御競(jìng)爭(zhēng)對(duì)手的護(hù)城河。
但是在這個(gè)方面,情況又變得更加復(fù)雜,會(huì)有各種有趣的問題涌現(xiàn)。比如誰擁有數(shù)據(jù),數(shù)據(jù)有多獨(dú)特,數(shù)據(jù)在什么層面上是獨(dú)一無二的,以及聚合和分析數(shù)據(jù)的正確位置在哪里。
所以:作為一家工業(yè)公司,你會(huì)保留自己的數(shù)據(jù)并建立機(jī)器學(xué)習(xí)系統(tǒng)來分析它嗎(或者付錢給承包商來幫你這樣做)?
你會(huì)從供應(yīng)商那里購買用其他人的數(shù)據(jù)訓(xùn)練的成品嗎?你是將你的數(shù)據(jù)融入其中,還是用你的數(shù)據(jù)進(jìn)行訓(xùn)練?供應(yīng)商是否需要你的數(shù)據(jù),或者它們已經(jīng)有足夠的數(shù)據(jù)了?
對(duì)于不同的業(yè)務(wù)部門、不同的行業(yè)和不同的用例,答案會(huì)有所不同。
從另一個(gè)角度來說,如果你正在創(chuàng)建一家公司來用機(jī)器學(xué)習(xí)解決現(xiàn)實(shí)世界的問題,那么有兩個(gè)基本的數(shù)據(jù)問題:
你如何獲得第一批數(shù)據(jù)來訓(xùn)練你的模型去獲得第一個(gè)客戶?你需要多少數(shù)據(jù)?
當(dāng)然,第二個(gè)問題可以分解成許多問題:
是用相對(duì)較少且相當(dāng)容易獲得的的數(shù)據(jù)來解決問題?(但許多競(jìng)爭(zhēng)對(duì)手可以獲得) 。
還是你需要更多的、難以獲得的數(shù)據(jù)去解決問題?
如果是這樣的話,是否存在一種網(wǎng)絡(luò)效應(yīng)可以從中受益?一個(gè)贏家將獲得所有的數(shù)據(jù)?
產(chǎn)品是隨著更多的數(shù)據(jù)無限期地變得更好,還是存在一個(gè)S曲線?
這要看情況。
有些數(shù)據(jù),是企業(yè)或產(chǎn)品所獨(dú)有的,或者具有很強(qiáng)的專有優(yōu)勢(shì)。 通用電氣公司的渦輪機(jī)遙測(cè)技術(shù)在分析勞斯萊斯的渦輪機(jī)方面,可能沒有多大用處。當(dāng)然,如果有用的話,他們也不會(huì)分享。
這可能是一個(gè)創(chuàng)辦公司的機(jī)會(huì),也是許多大公司的技術(shù)部門和承包商設(shè)計(jì)項(xiàng)目的地方。
一些數(shù)據(jù),可以應(yīng)用于許多公司甚至許多行業(yè)中的用例。
比如,“這個(gè)電話有些奇怪”,可能在所有信用卡公司中都有用。“顧客聽起來很生氣”,可能適用于任何設(shè)立有呼叫中心的企業(yè)。
基于此,誕生了許多創(chuàng)業(yè)公司,以解決許多公司或不同行業(yè)的共性問題,并且這里的數(shù)據(jù)具有網(wǎng)絡(luò)效應(yīng)。
但是也有這樣的情況,即在某個(gè)時(shí)間點(diǎn)之后,供應(yīng)商甚至不需要每個(gè)更多的數(shù)據(jù)了,因?yàn)楫a(chǎn)品已經(jīng)開始工作了。
實(shí)際上,隨著機(jī)器學(xué)習(xí)擴(kuò)散到幾乎所有領(lǐng)域,可以從很多創(chuàng)業(yè)公司種看到這些情況。我們(A16Z)的投資的公司Everlaw開發(fā)了一個(gè)法律發(fā)現(xiàn)軟件:如果你起訴某人,他們給你一卡車的文件,這對(duì)你有幫助。
使用機(jī)器學(xué)習(xí),他們能夠?qū)σ话偃f封電子郵件進(jìn)行情感分析,但不需要根據(jù)你的案件數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,因?yàn)榍楦凶R(shí)別模型的訓(xùn)練數(shù)據(jù),不需要來自這個(gè)特定的訴訟(或任何訴訟)。
另一家公司Drishti使用計(jì)算機(jī)視覺技術(shù)來檢測(cè)和分析生產(chǎn)線,其中一些模型是根據(jù)你的數(shù)據(jù)訓(xùn)練出來的,另一些根本不是針對(duì)于你的業(yè)務(wù),而是跨行業(yè)工作的。
還有一些極端情況。最近,我與一家大型車輛制造商的內(nèi)部人士進(jìn)行了交談,這家制造商正在利用機(jī)器學(xué)習(xí)技術(shù)來開發(fā)更精確的爆胎檢測(cè)器。
這是基于大量輪胎的數(shù)據(jù)訓(xùn)練出來的模型。但很明顯,獲得這些數(shù)據(jù)并不難。所以,這只能是一個(gè)功能,而不是算是護(hù)城河。
我早些時(shí)候說過,機(jī)器學(xué)習(xí)創(chuàng)業(yè)公司需要回答兩個(gè)問題:
你是如何獲得數(shù)據(jù)的?你需要多少數(shù)據(jù)?
但是這些只是技術(shù)層面的問題,你還需要問自己:
如何進(jìn)入市場(chǎng)?你的目標(biāo)市場(chǎng)是什么?你正在解決的問題對(duì)你的客戶有多有價(jià)值?等等。
也就是說,很快將不會(huì)有任何“人工智能”創(chuàng)業(yè)公司,它們將是工業(yè)流程分析公司、法律平臺(tái)公司或銷售優(yōu)化公司。
事實(shí)上,機(jī)器學(xué)習(xí)的普及并不意味著谷歌變得更強(qiáng)大,而是意味著各種各樣的創(chuàng)業(yè)公司,能夠比以前更快地利用這一前沿技術(shù)來構(gòu)建一個(gè)應(yīng)用,解決一個(gè)問題。
這讓我想到了我在其他地方用過的一個(gè)比喻:我們應(yīng)該將機(jī)器學(xué)習(xí)與SQL進(jìn)行比較。
它是構(gòu)建新的重要的事情的基石,在未來將成為一切的一部分。如果你不使用它,而你的競(jìng)爭(zhēng)對(duì)手會(huì)使用它,你就會(huì)落后。
一些人將基于此創(chuàng)建全新的公司,沃爾瑪?shù)囊徊糠殖晒σ蛩兀褪鞘褂脭?shù)據(jù)庫更有效地管理庫存和物流。
但是今天,如果你創(chuàng)辦了一家零售公司,并說“……我們將使用數(shù)據(jù)庫”,這不會(huì)讓你變得不同或有趣,因?yàn)镾QL成為了一切的一部分,然后它就在話語體系中消失了。
機(jī)器學(xué)習(xí)也會(huì)如此。
-
人工智能
+關(guān)注
關(guān)注
1817文章
50098瀏覽量
265393
原文標(biāo)題:A16Z合伙人:人工智能領(lǐng)域是否存在“贏家通吃”效應(yīng)?
文章出處:【微信號(hào):worldofai,微信公眾號(hào):worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
開發(fā)智能體配置-內(nèi)容合規(guī)
自然智能與人工智能融合如何重塑芯片設(shè)計(jì)
嵌入式系統(tǒng)中的人工智能
利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能
挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器
挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!
迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能
最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)
CYW20829是否能夠同時(shí)通過BT/BLE連接最多3臺(tái)設(shè)備?
超聲波清洗機(jī)是否能夠清洗特殊材料或器件?
人工智能領(lǐng)域是否能夠贏家通吃?
評(píng)論