劍橋大學(xué)數(shù)據(jù)科學(xué)家Marek Rei在個(gè)人博客上發(fā)布了2018年國際頂尖學(xué)術(shù)會議上發(fā)表的機(jī)器學(xué)習(xí)和NLP相關(guān)論文的數(shù)據(jù)統(tǒng)計(jì)。數(shù)據(jù)顯示,無論是頂會論文發(fā)表數(shù)量還是會議出席人數(shù),都表明AI領(lǐng)域仍處于快速的增長期,“AI寒冬”并未到來。
2018年已過經(jīng)去,各類盤點(diǎn)還在繼續(xù)。
近日,劍橋大學(xué)數(shù)據(jù)科學(xué)家Marek Rei在個(gè)人博客上更新了2018年國際頂尖學(xué)術(shù)會議上發(fā)表的機(jī)器學(xué)習(xí)和NLP相關(guān)論文的數(shù)據(jù)統(tǒng)計(jì)。
雖然2018年“AI寒冬”的警告不絕于耳,但Marek Rei的這份數(shù)據(jù)顯示,去年在AI相關(guān)領(lǐng)域,無論是頂會論文發(fā)表數(shù)量還是會議出席人數(shù),都表明AI領(lǐng)域仍處于快速的增長期,2018年的統(tǒng)計(jì)數(shù)據(jù)打破了此前的多項(xiàng)紀(jì)錄。
最值得注意的是,今年的NeurIPS會議的門票在開票后僅11分38秒即告售罄,堪比春運(yùn)火車票,令無數(shù)準(zhǔn)備參會或圍觀大牛的熱心觀眾唏噓不已。
本文提供了關(guān)于這些統(tǒng)計(jì)數(shù)字的更精細(xì)的分類數(shù)據(jù)信息,一起來看看哪些作者和機(jī)構(gòu)在特定的學(xué)術(shù)會議上發(fā)表的論文數(shù)最多。
今年的統(tǒng)計(jì)信息中涵蓋了下列會議/期刊:
ACL、EMNLP、NAACL、EACL、COLING、TACL、CL,CoNLL、NeurIPS、ICML、ICLR和AAAI。
上述會議/期刊基本涵蓋了全球最知名、級別最高的機(jī)器學(xué)習(xí)自然語言語言技術(shù)成果出處。與2017年的數(shù)據(jù)相比去掉了SemEval,因?yàn)樵摃h主要關(guān)注共享作者的論文,本次統(tǒng)計(jì)也沒有將合作成果的數(shù)據(jù)收錄在其他會議中。
今年的統(tǒng)計(jì)數(shù)據(jù)中新收錄了AAAI,這是一個(gè)規(guī)模較大的會議,之前的統(tǒng)計(jì)中未收錄。 NeurIPS(前NIPS)去年進(jìn)行了更名,但為了保持一致性,在之前年份的數(shù)據(jù)內(nèi)容中一律統(tǒng)一使用新名稱。
統(tǒng)計(jì)數(shù)據(jù)的抓取和分析是通過一系列腳本自動完成的,多年來,這些自動腳本一直在不斷改進(jìn)。論文列表是通過在線程序抓取的,通常也附帶有作者信息。組織機(jī)構(gòu)名稱需要直接從PDF中提取,這可能會導(dǎo)致一些錯(cuò)誤。為此我已經(jīng)采取各種方法來檢測和映射不同類型的機(jī)構(gòu)名,來盡量避免這些錯(cuò)誤。
這篇文章重點(diǎn)介紹了近年來發(fā)表論文數(shù)量最多的作者和機(jī)構(gòu),但這里要指出,不能將發(fā)表論文的數(shù)量作為研究領(lǐng)域中一味追求或獎(jiǎng)勵(lì)的目標(biāo),而且論文數(shù)量的快速增長,并不代表研究質(zhì)量的快速提高。
寫出一篇具有開創(chuàng)性意義的論文,要比發(fā)表10篇很快就被人遺忘的論文更了不起。此文的目的是為了給相關(guān)領(lǐng)域的人員提供一個(gè)更廣的視角,也可能為心懷優(yōu)秀創(chuàng)意的新研究人員提供一些靈感。
關(guān)注每位作者在不同年份發(fā)表的論文數(shù)量,按照兩年為單位,Chris Dyer仍然顯得一枝獨(dú)秀,Yue Zhang和 Ming Zhou緊隨其后。
2012-2018年全球會議/期刊論文數(shù)量變化情況

先來看看2012-2018年間統(tǒng)計(jì)收錄的會議上的會議論文。大多數(shù)機(jī)器學(xué)習(xí)會議上發(fā)表的論文數(shù)量都呈現(xiàn)持續(xù)增長態(tài)勢,其中發(fā)表在AAAI和NeurIPS上的論文超過1000篇。 EMNLP和NAACL也逐年連創(chuàng)新高。ACL和COLING則變化不是很大。 EACL今年休會,TACL和CL的論文數(shù)量多年來保持相對平穩(wěn)。
作者情況統(tǒng)計(jì)

接下來,看看2018年在這些會議上發(fā)表過論文的作者情況。有三位研究人員分別發(fā)表了22篇論文,論文數(shù)量排名并列第一,分別是:周明(微軟),格雷厄姆·紐比格(卡內(nèi)基梅隆大學(xué))和謝爾蓋·萊文(加州大學(xué)伯克利分校) 。緊隨其后的是張潼(曾供職騰訊AI,最近離職),孫茂松(清華大學(xué))和Iryna Gurevych(達(dá)姆施塔特工業(yè)大學(xué))。

再來看看2012-2018之間的發(fā)表論文總數(shù),Chris Dyer(DeepMind)以97篇排名榜首。緊隨其后的是周明(微軟)、Yoshua Bengio(蒙特利爾大學(xué)),張?jiān)溃ㄎ骱髮W(xué))和Noah A.Smith(華盛頓大學(xué))。大多數(shù)作者明顯更傾向于在自然語言處理或機(jī)器學(xué)習(xí)的核心會議,Percy Liang可能是個(gè)例外,在期刊和會議上發(fā)表的論文數(shù)量基本差不多。

還可以查看不同年份每位作者的論文數(shù)量。可以看到,Chris Dyer在2015-2016年間發(fā)表的論文數(shù)量增長驚人。
一作情況統(tǒng)計(jì)
接下來是關(guān)于論文第一作者的統(tǒng)計(jì)數(shù)據(jù)。論文的第一作者通常是那些實(shí)際操作、實(shí)驗(yàn)并撰寫論文的大部分內(nèi)容的人,是反映作者對論文成果貢獻(xiàn)度的重要指標(biāo)之一。

在這項(xiàng)統(tǒng)計(jì)中,位列榜首的是Yi Tay(南洋理工大學(xué)),他是一名三年級博士生,在2018年的學(xué)術(shù)會議上共發(fā)表了10篇一作論文,令人印象深刻。第二名為朱澤園(Zeyuan Allen-Zhu),去年共發(fā)表6篇一作論文。排在之后的分別是Mikel Artetxe,Jiatao Gu(香港大學(xué)),Dinghan Shen(杜克大學(xué))和Nathan Kallus(康奈爾大學(xué))去年共發(fā)表5篇一作論文。

再來看看發(fā)表論文總數(shù),李紀(jì)為(香儂科技)發(fā)表了 22 篇一作論文。其后是朱澤園(微軟)、Young-Bum Kim(亞馬遜)、Ryan Cotterell(劍橋大學(xué))和 Ivan Vuli?(劍橋大學(xué))。
組織機(jī)構(gòu)發(fā)表論文情況

接下來是企業(yè)和研究機(jī)構(gòu)發(fā)表論文的統(tǒng)計(jì)數(shù)據(jù)。與前兩年一樣,CMU在2018年發(fā)文數(shù)仍然位居第一,自然語言處理和機(jī)器學(xué)習(xí)主題之間的論文數(shù)量差距相對均勻。從企業(yè)方面來看,谷歌和微軟仍然是行業(yè)的領(lǐng)導(dǎo)者,清華大學(xué)、斯坦福大學(xué)、北京大學(xué)、麻省理工學(xué)院和加州大學(xué)伯克利分校都位列頂級機(jī)構(gòu)之列。

從2012年至2018年的整個(gè)時(shí)段來看,排名實(shí)際上沒有太多變化。CMU仍然處高居第一,微軟和谷歌得而排名則換了個(gè)位置。普林斯頓大學(xué)、INRIA和杜克大學(xué)似乎專注于機(jī)器學(xué)習(xí)領(lǐng)域,幾乎沒有在NLP領(lǐng)域發(fā)表文章。相比之下,北京大學(xué)、中科院和愛丁堡大學(xué)似乎更重視NLP方向,沒有在NeurIPS /ICML上發(fā)表什么文章。

從時(shí)間分布來看,CMU在過去幾年內(nèi)一直保持高產(chǎn),并且仍在繼續(xù)增長。谷歌和微軟一直在爭奪企業(yè)界的榜首位置,但目前谷歌似乎取得了領(lǐng)先地位。清華、北大等中國大學(xué)目前的論文發(fā)表數(shù)量正在迅猛上漲。
論文研究話題的分布
最后是關(guān)于論文作者和組織機(jī)構(gòu)發(fā)表論文主題的一些分類。我收集了與指定作者/組織機(jī)構(gòu)相關(guān)的所有論文,全部小寫處理,加上標(biāo)記,然后傳遞給LDA,再用t-SNE進(jìn)行可視化,顯示出了他們的論文內(nèi)容與圖中其他人內(nèi)容的相似關(guān)系。結(jié)果如下:


-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8554瀏覽量
136979 -
自然語言處理
+關(guān)注
關(guān)注
1文章
630瀏覽量
14669 -
nlp
+關(guān)注
關(guān)注
1文章
491瀏覽量
23282
原文標(biāo)題:機(jī)器學(xué)習(xí)和NLP頂會論文大王:周明、張潼、孫茂松等上榜
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
MediaTek多篇論文入選全球前沿國際學(xué)術(shù)會議
奧托立夫亮相2025國際汽車交通安全學(xué)術(shù)會議
長城汽車亮相2025國際汽車交通安全學(xué)術(shù)會議
理想汽車12篇論文入選全球五大AI頂會
奧松電子協(xié)辦第二屆智能計(jì)算與數(shù)據(jù)挖掘國際學(xué)術(shù)會議
會議回顧 | 深視智能攜新品sCMOS科學(xué)相機(jī)亮相中國神經(jīng)科學(xué)學(xué)會第十八屆全國學(xué)術(shù)會議
SAE 2025汽車智能與網(wǎng)聯(lián)技術(shù)學(xué)術(shù)會議在山城重慶成功舉辦
SAE 2025汽車智能與網(wǎng)聯(lián)技術(shù)學(xué)術(shù)會議圓滿落幕
長城汽車出席第二十八屆汽車安全技術(shù)國際學(xué)術(shù)會議
知存科技邀您相約第二十一屆全國容錯(cuò)計(jì)算學(xué)術(shù)會議
思必馳與上海交大聯(lián)合實(shí)驗(yàn)室兩篇論文入選ICML 2025
維智科技受邀出席第十屆全國虛擬地理環(huán)境學(xué)術(shù)會議
Aigtek高光回顧!第二十屆全國電介質(zhì)物理、材料與應(yīng)用學(xué)術(shù)會議!
【4月28日-29日|長沙】中星聯(lián)華邀您參加第六屆復(fù)雜電磁環(huán)境技術(shù)及應(yīng)用學(xué)術(shù)會議
會議邀請 | Aigtek安泰電子與您相約第二十屆全國電介質(zhì)物理、材料與應(yīng)用學(xué)術(shù)會議!
2018年國際頂尖學(xué)術(shù)會議上發(fā)表的機(jī)器學(xué)習(xí)和NLP相關(guān)論文的數(shù)據(jù)統(tǒng)計(jì)
評論