10月12日,由追一科技主辦、南京大學計算機軟件新技術國家重點實驗室協辦的“首屆中文NL2SQL挑戰賽”總決賽答辯暨頒獎典禮在南京大學舉行。經過最終決賽的5強選手隊伍現場分享答辯和現場評委考評,國防科技大學選手團隊奪得冠軍,國雙科技團隊獲得亞軍,觀安信息與妙盈科技聯合團隊獲得季軍,華南理工大學與佛羅里達大學的選手隊伍,以及浙江大學的團隊則獲得優勝獎。
由眾多人工智能權威專家組成的評委團,包括中國移動研究院首席科學家馮俊蘭、復旦大學教授肖仰華、新加坡南洋理工大學副教授毛可智、南京大學教授俞揚、追一科技CTO劉云峰等產學研多方代表,在決賽現場對選手們的技術方案,進行了專業的分析點評,從而產生最終結果。
隨著NLP基礎能力發展,自然語言轉換可執行的SQL語句,訪問數據庫等一系列復雜的人機交互正逐漸成為可能。此次大賽短短幾個月里,頂級選手模型方案準確率達到92%以上,刷新業界記錄。
追一科技CTO劉云峰
“此次挑戰賽參與規模、選手表現遠超預期,顯示出NL2SQL在學術和產業應用上的潛力,數據庫的交互創新,正在受到越來越多關注。”追一科技聯合創始人兼CTO劉云峰表示,追一科技將與更多院校、企業界同仁攜手,共同推動中文NLP研究與應用突破。
新一代數據庫交互
NL2SQL(自然語言轉結構化查詢語句)作為新興的研究領域,在國外由SalesForce耶魯大學等發布了WikiSQL和Spider數據集,但在國內市場,目前還處于起步階段。此次NL2SQL挑戰賽是國內首次舉辦。
“大數據價值變現最大難題就是訪問門檻太高”,嘉賓評委代表、復旦大學教授肖仰華表示,利用自然語言訪問關系型數據庫里的數據,一直是數據庫業內夢想。太多的數據“沉睡”在關系表格里,使得這一愿望更變得日益迫切。
NL2SQL挑戰賽點評評委、復旦大學教授肖仰華
作為此次比賽的主辦方,追一科技聯合創始人兼CTO劉云峰也表示,追一在服務企業的過程中的發現,很多企業的知識和數據都是以關系型數據庫的形式存儲,例如銀行用戶的消費記錄、基金公司的基金屬性、保險公司的保單記錄等等,如果想更好地利用,“亟需將自然語言轉換成可執行的機器語言技術”。
劉云峰認為,NL2SQL正是非常好的技術實現路徑,“這也是追一科技發起比賽的原因。”
期間,追一科技發布了業內首個大規模的中文數據集,包括4870張表格數據、近50000條標注數據以及相應的SQL語句,并獲得很多學界專家、產業界伙伴的支持,通過“產學研”等多方聯動,希望提供一個平臺,來推動NL2SQL研究和應用。
產學研參與
據了解,本次比賽吸引了海內外1457支隊伍參與,包括院校、機構和企業開發者。
其中,學生及科研人員占比48%,企業技術員工占比52%。學生參賽隊伍來自眾多知名院校,如北京大學、清華大學、復旦大學、上海交通大學、南京大學、浙江大學、中國科學技術大學、哈爾濱工業大學、西安交通大學等。以及來自海外CMU、墨爾本大學、新加坡國立大學等頂級院校參與。
企業界的開發愛好者,則成為比賽的另一只重要力量。來自中國移動、平安集團、搜狗、達闥科技、中興通訊、網宿科技、國雙科技、捷通華聲等眾多企業的技術人員,也成為參賽隊伍的重要力量。
院校與院校、企業與企業等聯合“組隊”挑戰,成為比賽的一大亮點。比如5強中的華南理工與佛羅里達,上海觀安信息與妙盈科技等,均為聯合戰隊。
“眾人拾柴火焰高”,劉云峰表示,這次比賽也是搭建一個橋梁,讓學界、技術創業者、市場多方更好地聯動,“讓企業釘子找到‘錘子’,讓學術和技術創業者的錘子找到‘釘子’。”
作為高校嘉賓代表,南京大學人工智能創新研究院院長詹德川表示,除了選手的熱情和參與,更看重比賽的交流機會,“學界和產業界可以進行深入的交流。”他同時表示,產學研攜手,“AI的熱情不會進入冬天” 。此次活動中,南京大學計算機軟件新技術國家重點實驗室與追一科技合作,協辦比賽,助力產學研合作。
南京大學人工智能創新研究院院長詹德川
經過多方努力,短短幾個月里,NL2SQL中文領域研究快速突破。
比賽初期,準確率尚為60%多,至8月份初賽結束時,榜上頭部分數已經達到89%,接近WikiSQL成績。復賽結束時,選手最高成績達到92%,刷新業界記錄。并且,最終晉級決賽的5支隊伍,個個都在“90分”以上。
“最終選手的成績,完全超出了我們對于比賽的預期。”作為評委代表,肖仰華表示,實際上中文自然語言轉SQL的挑戰更大,選手們的成績,不但讓人驚喜,而且表現了深厚理論功底,對深度學習、自然語言處理思路和模型的嫻熟。
中國移動研究院首席科學家馮俊蘭
作為來自產業界的專家評委,馮俊蘭表示,NL2SQL 是自然語言處理的一個非常重要的應用領域,涉及到多個自然語言處理領域的核心問題,非常開心看到這么多高水平的隊伍參賽,并取得了非常好的成績,也看了產、學、研在這個方向上共同提升技術的熱情。
應用前景
如火如荼比賽背后,NL2SQL應用潛力,也受到了越來越多的矚目。
業內人士表示, NL2SQL在銀行、保險、證券、電商、汽車、地產等數據富礦領域,有很大的應用潛力,可以大大地降低數據庫訪問和使用門檻,提升人機交互體驗,并更好地挖掘數據價值。
“今天在AI與數據庫交互上,我們又一次看到了突破,新的想象空間。”對于此次比賽的舉行,創新工場董事長兼首席執行官李開復也表示,期待看到追一和更多NLP開發愛好者,不斷探索努力,推進NLP創新和普惠應用。
“此次挑戰賽參與規模遠超預期,顯示出NL2SQL在學術和產業應用上的潛力,數據庫的交互創新,正在受到越來越多關注。”追一科技聯合創始人兼CTO劉云峰博士表示,追一科技將與更多院校、企業界同仁攜手,共同推動中文NLP研究與應用突破。
-
人機交互
+關注
關注
12文章
1288瀏覽量
57929 -
SQL
+關注
關注
1文章
789瀏覽量
46702 -
數據庫
+關注
關注
7文章
4020瀏覽量
68355
發布評論請先 登錄
思必馳斬獲Interspeech 2026音頻推理挑戰賽智能體賽道亞軍
AICAS 2026 Grand Challenge全球挑戰賽啟動
華大九天助力2025中國研究生創“芯”大賽EDA精英挑戰賽圓滿收官
廣立微助力2025中國研究生創“芯”大賽EDA精英挑戰賽圓滿落幕
BOE IPC電競嘉年華盛典圓滿收官
2025 EDA精英挑戰賽華大九天賽題發布
2025 EDA精英挑戰賽紫光同創賽題發布
e絡盟社區攜手 Würth Elektronik 發起全球 LED 設計挑戰賽
傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰賽冠亞軍,推動視頻畫質升級
華為攜手產業伙伴榮獲四項大獎
Denodo全新AI SDK認證發布,攜手大學挑戰賽共筑快速AI應用開發新生態
ASML杯光刻「芯 」勢力知識挑戰賽正式啟動
首屆中文NL2SQL挑戰賽收官 產學研攜手推動智能交互發展
評論