僅一周多的時(shí)間,您中的大多數(shù)人就會(huì)聽(tīng)說(shuō)Facebook的AI研究團(tuán)隊(duì)(FAIR)開(kāi)發(fā)了一種神經(jīng)轉(zhuǎn)編譯器,該代碼使用“無(wú)監(jiān)督翻譯 ” 將高級(jí)編程語(yǔ)言(如C ++,Python,Java,Cobol)的代碼轉(zhuǎn)換為另一種語(yǔ)言。傳統(tǒng)的方法是標(biāo)記源語(yǔ)言并將其轉(zhuǎn)換為抽象語(yǔ)法樹(shù)(AST),反編譯器將根據(jù)定義翻譯的手寫(xiě)規(guī)則(例如抽象或上下文)將其用于轉(zhuǎn)換為所選的目標(biāo)語(yǔ)言。沒(méi)有丟失。
在過(guò)去的幾十年中,神經(jīng)語(yǔ)言翻譯取得了如此重大的進(jìn)步,以至于盡管只有足夠的并行語(yǔ)料庫(kù)才是唯一的限制,但是這些神經(jīng)模型往往要比硬編碼的手寫(xiě)規(guī)則好得多。
這已通過(guò)“無(wú)監(jiān)督的ML翻譯”方法得到了更大程度的解決,其中Facebook的研究團(tuán)隊(duì)使用了來(lái)自Github的不同編程語(yǔ)言的大量單語(yǔ)源代碼庫(kù)來(lái)訓(xùn)練模型。
這使許多組織感到寬慰,尤其是在保險(xiǎn),政府和銀行部門(mén),他們繼續(xù)使用舊版應(yīng)用程序,而這些應(yīng)用程序幾乎沒(méi)有增強(qiáng)或微調(diào)的空間,因?yàn)樗鼈兪怯烧嬲炀毜?a href="http://www.3532n.com/v/tag/1730/" target="_blank">程序員在過(guò)去的美好時(shí)光中編寫(xiě)的— COBOL ,Pascal,F(xiàn)ortran等。
盡管編程語(yǔ)言已經(jīng)隨著時(shí)間的流逝而發(fā)展,但是從一種代碼庫(kù)移植到更高效或更現(xiàn)代的語(yǔ)言(如Java,Swift,Ruby,python)卻是真正的痛苦,因?yàn)樗枰凑Z(yǔ)言和目標(biāo)語(yǔ)言方面的專業(yè)知識(shí)。例如,有報(bào)道稱,澳大利亞聯(lián)邦銀行花費(fèi)了高達(dá)7.5億美元,并在五年內(nèi)將其核心軟件從大型機(jī)上的COBOL遷移到了現(xiàn)代平臺(tái)上。
基于規(guī)則的翻譯實(shí)現(xiàn)起來(lái)很復(fù)雜,靈活性和解釋性較差。Facebook的Transcoder可以解決長(zhǎng)期存在的問(wèn)題。
FAIR代碼轉(zhuǎn)換器的主要組件
FAIR轉(zhuǎn)碼器基于一種變壓器架構(gòu),包括一個(gè)編碼器和一個(gè)解碼器,基于“注意就是您所需要的”論文。FAIR轉(zhuǎn)碼器依賴于單個(gè)模型進(jìn)行編碼和解碼,并且基于3個(gè)原理:
屏蔽語(yǔ)言模型預(yù)訓(xùn)練
去噪自動(dòng)編碼
回譯
1. 屏蔽語(yǔ)言模型預(yù)訓(xùn)練
掩蔽語(yǔ)言預(yù)訓(xùn)練模型基于BERT論文,該模型訓(xùn)練編碼器從源代碼中識(shí)別出掩蔽標(biāo)記。訓(xùn)練編碼器以理解編程構(gòu)造,以便在屏蔽某些令牌時(shí)識(shí)別丟失的令牌并對(duì)其進(jìn)行重構(gòu)。
-
編程語(yǔ)言
+關(guān)注
關(guān)注
10文章
1965瀏覽量
39601 -
源代碼
+關(guān)注
關(guān)注
96文章
2953瀏覽量
70357 -
ML
+關(guān)注
關(guān)注
0文章
154瀏覽量
35484
發(fā)布評(píng)論請(qǐng)先 登錄
單片機(jī)開(kāi)發(fā)功能安全中編譯器
開(kāi)源鴻蒙技術(shù)大會(huì)2025丨編譯器與編程語(yǔ)言分論壇:語(yǔ)言驅(qū)動(dòng)系統(tǒng)創(chuàng)新,編譯賦能生態(tài)繁榮
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+神經(jīng)形態(tài)計(jì)算、類腦芯片
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+化學(xué)或生物方法實(shí)現(xiàn)AI
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的未來(lái):提升算力還是智力
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+第二章 實(shí)現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)
求助,關(guān)于NanoEdge AI Studio生成的庫(kù)交叉編譯器版本疑問(wèn)求解
進(jìn)迭時(shí)空同構(gòu)融合RISC-V AI CPU的Triton算子編譯器實(shí)踐
邊緣設(shè)備AI部署:編譯器如何實(shí)現(xiàn)輕量化與高性能?
編譯器功能安全驗(yàn)證的關(guān)鍵要素
Nordic收購(gòu) Neuton.AI 關(guān)于產(chǎn)品技術(shù)的分析
兆松科技ZCC編譯器全面支持芯來(lái)科技NA系列處理器
RISC-V架構(gòu)下的編譯器自動(dòng)向量化
Facebook的AI研究團(tuán)隊(duì)開(kāi)發(fā)了一種神經(jīng)轉(zhuǎn)編譯器
評(píng)論