電子發(fā)燒友網(wǎng)報道(文/李寧遠)自1965年戈登摩爾提出摩爾定律以后,半導(dǎo)體行業(yè)在摩爾定律上已經(jīng)繁榮發(fā)展了半個多世紀。芯片,已經(jīng)成為時代發(fā)展的重要引擎。但隨著晶體管尺寸逐漸逼近物理極限,近年來摩爾定律發(fā)展已放緩,甚至面臨失效無法延續(xù),需要建立新的芯片秩序。
而且在現(xiàn)在的人工智能時代,算力是無法替代的先進生產(chǎn)力,是人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)等先進技術(shù)落地應(yīng)用的基礎(chǔ)支撐,而國內(nèi)正處在高端算力芯片供應(yīng)鏈被封鎖的形勢。如何繞開專利、技術(shù)被封鎖的束縛,找出一條新的道路來也是至關(guān)重要。
近日,清華大學(xué)團隊在超高性能計算芯片領(lǐng)域取得了令人矚目的關(guān)鍵成果,他們成功研發(fā)的ACCEL光電計算芯片,相關(guān)成果以《面向高速視覺任務(wù)的純模擬光電計算芯片》為題發(fā)表在Nature上。
與現(xiàn)有高端GPU相比,實現(xiàn)了算力提升三千余倍,能效提升四百萬余倍的表現(xiàn),ACCEL光電計算芯片為超高性能芯片的研發(fā)開辟了全新的路徑。
ACCEL架構(gòu)光電計算實現(xiàn)高速視覺處理性能飛躍
現(xiàn)在我們使用的各種設(shè)備和系統(tǒng),絕大多數(shù)通過晶體管以電信號來進行計算,以現(xiàn)在市面上用于人工智能算力芯片內(nèi)集成的晶體管數(shù)量已經(jīng)以百億、千億來算。這些晶體管操縱電流實現(xiàn)超大規(guī)模的計算。
人工智能算力正在崛起成為剛需,而摩爾定律正在衰落,尋找新興技術(shù)革新硬件計算是目前前沿科技的一大技術(shù)熱點。量子計算、神經(jīng)形態(tài)芯片、光子計算等都是有可能實現(xiàn)計算性能飛躍的技術(shù)路線,光子計算是其中有力的競爭者,近期ACCEL光電計算芯片的突破也印證了這一技術(shù)路線的可行性。
面向高速視覺任務(wù)的純模擬光電計算芯片基于光電深度融合計算框架,將光芯片與電芯片結(jié)合,在一枚芯片上突破大規(guī)模計算單元集成、高效非線性、高速光電接口三個國際難題,由清華大學(xué)自動化系(戴瓊海院士、吳嘉敏助理教授)與電子工程系(方璐副教授、喬飛副研究員)聯(lián)合攻克。
不同于傳統(tǒng)計算,光子計算不是通過將電流表示成0和1來編碼和操作數(shù)據(jù),而是利用光的物理特性來進行計算。光子計算使用光,這使得它更快、更有效、更緊湊。光子計算的確能夠更快、更節(jié)能地處理視覺數(shù)據(jù)。
因此,清華大學(xué)團隊提出了一種結(jié)合電子和光計算(ACCEL)的全模擬芯片架構(gòu),將衍射光學(xué)模擬計算(OAC)和電子模擬計算(EAC)融合在一個芯片中,具有可擴展性、非線性和靈活性。根據(jù)論文數(shù)據(jù),其系統(tǒng)能效為74.8Peta-OPS/W,計算速度為4.6Peta-OPS,而且計算的99%都由光學(xué)部分實現(xiàn)。
不論是系統(tǒng)能效還是計算速度,和現(xiàn)在最先進的計算處理相比,ACCEL都有著數(shù)量級上絕對的領(lǐng)先。
具體來說,ACCEL的系統(tǒng)級算力穩(wěn)定達到現(xiàn)有高性能芯片的數(shù)千倍,同時系統(tǒng)級能效較現(xiàn)有的高性能 GPU、TPU、光計算和模擬電計算架構(gòu),提升了兩千到數(shù)百萬倍不等。
對于視覺數(shù)據(jù)來說,ACCEL無疑讓處理性能實現(xiàn)了飛躍,也表明了“掙脫”摩爾定律的全新計算架構(gòu)的可行性。
全新顛覆性計算架構(gòu),助力***領(lǐng)域彎道超車
ACCEL架構(gòu)光芯片與電芯片的融合性能的大幅提升已經(jīng)被證實,而且該芯片光學(xué)部分的加工最小線寬僅采用百納米級,而電路部分僅采用180nm CMOS工藝。如果采用更先進的工藝技術(shù),ACCEL能進一步大幅降低更高時鐘頻率下運行的控制單元功耗。
成熟的工藝卻實現(xiàn)了超越先進制程GPU的性能,未來光子計算的霸權(quán)或許不是說說而已。
根據(jù)清華團隊的說法,如果將OAC層數(shù)進一步提高,ACCEL的性能將進一步提高,實現(xiàn)靈敏度更高的光電二極管陣列并行輸出。增加SRAM位數(shù)將進一步拓展ACCEL可分類的視覺類別數(shù)量。其未來的發(fā)展還有很大的提升空間。
更高算力和更優(yōu)秀的能耗比只是ACCEL兩個最直觀的特點,在論文中,還披露了大量技術(shù)細節(jié)。
ACCEL將衍射光學(xué)計算作為光學(xué)編碼器進行特征提取后,誘導(dǎo)光電流直接用于進一步計算,無需模數(shù)轉(zhuǎn)換器。在同一任務(wù)不同類型的數(shù)字神經(jīng)網(wǎng)絡(luò)的端到端延遲和能耗對比中,ACCEL實現(xiàn)了每幀72 ns的超低計算延遲和每幀4.38 nJ的能耗,遠小于NVIDIA A100的每幀0.26 ms延遲和每幀18.5 mJ的能耗。
論采用哪種方式計算操作,在實際應(yīng)用中實現(xiàn)相同精度時,ACCEL與先進GPU上的數(shù)字神經(jīng)網(wǎng)絡(luò)相比,全模擬的ACCEL都能將系統(tǒng)延遲和能耗降低了幾個數(shù)量級。
可以說ACCEL的全新計算架構(gòu),極具顛覆性,繞過了模擬數(shù)字轉(zhuǎn)換器速度、精度與功耗相互制約的物理瓶頸,充分利用了光電技術(shù)的優(yōu)勢,芯片實現(xiàn)了計算效率和能耗的極致優(yōu)化。大量的實驗數(shù)據(jù)對比也打消了人們對光子計算算力“有效性”的顧慮。
雖然這一技術(shù)目前還只是停留在實驗室階段,但從實際應(yīng)用價值來看,這一成果對于推動芯片技術(shù)進步、降低能耗和提高計算效率具有重要意義。在國內(nèi)先進制程面臨制約的情況下,清華大學(xué)團隊在顛覆性計算架構(gòu)取得的成果給我國高性能芯片研發(fā)開辟了一條全新的路徑,是打破芯片專利、技術(shù)封鎖的一個方向。
光電芯片在量產(chǎn)后,也足夠顛覆現(xiàn)在的半導(dǎo)體格局,也將在未來實際應(yīng)用落地后推動人工智能等領(lǐng)域的創(chuàng)新與發(fā)展。
小結(jié)
目前,該團隊正在研究規(guī)模更大、算力更強的模擬域光電融合系統(tǒng),這需要在算法層面和硬件層面,開展更高層次的聯(lián)合設(shè)計優(yōu)化。目標(biāo)應(yīng)用也拓展至和高速處理相關(guān)的領(lǐng)域,如時延降低四個數(shù)量級的超高速圖像計算、自動駕駛、野外監(jiān)測、物聯(lián)網(wǎng)傳感器網(wǎng)絡(luò)等等。
采用全新原理研發(fā)出計算芯片需要越過很多難關(guān),不可能一蹴而就,但ACCEL的出現(xiàn)也意味著新一代計算架構(gòu)時代的來臨可能會比料想中的更早。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
光電
+關(guān)注
關(guān)注
8文章
841瀏覽量
83103 -
gpu
+關(guān)注
關(guān)注
28文章
5194瀏覽量
135467
發(fā)布評論請先 登錄
相關(guān)推薦
熱點推薦
曦望發(fā)布新一代推理GPU芯片,單位Token推理成本降低90%
電子發(fā)燒友網(wǎng)報道 1月27日,國產(chǎn)GPU廠商曦望(Sunrise)重磅發(fā)布新一代推理GPU芯片——啟望S3。這是曦望在近一年累計完成約30億
今日看點:消息稱 AMD、高通考慮導(dǎo)入 SOCAMM 內(nèi)存;曦望發(fā)布新一代推理GPU芯片啟望S3
曦望發(fā)布新一代推理GPU芯片啟望S3 近日,浙江杭州GPU創(chuàng)企曦望(Sunrise)發(fā)布新一代推理GPU
發(fā)表于 01-28 11:09
?394次閱讀
這家公司研發(fā)玻璃光計算芯片,算力超傳統(tǒng)AI推理芯片千倍
之間幾乎無縫兼容,具有較高的工藝成熟度和集成便利性。然而,純硅調(diào)制存在諸多局限性,其中最為突出的是矩陣規(guī)模擴展困難。從64×64擴大至128×128的矩陣規(guī)模,竟然間隔了三年之久,這嚴重制約了光計算芯片性能的提升和應(yīng)用的拓展。
北大團隊最新研究:AI芯片算力提升數(shù)倍,能效提升超90倍
首次實現(xiàn)后摩爾新器件異質(zhì)集成的多物理域融合傅里葉變換系統(tǒng)。 ? 這一全新計算架構(gòu)將傅里葉變換計算速度從當(dāng)前每秒約1300億次提升至每秒約50
摩爾線程新一代GPU架構(gòu)即將揭曉
的開發(fā)者盛會,大會以“創(chuàng)造、鏈接、匯聚(Create, Connect, Converge)”為核心理念,直面技術(shù)自立自強與產(chǎn)業(yè)升級的時代命題,旨在匯聚全球AI與GPU領(lǐng)域開發(fā)者、技術(shù)領(lǐng)袖、產(chǎn)業(yè)先鋒及行業(yè)數(shù)智化轉(zhuǎn)型實踐者,共同探索國產(chǎn)算力的突破路徑,擘畫自主計算生態(tài)的嶄新
亞馬遜發(fā)布新一代AI芯片Trainium3,性能提升4倍
Trainium 4的開發(fā)計劃。亞馬遜表示,這款芯片能夠比英偉達市場領(lǐng)先的圖形處理單元(GPU)更便宜、更高效地驅(qū)動AI模型背后的密集計算。 ? ? 作為亞馬遜首款3納米工藝AI芯片,
Nordic新一代NRF54高性能藍牙, 賦能更多穿戴戒指行業(yè)客戶產(chǎn)品
nRF54L15芯片去開發(fā)智能戒指產(chǎn)品,其處理能力較上一代系統(tǒng)級芯片提升一倍,處理效率提高三倍,使智能戒指能夠整合多款高
發(fā)表于 11-26 17:19
今日看點丨優(yōu)必選獲得2.5億大單;象帝先新一代“伏羲”架構(gòu)芯片完成流片驗證
象帝先新一代“伏羲”架構(gòu)芯片完成流片驗證 9月3日,安孚科技在互動平臺表示,象帝先研發(fā)的新一代“伏羲”架構(gòu)
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】+NVlink技術(shù)從應(yīng)用到原理
前言
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」書中的芯片知識是比較接近當(dāng)前的頂尖芯
發(fā)表于 06-18 19:31
iTOP-3588S開發(fā)板四核心架構(gòu)GPU內(nèi)置GPU可以完全兼容0penGLES1.1、2.0和3.2。
性能強
iTOP-3588S開發(fā)板采用瑞芯微RK3588S處理器,是全新一代AloT高端應(yīng)用芯片,搭載八核64位CPU,四核Cortex-A76和四核Cortex-A55架構(gòu)主頻高達2
發(fā)表于 05-15 10:36
Nordic新一代旗艦芯片nRF54H20深度解析
異構(gòu)架構(gòu)??的芯片集成了:
??雙Cortex-M33內(nèi)核??(主頻320MHz,性能達nRF5340的2倍)
??RISC-V協(xié)處理器集群??(專為實時任務(wù)優(yōu)化)
??超大存儲配置?
發(fā)表于 04-26 23:25
比亞迪推出全新一代車規(guī)級碳化硅功率芯片
在3月17日的超級e平臺技術(shù)發(fā)布會上,比亞迪發(fā)布了劃時代超級e平臺,推出閃充電池、3萬轉(zhuǎn)電機和全新一代車規(guī)級碳化硅功率芯片,核心三電全維升級,搭配全球首個電動車全域千伏架構(gòu),刷新多項全
一文讀懂分貝(dB)【強烈建議收藏】
來,計算信號經(jīng)過多個放大或衰減環(huán)節(jié)后的總增益或損耗就變得輕松多了。
舉個例子,如果一個信號經(jīng)歷了 4千倍的增益,我們可以將 4千倍分解為 1
發(fā)表于 03-24 12:03
寶馬發(fā)布全新一代智能電子電氣架構(gòu)
"超級大腦"賦能寶馬新世代車型智能駕駛樂趣 全新一代電子電氣架構(gòu)搭載新世代車型,覆蓋全動力系統(tǒng)和全細分車型 全新一代電子電氣架構(gòu)集成算力提升20倍
ACCEL光電芯片,性能超GPU千倍,新一代計算架構(gòu)將更早來臨
評論