來源:內(nèi)容編譯自theconversation,謝謝。
高性能計(jì)算(簡稱 HPC)聽起來像是科學(xué)家在秘密實(shí)驗(yàn)室里才會(huì)用到的東西,但它實(shí)際上是當(dāng)今世界上最重要的技術(shù)之一。從預(yù)測天氣到研發(fā)新藥,甚至訓(xùn)練人工智能,高性能計(jì)算系統(tǒng)都能幫助解決普通計(jì)算機(jī)無法解決的難題或大型問題。
過去40年來,這項(xiàng)技術(shù)助力科學(xué)和工程領(lǐng)域取得了重大發(fā)現(xiàn)。如今,高性能計(jì)算正處于一個(gè)轉(zhuǎn)折點(diǎn),政府、研究人員和科技行業(yè)今天的選擇可能會(huì)影響創(chuàng)新、國家安全和全球領(lǐng)導(dǎo)力的未來。
高性能計(jì)算系統(tǒng)本質(zhì)上是由數(shù)千甚至數(shù)百萬個(gè)處理器同時(shí)協(xié)同工作的超強(qiáng)計(jì)算機(jī)。它們還使用先進(jìn)的內(nèi)存和存儲(chǔ)系統(tǒng)來快速移動(dòng)和保存大量數(shù)據(jù)。
憑借如此強(qiáng)大的能力,高性能計(jì)算系統(tǒng)可以運(yùn)行極其精細(xì)的模擬和計(jì)算。例如,它們可以模擬新藥如何與人體相互作用,或者颶風(fēng)如何穿越海洋。它們還應(yīng)用于汽車設(shè)計(jì)、能源生產(chǎn)和太空探索等領(lǐng)域。
近年來,高性能計(jì)算因人工智能而變得更加重要。人工智能模型,尤其是用于語音識(shí)別和自動(dòng)駕駛汽車等領(lǐng)域的模型,需要海量的計(jì)算能力進(jìn)行訓(xùn)練。高性能計(jì)算系統(tǒng)非常適合這項(xiàng)工作。因此,人工智能和高性能計(jì)算如今正緊密合作,相互促進(jìn)。
可以明見,高性能計(jì)算系統(tǒng)面臨著比以往任何時(shí)候都更大的壓力,對系統(tǒng)的速度、數(shù)據(jù)和能耗提出了更高的要求。與此同時(shí),我也看到高性能計(jì)算面臨著一些嚴(yán)峻的技術(shù)問題。
技術(shù)挑戰(zhàn)
高性能計(jì)算面臨的一大挑戰(zhàn)是處理器速度與內(nèi)存系統(tǒng)跟上處理器輸出速度之間的差距。想象一下,你有一輛超快的汽車,但卻堵在路上——如果道路無法承載,速度再快也于事無補(bǔ)。同樣,高性能計(jì)算處理器也經(jīng)常需要等待,因?yàn)閮?nèi)存系統(tǒng)無法足夠快地發(fā)送數(shù)據(jù)。這會(huì)降低整個(gè)系統(tǒng)的效率。
另一個(gè)問題是能源消耗。如今的超級計(jì)算機(jī)耗電量巨大,有時(shí)甚至相當(dāng)于一個(gè)小鎮(zhèn)的用電量。這不僅成本高昂,而且對環(huán)境也非常不利。過去,隨著計(jì)算機(jī)部件體積變小,它們的耗電量也隨之減少。但這種被稱為登納德縮放定律的趨勢在2000年代中期停止了。如今,計(jì)算機(jī)性能的提升通常意味著它們也消耗更多的能源。為了解決這個(gè)問題,研究人員正在尋找新的方法來設(shè)計(jì)高性能計(jì)算系統(tǒng)的硬件和軟件。
芯片的種類也存在問題。芯片行業(yè)主要專注于人工智能,而人工智能在處理 16 位或 8 位等低精度數(shù)學(xué)運(yùn)算時(shí)也能正常工作。但許多科學(xué)應(yīng)用仍然需要 64 位精度才能達(dá)到準(zhǔn)確度。位數(shù)越高,芯片能夠處理的小數(shù)點(diǎn)右側(cè)位數(shù)就越多,精度也就越高。如果芯片公司停止生產(chǎn)科學(xué)家所需的部件,那么進(jìn)行重要的研究可能會(huì)變得更加困難。
本報(bào)告討論了半導(dǎo)體制造和商業(yè)優(yōu)先事項(xiàng)的趨勢如何與科學(xué)計(jì)算界的需求產(chǎn)生分歧,以及缺乏定制硬件如何阻礙研究進(jìn)展。
一種解決方案可能是構(gòu)建用于高性能計(jì)算的定制芯片,但這既昂貴又復(fù)雜。盡管如此,研究人員仍在探索新的設(shè)計(jì),包括芯片(chiplet,可以像樂高積木一樣組合的小型芯片),以使高精度處理器更加經(jīng)濟(jì)實(shí)惠。
一場全球競賽
全球許多國家正在大力投資高性能計(jì)算。歐洲有“歐洲高性能計(jì)算”(EuroHPC)計(jì)劃,正在芬蘭和意大利等地建造超級計(jì)算機(jī)。他們的目標(biāo)是減少對外國技術(shù)的依賴,并在氣候建模和個(gè)性化醫(yī)療等領(lǐng)域占據(jù)領(lǐng)先地位。日本建造了富岳超級計(jì)算機(jī),它既支持學(xué)術(shù)研究,也支持工業(yè)生產(chǎn)。中國也取得了重大進(jìn)展,利用自主研發(fā)的技術(shù)建造了一些世界上速度最快的計(jì)算機(jī)。所有這些國家的政府都明白,高性能計(jì)算是國家安全、經(jīng)濟(jì)實(shí)力和科學(xué)領(lǐng)導(dǎo)力的關(guān)鍵。
美國數(shù)十年來一直是高性能計(jì)算領(lǐng)域的領(lǐng)導(dǎo)者,最近完成了能源部的百億億次計(jì)算項(xiàng)目。該項(xiàng)目研發(fā)的計(jì)算機(jī)每秒可執(zhí)行數(shù)十億億次運(yùn)算。這是一個(gè)令人難以置信的成就。但即使取得了這樣的成功,美國仍然沒有明確的長期規(guī)劃。其他國家正在迅速行動(dòng),如果沒有國家戰(zhàn)略,美國可能會(huì)落后。
我認(rèn)為,美國的國家戰(zhàn)略應(yīng)該包括資助新機(jī)器并培訓(xùn)人們使用這些機(jī)器。它還應(yīng)包括與大學(xué)、國家實(shí)驗(yàn)室和私營企業(yè)的合作。最重要的是,該計(jì)劃不僅要關(guān)注硬件,還要關(guān)注使高性能計(jì)算變得實(shí)用的軟件和算法。
充滿希望的跡象
量子計(jì)算是未來一個(gè)令人興奮的領(lǐng)域。這是一種基于原子級物理定律進(jìn)行計(jì)算的全新方式。量子計(jì)算機(jī)有朝一日或許能夠解決普通計(jì)算機(jī)無法解決的問題。但它們?nèi)蕴幱谠缙陔A段,未來很可能是對傳統(tǒng)高性能計(jì)算系統(tǒng)的補(bǔ)充,而非取代。正因如此,持續(xù)投資這兩種計(jì)算技術(shù)都至關(guān)重要。
好消息是,一些舉措已經(jīng)落地。2022年通過的《芯片與科學(xué)法案》為擴(kuò)大美國芯片制造規(guī)模提供了資金,并設(shè)立了一個(gè)辦公室,幫助將科學(xué)研究轉(zhuǎn)化為實(shí)際產(chǎn)品。“美國科學(xué)技術(shù)愿景”工作組于2025年2月25日成立,由美國科學(xué)促進(jìn)會(huì)首席執(zhí)行官蘇迪普·帕里克領(lǐng)導(dǎo),旨在匯聚非營利組織、學(xué)術(shù)界和產(chǎn)業(yè)界的力量,共同指導(dǎo)政府決策。私營企業(yè)也在數(shù)據(jù)中心和人工智能基礎(chǔ)設(shè)施上投入了數(shù)十億美元。
這些都是積極的信號(hào),但并不能完全解決如何長期支持高性能計(jì)算的問題。除了短期資金和基礎(chǔ)設(shè)施投資外,這還意味著:
聯(lián)邦政府長期投資高性能計(jì)算研發(fā),包括先進(jìn)的硬件、軟件和節(jié)能架構(gòu)。
在國家實(shí)驗(yàn)室和大學(xué)采購和部署領(lǐng)導(dǎo)級計(jì)算系統(tǒng)。
勞動(dòng)力發(fā)展,包括并行編程、數(shù)值方法和 AI-HPC 集成方面的培訓(xùn)。
硬件路線圖的協(xié)調(diào),確保商業(yè)芯片開發(fā)與科學(xué)和工程應(yīng)用的需求保持一致。
可持續(xù)的融資模式可以防止與一次性里程碑或地緣政治緊急情況相關(guān)的繁榮與蕭條周期。
公私合作彌合學(xué)術(shù)研究、行業(yè)創(chuàng)新和國家安全需求之間的差距。
高性能計(jì)算不僅僅是指速度更快的計(jì)算機(jī)。它是科學(xué)發(fā)現(xiàn)、經(jīng)濟(jì)增長和國家安全的基礎(chǔ)。隨著其他國家的積極推進(jìn),美國面臨著制定清晰、協(xié)調(diào)一致的計(jì)劃的壓力。這意味著投資新硬件、開發(fā)更智能的軟件、培訓(xùn)熟練的勞動(dòng)力,并在政府、產(chǎn)業(yè)和學(xué)術(shù)界之間建立合作伙伴關(guān)系。如果美國能夠做到這一點(diǎn),就能確保高性能計(jì)算在未來幾十年繼續(xù)推動(dòng)創(chuàng)新。
參考鏈接
https://theconversation.com/challenges-to-high-performance-computing-threaten-us-innovation-255188
-
芯片
+關(guān)注
關(guān)注
463文章
54183瀏覽量
467846 -
HPC
+關(guān)注
關(guān)注
0文章
346瀏覽量
25044 -
高性能計(jì)算
+關(guān)注
關(guān)注
0文章
96瀏覽量
13824
發(fā)布評論請先 登錄
芯片可靠性面臨哪些挑戰(zhàn)
“AI+”大咖說|安全不是“錦上添花”,是AI時(shí)代的“生存必需”,“山海”S30FP/S30P讓高性能計(jì)算安全需求皆有解
MLCC高性能設(shè)計(jì)全解析:軟端子、Open模式、內(nèi)串結(jié)構(gòu)與支架方案的優(yōu)勢與應(yīng)用
推薦高性能存儲(chǔ)psram芯片
【產(chǎn)品介紹】Altair HPCWorks高性能計(jì)算管理平臺(tái)(HPC平臺(tái))
中科馭數(shù)亮相2025 CCF全國高性能計(jì)算學(xué)術(shù)大會(huì)
知合計(jì)算:RISC-V架構(gòu)創(chuàng)新,阿基米德系列劍指高性能計(jì)算
緩解高性能存算一體芯片IR-drop問題的軟硬件協(xié)同設(shè)計(jì)
中科曙光構(gòu)建全國產(chǎn)化基因組學(xué)高性能計(jì)算平臺(tái)
高性能計(jì)算集群在AI領(lǐng)域的應(yīng)用前景
使用樹莓派構(gòu)建 Slurm 高性能計(jì)算集群:分步指南!
AI?時(shí)代來襲,手機(jī)芯片面臨哪些新挑戰(zhàn)?
高性能計(jì)算面臨的芯片挑戰(zhàn)
評論