電子發(fā)燒友網(wǎng)報道(文/李彎彎)近段時間,由OpenAI推出的ChatGPT火遍全球,它幾乎可以生成任何形式的文本,從寫文章、編寫代碼,到回答復雜的數(shù)學問題。上線近兩個月,ChatGPT的注冊用戶就達到1億,成為史上用戶破億速度最快的軟件之一。
ChatGPT的爆火給生成式AI的應用帶來更多可能性,AI語言處理大模型也隨之進入全球角逐的新階段。在國內(nèi),百度、阿里等頭部互聯(lián)網(wǎng)企業(yè)都已經(jīng)宣布有相關(guān)的研究。那么,國內(nèi)在發(fā)展AI語言處理大模型方面是否具備相應的條件,國產(chǎn)廠商可以如何把握這個機會?
在AIGC大模型發(fā)展上,國內(nèi)具備哪些條件
從目前的情況來看,國內(nèi)在發(fā)展這類大模型上可以說已經(jīng)具備一定的條件。比如在算法層面,國內(nèi)的互聯(lián)網(wǎng)公司以及一些研究院,已經(jīng)具備研究語言大模型的基礎(chǔ);在算力層面,國內(nèi)的AI大算力芯片,以及在算力集群方面,也已經(jīng)取得長足進步;在部署和服務(wù)方面,國內(nèi)的云服務(wù)廠商可以提供各種服務(wù)渠道,讓基礎(chǔ)設(shè)施能夠便捷實用,使算法在大算力平臺上很好的部署。
不足之處在于,第一,ChatGPT能夠達到現(xiàn)在的水平,是因為它六七年長時間的產(chǎn)品迭代,從GPT-1到GPT-2再到ChatGPT期間有大量的用戶使用,在數(shù)據(jù)集的標注、分揀、精煉上,也有很多創(chuàng)新的工程化步驟。對于中文大模型來說,差距在于如何獲得更多、更有意義,更有價值的語義語料,如何在算法迭代、大量的用戶使用之后,使能更大規(guī)模模型的推進。
第二,大模型的訓練離不開大算力,燧原科技創(chuàng)始人兼COO張亞林在接受電子發(fā)燒友采訪的時候表示,目前國際廠商的高算力芯片在中國仍然具有標桿效應。
第三,在生態(tài)建設(shè)上,無論是現(xiàn)在很火的ChatGPT,還是之前備受關(guān)注的生成式AI公司Stability、Runway,他們在基礎(chǔ)模型、大模型的模型開發(fā)庫,用戶大量的應用上,都已經(jīng)形成了可以觸達終端用戶的商業(yè)模式。而在國內(nèi),目前還沒樹立起這樣全棧的生態(tài)和商業(yè)模式。
不過,雖然國內(nèi)在發(fā)展這類大模型方面存在不足,整體而言這對于國內(nèi)廠商來是個很好的機會。從算力方面來看,人工智能技術(shù)的發(fā)展和應用本身對算力的需求極大,目前全球大模型訓練的算力基本以英偉達為主。
隨著ChatGPT的爆火,國內(nèi)各類生成式AI大模型的訓練和部署將會加速,這對國內(nèi)人工智能算力廠商來說無疑是個機會,國內(nèi)廠商需要思考如何通過自身的算力發(fā)展,來持續(xù)推動中國本土大模型的進步。
ChatGPT爆火,算力廠商如何把握機會
那么AIGC大模型的訓練和推理,對算力供應商有怎樣的要求呢?對此,張亞林談到了幾點:首先是芯片,包括芯片的有效算力、架構(gòu)的創(chuàng)新性、以及芯片的性價比等,這些將會決定算力集群是否具備足夠的市場競爭力。
其次是集群系統(tǒng),一個超大規(guī)模的集群系統(tǒng),由幾千張加速卡、幾千顆芯片組成,還包括互聯(lián)和存儲。除了加速卡的性能之外,還要看整個系統(tǒng)的穩(wěn)定性、集群的互聯(lián)效率、存儲的效率、以及分布式系統(tǒng)運行的穩(wěn)定性。
第三是軟件生態(tài),它是否能夠支持整個大模型的調(diào)試和開發(fā)。這要求企業(yè)不僅要能提供基礎(chǔ)的軟件棧,還要能夠提供大模型能跑的分布式框架,讓調(diào)試者和開發(fā)者能夠更好的調(diào)試和開發(fā)這些大模型,就是說還需要具備一個整套的軟件棧。
張亞林認為,從芯片設(shè)計,集群的穩(wěn)定性,到整個軟件棧的完備性,這對于初創(chuàng)公司來說還有一段很長的路要走,需要持續(xù)的產(chǎn)品迭代。
那么國內(nèi)在AI大算力芯片或者GPGPU賽道的廠商,如何能夠抓住ChatGPT這波浪潮帶來的機會呢?首先,它需要做出高性價比的算力,現(xiàn)在來說這樣的算力還太貴,以致于并不是所有人都能夠玩得起這場游戲,企業(yè)需要能夠推出高性價比的集群,讓整個ChatGPT類大模型的開發(fā)更經(jīng)濟。
第二,最終呈現(xiàn)在用戶側(cè)的是整個的集群系統(tǒng),就如上文所言,其中包括幾千張加速卡,幾千顆芯片,大量的互聯(lián)和存儲,很多服務(wù)器。因此,國內(nèi)的AI大芯片廠商需要能夠站到系統(tǒng)的角度去看問題,包括整個系統(tǒng)的設(shè)計、調(diào)動能力、讓用戶易用,這些跟芯片本身的設(shè)計和開發(fā)能力會不太一樣。
第三,如何讓用戶在開發(fā)過程中做到高效和易用。訓練本身是一個很復雜、很廣闊的生態(tài)。今天的大模型,其實是把很廣闊的需求濃縮到了一些比較確定的大模型上,這讓整個訓練從很廣闊的發(fā)散狀態(tài),變成了有可能聚焦在某一些維度上就能夠很好的支撐和優(yōu)化的狀態(tài)。
這給國內(nèi)很多AI廠商提供了很好的思路,企業(yè)可以聚焦在比如大模型集群化的領(lǐng)域。國內(nèi)廠商可以由此切入,誰能夠在這樣一個大規(guī)模AI生成領(lǐng)域,把訓練和推理整套集群系統(tǒng),做得更優(yōu)化、更完整、更易用,誰就能夠在這場游戲中拔得先機。
在人工智能算力領(lǐng)域,燧原科技已經(jīng)有了很深的積累。目前燧原科技已經(jīng)迭代了兩代訓練和推理產(chǎn)品,第三代也已經(jīng)在研發(fā)中。此外,燧原科技已經(jīng)在科研領(lǐng)域和智慧城市的應用中落地了訓練和推理的超千卡算力集群。張亞林表示,類似ChatGPT這樣的AIGC生成式模型,對于燧原科技而言是個機遇,公司可以把已經(jīng)積累的系統(tǒng)集群的經(jīng)驗推廣到更多的客戶賽道上,幫助客戶使能更多大模型的生成。
同時,面對生成式AI大模型帶來的發(fā)展機會,燧原科技將從多個方面去做深度布局。第一是持續(xù)推進和迭代集群化產(chǎn)品和軟件生態(tài)棧,與更多戰(zhàn)略用戶一起優(yōu)化集群系統(tǒng),提高性價比和能效比;第二是與國內(nèi)云服務(wù)商進行深度合作,通過他們的云服務(wù)平臺,觸達更多To B和To C用戶;第三是與國家相關(guān)機構(gòu)合作制定更多關(guān)于AIGC標準和白皮書,探討未來發(fā)展方向,與國家政策和標準融合;第四是與更多大模型廠商、云平臺廠商等一起共創(chuàng)生態(tài)。
小結(jié)
整體而言,雖然目前ChatGPT仍然還存在一些問題,不過它的強大功能卻是有目共睹。對于人們的生產(chǎn)生活來說,ChatGPT等大模型的發(fā)展將會帶來勞動力的釋放。
未來隨著模型的進一步擴大,數(shù)據(jù)集進一步加強,AIGC這類巨大模型將會愈發(fā)智能,它也將會更加逼近人們所說的通用人工智能(AGI),而這個過程必然給相關(guān)產(chǎn)業(yè)帶來機會,包括算力,而對于用戶來說,廠商如何提供更高能效比、性價比的算力是關(guān)鍵。
ChatGPT的爆火給生成式AI的應用帶來更多可能性,AI語言處理大模型也隨之進入全球角逐的新階段。在國內(nèi),百度、阿里等頭部互聯(lián)網(wǎng)企業(yè)都已經(jīng)宣布有相關(guān)的研究。那么,國內(nèi)在發(fā)展AI語言處理大模型方面是否具備相應的條件,國產(chǎn)廠商可以如何把握這個機會?
在AIGC大模型發(fā)展上,國內(nèi)具備哪些條件
從目前的情況來看,國內(nèi)在發(fā)展這類大模型上可以說已經(jīng)具備一定的條件。比如在算法層面,國內(nèi)的互聯(lián)網(wǎng)公司以及一些研究院,已經(jīng)具備研究語言大模型的基礎(chǔ);在算力層面,國內(nèi)的AI大算力芯片,以及在算力集群方面,也已經(jīng)取得長足進步;在部署和服務(wù)方面,國內(nèi)的云服務(wù)廠商可以提供各種服務(wù)渠道,讓基礎(chǔ)設(shè)施能夠便捷實用,使算法在大算力平臺上很好的部署。
不足之處在于,第一,ChatGPT能夠達到現(xiàn)在的水平,是因為它六七年長時間的產(chǎn)品迭代,從GPT-1到GPT-2再到ChatGPT期間有大量的用戶使用,在數(shù)據(jù)集的標注、分揀、精煉上,也有很多創(chuàng)新的工程化步驟。對于中文大模型來說,差距在于如何獲得更多、更有意義,更有價值的語義語料,如何在算法迭代、大量的用戶使用之后,使能更大規(guī)模模型的推進。
第二,大模型的訓練離不開大算力,燧原科技創(chuàng)始人兼COO張亞林在接受電子發(fā)燒友采訪的時候表示,目前國際廠商的高算力芯片在中國仍然具有標桿效應。
第三,在生態(tài)建設(shè)上,無論是現(xiàn)在很火的ChatGPT,還是之前備受關(guān)注的生成式AI公司Stability、Runway,他們在基礎(chǔ)模型、大模型的模型開發(fā)庫,用戶大量的應用上,都已經(jīng)形成了可以觸達終端用戶的商業(yè)模式。而在國內(nèi),目前還沒樹立起這樣全棧的生態(tài)和商業(yè)模式。
不過,雖然國內(nèi)在發(fā)展這類大模型方面存在不足,整體而言這對于國內(nèi)廠商來是個很好的機會。從算力方面來看,人工智能技術(shù)的發(fā)展和應用本身對算力的需求極大,目前全球大模型訓練的算力基本以英偉達為主。
隨著ChatGPT的爆火,國內(nèi)各類生成式AI大模型的訓練和部署將會加速,這對國內(nèi)人工智能算力廠商來說無疑是個機會,國內(nèi)廠商需要思考如何通過自身的算力發(fā)展,來持續(xù)推動中國本土大模型的進步。
ChatGPT爆火,算力廠商如何把握機會
那么AIGC大模型的訓練和推理,對算力供應商有怎樣的要求呢?對此,張亞林談到了幾點:首先是芯片,包括芯片的有效算力、架構(gòu)的創(chuàng)新性、以及芯片的性價比等,這些將會決定算力集群是否具備足夠的市場競爭力。
其次是集群系統(tǒng),一個超大規(guī)模的集群系統(tǒng),由幾千張加速卡、幾千顆芯片組成,還包括互聯(lián)和存儲。除了加速卡的性能之外,還要看整個系統(tǒng)的穩(wěn)定性、集群的互聯(lián)效率、存儲的效率、以及分布式系統(tǒng)運行的穩(wěn)定性。
第三是軟件生態(tài),它是否能夠支持整個大模型的調(diào)試和開發(fā)。這要求企業(yè)不僅要能提供基礎(chǔ)的軟件棧,還要能夠提供大模型能跑的分布式框架,讓調(diào)試者和開發(fā)者能夠更好的調(diào)試和開發(fā)這些大模型,就是說還需要具備一個整套的軟件棧。
張亞林認為,從芯片設(shè)計,集群的穩(wěn)定性,到整個軟件棧的完備性,這對于初創(chuàng)公司來說還有一段很長的路要走,需要持續(xù)的產(chǎn)品迭代。
那么國內(nèi)在AI大算力芯片或者GPGPU賽道的廠商,如何能夠抓住ChatGPT這波浪潮帶來的機會呢?首先,它需要做出高性價比的算力,現(xiàn)在來說這樣的算力還太貴,以致于并不是所有人都能夠玩得起這場游戲,企業(yè)需要能夠推出高性價比的集群,讓整個ChatGPT類大模型的開發(fā)更經(jīng)濟。
第二,最終呈現(xiàn)在用戶側(cè)的是整個的集群系統(tǒng),就如上文所言,其中包括幾千張加速卡,幾千顆芯片,大量的互聯(lián)和存儲,很多服務(wù)器。因此,國內(nèi)的AI大芯片廠商需要能夠站到系統(tǒng)的角度去看問題,包括整個系統(tǒng)的設(shè)計、調(diào)動能力、讓用戶易用,這些跟芯片本身的設(shè)計和開發(fā)能力會不太一樣。
第三,如何讓用戶在開發(fā)過程中做到高效和易用。訓練本身是一個很復雜、很廣闊的生態(tài)。今天的大模型,其實是把很廣闊的需求濃縮到了一些比較確定的大模型上,這讓整個訓練從很廣闊的發(fā)散狀態(tài),變成了有可能聚焦在某一些維度上就能夠很好的支撐和優(yōu)化的狀態(tài)。
這給國內(nèi)很多AI廠商提供了很好的思路,企業(yè)可以聚焦在比如大模型集群化的領(lǐng)域。國內(nèi)廠商可以由此切入,誰能夠在這樣一個大規(guī)模AI生成領(lǐng)域,把訓練和推理整套集群系統(tǒng),做得更優(yōu)化、更完整、更易用,誰就能夠在這場游戲中拔得先機。
在人工智能算力領(lǐng)域,燧原科技已經(jīng)有了很深的積累。目前燧原科技已經(jīng)迭代了兩代訓練和推理產(chǎn)品,第三代也已經(jīng)在研發(fā)中。此外,燧原科技已經(jīng)在科研領(lǐng)域和智慧城市的應用中落地了訓練和推理的超千卡算力集群。張亞林表示,類似ChatGPT這樣的AIGC生成式模型,對于燧原科技而言是個機遇,公司可以把已經(jīng)積累的系統(tǒng)集群的經(jīng)驗推廣到更多的客戶賽道上,幫助客戶使能更多大模型的生成。
同時,面對生成式AI大模型帶來的發(fā)展機會,燧原科技將從多個方面去做深度布局。第一是持續(xù)推進和迭代集群化產(chǎn)品和軟件生態(tài)棧,與更多戰(zhàn)略用戶一起優(yōu)化集群系統(tǒng),提高性價比和能效比;第二是與國內(nèi)云服務(wù)商進行深度合作,通過他們的云服務(wù)平臺,觸達更多To B和To C用戶;第三是與國家相關(guān)機構(gòu)合作制定更多關(guān)于AIGC標準和白皮書,探討未來發(fā)展方向,與國家政策和標準融合;第四是與更多大模型廠商、云平臺廠商等一起共創(chuàng)生態(tài)。
小結(jié)
整體而言,雖然目前ChatGPT仍然還存在一些問題,不過它的強大功能卻是有目共睹。對于人們的生產(chǎn)生活來說,ChatGPT等大模型的發(fā)展將會帶來勞動力的釋放。
未來隨著模型的進一步擴大,數(shù)據(jù)集進一步加強,AIGC這類巨大模型將會愈發(fā)智能,它也將會更加逼近人們所說的通用人工智能(AGI),而這個過程必然給相關(guān)產(chǎn)業(yè)帶來機會,包括算力,而對于用戶來說,廠商如何提供更高能效比、性價比的算力是關(guān)鍵。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
算力
+關(guān)注
關(guān)注
2文章
1511瀏覽量
16702 -
ChatGPT
+關(guān)注
關(guān)注
31文章
1598瀏覽量
10207
發(fā)布評論請先 登錄
相關(guān)推薦
熱點推薦
從CPU、GPU到NPU,美格智能持續(xù)優(yōu)化異構(gòu)算力計算效能
前言AI算力已成為數(shù)字經(jīng)濟時代的核心生產(chǎn)力,但全球AI產(chǎn)業(yè)正面臨“供給不足、成本高企、生態(tài)待建”三重挑戰(zhàn)。據(jù)行業(yè)統(tǒng)計,行業(yè)算力資源平均利用率
奇異摩爾受邀出席2025多樣性算力產(chǎn)業(yè)發(fā)展大會
為探究多樣性算力發(fā)展新模式、推動國內(nèi)算力產(chǎn)業(yè)優(yōu)化升級,中國通信標準化協(xié)會多樣性算
什么是AI算力模組?
未來,騰視科技將繼續(xù)深耕AI算力模組領(lǐng)域,全力推動AI邊緣計算行業(yè)的深度發(fā)展。隨著AI技術(shù)的不斷演進和物聯(lián)網(wǎng)應用的持續(xù)拓展,騰視科技的AI算力模組將在更多領(lǐng)域發(fā)揮重要作用,實現(xiàn)實時、安
借勢 RISC-V與 AI 浪潮,元石智算打造算力新范式
在AI技術(shù)飛速發(fā)展的當下,算力需求呈指數(shù)級增長,成為推動行業(yè)前行的核心動力。與此同時,RISC-V架構(gòu)憑借其開源、靈活、可定制等特性,正逐漸嶄露頭角,為AI算力領(lǐng)域帶來全新變革。 在A
一文看懂AI算力集群
最近這幾年,AI浪潮席卷全球,成為整個社會的關(guān)注焦點。大家在討論AI的時候,經(jīng)常會提到AI算力集群。AI的三要素,是算力、算法和數(shù)據(jù)。而AI算
AIGC算力基礎(chǔ)設(shè)施技術(shù)架構(gòu)與行業(yè)實踐
代提升1.5倍,內(nèi)存容量達288GB,適配千億參數(shù)模型訓練需求。 國產(chǎn)突破?:國內(nèi)首款6nm高性能GPU芯片于2025年5月成功點亮,性能對標國際中端產(chǎn)品,已獲億元級訂單;國產(chǎn)芯片廠商與高端制程工藝結(jié)合,推動算
摩爾線程與AI算力平臺AutoDL達成深度合作
近日,摩爾線程與國內(nèi)領(lǐng)先的AI算力平臺AutoDL宣布達成深度合作,雙方聯(lián)合推出面向個人開發(fā)者的“摩爾線程專區(qū)”,首次將國產(chǎn)GPU算力開放至
軟通智算中標韶關(guān)公共算力服務(wù)平臺項目
日前,軟通動力旗下軟通智算中標《韶關(guān)公共算力服務(wù)平臺(一體化算力網(wǎng)算
大算力芯片的生態(tài)突圍與算力革命
電子發(fā)燒友網(wǎng)報道(文 / 李彎彎)大算力芯片,即具備強大計算能力的集成電路芯片,主要應用于高性能計算(HPC)、人工智能(AI)、數(shù)據(jù)中心、自動駕駛等需要海量數(shù)據(jù)并行計算的場景。隨著 AI 與大數(shù)
算力領(lǐng)域常用名詞解釋
本文系統(tǒng)地整理和解釋了算力領(lǐng)域中常用的數(shù)十個關(guān)鍵名詞,并按照以下維度進行了分類:基礎(chǔ)概念、系統(tǒng)架構(gòu)、硬件架構(gòu)、基礎(chǔ)運算類型、計算模式、相關(guān)軟件架構(gòu)與部署模式、浮點精度格式、算力類型、
燧原科技助力美圖AI換裝全球爆火
2025蛇年元宵后,美圖公司旗下美顏相機憑借“AI換裝”功能爆火,獲得了國內(nèi)外用戶的極大青睞,App下載量和使用量迅速激增的同時,也面臨了海量推理算力即時支持的挑戰(zhàn)。
【一文看懂】什么是端側(cè)算力?
隨著物聯(lián)網(wǎng)(IoT)、人工智能和5G技術(shù)的快速發(fā)展,端側(cè)算力正逐漸成為智能設(shè)備性能提升和智能化應用實現(xiàn)的關(guān)鍵技術(shù)。什么是端側(cè)算力,它的應用價值是什么,與云計算、邊緣計算有哪些區(qū)別?本文
ChatGPT爆火,國內(nèi)算力廠商如何把握機會?
評論