電子發燒友網報道(文/李彎彎)近幾年,隨著物聯網、人工智能等技術的發展,算力的需求越來越大。而在馮諾依曼架構下,芯片性能的提升遇到瓶頸。業界開始不斷探索新的技術形式,因為具備大算力、低功耗的特點,存算一體架構芯片應運而生。
后摩智能是一家致力于存算一體大算力芯片研發的企業,成立于2020年。今年5月,該公司發布了首款SRAM存算一體智駕芯片后摩鴻途?H30,這也是全球首款面向智能駕駛領域的存算一體芯片。此外,今年8月該公司宣布完成首款RRAM存算芯片的測試,可以說在存算一體大算力方面進展迅速。
近日,電子發燒友采訪到后摩智能公共事務部負責人屈艷格,就其在存儲介質及應用賽道的選擇,存算一體發展趨勢及后摩智能未來規劃方面做了探討。
從SRAM到RRAM,后摩智能是如何選擇存儲介質的
后摩智能今年5月推出的首款存算一體智駕芯片H30,最高物理算力256TOPS,典型功耗35W。該芯片基于SRAM存儲介質,采用數字存算一體架構,擁有極低訪存功耗和超高計算密度,僅用12nm工藝制程,在Int8數據精度下,其AI核心IPU能效比達15Tops/W,是傳統架構芯片7倍以上。
據了解,H30已成功運行CV類的經典網絡,以及自動駕駛領域先進的BEV、Pointpillar等模型。為了更好地實現車規級,后摩智能基于H30 自主研發了硬件增強機制和檢測機制,在提升芯片可靠性的同時,進一步保障了功能安全性。
屈艷格告訴電子發燒友,雖然相對來說,后摩智能在AI芯片方面算是入局較晚的企業了,但相對傳統架構的AI芯片,后摩智能推出這款存算一體架構的H30有它突出的優勢。
她總結了三點:1、高計算效率。在相同工藝制程下,它比傳統馮諾依曼架構的AI芯片能效比更優,比如,英偉達Orin芯片的能效比大概是2TPOS/W,TI TDA4VH芯片的能效比大概是1TPOS/W,特斯拉FSD芯片的能效比也不到2TPOS/W,而H30存算一體芯片物理算力士256TPOS,功耗是35W,它的能效比能夠達到7.3TPOS/W。
在當前業界,這樣的能效比是相當高的。對于客戶來說,這是一款非常有競爭力的產品,因為幾乎所有的計算場景,它對功耗的需求都較為敏感,而這款產品在低功耗的情況下,仍然能夠實現很高的算力。
2、低計算時延。因為是存算一體架構,這款芯片最大的特點是,在數據傳傳輸過程中不用來回搬運數據,這樣的好處是:一、極大地減少功耗,二、延時也會大大減少。后摩智能此前對此做過測算,它跟傳統架構的芯片相比,大概會有兩倍的延時提升。而這在一些對安全有極高要求的場景,比如智能駕駛,優勢會非常明顯。
3、低工藝依賴性。因為是存算一體架構,它對先進工藝制程的依賴性并沒有那么強,它可以用傳統的工藝實現先進工藝才能實現的特點。比如,要實現100TOPS算力,大部分公司會采用比較先進的工藝制程,12nm或者7nm,而后摩智能因為是存算一體架構芯片,可以采用28nm,就能夠達到這樣的算力。
存算一體架構對工藝的依賴性不強,有其非常大的戰略意義。在當前的國際局勢下,對于國內的企業來說,如何保障供應鏈安全很重要。如果真的出現先進制程供應緊張的情況下,存算一體架構芯片仍然能夠用一些較成熟的工藝制程生產芯片,同時還能實現較高的算力。
除了發布首款基于SRAM存儲介質的H30之外,后摩智能也在探索RRAM存儲介質的存算一體芯片。RRAM雖然誕生已久,但在近幾年才較多的被關注。相對于來說,RRAM在技術成熟度上不及SRAM,為何后摩智能在成功推出SRAM介質的存算一體芯片之后,又會著手研究RRAM存儲介質的存算一體芯片呢?
在采訪中,屈艷格詳細介紹了不同存儲介質的特點,以及后摩智能在存儲介質選擇上的考量。據她介紹,存算一體芯片有兩個很典型的特點:一是大算力,二是低功耗。這兩個特點也使得它能實現比較高的能效比。不過從使用來看,重點還是要看哪個是第一個要關注的指標,是大算力,還是低功耗。而后摩智能關注的第一個指標是大算力。
因此在進行存儲介質選擇的時候,后摩智能會選擇更適合做大算力場景的存儲介質,比如SRAM、MRAM、RRAM等。因為這些存儲介質,可以用來做數字電路,能夠用于智能駕駛、智能工業、機器人以及云端大模型推理等場景。而Flash這種存儲介質,更適合用在小算力,對功耗要求較高的場景,比如藍牙耳機、可穿戴手表等。屈艷格介紹說:“因為我們更關注大算力,所以會選擇在SRAM、MRAM、RRAM這些存儲介質上做技術演進。”
據她介紹,后摩智能當前選擇SRAM這個存儲介質的主要原因:一是目前SRAM在做大算力方面最為成熟,它可以支持較為先進的工藝制程,讀寫速度也比較快。二是雖然它是很成熟的存儲介質,而在當前的產業界,將它用作存內計算,且算力達到幾十TOPS,同時又是做純數字電路,并且用在工業、智能駕駛場景中的幾乎沒有。
后摩智能在2021年通過技術驗證的流片成功,證明這條技術路徑可行,于是便進一步推進,在今年5月推出第一代產品H30。這款基于SRAM的存算一體芯片H30,主要可用在智能駕駛和機器人等領域。屈艷格進一步談到:“我們下一代還會基于SRAM做存算一體架構優化,包括整個電路、架構的優化,以進一步提升產品性能。按照初步規劃,未來會基于SRAM介質研發幾款產品,逐步將性能做到最佳。”
當然她也提到,SRAM有它的缺點,比如存儲密度相對較低,這樣它的芯片面積會有點大,其計算密度相對來說不會太高。因此,后摩智能考慮再選擇一些更適合的存儲介質,比如MRAM、RRAM這些比較新型的存儲器。相對來說,這兩款存儲介質的讀寫性能更好,存儲密度更大。
屈艷格說:“我們會在這兩款介質上做一些技術預研,類似2021年基于SRAM做過的技術驗證,等確定行得通之后,再進行下一步的推進,今年8月宣布的初步驗證的結果。” 她表示:“我們會根據這些存儲介質的成熟性,以及它做存算電路的優勢。再根據場景情況,把這個技術從SRAM切換到RRAM或者MRAM上去。”
做透智能駕駛市場,未來希望賦能機器人、云端推理等更多場景
從2020年成立到現在僅三年時間,后摩智能便已經推出第一代SRAM存算一體芯片,同時完成首款RRAM大容量存儲芯片的測試。這在做存算一體大算力芯片領域算是相當快了。屈艷格認為,公司在技術和產品推進上能夠如此之快,與其完善的團隊搭建有關。
后摩智能的團隊包括兩方面的人才:一部分是在存算一體技術領域有深度研究的人,一部分是在工程落地方面有豐富經驗積累的人。在存算方面,后摩智能的團隊發布分來自海外知名院校、研究機構和企業,在存算一體、先進存儲器方面大概有15年左右的積累。其中一個核心成員,曾經做過六次基于SRAM存算芯片的流片,具有豐富的經驗。
這是偏學術方面的經驗,另外,后摩智能很好的將這些學術經驗與產業界的團隊做了結合。后摩智能還組建了一支產業的工程化落地團隊,這個團隊大部分員工來自AMD、Intel,還有華為海思等,具有百萬級智駕芯片量產落地經驗,學術和產業團隊的結合,加速了公司將產品推向商業化落地的進程。
在應用賽道的選擇上,后摩智能也做了仔細的考量。據屈艷格介紹,公司成立初期,做了大量的調研,去思考選擇什么樣的賽道,對數據中心、安防、智能駕駛等都進行了分析。
比如數據中心,這個市場需要大算力,需求量也非常大,尤其是今年大模型迅速發展,未來市場空間會更大。可是分析下來可以發現,數據中心市場90%以上由英偉達的GPU占據,算法迭代快,對英偉達CUDA生態的依賴強。第三方初創企業想進去構建自己的生態,很難。
再比如安防市場,相對來說它對算力的要求比較低,生態依賴度不高,是一個成熟市場。可是,它對算力要求并不高。而后摩智能的核心特點是,容易做大算力的產品,安防市場并不能凸顯出公司的優勢。
后來確定選擇智能駕駛賽道,有兩個方面的原因:1、當前智能駕駛是一個發展比較快的行業,每年增速差不多30%以上。尤其現在,我國智能化全球領先,未來市場極其可觀。智能駕駛對算力要求很大,L1/L2可能需要幾TOPS,到L2++以及未來L4/L5級自動駕駛,它需要的算力會達到上千TOPS,存算一體跟這個市場的需求匹配度很高。
2、雖然智能駕駛現在發展很快,但這個市場剛開始沒多長時間。雖然已經有幾家巨頭企業,包括英偉達、高通、TI,以及國內幾家頭部企業開始在做,并且取得了不錯的成績。但是相對來說推進的時間還不是很長,整個生態并沒有那么成熟,還有去沖刺的機會。
后摩智能推出的首款智能駕駛芯片,是一款通用的產品,它可以像英偉達Orin芯片一樣,去適配更多車廠的主流算法。目前已經與新石器、環宇智行等無人車企業達成合作,另外在乘用車方面,也正在與車企業推進測試中。
談到未來規劃,屈艷格表示,公司首先還是會基于SRAM存儲介質去進行不斷產品優化,面向智能駕駛領域,將這塊市場打透,建立起足夠高的壁壘。此外還會不斷深耕機器人、智能工業、電力、云端推理等領域,去賦能更多的場景。
結尾
可以看到,經過近幾年的發展,存算一體已經逐漸在一些場景中得到應用。今年以來,大模型及AIGC迅速發展,它對算力的需求越來越大,而當前傳統架構的芯片在性能提升上遇到瓶頸,存算一體在這方面卻優勢明顯,未來將會有很大的應用空間。
雖然存算一體作為一門新技術,在產品和應用的推進上存在挑戰。而如今,SRAM已經實現大算力的存算,新型存儲介質也在加速推進產業落地。可想而知,未來隨著MRAM、RRAM這些新型存儲介質的成熟商業化,存算一體的可想像空間將會更大。
后摩智能是一家致力于存算一體大算力芯片研發的企業,成立于2020年。今年5月,該公司發布了首款SRAM存算一體智駕芯片后摩鴻途?H30,這也是全球首款面向智能駕駛領域的存算一體芯片。此外,今年8月該公司宣布完成首款RRAM存算芯片的測試,可以說在存算一體大算力方面進展迅速。
近日,電子發燒友采訪到后摩智能公共事務部負責人屈艷格,就其在存儲介質及應用賽道的選擇,存算一體發展趨勢及后摩智能未來規劃方面做了探討。
從SRAM到RRAM,后摩智能是如何選擇存儲介質的
后摩智能今年5月推出的首款存算一體智駕芯片H30,最高物理算力256TOPS,典型功耗35W。該芯片基于SRAM存儲介質,采用數字存算一體架構,擁有極低訪存功耗和超高計算密度,僅用12nm工藝制程,在Int8數據精度下,其AI核心IPU能效比達15Tops/W,是傳統架構芯片7倍以上。
據了解,H30已成功運行CV類的經典網絡,以及自動駕駛領域先進的BEV、Pointpillar等模型。為了更好地實現車規級,后摩智能基于H30 自主研發了硬件增強機制和檢測機制,在提升芯片可靠性的同時,進一步保障了功能安全性。
屈艷格告訴電子發燒友,雖然相對來說,后摩智能在AI芯片方面算是入局較晚的企業了,但相對傳統架構的AI芯片,后摩智能推出這款存算一體架構的H30有它突出的優勢。
她總結了三點:1、高計算效率。在相同工藝制程下,它比傳統馮諾依曼架構的AI芯片能效比更優,比如,英偉達Orin芯片的能效比大概是2TPOS/W,TI TDA4VH芯片的能效比大概是1TPOS/W,特斯拉FSD芯片的能效比也不到2TPOS/W,而H30存算一體芯片物理算力士256TPOS,功耗是35W,它的能效比能夠達到7.3TPOS/W。
在當前業界,這樣的能效比是相當高的。對于客戶來說,這是一款非常有競爭力的產品,因為幾乎所有的計算場景,它對功耗的需求都較為敏感,而這款產品在低功耗的情況下,仍然能夠實現很高的算力。
2、低計算時延。因為是存算一體架構,這款芯片最大的特點是,在數據傳傳輸過程中不用來回搬運數據,這樣的好處是:一、極大地減少功耗,二、延時也會大大減少。后摩智能此前對此做過測算,它跟傳統架構的芯片相比,大概會有兩倍的延時提升。而這在一些對安全有極高要求的場景,比如智能駕駛,優勢會非常明顯。
3、低工藝依賴性。因為是存算一體架構,它對先進工藝制程的依賴性并沒有那么強,它可以用傳統的工藝實現先進工藝才能實現的特點。比如,要實現100TOPS算力,大部分公司會采用比較先進的工藝制程,12nm或者7nm,而后摩智能因為是存算一體架構芯片,可以采用28nm,就能夠達到這樣的算力。
存算一體架構對工藝的依賴性不強,有其非常大的戰略意義。在當前的國際局勢下,對于國內的企業來說,如何保障供應鏈安全很重要。如果真的出現先進制程供應緊張的情況下,存算一體架構芯片仍然能夠用一些較成熟的工藝制程生產芯片,同時還能實現較高的算力。
除了發布首款基于SRAM存儲介質的H30之外,后摩智能也在探索RRAM存儲介質的存算一體芯片。RRAM雖然誕生已久,但在近幾年才較多的被關注。相對于來說,RRAM在技術成熟度上不及SRAM,為何后摩智能在成功推出SRAM介質的存算一體芯片之后,又會著手研究RRAM存儲介質的存算一體芯片呢?
在采訪中,屈艷格詳細介紹了不同存儲介質的特點,以及后摩智能在存儲介質選擇上的考量。據她介紹,存算一體芯片有兩個很典型的特點:一是大算力,二是低功耗。這兩個特點也使得它能實現比較高的能效比。不過從使用來看,重點還是要看哪個是第一個要關注的指標,是大算力,還是低功耗。而后摩智能關注的第一個指標是大算力。
因此在進行存儲介質選擇的時候,后摩智能會選擇更適合做大算力場景的存儲介質,比如SRAM、MRAM、RRAM等。因為這些存儲介質,可以用來做數字電路,能夠用于智能駕駛、智能工業、機器人以及云端大模型推理等場景。而Flash這種存儲介質,更適合用在小算力,對功耗要求較高的場景,比如藍牙耳機、可穿戴手表等。屈艷格介紹說:“因為我們更關注大算力,所以會選擇在SRAM、MRAM、RRAM這些存儲介質上做技術演進。”
據她介紹,后摩智能當前選擇SRAM這個存儲介質的主要原因:一是目前SRAM在做大算力方面最為成熟,它可以支持較為先進的工藝制程,讀寫速度也比較快。二是雖然它是很成熟的存儲介質,而在當前的產業界,將它用作存內計算,且算力達到幾十TOPS,同時又是做純數字電路,并且用在工業、智能駕駛場景中的幾乎沒有。
后摩智能在2021年通過技術驗證的流片成功,證明這條技術路徑可行,于是便進一步推進,在今年5月推出第一代產品H30。這款基于SRAM的存算一體芯片H30,主要可用在智能駕駛和機器人等領域。屈艷格進一步談到:“我們下一代還會基于SRAM做存算一體架構優化,包括整個電路、架構的優化,以進一步提升產品性能。按照初步規劃,未來會基于SRAM介質研發幾款產品,逐步將性能做到最佳。”
當然她也提到,SRAM有它的缺點,比如存儲密度相對較低,這樣它的芯片面積會有點大,其計算密度相對來說不會太高。因此,后摩智能考慮再選擇一些更適合的存儲介質,比如MRAM、RRAM這些比較新型的存儲器。相對來說,這兩款存儲介質的讀寫性能更好,存儲密度更大。
屈艷格說:“我們會在這兩款介質上做一些技術預研,類似2021年基于SRAM做過的技術驗證,等確定行得通之后,再進行下一步的推進,今年8月宣布的初步驗證的結果。” 她表示:“我們會根據這些存儲介質的成熟性,以及它做存算電路的優勢。再根據場景情況,把這個技術從SRAM切換到RRAM或者MRAM上去。”
做透智能駕駛市場,未來希望賦能機器人、云端推理等更多場景
從2020年成立到現在僅三年時間,后摩智能便已經推出第一代SRAM存算一體芯片,同時完成首款RRAM大容量存儲芯片的測試。這在做存算一體大算力芯片領域算是相當快了。屈艷格認為,公司在技術和產品推進上能夠如此之快,與其完善的團隊搭建有關。
后摩智能的團隊包括兩方面的人才:一部分是在存算一體技術領域有深度研究的人,一部分是在工程落地方面有豐富經驗積累的人。在存算方面,后摩智能的團隊發布分來自海外知名院校、研究機構和企業,在存算一體、先進存儲器方面大概有15年左右的積累。其中一個核心成員,曾經做過六次基于SRAM存算芯片的流片,具有豐富的經驗。
這是偏學術方面的經驗,另外,后摩智能很好的將這些學術經驗與產業界的團隊做了結合。后摩智能還組建了一支產業的工程化落地團隊,這個團隊大部分員工來自AMD、Intel,還有華為海思等,具有百萬級智駕芯片量產落地經驗,學術和產業團隊的結合,加速了公司將產品推向商業化落地的進程。
在應用賽道的選擇上,后摩智能也做了仔細的考量。據屈艷格介紹,公司成立初期,做了大量的調研,去思考選擇什么樣的賽道,對數據中心、安防、智能駕駛等都進行了分析。
比如數據中心,這個市場需要大算力,需求量也非常大,尤其是今年大模型迅速發展,未來市場空間會更大。可是分析下來可以發現,數據中心市場90%以上由英偉達的GPU占據,算法迭代快,對英偉達CUDA生態的依賴強。第三方初創企業想進去構建自己的生態,很難。
再比如安防市場,相對來說它對算力的要求比較低,生態依賴度不高,是一個成熟市場。可是,它對算力要求并不高。而后摩智能的核心特點是,容易做大算力的產品,安防市場并不能凸顯出公司的優勢。
后來確定選擇智能駕駛賽道,有兩個方面的原因:1、當前智能駕駛是一個發展比較快的行業,每年增速差不多30%以上。尤其現在,我國智能化全球領先,未來市場極其可觀。智能駕駛對算力要求很大,L1/L2可能需要幾TOPS,到L2++以及未來L4/L5級自動駕駛,它需要的算力會達到上千TOPS,存算一體跟這個市場的需求匹配度很高。
2、雖然智能駕駛現在發展很快,但這個市場剛開始沒多長時間。雖然已經有幾家巨頭企業,包括英偉達、高通、TI,以及國內幾家頭部企業開始在做,并且取得了不錯的成績。但是相對來說推進的時間還不是很長,整個生態并沒有那么成熟,還有去沖刺的機會。
后摩智能推出的首款智能駕駛芯片,是一款通用的產品,它可以像英偉達Orin芯片一樣,去適配更多車廠的主流算法。目前已經與新石器、環宇智行等無人車企業達成合作,另外在乘用車方面,也正在與車企業推進測試中。
談到未來規劃,屈艷格表示,公司首先還是會基于SRAM存儲介質去進行不斷產品優化,面向智能駕駛領域,將這塊市場打透,建立起足夠高的壁壘。此外還會不斷深耕機器人、智能工業、電力、云端推理等領域,去賦能更多的場景。
結尾
可以看到,經過近幾年的發展,存算一體已經逐漸在一些場景中得到應用。今年以來,大模型及AIGC迅速發展,它對算力的需求越來越大,而當前傳統架構的芯片在性能提升上遇到瓶頸,存算一體在這方面卻優勢明顯,未來將會有很大的應用空間。
雖然存算一體作為一門新技術,在產品和應用的推進上存在挑戰。而如今,SRAM已經實現大算力的存算,新型存儲介質也在加速推進產業落地。可想而知,未來隨著MRAM、RRAM這些新型存儲介質的成熟商業化,存算一體的可想像空間將會更大。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
SRAM技術
+關注
關注
0文章
4瀏覽量
2026
發布評論請先 登錄
相關推薦
熱點推薦
華為AI WAN解決方案使能算網一體化新服務
此前,9月24日-26日,2025年中國國際信息通信展覽會在北京召開。期間,華為數據通信產品線運營商領域總裁劉凱在算力基礎設施論壇上發表了“AI WAN使能
后摩爾定律時代,3D-CIM+RISC-V打造國產存算一體新范式
,算力、能效與帶寬瓶頸成為行業前行的關鍵阻礙,而美西方的技術禁運更讓中國芯片產業面臨嚴峻挑戰。 ? 在這一大背景下,
發表于 09-17 09:31
?5889次閱讀
在TR組件優化與存算一體架構中構建技術話語權
電磁兼容性、熱管理在內的12項專業能力評估。\"這種評估體系,正是行業對技術人才的分級認證標準。
1.2 異構計算架構下的能力矩陣
存算一體架構的普及正在重構工程師的知識體系:
近內存計算
發表于 08-26 10:40
存算一體技術加持!后摩智能 160TOPS 端邊大模型AI芯片正式發布
,同步推出力擎?系列M.2卡、力謀?系列加速卡及計算盒子等硬件組合,形成覆蓋移動終端與邊緣場景的完整產品矩陣。這一系列動作標志著后摩智能在存算
國際首創新突破!中國團隊以存算一體排序架構攻克智能硬件加速難題
2025 年 6 月 25 日,北京大學團隊在智能計算硬件方面取得領先突破,國際上首次實現了基于存算一體技術的高效排序硬件架構 (A fast and reconfigurable
智能算力基建:RAKsmart如何賦能下一代AI開發工具
當今,AI模型的復雜化與規模化對算力提出了前所未有的要求。然而,傳統的算力基礎設施在靈活性、成本效率和可擴展性上逐漸顯露出瓶頸。而RAKsmart憑借其全球化的
蘋芯科技 N300 存算一體 NPU,開啟端側 AI 新征程
隨著端側人工智能技術的爆發式增長,智能設備對本地算力與能效的需求日益提高。而傳統馮·諾依曼架構在數據處理效率上存在瓶頸,“內存墻”問題成為制
不只是智能駕駛!從SRAM到RRAM,存算一體大算力芯片將賦能更多領域!
評論