2020 年新冠肺炎 “黑天鵝事件” 肆虐全球,出于疫情防控的需要,以往發生在線下的面對面的諸多工作與生活場景不得不轉移到線上,催生或者說加速了云會議、云打卡、云診斷、云教學、云游戲、云監工等一系列新型 “宅經濟” 的蓬勃發展,從真正意義上掀開了萬物云化與全民用云時代來臨的大幕。
但對于互聯網技術服務供應商而言,無限的機遇之下卻也暗藏著無限的挑戰:面對海量的數據、超強的流量沖擊、潮涌式的需求,如果保證平臺不宕機、低時延、快速吞吐數據,用長時間穩定高效的服務保障用戶的使用體驗成了最核心的痛點。
事實證明,面對這次 “大考”,騰訊不但 “抗住” 了,應對時的從容表現更是搶眼 —— 從日活超千萬到為聯合國 75 周年活動提供線上服務,騰訊會議僅僅用了不到四個月的時間,而這背后依靠的就是具有極強的處理能力與支撐能力的云計算與服務器。
去年,騰訊發布了 “為云而生” 的星星海首款自研服務器,目前云上的服務規模已經超過 30 倍。今年 12 月 20 日,在一年一度的騰訊 2020 Techo Park 開發者大會上,騰訊云在 “下一代軟硬一體化的云計算基礎設施” 分論壇上,重磅發布了兩款來自 “騰訊云星星海家族” 的最新產品 —— 星星海首款自研 GPU 服務器和星星海新一代自研雙路服務器。
星星海 GPU 服務器 - 云游戲的定海神針
“針對具體的應用場景,我們結合具體的業務需求,對服務器性能進行了優化。比如,在云游戲場景中,客戶對單卡 TCO,單一用戶成本非常敏感,也迫切地需要降低成本。” 騰訊云服務器與供應鏈管理部總經理劉裕勛在開發者大會現場說道。
據 iiMedia Research(艾媒咨詢)數據顯示,2019 年云游戲用戶規模約為 1.33 億人,預計 2023 年用戶規模將達 6.58 億人,這意味著每 11 個人中間,就有一位是云游戲用戶。玩家在玩云游戲時,如果單卡總成本非常高,就會出現單卡掛死甚至整機掛死的情況。導致這種情況的原因之一,是因為現有 GPU 服務器的機箱長度過長,無法滿足低延時邊緣部署。
深受廣大玩家喜愛的云游戲場景,其實只是對于云算力巨大需求的一個小小側面,最新的人工智能模型對于算力的要求往往都是非常高的,比如谷歌的 T5,其整個模型的參數數量達到了驚人的 110 億,甚至谷歌科學家直接在 T5 的論文指出:“越大的模型往往表現更好。這表現擴大規模可能仍然是實現更好性能的方式。” 而一般的創業公司如果沒有雄厚的資金實力是不可能搭建這種級別的 AI 訓練平臺。只有依靠云計算才能使 AI、區塊鏈等新興技術真正落地生根,發展壯大。
根據 IDC 的研究資料,截止到 2021 年,全球企業對于 AI 系統的支出將保持 50.1% 的年復合增長率,這說明企業對這些技術的總支出將從 2017 年的 120 億美元增加到 2021 年的 576 億美元。云計算尤其是 AI 云已經形成一個不可忽略的細分市場,尤其是在疫情影響下各行業上云意愿明顯加強,這也對于云計算的算力底座提出了更高的要求,而日前騰訊云星星海發布的首款自研 GPU 服務器和新一代自研雙路服務器堪稱是云算力底座的標竿式產品。
騰訊云星星海發布首款自研 GPU 服務器,以及它的支持 16 卡 GPU+4 路 Intel 服務器、達到業界最高算力密度與此同時還大幅降低了單卡 TCO,這些特性使騰訊云在向企業提供 AI 算力或者向玩家提供 AI 云服務時都堪稱是定海神針式的存在。
騰訊云星星海推出的首款自研 GPU 服務器,在技術方面主要有 “一獨” 和 “三最” 等四大優勢。
圖 | 騰訊云星星海首款自研 GPU 服務器
“一獨” 指的是在設計上,該 GPU 服務器采用全球首創的、可在同一框架內靈活更換的主板,此外還克服了通用計算和異構計算兼容對系統的挑戰,做到支持多平臺兼容。
“三最” 分別指的是最大密度、最短機框和最高可用性。該 GPU 服務器可結合業務對 PCIe 帶寬要求低的特點,來支持 16 卡 GPU 和 4 路 Intel 服務器,是目前業界密度最高的 GPU 服務器,故此可使單卡 TCO 大幅降低。它還擁有目前業界最短機框,可支持邊緣部署,在提高帶寬穩定性的同時,還能極大降低業務延時,最高可降近百毫秒。此外,基于該 GPU 服務器的 RAS 特性以及 PCIe 熱插拔特性,遇到單 GPU 卡故障,也不會對整機產生影響,因此用戶可用性相對較高。
而以上這些技術還可以讓星星海首款自研 GPU 服務器在與對手同臺競技時擁有以下優勢:
低成本:由于大多數的 AI 工作任務被認為是 “突發性” 的,也就是說,他們依賴于那些能夠在短時提供大量計算能力的服務。星星海 GPU 服務器只會針對用戶去收取那些他們進行硬件使用時的費用,這大大降低了他們的成本。
可擴展:與其他的云服務一樣,星星海首款自研 GPU 服務器提供的 AI 云服務本身也具有較高的可擴展性。企業可以從一個試點項目開始,然后隨著需求的提升,快速擴展他們 AI 服務的規模。
高可用:一般來講云計算的可用性,會比傳統架構的系統高出兩個量級,而星星海服務器在高可用方面更有獨到的設計,在高可用方面相信還會更有保證。
星星海自研服務器 - 云算力底座的最強神器
像金融領域一樣,目前的技術也開始朝著普惠的方向轉變,并且還應滿足客戶的個性化與定制化需求,達到快速響應,而這些都需要強大的算力支撐。
但是,如騰訊云服務器與供應鏈管理部總經理劉裕勛所說,隨著云計算承載的業務規模越來越大,傳統服務器難以完全滿足云計算數據中心場景下對超大規模、需求多樣、高性價比、安全可靠以及軟硬件一體化等方面的要求。
騰訊云星星海發布的新一代自研雙路服務器就是算力底座中的王者。這款服務器是國內首款搭載即將發布的第三代英特爾至強可擴展處理器(Ice Lake)的雙路服務器。
該服務器是云服務的硬件基礎,采用英特爾 10nm 工藝處理器。在第二代英特爾傲騰持久內存的支持下,雙路服務器單機最高支持 12TB 內存,這可滿足大型數據庫等業務需求,用戶也可獲得更強的計算性能。
另外,雙路服務器的免工具模組化設計,可使全系列服務器共用成為現實,這不僅能覆蓋全業務場景,還能實現彈性部署,且可降低云服務總體成本。
在安全技術上,雙路服務器采用英特爾 SGX 技術,最大可支持 1TB enclave;其還采用加密加速技術,在增強安全性的同時,還可滿足創新云業務的安全需求。
概括來說,其不僅能為用戶提供更高的內存帶寬、更快的 I/O 吞吐、更強的實例性能,還可幫助用戶基于英特爾深度學習加速技術,來獲得處理器內置 AI 加速能力。主要應用場景有通用計算、異構計算、裸金屬、高性能計算等。此外,在生命科學和金融服務領域,基于英特爾 ?AVX-512 擴展指令集,騰訊云星星海新一代自研雙路服務器對應的服務器實例在高性能計算機群場景下表現出較大提升。
除立足于當下,以上兩款服務器也已為將來做準備,基于硬件系統架構設計和持續不斷的基礎技術研究,上述服務器可支持未來 3-5 年的前瞻性架構演變,也就是說云上開發部署可以提前享受技術紅利。
騰訊云星星海 - 追逐科技時代的星辰大海
如果將數據比作這個數字時代的石油,那么騰訊社交帝國憑借其豐富的業務場景與龐大的用戶基數,就為其科研團隊提供了世界上最大的原油儲存基地,這些都為前沿的 AI 研究成果提供了令整個業界都非常羨慕的絕佳 “訓練場”,而擁有了這樣高的訓練水平,騰訊技術方面取得如此的突破也就不足為奇了。
據悉,上述兩款自研服務器均誕生于騰訊云星星海實驗室,它是騰訊史上首個硬件工程實驗室,也是騰訊云面向產業互聯網加速技術自研的重要戰略。
該實驗室至今未滿一歲,其名字取自青海省果洛藏族自治州瑪多星星海,瑪多星星海地處黃河源頭,這樣的命名既預表著該實驗室兼具靈動和智慧,亦是科技對古老的致敬。
該實驗室主要專注于硬件系統架構設計和前瞻性基礎技術研究,力圖通過創新性高兼容架構、簡潔可靠的自主設計,來提供云計算產品和服務,其目前正結合騰訊自有業務和上云客戶的需求,在云原生服務器技術方面開展專項研發,此外其也是騰訊云與智慧產業事業群技術實驗室矩陣中的一所。
“以硬為主” 的星星海,已擁有 20 多項專利和多款自主知識產權產品,其中包括四款自研服務器和一款智能網卡。
以 2019 年騰訊云發布的首款擁有完全自主知識產權的服務器產品星星海 SA2 云服務器為例,其已廣泛應用于騰訊內部,如騰訊會議、騰訊教育、春節 QQ 紅包、微信等產品和業務中。在疫情期間,星星海 SA2 云服務器支撐騰訊會議擴容 10 萬多臺云主機,日均擴容云主機近 1.5 萬臺,共涉及超百萬核的計算資源投入,而以上工作量均在 8 天內完成。
最后不得不提的就是上述兩款服務器,均發布于騰訊 2020 Techo Park 開發者大會。
什么是 Techo 呢?據大會虛擬主持人 “小七” 的介紹,所謂 Techo,就是 Tech(技術)和 Echo(回響)的合稱,暗含著這一面向全球開發者和技術愛好者的平臺具有的技術交流和分享屬性。這個由騰訊發起的非商業大會,通過匯聚全球頂尖行業專家、企業高管、技術愛好者等共同研討前沿技術,以助力開發者實現能力成長和實踐創新。
本次 Techo Park 開發者大會的 Slogan 是 “代碼傳遞思想,技術創造回響”,區塊鏈、視頻云、5G、AI、大數據等各個信息科技領域的 “大腦” 發表主題演講和論壇,并吸引了來自科研機構、高校、創業公司的大批開發者齊聚現場。
盡管這只是 Techo Park 的第二次全球亮相,但其激烈碰撞的觀點和接連發布的自研新品,仍然為試圖洞察未來科技走向的參與者們打開了一扇窗。
原文標題:騰訊云星星海發布首款自研GPU服務器和新一代自研雙路服務器,打造軟硬一體化云基礎設施
文章出處:【微信公眾號:DeepTech深科技】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
-
gpu
+關注
關注
28文章
5194瀏覽量
135461 -
服務器
+關注
關注
14文章
10253瀏覽量
91490
原文標題:騰訊云星星海發布首款自研GPU服務器和新一代自研雙路服務器,打造軟硬一體化云基礎設施
文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
云服務器端口怎么開放?
國產真自研高性能圖形 GPU 重磅發布:跑分超 RTX4060,暢玩《黑神話?悟空》
又一顆國產GPU芯片成功點亮!6nm制程,自研TrueGPU架構
高端芯片自研,服務器芯片傳來好消息!
云存儲服務器租用的好處有哪些?
云電競服務器 工作原理
騰訊云星星海發布首款自研GPU服務器
評論