電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))在大型數(shù)據(jù)中心里,視頻處理或許是當(dāng)下占比最高的關(guān)鍵工作負(fù)載,疫情期間,人們在視頻細(xì)分的產(chǎn)品上所花時間越來越多。對于云服務(wù)廠商來說,視頻市場帶來的紅利仍然在持續(xù),但對于視頻網(wǎng)站和視頻app等產(chǎn)品來說,他們面臨的服務(wù)器成本壓力也在與日俱增。
?
云平臺的視頻轉(zhuǎn)碼單價(jià)/ 華為云
比如隨著流量激增,Teams、Zoom和騰訊會議等服務(wù)都出現(xiàn)了崩潰的事故,有的視頻網(wǎng)站面臨巨額的服務(wù)器費(fèi)用和下跌的營收,也開始采取壓縮畫質(zhì)等策略。盡管服務(wù)器端的摩爾定律依然在延續(xù),但面對視頻處理的計(jì)算需求,已經(jīng)開始有些力不從心了,哪怕在專業(yè)處理圖形的GPU加持下也是如此。如果不采用特定領(lǐng)域的ASIC硬件加速器,成本壓力將會繼續(xù)堆積。
全球最大視頻網(wǎng)站的策略
作為全球最大視頻網(wǎng)站Youtube的所有者,照理說谷歌面臨的壓力是最大的,但Youtube從疫情至今,卻基本維持著穩(wěn)定的狀態(tài),而且視頻質(zhì)量也是同行中最高的那一檔。能維持住這樣服務(wù)器壓力,靠的并不是傳統(tǒng)的CPU+GPU商用服務(wù)器組合,而是谷歌自研的視頻處理芯片VCU。
谷歌預(yù)見了真正大規(guī)模視頻處理和其他消費(fèi)級服務(wù)器用例的根本差異,尤其是在數(shù)據(jù)多樣性、質(zhì)量要求、吞吐量和成本上。所以谷歌打算從計(jì)算資源最昂貴的一塊,也就是視頻處理這塊著手,設(shè)計(jì)自己的VCU處理單元,解決從視頻共享、照片與視頻云存儲、直播到云游戲等一眾業(yè)務(wù)上的視頻處理難題。
VCU的設(shè)計(jì)思路
谷歌的VCU全名為視頻編碼單元,單個芯片集成了10個編碼核心、3個解碼核心。從谷歌VCU芯片的布圖規(guī)劃也可以看出,大部分區(qū)域都分配給了編碼器核心,其次是四通道的LPDDR4內(nèi)存,不僅提供邊帶錯誤糾正,也提供芯片所需的帶寬。
?
VCU芯片布圖規(guī)劃/ 谷歌
每個VCU服務(wù)器系統(tǒng)由10塊板卡組成,每塊板卡上配有2個VCU芯片。谷歌將一切非轉(zhuǎn)碼的處理工作丟給非VCU服務(wù)器,而VCU服務(wù)器則盡可能靠近視頻上傳的位置,降低延遲從而降低轉(zhuǎn)碼所需時間。
但我們要知道一點(diǎn),視頻處理專用的服務(wù)器成本之所以如此之高,并不是只有GPU價(jià)格高、性能要求高等原因,還有就是低利用率的問題。并非所有的轉(zhuǎn)碼工作都能用滿芯片的硬件資源,所以谷歌采用了固件管理的隊(duì)列來啟用并發(fā)轉(zhuǎn)碼。
?
VCU加速卡/ 谷歌
比如某個操作是“將這一幀的畫面編碼為VP9位流,”那么應(yīng)用程序負(fù)責(zé)將指令寫入隊(duì)列中,固件則只負(fù)責(zé)隊(duì)列調(diào)度和編解碼器核心的激活。如此一來編程只發(fā)生在應(yīng)用層面,避免了ASIC這類硬件先天缺乏FPGA那樣靈活的可編程性,也符合數(shù)據(jù)中心快節(jié)奏的軟件迭代速度,同時又確保了沒有一個編碼核心能閑下來。
谷歌也給出了VCU與主流方案的差距,比如與純英特爾SkylakeCPU轉(zhuǎn)碼或4個英偉達(dá)T4 GPU轉(zhuǎn)碼的對比,8個VCU的配置在進(jìn)行H.264或VP9轉(zhuǎn)碼時,性價(jià)比最高可達(dá)前兩種方案的20倍以上。
專用視頻處理硬件的未來
對于流量快速增長,負(fù)載持續(xù)增加的大規(guī)模數(shù)據(jù)中心和云服務(wù)來說,谷歌這種方案無疑是最省成本的。阿里巴巴、亞馬遜等云服務(wù)廠商紛紛開始了自研服務(wù)器芯片計(jì)劃,這點(diǎn)人盡皆知,但從設(shè)計(jì)上就可以看出,這些芯片還是面向在通用服務(wù)器或AI服務(wù)器的,與視頻沾邊的應(yīng)用也大部分是AI視頻識別類的。
而目前最讓視頻產(chǎn)品頭疼的轉(zhuǎn)碼這塊,卻少有ASIC產(chǎn)品的出現(xiàn),不少加速卡做成了PCIe的尺寸規(guī)格,但其實(shí)仍是基于CPU,尤其是編解碼性能稍強(qiáng)的英特爾CPU。反倒是Xilinx的AlveoU200/250 FPGA加速卡在性能上更有優(yōu)勢,但考慮到這些加速卡高昂的價(jià)格,目前云服務(wù)平臺還沒有普及開來,甚至還在用老版的UltraScaleFPGA。
與此同時,AV1這類壓縮率更高編碼的編碼標(biāo)準(zhǔn)提出了更高的硬件要求,谷歌的VCU雖然性價(jià)比極高,也沒有支持AV1這一標(biāo)準(zhǔn),或許我們會在下一代VCU上看到。
?云平臺的視頻轉(zhuǎn)碼單價(jià)/ 華為云
全球最大視頻網(wǎng)站的策略
作為全球最大視頻網(wǎng)站Youtube的所有者,照理說谷歌面臨的壓力是最大的,但Youtube從疫情至今,卻基本維持著穩(wěn)定的狀態(tài),而且視頻質(zhì)量也是同行中最高的那一檔。能維持住這樣服務(wù)器壓力,靠的并不是傳統(tǒng)的CPU+GPU商用服務(wù)器組合,而是谷歌自研的視頻處理芯片VCU。
谷歌預(yù)見了真正大規(guī)模視頻處理和其他消費(fèi)級服務(wù)器用例的根本差異,尤其是在數(shù)據(jù)多樣性、質(zhì)量要求、吞吐量和成本上。所以谷歌打算從計(jì)算資源最昂貴的一塊,也就是視頻處理這塊著手,設(shè)計(jì)自己的VCU處理單元,解決從視頻共享、照片與視頻云存儲、直播到云游戲等一眾業(yè)務(wù)上的視頻處理難題。
VCU的設(shè)計(jì)思路
谷歌的VCU全名為視頻編碼單元,單個芯片集成了10個編碼核心、3個解碼核心。從谷歌VCU芯片的布圖規(guī)劃也可以看出,大部分區(qū)域都分配給了編碼器核心,其次是四通道的LPDDR4內(nèi)存,不僅提供邊帶錯誤糾正,也提供芯片所需的帶寬。
?VCU芯片布圖規(guī)劃/ 谷歌
每個VCU服務(wù)器系統(tǒng)由10塊板卡組成,每塊板卡上配有2個VCU芯片。谷歌將一切非轉(zhuǎn)碼的處理工作丟給非VCU服務(wù)器,而VCU服務(wù)器則盡可能靠近視頻上傳的位置,降低延遲從而降低轉(zhuǎn)碼所需時間。
但我們要知道一點(diǎn),視頻處理專用的服務(wù)器成本之所以如此之高,并不是只有GPU價(jià)格高、性能要求高等原因,還有就是低利用率的問題。并非所有的轉(zhuǎn)碼工作都能用滿芯片的硬件資源,所以谷歌采用了固件管理的隊(duì)列來啟用并發(fā)轉(zhuǎn)碼。
?VCU加速卡/ 谷歌
谷歌也給出了VCU與主流方案的差距,比如與純英特爾SkylakeCPU轉(zhuǎn)碼或4個英偉達(dá)T4 GPU轉(zhuǎn)碼的對比,8個VCU的配置在進(jìn)行H.264或VP9轉(zhuǎn)碼時,性價(jià)比最高可達(dá)前兩種方案的20倍以上。
專用視頻處理硬件的未來
對于流量快速增長,負(fù)載持續(xù)增加的大規(guī)模數(shù)據(jù)中心和云服務(wù)來說,谷歌這種方案無疑是最省成本的。阿里巴巴、亞馬遜等云服務(wù)廠商紛紛開始了自研服務(wù)器芯片計(jì)劃,這點(diǎn)人盡皆知,但從設(shè)計(jì)上就可以看出,這些芯片還是面向在通用服務(wù)器或AI服務(wù)器的,與視頻沾邊的應(yīng)用也大部分是AI視頻識別類的。
而目前最讓視頻產(chǎn)品頭疼的轉(zhuǎn)碼這塊,卻少有ASIC產(chǎn)品的出現(xiàn),不少加速卡做成了PCIe的尺寸規(guī)格,但其實(shí)仍是基于CPU,尤其是編解碼性能稍強(qiáng)的英特爾CPU。反倒是Xilinx的AlveoU200/250 FPGA加速卡在性能上更有優(yōu)勢,但考慮到這些加速卡高昂的價(jià)格,目前云服務(wù)平臺還沒有普及開來,甚至還在用老版的UltraScaleFPGA。
與此同時,AV1這類壓縮率更高編碼的編碼標(biāo)準(zhǔn)提出了更高的硬件要求,谷歌的VCU雖然性價(jià)比極高,也沒有支持AV1這一標(biāo)準(zhǔn),或許我們會在下一代VCU上看到。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報(bào)投訴
-
谷歌
+關(guān)注
關(guān)注
27文章
6254瀏覽量
111414
發(fā)布評論請先 登錄
相關(guān)推薦
熱點(diǎn)推薦
為何企業(yè)紛紛引入線束接頭氣密性測漏設(shè)備?
在智能制造升級的浪潮中,降本增效已成為企業(yè)核心競爭力的關(guān)鍵指標(biāo)。線束接頭作為電氣系統(tǒng)的核心連接部件,其密封檢測環(huán)節(jié)的效率與成本控制,直接影響企業(yè)整體運(yùn)營效益。如今,越來越多企業(yè)紛紛引入線束接頭氣密性
正運(yùn)動技術(shù)喜獲 “AI天馬 · 臻品” 獎項(xiàng)!
正運(yùn)動技術(shù)堅(jiān)持國產(chǎn)自研,專注智能制造。我們以創(chuàng)新方案助力客戶降本增效,攜手共創(chuàng)長期價(jià)值。
如何基于FFmpeg解碼WMV3視頻
在音視頻開發(fā)的世界里,WMV3 就像一位沉靜的老友——它曾是 Windows Media 時代的主角,如今雖已淡出主流視野,卻仍在企業(yè)錄像、歷史資料、監(jiān)控存檔中默默守候;而 FFmpeg,這位開源世界的“瑞士軍刀”,正是我們與這位老友對話的最佳翻譯官。
炸裂!為什么各行各業(yè)都紛紛擁抱物聯(lián)網(wǎng) + 智能?有人硬核方案讓降本增效爽到飛起!
的 “轉(zhuǎn)型加速器”——究竟是什么讓企業(yè)趨之若鶩? 一、降本增效:從 “經(jīng)驗(yàn)管理” 到 “數(shù)據(jù)驅(qū)動”,有人方案直擊企業(yè)痛點(diǎn) 企業(yè)最核心的訴求永遠(yuǎn)是 “少花錢、多辦事”,而物聯(lián)網(wǎng)的本質(zhì)就是用數(shù)據(jù)打通生產(chǎn)堵點(diǎn),有人智能的方案更是把這點(diǎn)做到
集創(chuàng)北方推出首款移動終端AI畫質(zhì)增強(qiáng)獨(dú)顯芯片
集創(chuàng)北方隆重推出首款12納米AI-PQ畫質(zhì)增強(qiáng)獨(dú)顯芯片。該芯片聚焦移動終端用戶對高畫質(zhì)、高幀率、低功耗的核心訴求,融合了集創(chuàng)北方在多媒體AI處理、畫質(zhì)提升、低功耗芯片設(shè)計(jì)領(lǐng)域的核心技術(shù)。
鋼鐵廠降本秘訣:風(fēng)機(jī)預(yù)警讓停機(jī)時間砍半
鋼鐵廠降本關(guān)鍵在 “少損失”。風(fēng)機(jī)預(yù)警系統(tǒng)的核心,是將運(yùn)維從 “事后維修” 推向 “事前預(yù)防”,從 “經(jīng)驗(yàn)依賴” 轉(zhuǎn)向 “數(shù)據(jù)驅(qū)動”。如今老王只需查看系統(tǒng)健康報(bào)表,按預(yù)警安排維護(hù),廠區(qū)風(fēng)機(jī)轟鳴依舊,卻少了驚心動魄,多了安穩(wěn) —— 這背后,是千萬級成本節(jié)約與企業(yè)競爭力的提升。
谷歌查找我的設(shè)備配件(Google Find My Device Accessory)詳解和應(yīng)用
谷歌查找我的設(shè)備配件(Google Find My Device Accessory)介紹
谷歌查找我的設(shè)備配件是與谷歌 “查找我的設(shè)備” 應(yīng)用程序配合使用的配件,旨在幫助用戶更方便地追蹤和定位個人
發(fā)表于 08-31 21:10
AI終于賺錢了,科技巨頭紛紛猛加杠桿
電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)在2025年,科技巨頭們的AI業(yè)務(wù),終于開始賺錢了。 ? 最近,谷歌、微軟、Meta、亞馬遜紛紛公布2025年二季度財(cái)報(bào),四大AI巨頭都交出了一份強(qiáng)勁的業(yè)績答卷。過去
安科瑞光儲充一體化解決方案如何給企業(yè)降本減碳
電子發(fā)燒友網(wǎng)站提供《安科瑞光儲充一體化解決方案如何給企業(yè)降本減碳.docx》資料免費(fèi)下載
發(fā)表于 07-16 15:42
?0次下載
STM32N6570-DK自帶的攝像頭運(yùn)行自帶的AI demo,畫質(zhì)特別差,這是應(yīng)該這個例程的原因,還是攝像頭不行?
STM32N6570-DK自帶的攝像頭運(yùn)行自帶的AI demo,畫質(zhì)特別差,這是應(yīng)該這個例程的原因,還是攝像頭不行?
發(fā)表于 06-18 07:18
STM32N6570-DK自帶的攝像頭運(yùn)行自帶的AI demo,畫質(zhì)特別差,這是應(yīng)該這個例程的原因,還是攝像頭不行?
STM32N6570-DK自帶的攝像頭運(yùn)行自帶的AI demo,畫質(zhì)特別差,這是應(yīng)該這個例程的原因,還是攝像頭不行?
發(fā)表于 06-16 06:02
谷歌地圖GPS定位
谷歌地圖GPS定位:精準(zhǔn)導(dǎo)航背后的技術(shù)解析 谷歌地圖作為全球最受歡迎的地圖服務(wù)之一,其精準(zhǔn)的GPS定位功能為用戶提供了極大便利。本文將深入探討谷歌地圖如何利用GPS技術(shù),實(shí)現(xiàn)高精度定位,并帶來革命性
STM32CubeMX在配置DCMI的腳位時,在Mode的選項(xiàng)中, 只有8bits, 10bits與12bits, 為何沒有14bits?
STM32CubeMX在配置DCMI的腳位時,在Mode的選項(xiàng)中, 只有8bits, 10bits與12bits, 為何沒有14bits?
發(fā)表于 04-27 08:49
視頻網(wǎng)站為了降本紛紛砍畫質(zhì),為何只有谷歌仍在堅(jiān)持?
評論