亞馬遜宣布將人工智能處理遷移到自家定制的 AWS Inferentia 芯片。這意味著亞馬遜最大的推理(inferencing)服務(wù)(例如語(yǔ)音助手 Alexa)將交由更快、更專業(yè)的芯片進(jìn)行處理,而非基于 NVIDIA 的多用途 GPU。
亞馬遜已經(jīng)將大約 80% 的 Alexa 語(yǔ)音助手處理遷移到 Elastic Compute Cloud (EC2) Inf1 實(shí)例上處理。和使用傳統(tǒng) GPU 的 G4 實(shí)例相比,Inf1 實(shí)例將吞吐量提高了 30%,成本下降了 45%。亞馬遜認(rèn)為,它們是推斷自然語(yǔ)言和語(yǔ)音處理工作負(fù)載的最佳實(shí)例。
Alexa 的工作方式是這樣的:實(shí)際的智能音箱(或者揚(yáng)聲器)可以不做任何操作,所有任務(wù)都交由 AWS 處理器完成。或者更準(zhǔn)確的說(shuō),一旦 Echo 設(shè)備上的芯片檢測(cè)到喚醒詞,系統(tǒng)就會(huì)啟動(dòng)。。它開始實(shí)時(shí)將音頻流傳輸?shù)皆啤T跀?shù)據(jù)中心的某個(gè)地方,音頻被轉(zhuǎn)換為文本(這是推理的一個(gè)示例)。然后從文本中提取含義(另一個(gè)推理實(shí)例)完成所需要的所有操作,例如獲取當(dāng)天的天氣信息等等。
Alexa 完成您的請(qǐng)求后,她需要將答案?jìng)鬟_(dá)給您。然后,腳本被轉(zhuǎn)換為音頻文件(另一個(gè)推理示例),并發(fā)送到您的Echo設(shè)備。回音播放文件,以便于你出行的時(shí)候是否決定帶上雨傘。顯然,推理是工作的重要組成部分。毫不奇怪,亞馬遜投入了數(shù)百萬(wàn)美元來(lái)制造完美的推理芯片。
Inferentia 芯片由四個(gè) NeuronCore 組成。每個(gè)實(shí)現(xiàn)一個(gè)“高性能脈動(dòng)陣列矩陣乘法引擎”。每個(gè)NeuronCore或多或少地由以線性,獨(dú)立方式處理數(shù)據(jù)的大量小型數(shù)據(jù)處理單元(DPU)組成。每個(gè)Inferentia芯片還具有巨大的緩存,從而提高了延遲。
責(zé)任編輯:haq
-
芯片
+關(guān)注
關(guān)注
463文章
54007瀏覽量
465952 -
人工智能
+關(guān)注
關(guān)注
1817文章
50094瀏覽量
265298 -
亞馬遜
+關(guān)注
關(guān)注
8文章
2731瀏覽量
85738
發(fā)布評(píng)論請(qǐng)先 登錄
技術(shù)解析|SAP ECC到S/4HANA遷移實(shí)戰(zhàn):50TB數(shù)據(jù)19小時(shí)遷移架構(gòu)
亞馬遜發(fā)布新一代AI芯片Trainium3,性能提升4倍
芯片AES硬件運(yùn)算單元好用嗎?
無(wú)質(zhì)量損失的數(shù)據(jù)遷移:Nikon SLM Solutions信賴3Dfindit企業(yè)版
定點(diǎn)小數(shù)運(yùn)算
新思科技攜手是德科技推出AI驅(qū)動(dòng)的射頻設(shè)計(jì)遷移流程
STM32多通道FFT運(yùn)算異常的原因?怎么解決?
上海貝嶺計(jì)量芯片產(chǎn)品選型技巧分享 包括RS485接口芯片 運(yùn)算放大器等
如何精準(zhǔn)提取MOSFET溝道遷移率
樂(lè)鑫科技自研聲學(xué)前端算法通過(guò)亞馬遜 Alexa 認(rèn)證,啟明云端樂(lè)鑫科技代理商
亞馬遜云科技與倫敦證券交易所集團(tuán)擴(kuò)展多年云合作關(guān)系
亞馬遜云科技發(fā)布“3+2”合作伙伴戰(zhàn)略 與合作伙伴加速前行
Arm助力開發(fā)者加速遷移至Arm架構(gòu)云平臺(tái) Arm云遷移資源分享
KVM主機(jī)遷移方法
使用智能工具簡(jiǎn)化向Arm平臺(tái)的遷移過(guò)程
亞馬遜Alexa運(yùn)算遷移至自家芯片
評(píng)論