国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ChatGPT帶來AI爆炸式流量怎么解?

SSDFans ? 來源:SSDFans ? 2023-04-04 11:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在過去六個(gè)月里,我們已經(jīng)目睹了人工智能應(yīng)用程序的大規(guī)模增長——ChatGPT、Dall·E、Bard和Bing等。據(jù)估計(jì),僅ChatGPT在推出兩個(gè)月后,月用戶就達(dá)到了1億。

網(wǎng)絡(luò)I/O瓶頸

人工智能流量的爆炸式增長給網(wǎng)絡(luò)和分布式計(jì)算基礎(chǔ)設(shè)施帶來了瓶頸。Enfabrica在2020年創(chuàng)立,該公司認(rèn)為擴(kuò)展現(xiàn)代高性能分布式計(jì)算的性能和容量受到I/O的限制。內(nèi)存容量快速增長,GPU性能呈指數(shù)級增長,但I(xiàn)/O卻沒有跟上,如下圖所示。

cd135a28-d285-11ed-bfe3-dac502259ad0.png

EnfabricaCEO Rochan Sankar表示,人工智能的高級挑戰(zhàn)是“它通過100或200 Gig NIC將海量數(shù)據(jù)輸入/輸出服務(wù)器節(jié)點(diǎn),而NIC最初是為與CPU配對而設(shè)計(jì)的。”他接著詳細(xì)闡述了與這個(gè)基本問題有關(guān)的三個(gè)問題:

大量的資源滯留。雖然CPU虛擬化做得很好,但GPU和內(nèi)存等昂貴的資源卻沒有得到充分利用;

現(xiàn)有的I/O設(shè)備堆棧效率很低,因?yàn)樗菫椴煌男枨蠖鴺?gòu)建的;

以太網(wǎng)、PCI和CXL等行業(yè)標(biāo)準(zhǔn)相反,其他創(chuàng)建產(chǎn)品解決方案的公司正在使用“更專有或更孤立”的方法。

解決日益增長的網(wǎng)絡(luò)I/O問題

Enfabrica聯(lián)合創(chuàng)始人Rochan Sankar和Shrijeet Mukherjee在Broadcom、谷歌和Cisco等行業(yè)巨頭工作過,擁有數(shù)十年的網(wǎng)絡(luò)基礎(chǔ)設(shè)施經(jīng)驗(yàn)。正如Sankar解釋的那樣,他們并不是唯一認(rèn)識到迫在眉睫的I/O問題的人,但他們相信有更好的方法來解決這個(gè)問題。有了這些想法,他們組建了自己的團(tuán)隊(duì),開始致力于顛覆互聯(lián)硅市場,據(jù)估計(jì),這個(gè)市場的價(jià)值很快就會(huì)達(dá)到200億美元。

Enfabrica設(shè)計(jì)的核心是用其加速計(jì)算結(jié)構(gòu)取代多層網(wǎng)絡(luò)基礎(chǔ)設(shè)施(見下圖)。Sankar表示Enfabrica架構(gòu)“就像一個(gè)輪輻模型”,可以“分解和擴(kuò)展任何計(jì)算資源”。他接著解釋道:“無論是CPU、GPU、加速器、內(nèi)存還是Flash,它們都可以連接到這個(gè)集線器,這個(gè)集線器有效地充當(dāng)了它們的聚合I/O結(jié)構(gòu)設(shè)備。”

cd28a180-d285-11ed-bfe3-dac502259ad0.png

Sankar指出,除了在這些系統(tǒng)中引入新的硬件架構(gòu)的挑戰(zhàn)之外,我們還不能改變軟件層。“從一開始就需要付出很多努力。因此,引入硬件技術(shù)或網(wǎng)絡(luò)技術(shù)來迫使這種情況發(fā)生改變實(shí)際上是很有挑戰(zhàn)的。”Enfabrica的目標(biāo)是讓它的硬件“使用與現(xiàn)在相同的接口和API集”運(yùn)行。

行業(yè)標(biāo)準(zhǔn)和開源

包括行業(yè)巨頭英偉達(dá)在內(nèi)的其他公司都在使用專有接口解決方案來解決這一網(wǎng)絡(luò)問題,而Enfabrica則使用PCIe和CXL等行業(yè)標(biāo)準(zhǔn)與開源軟件框架相結(jié)合。

Sanker表示,他們“提供了另一種擴(kuò)展方式”。他認(rèn)為,“英偉達(dá)將在相當(dāng)長一段時(shí)間內(nèi)處于這個(gè)生態(tài)系統(tǒng)的核心地位。”因此,他們并不期望取代英偉達(dá),而是增強(qiáng)現(xiàn)有的解決方案。“我們可以增加一層高容量內(nèi)存”,客戶可以“利用它來擴(kuò)展非常大的語言模型”。

第一代ACF

第一代高級計(jì)算結(jié)構(gòu)交換機(jī)(ACF-S,如下圖所示)是在臺(tái)積電的5納米FinFET工藝上制造的,該工藝在一定程度上是為這樣的高性能計(jì)算應(yīng)用開發(fā)的。

cd6a0c9c-d285-11ed-bfe3-dac502259ad0.png

ACF-S設(shè)計(jì)用于在單個(gè)硅晶片中提供異構(gòu)計(jì)算和內(nèi)存資源之間的多太比特交換和橋接,而不改變設(shè)備驅(qū)動(dòng)程序以上的物理接口、協(xié)議或軟件層。Sankar解釋道,該交換芯片像個(gè)“三明治”,包括“高性能以太網(wǎng)交換管道,一個(gè)大型共享緩沖區(qū),即所謂的太比特NIC復(fù)制引擎,以及高性能PCIe Gen5和CXL 2.0+交換。”

“這些加速計(jì)算結(jié)構(gòu)產(chǎn)品旨在創(chuàng)建彈性資源池,可以按需聯(lián)網(wǎng)和供應(yīng),以創(chuàng)建更靈活的實(shí)例。這能夠擴(kuò)展以滿足下一代工作負(fù)載的需求,并以一種可持續(xù)的方式實(shí)現(xiàn)總擁有成本。”

云經(jīng)濟(jì)的超級計(jì)算機(jī)性能

如果目標(biāo)是顛覆一個(gè)200億美元的行業(yè),那么最好有一些重大改進(jìn)。在我們的討論中,Sankar強(qiáng)調(diào)了他們預(yù)見到的先進(jìn)計(jì)算結(jié)構(gòu)的一些好處:

AI集群從數(shù)百個(gè)節(jié)點(diǎn)擴(kuò)展到數(shù)千個(gè)節(jié)點(diǎn)

每美元I/O帶寬提高2倍

緩解GPU、DRAM、SSD卡死,提高利用率

降低75%的節(jié)點(diǎn)到節(jié)點(diǎn)延遲

AI集群總擁有成本降低50%

GPU機(jī)架和集群功耗至少降低10%

Sanker認(rèn)為,如果他們成功了,Enfabrica可以幫助“在高性能超級計(jì)算和云規(guī)模分布之間架起一座橋梁”,人工智能是驅(qū)動(dòng)這些需求的核心工作負(fù)載。“人們想要云經(jīng)濟(jì),但他們想要超級計(jì)算機(jī)的性能。”

Enfabrica計(jì)劃在今年晚些時(shí)候發(fā)布特定產(chǎn)品的公告,有興趣的讀者可以關(guān)注。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39793

    瀏覽量

    301438
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50098

    瀏覽量

    265402
  • ChatGPT
    +關(guān)注

    關(guān)注

    31

    文章

    1598

    瀏覽量

    10269

原文標(biāo)題:ChatGPT帶來AI爆炸式流量怎么解?

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    奧迪威外夾流量傳感器:非侵入、高精度流量測量方案

    外夾流量傳感器重新定義了流量監(jiān)測的易用性。它將超聲波時(shí)差測量的精確性與非侵入安裝的顯著優(yōu)勢相結(jié)合,為水處理、化工、暖通空調(diào)以及無數(shù)其他工業(yè)和商業(yè)場景中的連續(xù)
    的頭像 發(fā)表于 02-25 11:20 ?243次閱讀
    奧迪威外夾<b class='flag-5'>式</b><b class='flag-5'>流量</b>傳感器:非侵入<b class='flag-5'>式</b>、高精度<b class='flag-5'>流量</b>測量方案

    AI推理芯片需求爆發(fā),OpenAI欲尋求新合作伙伴

    領(lǐng)域占據(jù)主導(dǎo),其GPU憑借強(qiáng)大的海量數(shù)據(jù)處理能力,成為全球AI爆炸增長的重要基石。但隨著AI不斷演進(jìn),重點(diǎn)正從大規(guī)模訓(xùn)練轉(zhuǎn)向?qū)σ延?xùn)練模型的推理和推斷,推理已然成為新的競爭戰(zhàn)場。業(yè)內(nèi)普
    的頭像 發(fā)表于 02-03 17:15 ?1999次閱讀

    巨頭競逐AI醫(yī)療健康:OpenAI推出ChatGPT Health,螞蟻阿福國內(nèi)領(lǐng)跑

    健康已成為AI技術(shù)的高頻應(yīng)用場景。OpenAI在其一篇博客文章中透露,通過分析匿名化的ChatGPT對話數(shù)據(jù),發(fā)現(xiàn)全球每周有超過2.3億人在ChatGPT上咨詢健康相關(guān)問題,醫(yī)療健康的需求極為旺盛。
    的頭像 發(fā)表于 01-10 11:17 ?2415次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    解決人類智能無法解決的復(fù)雜問題。實(shí)現(xiàn)AGI的AI相關(guān)研究機(jī)構(gòu)和企業(yè)的主要目標(biāo)。 一、生成AI點(diǎn)燃AGI之火 CHatGPT就是已經(jīng)取得成功的生成
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    是一種快速反應(yīng)能力,是直接的感知;靈感是一種通過思考和探索獲得的創(chuàng)造性想法,是一種創(chuàng)意。 AI怎么模擬直覺與靈感呢?四、AI代替人類的假說 這可能嗎? 用機(jī)器來生成假說: 1、直接生成 生成
    發(fā)表于 09-17 11:45

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    、DDoS攻擊跡象、性能劣化趨勢。l 智能推送優(yōu)化建議(如流量調(diào)度策略調(diào)整、安全規(guī)則預(yù)加載),將風(fēng)險(xiǎn)扼殺在萌芽狀態(tài)。 方案價(jià)值:AI推理引擎帶來的運(yùn)維變革 信而泰融合DeepSeek AI
    發(fā)表于 07-16 15:29

    大家都在用什么AI軟件?有沒有好用的免費(fèi)的AI軟件推薦一下?

    大家都在用什么AI軟件?有沒有好用的免費(fèi)的AI軟件推薦一下?直接發(fā)個(gè)安裝包,謝謝。比如deepseek、Chatgpt、豆包、阿里AI、百度AI
    發(fā)表于 07-09 18:30

    邊緣生成AI面臨哪些工程挑戰(zhàn)?

    本文由TechSugar編譯自electronicdesign當(dāng)大多數(shù)人想到人工智能(AI)時(shí),他們通常能想到的是能夠生成新文本、圖像或語音內(nèi)容的應(yīng)用。像ChatGPT這樣流行的文本應(yīng)用(在幾天
    的頭像 發(fā)表于 06-25 10:44 ?1145次閱讀
    邊緣生成<b class='flag-5'>式</b><b class='flag-5'>AI</b>面臨哪些工程挑戰(zhàn)?

    AI真會(huì)人格分裂!OpenAI最新發(fā)現(xiàn),ChatGPT善惡開關(guān)已開啟

    AI現(xiàn)在就像一個(gè)小朋友,很容易就學(xué)壞了!OpenAI剛剛發(fā)現(xiàn),如果用錯(cuò)誤的數(shù)據(jù)微調(diào)自家的模型的一個(gè)領(lǐng)域,ChatGPT就會(huì)把在這個(gè)領(lǐng)域?qū)W到的「惡」和「壞」泛化到其他領(lǐng)域。比如「刻意」用錯(cuò)誤數(shù)據(jù)在汽車
    的頭像 發(fā)表于 06-20 12:41 ?1.5w次閱讀
    <b class='flag-5'>AI</b>真會(huì)人格分裂!OpenAI最新發(fā)現(xiàn),<b class='flag-5'>ChatGPT</b>善惡開關(guān)已開啟

    INT-based Routing(基于遙測的智能路由)如何重構(gòu)AI集群流量調(diào)度?

    在GPT-4o參數(shù)規(guī)模突破10萬億、千卡集群成為AI訓(xùn)練標(biāo)配的今天,全球互聯(lián)網(wǎng)正經(jīng)歷著前所未有的流量風(fēng)暴。當(dāng)單次模型訓(xùn)練可產(chǎn)生相當(dāng)于YouTube全球三日流量的數(shù)據(jù)洪流,當(dāng)分布推理系
    的頭像 發(fā)表于 05-12 17:06 ?899次閱讀
    INT-based Routing(基于遙測的智能路由)如何重構(gòu)<b class='flag-5'>AI</b>集群<b class='flag-5'>流量</b>調(diào)度?

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    Studio提供了最優(yōu)。Neuron Studio可針對模型到應(yīng)用,提供一站、全鏈路、自動(dòng)化的開發(fā)協(xié)助,不僅讓AI應(yīng)用開發(fā)的全流程可視化,更帶來整個(gè)多種工具的一站
    發(fā)表于 04-13 19:52

    適用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)

    隨著人工智能(AI)技術(shù)的迅猛發(fā)展,數(shù)據(jù)中心面臨著前所未有的計(jì)算和網(wǎng)絡(luò)壓力。從大語言模型(LLM)訓(xùn)練到生成AI應(yīng)用,海量數(shù)據(jù)處理需求推動(dòng)了網(wǎng)絡(luò)帶寬的快速增長。在此背景下,800G網(wǎng)絡(luò)技術(shù)應(yīng)運(yùn)而生
    發(fā)表于 03-25 17:35

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入開發(fā)

    RZ/V2N——近期在嵌入世界2025上新發(fā)布,為 AI 計(jì)算、嵌入系統(tǒng)及工自動(dòng)化提供強(qiáng)大支持。這款全新的計(jì)算平臺(tái)旨在滿足開發(fā)者和企業(yè)用戶對高性能、低功耗和靈活擴(kuò)展的需求。 []() 領(lǐng)先的計(jì)算
    發(fā)表于 03-19 17:54

    和安信可Ai-M61模組對話?手搓一個(gè)ChatGPT 語音助手 #人工智能 #

    ChatGPT
    jf_31745078
    發(fā)布于 :2025年03月12日 15:56:59

    能和Ai-M61模組對話了?手搓一個(gè)ChatGPT 語音助手

    起猛了, 安信可的Ai-M61模組能說話了! 超低延遲實(shí)時(shí)秒回 ,對話超絲滑的那種,先來看一段VCR: 小安派+ChatGPT語音實(shí)測:對話絲滑到忘記對面是AI_ 人工智能的應(yīng)用日益廣泛。 各家模型
    的頭像 發(fā)表于 03-12 11:57 ?1.2w次閱讀
    能和<b class='flag-5'>Ai</b>-M61模組對話了?手搓一個(gè)<b class='flag-5'>ChatGPT</b> 語音助手