国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Merlin HugeCTR V3.4.1版本新增內(nèi)容介紹

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2022-03-10 10:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Merlin HugeCTR(以下簡稱 HugeCTR)是 GPU 加速的推薦程序框架,旨在在多個(gè) GPU 和節(jié)點(diǎn)之間分配訓(xùn)練并估計(jì)點(diǎn)擊率(Click-through rate)。

此次v3.4更新涉及的模塊主要為:

HugeCTR 分級(jí)參數(shù)服務(wù)器

HugeCTR Python API

相關(guān)介紹:

HugeCTR 分級(jí)參數(shù)服務(wù)器介紹

V3.4.1 版本新增內(nèi)容

調(diào)整了整個(gè)代碼庫中日志消息的日志級(jí)別。

現(xiàn)已支持對(duì)具有多個(gè)標(biāo)簽的數(shù)據(jù)集進(jìn)行推理:

“Softmax” 層現(xiàn)在已支持 FP16,并且支持混合精度以進(jìn)行多標(biāo)簽推理。

支持多 GPU 離線推理:

我們通過 Python 接口支持多 GPU 離線推理,它可以利用Hierarchical Parameter Server并在多個(gè)設(shè)備上實(shí)現(xiàn)并發(fā)執(zhí)行。更多信息請(qǐng)參考推理 API和多 GPU 離線推理筆記本。

HPS 已構(gòu)建為獨(dú)立庫:

我們重構(gòu)了代碼庫并將分層參數(shù)服務(wù)器構(gòu)建為一個(gè)獨(dú)立的庫,以后會(huì)進(jìn)一步封裝。

metadata.json 簡介:

添加了有關(guān) Parquet data 中 _metadata.json 的詳細(xì)信息。

增加了用于估計(jì)每個(gè) GPU 的詞匯量大小的文檔和工具:

我們添加了一個(gè)工具來計(jì)算每個(gè) GPU 的不同嵌入類型的詞匯量大小,在此基礎(chǔ)上,workspace_size_per_gpu_in_mb 可以根據(jù)嵌入向量大小和優(yōu)化器類型評(píng)估更多信息請(qǐng)參考腳本。

訓(xùn)練中支持 HDFS :

a. 現(xiàn)在支持從 HDFS 加載和存儲(chǔ)模型和優(yōu)化器狀態(tài)。

b. 增加了編譯選項(xiàng)使 HDFS 的支持更加靈活。

c. 添加了一個(gè)筆記本來展示如何將 HugeCTR 與 HDFS 一起使用:

增加了一個(gè)演示如何分析模型文件的 Python 腳本和筆記本

錯(cuò)誤修復(fù):

修復(fù)了SOK 中的鏡像策略錯(cuò)誤

修復(fù)了無法在nvcr.io/nvidia/merlin/merlin-tensorflow-training:22.02中導(dǎo)入稀疏操作工具包的問題。

HugeCTR 參數(shù)服務(wù)器:修復(fù)了在未配置 RocksDB 時(shí),可能會(huì)在初始化期間發(fā)生的訪問沖突問題。

已知問題

HugeCTR 使用 NCCL 在 rank 之間共享數(shù)據(jù),并且 NCCL 可能需要共享系統(tǒng)內(nèi)存用于 IPC 和固定(頁面鎖定)系統(tǒng)內(nèi)存資源。在容器內(nèi)使用 NCCL 時(shí),建議您通過發(fā)出以下命令(-shm-size=1g -ulimit memlock=-1) 來增加這些資源。

另見 NCCL 的 已知問題

還有 GitHub 問題

目前即使目標(biāo) Kafka broker 無響應(yīng),KafkaProducers 啟動(dòng)也會(huì)成功。為了避免與來自 Kafka 的流模型更新相關(guān)的數(shù)據(jù)丟失,您必須確保有足夠數(shù)量的 Kafka brokers 啟動(dòng)、正常工作并且可以從運(yùn)行 HugeCTR 的節(jié)點(diǎn)訪問。

文件列表中的數(shù)據(jù)文件數(shù)量應(yīng)不小于數(shù)據(jù)讀取器的數(shù)量。否則,不同的 worker 將被映射到同一個(gè)文件,從而導(dǎo)致數(shù)據(jù)加載不會(huì)按預(yù)期進(jìn)行。

正則化器暫不支持聯(lián)合損失訓(xùn)練。

原文標(biāo)題:Merlin HugeCTR v3.4.1 發(fā)布說明

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135441
  • 節(jié)點(diǎn)
    +關(guān)注

    關(guān)注

    0

    文章

    229

    瀏覽量

    25570
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    14

    文章

    10253

    瀏覽量

    91484

原文標(biāo)題:Merlin HugeCTR v3.4.1 發(fā)布說明

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【「Altium Designer 25 電路設(shè)計(jì)精進(jìn)實(shí)踐」閱讀體驗(yàn)】+本書概覽與內(nèi)容特點(diǎn)介紹

    本文以AD 25版本為依托,介紹了AD25進(jìn)行電子電路設(shè)計(jì)的方法,理論結(jié)合實(shí)踐。 內(nèi)容概覽先來概覽下本書的內(nèi)容,看一書的
    發(fā)表于 02-14 15:56

    西門子PCB DFM分析工具Valor NPI 2510版本新增功能

    Valor NPI 2510 版本新增多項(xiàng)檢查功能、提升制造風(fēng)險(xiǎn)識(shí)別,并推出令人矚目的 3D 可視化增強(qiáng)特性,這標(biāo)志著產(chǎn)品的重大升級(jí)。Valor NPI 的 3D 視圖經(jīng)過重新設(shè)計(jì),讓可制造性設(shè)計(jì) (DFM) 結(jié)果的查看更直觀、精準(zhǔn)。
    的頭像 發(fā)表于 01-04 16:10 ?403次閱讀
    西門子PCB DFM分析工具Valor NPI 2510<b class='flag-5'>版本</b>的<b class='flag-5'>新增</b>功能

    AMD Vivado Design Suite 2025.2版本現(xiàn)已發(fā)布

    AMD Vivado Design Suite 2025.2 版本現(xiàn)已發(fā)布,新增對(duì) AMD Versal 自適應(yīng) SoC 的設(shè)計(jì)支持,包含新器件支持、QoR 功能及易用性增強(qiáng)。
    的頭像 發(fā)表于 12-09 15:11 ?948次閱讀

    RT-Thread Studio V2.3.0 版本正式發(fā)布!

    RT-ThreadStudioV2.3.0親愛的開發(fā)者們,我們很高興地宣布RT-ThreadStudio版本更新啦!V2.3.0版正式發(fā)布!RT-ThreadStudioV2.3.0更新內(nèi)容1
    的頭像 發(fā)表于 11-29 09:29 ?1116次閱讀
    RT-Thread Studio <b class='flag-5'>V</b>2.3.0 <b class='flag-5'>版本</b>正式發(fā)布!

    Quartus Prime Pro 25.1版本的安裝和使用

    如果用戶開發(fā)板是基于Agilex 3、Agilex 5等高階器件,則需要安裝高版本的Quartus軟件比如Quartus Prime Pro 25.1版本,這個(gè)版本在安裝包和license獲取(免費(fèi))等方面跟以往的Quartus
    的頭像 發(fā)表于 10-07 13:06 ?2669次閱讀
    Quartus Prime Pro 25.1<b class='flag-5'>版本</b>的安裝和使用

    開鴻Bot系列大版本更新:體驗(yàn)穩(wěn)定升級(jí),樂享高效協(xié)同!

    V5.0.1.22版本開鴻Bot系列今日,開鴻Bot系列迎來第二次大版本更新——V5.0.1.22。此次版本更新致力于進(jìn)一步提升系統(tǒng)穩(wěn)定性與
    的頭像 發(fā)表于 09-26 17:06 ?1346次閱讀
    開鴻Bot系列大<b class='flag-5'>版本</b>更新:體驗(yàn)穩(wěn)定升級(jí),樂享高效協(xié)同!

    NVIDIA RAPIDS 25.06版本新增多項(xiàng)功能

    RAPIDS 是一套面向 Python 數(shù)據(jù)科學(xué)的 NVIDIA CUDA-X 庫,最新發(fā)布的 25.06 版本引入了多項(xiàng)亮眼新功能,其中包括 Polars GPU 流執(zhí)行引擎——這是一種面向圖
    的頭像 發(fā)表于 09-09 09:54 ?1063次閱讀

    開鴻Bot系列V5.0.1.10版本升級(jí)!

    開鴻Bot系列更新至V5.0.1.10版本,此次升級(jí)聚焦功能優(yōu)化及系統(tǒng)穩(wěn)定性提升,在分布式能力、文件分享、打印功能及界面顯示等方面進(jìn)行了多項(xiàng)改進(jìn),同時(shí)修復(fù)了多個(gè)已知問題,進(jìn)一步提升了系統(tǒng)的可靠性
    的頭像 發(fā)表于 08-08 18:58 ?676次閱讀
    開鴻Bot系列<b class='flag-5'>V</b>5.0.1.10<b class='flag-5'>版本</b>升級(jí)!

    匠芯創(chuàng)發(fā)布新版GUI開發(fā)工具 新增多國語言設(shè)置等功能

    。此次版本更新,為用戶帶來了諸多實(shí)用的新功能,進(jìn)一步提升了設(shè)計(jì)體驗(yàn)和開發(fā)效率。在V1.3.0版本中,AiUIBuilder新增了多國語言切換功能,支持設(shè)計(jì)界面顯示
    的頭像 發(fā)表于 08-07 15:36 ?1307次閱讀
    匠芯創(chuàng)發(fā)布新版GUI開發(fā)工具 <b class='flag-5'>新增</b>多國語言設(shè)置等功能

    請(qǐng)問k230創(chuàng)樂博V3.0版本如何使用ADB傳輸文件呢?

    請(qǐng)問k230 創(chuàng)樂博V3.0版本如何使用ADB傳輸文件?
    發(fā)表于 06-24 07:57

    CANoe產(chǎn)品體系19版本新特性及新增Option(上)

    版本持續(xù)助力當(dāng)前車輛E/E架構(gòu)中ECU開發(fā)驗(yàn)證,同時(shí)賦能后續(xù)智能網(wǎng)聯(lián)電動(dòng)車型預(yù)研驗(yàn)證。新版本CANoe產(chǎn)品體系新增數(shù)據(jù)驅(qū)動(dòng)的DDS、車輛互聯(lián)服務(wù)和高效電機(jī)模型庫,進(jìn)一步支持CANXL
    的頭像 發(fā)表于 06-11 10:03 ?2916次閱讀
    CANoe產(chǎn)品體系19<b class='flag-5'>版本</b>新特性及<b class='flag-5'>新增</b>Option(上)

    支持HPM6P00/HPM5E00系列!HPMicro Manufacturing Tool v0.6.0發(fā)布

    各位先楫的小伙伴久等了,HPMicroManufacturingTool0.6.0版本正式發(fā)布啦!該版本包含多個(gè)模塊的更新優(yōu)化,讓我們抓緊時(shí)間先睹為快!v0.6.0版本主要更新
    的頭像 發(fā)表于 06-04 08:28 ?2046次閱讀
    支持HPM6P00/HPM5E00系列!HPMicro Manufacturing Tool <b class='flag-5'>v</b>0.6.0發(fā)布

    信捷電氣XDPPro V3.8.0版本的五大創(chuàng)新功能

    作為信捷XD、XL、XG系列PLC的編程軟件,XDPPro始終以工程師的需求為核心,聚焦編程效率、硬件配置與協(xié)作體驗(yàn),此次V3.8.0版本將推出五大創(chuàng)新功能,助您輕松應(yīng)對(duì)復(fù)雜工程挑戰(zhàn)。
    的頭像 發(fā)表于 05-23 16:03 ?1753次閱讀
    信捷電氣XDPPro <b class='flag-5'>V</b>3.8.0<b class='flag-5'>版本</b>的五大創(chuàng)新功能

    達(dá)實(shí)智能正式發(fā)布AIoT平臺(tái)V7版本

    近日,在達(dá)實(shí)智能成立30周年慶典上,達(dá)實(shí)AIoT智能物聯(lián)網(wǎng)平臺(tái)V7版本重磅發(fā)布。此版本借助國產(chǎn)AI大模型發(fā)展趨勢(shì),展示了生成式AI在園區(qū)數(shù)字化平臺(tái)的實(shí)際應(yīng)用。以下為發(fā)布會(huì)當(dāng)天達(dá)實(shí)智能研發(fā)中心袁宜峰博士現(xiàn)場分享:
    的頭像 發(fā)表于 03-21 11:44 ?1136次閱讀

    達(dá)實(shí)AIoT智能物聯(lián)網(wǎng)管控平臺(tái)V7版本發(fā)布

    近日,達(dá)實(shí)智能在公司總部發(fā)布了達(dá)實(shí)AIoT智能物聯(lián)網(wǎng)管控平臺(tái)V7版本,展示了生成式AI在園區(qū)數(shù)字化平臺(tái)的實(shí)際應(yīng)用。
    的頭像 發(fā)表于 03-19 11:39 ?1126次閱讀