繼 DeepSeek 全套蒸餾模型以及 V3 版本上線后,經(jīng)過 Gitee AI 和沐曦團(tuán)隊(duì)兩天緊鑼密鼓的適配和機(jī)器籌備,DeepSeek-R1全尺寸版本現(xiàn)在已上線 Gitee AI 供開發(fā)者們使用。
截至目前,DeepSeek-R1、DeepSeek-V3 以及 DeepSeek-R1-Distill(1.5B/7B/14B/32B) 千問蒸餾模型均實(shí)現(xiàn)了在國產(chǎn)沐曦訓(xùn)推一體 GPU 上成功運(yùn)行,且均已上線 Gitee AI 開放使用體驗(yàn),國內(nèi) AI 全鏈路自主技術(shù)閉環(huán)踏出了巨大且關(guān)鍵的一步。在此特別感謝沐曦團(tuán)隊(duì)的技術(shù)支持以及來自上海加佳的算力支撐。
三大「殺手锏」成就國產(chǎn)模型新高度
DeepSeek-R1的性能相信大家已經(jīng)充分領(lǐng)教了,其「殺手锏」之一就是開放了思維鏈輸出過程,用戶可以看到模型進(jìn)行推理時(shí)的每一步邏輯,告別了傳統(tǒng)大模型的「黑盒」問題。
DeepSeek-R1另一個(gè)「殺手锏」則是在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,性能比肩OpenAI-o1 正式版。
DeepSeek-R1的第三個(gè)「殺手锏」無疑是開放的許可證和用戶協(xié)議,模型開源 License 統(tǒng)一使用 MIT,完全開源,不限制商用,無需申請(qǐng)。
同時(shí),產(chǎn)品協(xié)議明確可「模型蒸餾」,明確允許用戶利用模型輸出、通過模型蒸餾等方式訓(xùn)練其他模型。
這三大「殺手锏」使得DeepSeek-R1不但擁有極高的透明度和易用性,也為開發(fā)者提供了更靈活的訓(xùn)練和應(yīng)用方式,極大地加速了模型的落地與普及,迅速讓國產(chǎn)模型在世界 AI 競(jìng)爭(zhēng)格局中登上了新的制高點(diǎn)。
沐曦 GPU+曦源一號(hào)萬卡集群=國產(chǎn)算力新標(biāo)桿
當(dāng)然,想要實(shí)現(xiàn)技術(shù)自主與獨(dú)立,僅有模型的領(lǐng)先還不夠,關(guān)鍵在于 AI 模型對(duì)國產(chǎn) GPU 的深度適配與高效運(yùn)行。
唯有 DeepSeek-R1 能夠在國產(chǎn) GPU 上穩(wěn)定運(yùn)行,中國 AI 技術(shù)體系才能真正實(shí)現(xiàn)自主可控的完整閉環(huán)。
本次DeepSeek-R1部署采用了沐曦訓(xùn)推一體 GPU,使用完全自主研發(fā)的 GPU IP,擁有完整的知識(shí)產(chǎn)權(quán),并具備強(qiáng)大的多精度混合計(jì)算能力及高帶寬顯存支持。同時(shí),沐曦產(chǎn)品搭載先進(jìn)的時(shí)空互聯(lián)技術(shù)和全球兼容的 MXMACA 軟件棧,可廣泛應(yīng)用于智能、通用計(jì)算和數(shù)據(jù)處理等場(chǎng)景。
此外,由上海加佳智云數(shù)字科技有限公司運(yùn)營的曦源一號(hào)國產(chǎn)替代萬卡集群正以其卓越的性能為本次部署以及各類 AI 平臺(tái)、AI 模型及 AI 應(yīng)用提供強(qiáng)大的算力支持。
曦源一號(hào)國產(chǎn)替代算力集群是基于沐曦高性能 GPU 加速卡所構(gòu)建的一個(gè)開放、標(biāo)準(zhǔn)、高效的計(jì)算架構(gòu),有效促進(jìn)了計(jì)算資源、數(shù)據(jù)資源與智能服務(wù)的全面整合。這種創(chuàng)新不僅提升了整體性能,也在 AI 實(shí)時(shí)推理、大規(guī)模模型訓(xùn)練等眾多領(lǐng)域展現(xiàn)出巨大的潛力,從而滿足了目前急需高效、穩(wěn)定計(jì)算能力的國內(nèi)市場(chǎng)。
Gitee AI——模型 API 新選擇
2024 年初上線以來,Gitee AI 平臺(tái)以 Serverless API、模型引擎、AI 應(yīng)用為核心功能與服務(wù),致力于讓開發(fā)者輕松構(gòu)建和部署 AI 應(yīng)用,為企業(yè)客戶提供更加智能、高效的 AI 應(yīng)用解決方案。
Gitee AI 的 Serverless API 提供了文本生成、視覺模型、圖像處理、語音識(shí)別、語音生成、向量與重排模型、代碼生成等 9 種類型共 54 個(gè)大模型的 API 使用。通過購買模型資源包,即可通過極低的價(jià)格即可盡享眾多主流模型。
點(diǎn)擊文末閱讀原文訪問 Gitee AI,體驗(yàn)基于基于沐曦曦云 GPU 及曦源一號(hào)國產(chǎn)替代算力集群的DeepSeek-R1,使用 100% 國產(chǎn) AI 開發(fā)應(yīng)用吧!
-
gpu
+關(guān)注
關(guān)注
28文章
5245瀏覽量
136005 -
AI
+關(guān)注
關(guān)注
91文章
40715瀏覽量
302383 -
模型
+關(guān)注
關(guān)注
1文章
3805瀏覽量
52232 -
DeepSeek
+關(guān)注
關(guān)注
2文章
837瀏覽量
3373
原文標(biāo)題:繼V3之后,沐曦GPU再完成DeepSeek-R1全尺寸適配,已上線Gitee AI
文章出處:【微信號(hào):OSC開源社區(qū),微信公眾號(hào):OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
百度騰訊搶灘布局!DeepSeek-R1升級(jí)和開源背后,國產(chǎn)AI的逆襲之路
DeepSeek R1 MTP在TensorRT-LLM中的實(shí)現(xiàn)與優(yōu)化
速看!EASY-EAI教你離線部署Deepseek R1大模型
【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】+混合專家
【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】--全書概覽
【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】書籍介紹+第一章讀后心得
信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代
Arm Neoverse N2平臺(tái)實(shí)現(xiàn)DeepSeek-R1滿血版部署
NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場(chǎng)景中的性能紀(jì)錄
DeepSeek-R1全尺寸版本上線Gitee AI
評(píng)論