今天,我們正式發布 DeepSeek-R1,并同步開源模型權重。
DeepSeek-R1 遵循 MIT License,允許用戶通過蒸餾技術借助 R1 訓練其他模型。
DeepSeek-R1 上線API,對用戶開放思維鏈輸出,通過設置 `model='deepseek-reasoner'` 即可調用。
DeepSeek 官網與 App 即日起同步更新上線。
性能對齊OpenAI-o1正式版 DeepSeek-R1 在后訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,性能比肩 OpenAI o1 正式版。

在此,我們將 DeepSeek-R1 訓練技術全部公開,以期促進技術社區的充分交流與創新協作。
論文鏈接:
https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
蒸餾小模型超越 OpenAI o1-mini
我們在開源 DeepSeek-R1-Zero 和 DeepSeek-R1 兩個 660B 模型的同時,通過 DeepSeek-R1 的輸出,蒸餾了 6 個小模型開源給社區,其中 32B 和 70B 模型在多項能力上實現了對標 OpenAI o1-mini 的效果。

HuggingFace鏈接:
https://huggingface.co/deepseek-ai

開放的許可證和用戶協議
為了推動和鼓勵開源社區以及行業生態的發展,在發布并開源 R1 的同時,我們同步在協議授權層面也進行了如下調整:
模型開源 License 統一使用 MIT。我們曾針對大模型開源的特點,參考當前行業的通行實踐,特別引入 DeepSeek License 為開源社區提供授權,但實踐表明非標準的開源 License 可能反而增加了開發者的理解成本。為此,此次我們的開源倉庫(包括模型權重)統一采用標準化、寬松的 MIT License,完全開源,不限制商用,無需申請。
產品協議明確可“模型蒸餾”。為了進一步促進技術的開源和共享,我們決定支持用戶進行“模型蒸餾”。我們已更新線上產品的用戶協議,明確允許用戶利用模型輸出、通過模型蒸餾等方式訓練其他模型。
App與網頁端
登錄DeepSeek官網或官方App,打開“深度思考”模式,即可調用最新版 DeepSeek-R1 完成各類推理任務。

API 及定價
DeepSeek-R1 API 服務定價為每百萬輸入 tokens 1 元(緩存命中)/ 4 元(緩存未命中),每百萬輸出 tokens 16 元。


詳細的 API 調用指南請參考官方文檔:
https://api-docs.deepseek.com/zh-cn/guides/reasoning_model
-
開源
+關注
關注
3文章
4203瀏覽量
46120 -
OpenAI
+關注
關注
9文章
1245瀏覽量
10056 -
DeepSeek
+關注
關注
2文章
835瀏覽量
3254
原文標題:DeepSeek-R1發布,性能對標OpenAI o1正式版
文章出處:【微信號:OSC開源社區,微信公眾號:OSC開源社區】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
百度騰訊搶灘布局!DeepSeek-R1升級和開源背后,國產AI的逆襲之路
DeepSeek R1 MTP在TensorRT-LLM中的實現與優化
速看!EASY-EAI教你離線部署Deepseek R1大模型
Arm Neoverse N2平臺實現DeepSeek-R1滿血版部署
NVIDIA Blackwell GPU優化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景中的性能紀錄
DeepSeek開源新版R1 媲美OpenAI o3
雷軍:小米玄戒O1已開始大規模量產
全新訊飛星火X1還有哪些升級
香橙派發布OrangePi RV2本地部署Deepseek-R1蒸餾模型指南
如何使用OpenVINO運行DeepSeek-R1蒸餾模型
在英特爾哪吒開發套件上部署DeepSeek-R1的實現方式
DeepSeek-R1:別被它的光環迷了眼,這些能力局限你得知道!
HarmonyOS NEXT開發實戰:DevEco Studio中DeepSeek的使用
實戰案例 | 299元國產工業級AI核心板部署DeepSeek-R1
對標OpenAI o1,DeepSeek-R1發布
評論