近年來,以大規模預訓練模型為代表的人工智能技術迅猛發展,為科研創新提供了全新范式。中科院高能物理研究所依托正負電子對撞機等大科學裝置,積累了海量高價值實驗數據,如何高效利用數據、加速成果產出,成為研究所面臨的核心課題。
經過多方評估,中科院高能物理研究所選用曙光 AI 解決方案作為算力支撐,聯合 DeepAI 深算智能引擎,自主研發出高能物理領域首款聚焦知識挖掘與發現的 L2 級大模型 —— 溪悟 (Xiwu)。
在項目推進中,研究所面臨多重挑戰:大模型訓練所需的龐大算力資源存在行業性短缺;高價值科學數據需在安全可控的環境下實現內部深度挖掘;基座模型種類繁多,需精準適配領域需求。
借助DeepAI深算智能引擎,中科院高能物理研究所快速完成基座模型的適配優化與訓練框架(如LlamaFactory、Xtuner、vLLM等)的精準選型,在兩方面實現價值突破:
打通實驗數據與理論研究的壁壘,幫助科學家快速定位關鍵信息,加速粒子物理、宇宙學等領域的研究進程;
通過極簡的生態兼容設計,大幅降低模型微調與部署成本,為大模型在科研場景的規模化應用奠定基礎。
經過微調訓練,溪悟(Xiwu)-130 億語言模型在100 個高能物理領域問答測試集上,采用人工評估的方法,與基準模型Vicuna-130億相比,回答更加準確或持平的概率達到95%,性能明顯優于基準模型。
中科曙光將持續攜手中科院高能物理研究所,不斷提升溪悟(Xiwu)大模型在Tokens限制解除、思維能力進化、圖像處理優化等一系列能力,探索大模型在更多復雜科學問題中的應用潛力,推動科研范式智能化轉型。
-
AI
+關注
關注
89文章
37814瀏覽量
294910 -
人工智能
+關注
關注
1813文章
49667瀏覽量
260779 -
中科曙光
+關注
關注
5文章
453瀏覽量
18824 -
大模型
+關注
關注
2文章
3423瀏覽量
4930
原文標題:中科院高能物理研究所 × 曙光AI,打造全球首個L2級高能物理大模型“溪悟”
文章出處:【微信號:sugoncn,微信公眾號:中科曙光】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄

中科曙光助力中科院高能物理研究所打造溪悟大模型
評論