水木分子聯合清華大學智能產業研究院(AIR)宣布開源全球首個可商用多模態生物醫藥百億參數大模型 BioMedGPT-10B,可用于提升藥物研發各個環節的效率,包括新藥立項評估、藥物設計和優化、臨床試驗設計、適應癥拓展等。 此外,該模型在生物醫藥專業領域問答能力比肩人類專家水平,在自然語言、分子、蛋白質跨模態問答任務上達到 SOTA,已成功通過了美國醫師資格考試。 開源地址:
https://github.com/PharMolix/OpenBioMed
https://huggingface.co/PharMolix/BioMedGPT-LM-7B
BioMedGPT 是全新的多模態語義理解框架,它運用了生物醫學領域中的預訓練大語言模型 —BioMedGPT-LM 作為橋梁,將自然語言、生物編碼語言以及化學分子語言等連接起來。 BioMedGPT 架構::

BioMedGPT-LM 通過充分利用海量生物醫學相關數據,對通用的基于 GPT 架構的大型語言模型進行微調,在生物醫學領域發揮更出色的性能。 作為連接橋梁,BioMedGPT-LM 能夠連接各種生物模態的編碼,包括分子、蛋白質、細胞和基因表達數據,同時還能夠整合知識圖譜、文檔、數值實驗結果以及其他格式所體現的專業知識。通過跨模態特征融合模塊集成,不同模態的生物編碼語言、化學分子語言與自然語言能夠在同一個特征空間中實現統一融合。

同時,水木分子、AIR 聯合開源了全球首個免費可商用、生物醫藥專用 Llama 2 大語言模型BioMedGPT-LM-7B。“AIR - 智源健康計算聯合研究中心” 合作開源了小分子藥物基礎模型 DrugFM。此次開源的生物醫藥基礎模型重科研、可商用,為生物醫藥研究與應用提供大模型底座。
-
開源
+關注
關注
3文章
4207瀏覽量
46152 -
自然語言
+關注
關注
1文章
292瀏覽量
13989 -
大模型
+關注
關注
2文章
3650瀏覽量
5189
原文標題:全球首個可商用生物醫藥大模型BioMedGPT-10B開源
文章出處:【微信號:OSC開源社區,微信公眾號:OSC開源社區】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
基于兆芯CPU的紫光UNIS PC終端中標生物醫藥行業央企年度集采項目
潤和軟件與中國科學院廣州生物醫藥與健康研究院達成戰略合作
NVIDIA ACE現已支持開源Qwen3-8B小語言模型
明治案例 | 潔凈車間“透明殺手”終結者:EST-200N在生物醫藥的實戰應用
中科曙光超智融合技術重塑生物醫藥研發新范式
華為宣布開源盤古7B稠密和72B混合專家模型
全球首個胃癌影像篩查AI模型發布
華為正式開源盤古7B稠密和72B混合專家模型
玻色量子亮相2025全球生物制造大會
望石智慧基于亞馬遜云科技構建醫藥行業專屬大模型 推動藥物研發創新
上新:小米首個推理大模型開源 馬斯克:下周推出Grok 3.5
大象機器人攜手進迭時空推出 RISC-V 全棧開源六軸機械臂產品
NVIDIA發布全球首個開源人形機器人基礎模型Isaac GR00T N1
NVIDIA 發布全球首個開源人形機器人基礎模型 Isaac GR00T N1——并推出加速機器人開發的仿真框架
全球首個可商用生物醫藥大模型BioMedGPT-10B開源
評論