Stability AI 是 Stable Diffusion 圖像生成工具背后的公司,如今他們不再局限于開發(fā)圖像 / 視頻生成方面的 AI,于今天正式發(fā)布了一套開源的大型語言模型(LLM)—— StableLM,首次涉足目前由 OpenAI、Meta 和 Google 等科技公司主導的語言模型領域。
StableLM 跟 ChatGPT、Bard 這些一樣,被設計用來生成文本和代碼。它是通過使用開源數據集 the Pile 訓練而來的,這個數據集包含的數據來源就有維基百科、Stack Exchange 和 PubMed。不過,Stability AI 在 the Pile 的基礎上進行了擴展,所使用的數據集大小是標準 the Pile 的 3 倍。
Stability AI 現在已經將這個 StableLM 模型發(fā)布到了 GitHub 上,開發(fā)者可以使用或經過調整后再使用。StableLM 模型還處于 Alpha 階段,它的參數也比較少,只有 30 億和 70 億個參數,之后他們還會推出有 150 億到 650 億參數的模型。

對于 AI 可能會產生的風險,Stability AI 也給出了提醒:
對于任何沒有額外微調和強化學習的預訓練大型語言模型來說,用戶得到的回應質量可能參差不齊,并且可能包括冒犯性的語言和觀點。這有望隨著規(guī)模、更好的數據、社區(qū)反饋和優(yōu)化而得到改善。

除了將代碼托管在 GitHub 上,Stability AI 還在 Hugging Face 上發(fā)布了一個演示版本,經過測試 StableLM 會說中文,但只會一點點(回復內容對應不上,語句也不通順)。

在 Stable Diffusion 發(fā)布后,Stability AI 遭到了很多藝術家的投訴和起訴,指控它通過使用網絡抓取的受版權保護的圖像開發(fā) AI 圖像生成工具,侵犯了藝術家們的權利。在之前的糾紛還沒解決的情況下,如今推出 StableLM 不知道是否還會引發(fā)更多的訴訟。
Stability AI 在去年 10 月融資了 1 億美元,公司估值也超過了 10 億美元。但 AI 是一個投入非常高,可能短期也很難產生收益的領域,也不知道這 1 億美金現在還剩多少,為了在這個領域持續(xù)發(fā)展,Stability AI 會不會繼續(xù)融資,亦或是投入某個大型公司的懷抱呢?
項目地址:https://github.com/Stability-AI/StableLM
審核編輯 :李倩
-
語言模型
+關注
關注
0文章
571瀏覽量
11310 -
數據集
+關注
關注
4文章
1236瀏覽量
26190 -
GitHub
+關注
關注
3文章
488瀏覽量
18660 -
LLM
+關注
關注
1文章
346瀏覽量
1329
原文標題:AI作畫鼻祖Stability AI推出大型語言模型,會一點點中文
文章出處:【微信號:OSC開源社區(qū),微信公眾號:OSC開源社區(qū)】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
從網絡接口到 DMA,一套面向工程師的 FPGA 網絡開發(fā)框架
芯盾時代如何破局LLM供應鏈漏洞危機
什么是大模型,智能體...?大模型100問,快速全面了解!
NVIDIA ACE現已支持開源Qwen3-8B小語言模型
廣和通發(fā)布端側情感對話大模型FiboEmo-LLM
米爾RK3576部署端側多模態(tài)多輪對話,6TOPS算力驅動30億參數LLM
3萬字長文!深度解析大語言模型LLM原理
Votee AI借助NVIDIA技術加速方言小語種LLM開發(fā)
如何在NVIDIA Blackwell GPU上優(yōu)化DeepSeek R1吞吐量
如何在魔搭社區(qū)使用TensorRT-LLM加速優(yōu)化Qwen3系列模型推理部署
歐洲借助NVIDIA Nemotron優(yōu)化主權大語言模型
新品 | Module LLM Kit,離線大語言模型推理模塊套裝
一套開源的大型語言模型(LLM)—— StableLM
評論