国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云服務(wù)器 Flexus X 實例:one-api 部署,支持眾多大模型

jf_94205927 ? 來源:jf_94205927 ? 作者:jf_94205927 ? 2025-02-06 17:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文通過 Flexus 云服務(wù)器 X 實例 部署 one-api。Flexus 云服務(wù)器 X 實例是新一代面向中小企業(yè)和開發(fā)者打造的柔性算力云服務(wù)器,可智能感知業(yè)務(wù)負載,適用于電商直播、企業(yè)建站、開發(fā)測試環(huán)境、游戲服務(wù)器、音視頻服務(wù)等中低負載場景。相較于 Flexus 應(yīng)用服務(wù)器 L 實例,F(xiàn)lexus 云服務(wù)器 X 實例的優(yōu)勢包含:提供豐富的公共鏡像、可靈活自定義 vCPU 內(nèi)存配比、智能感知業(yè)務(wù)動態(tài)升降配,負載范圍更高等。

Flexus 云服務(wù)器 X 實例 能夠支持電商直播、企業(yè)建站、個人開發(fā)測試、游戲服務(wù)器等。

wKgZO2dtK_eAc7kIAACbHKe18ok616.png

一、one-api 介紹

one-api 是一個 OpenAI 接口管理 &分發(fā)系統(tǒng),目前支持 Azure、Anthropic Claude、Google PaLM 2 & Gemini、智譜 ChatGLM、百度文心一言、訊飛星火認知、阿里通義千問、360 智腦以及騰訊混元,可用于二次分發(fā)管理 key,僅單可執(zhí)行文件,已打包好 Docker 鏡像,一鍵部署,開箱即用。

wKgZPGdtK_iAc3ayAACrqFqjHuo018.png

one-api 特性:

(1)支持多種大模型;

(2)支持配置鏡像以及眾多第三方代理服務(wù);

(3)支持通過負載均衡的方式訪問多個渠道;

(4)支持 stream 模式,可以通過流式傳輸實現(xiàn)打字機效果;

(5)支持多機部署,支持令牌管理,設(shè)置令牌的過期時間、額度、允許的 IP 范圍以及允許的模型訪問;

(6) 支持兌換碼管理,支持批量生成和導(dǎo)出兌換碼,可使用兌換碼為賬戶進行充值;

(7)支持渠道管理,批量創(chuàng)建渠道。 支持用戶分組以及渠道分組,支持為不同分組設(shè)置不同的倍率;

(8) 支持渠道設(shè)置模型列表,支持查看額度明細。 支持用戶邀請獎勵。 支持以美元為單位顯示額度等。

二、部署 one-api

2.1 拉取鏡像

首先,先從遠程鏡像倉庫中拉取 one-api 鏡像,執(zhí)行如下命令拉取。

root@flexusx-7305:~#dockerpull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/justsong/one-api:v0.6.0

v0.6.0: Pulling from ddn-k8s/docker.io/justsong/one-api

4abcf2066143: Pull complete

c2f30ece0032: Pull complete

213fae9f6ab5: Pull complete

f2605c032589: Pull complete

Digest: sha256:416dc625c8c5a905e70db79b40bed5325fa0bc26aecf9cf9181e89b653595e14

Status: Downloaded newer image for swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/justsong/one-api:v0.6.0

swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/justsong/one-api:v0.6.0

one-api 鏡像拉取成功。

2.2 部署 one-api

拉取完 one-api 鏡像后,one-api 鏡像會存儲到本地,如下所示。

root@flexusx-7305:~# docker images

REPOSITORY TAG IMAGE ID CREATED SIZE

swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/gitea/gitea 1.22.1 b3de72970178 2 months ago 167MB

swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/justsong/one-api v0.6.0 36bd98ce5a7c 6 months ago 48.4MB

daocloud.io/library/mysql 8 26d0ac143221 3 years ago 546MB

daocloud.io/library/mysql latest 8457e9155715 3 years ago 546MB

root@flexusx-7305:~#

復(fù)制鏡像名稱,通過 docker 部署 one-api,執(zhí)行如下命令。

root@flexusx-7305:~# docker run --name one-api -d --restart always -p 3002:3000 -e TZ=Asia/Shanghai -v /root/data/one-api:/data swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/justsong/one-api:v0.6.0

89bb9f7a3dd119008c678243464bdf10df377dc4d482b123be3c077d7a675ac8

root@flexusx-7305:~# docker ps

CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES

89bb9f7a3dd1 swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/justsong/one-api:v0.6.0 "/one-api" 2 seconds ago Up 2 seconds 0.0.0.0:3002->3000/tcp, [::]:3002->3000/tcp one-api

ef512af0c1c5 swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/gitea/gitea:1.22.1 "/usr/bin/entrypoint…" 2 days ago Up 2 days 0.0.0.0:3000->3000/tcp, :::3000->3000/tcp, 0.0.0.0:222->22/tcp, [::]:222->22/tcp gitea

65fe1c102df6 daocloud.io/library/mysql:8 "docker-entrypoint.s…" 2 days ago Up 2 days 3306/tcp, 33060/tcp root_db_1

root@flexusx-7305:~#

通過 docker ps 可以查看正在運行的容器,可以看到 one-api 已運行,端口是 3002,對應(yīng)容器內(nèi)部端口 3000。

三、運行 one-api

通過上面的步驟,one-api 已經(jīng)部署成功,下面就來詳細看下 one-api 的功能。

3.1 添加規(guī)則

one-api 對應(yīng)的端口是 3002,需要將 3002 端口加入到準入規(guī)則中。

首先,在基本信息中,找到安全組,點擊進入安全組,如下所示。

wKgZO2dtK_iAcX22AABSMFpa2To274.png

然后,點擊配置規(guī)則配置 3002 端口,如下所示。

wKgZPGdtK_iAITNsAAClNKC6DOw774.png

設(shè)置優(yōu)先級,然后在協(xié)議端口中添加端口,點擊確定,如下所示。

wKgZO2dtK_iAKGaCAACdB5kY2u0367.png

可以看到 3002 端口已經(jīng)被加入到安全規(guī)則中,如下所示。

wKgZPGdtK_qAUTpaAADrNel8ql4859.png

3.2 運行 one-api

在瀏覽器中,訪問 http://服務(wù)器 IP 地址:3002,one-api 界面如下所示。

wKgZO2dtK_qAPhgaAACntc2Mgmo121.png

然后,點擊右上角登錄按鈕,默認用戶名為 root,默認密碼為 123456,登錄后可以修改密碼,如下所示。

wKgZPGdtK_qAPzkYAACG8_k-8V8559.png

wKgZO2dtK_uAWzNWAADTXB9fS2Y701.png

四、添加大模型 API

4.1 添加大模型 API

添加大模型 API 是在渠道里面,如下所示。

wKgZPGdtK_uACRr2AACqHBrn_lg032.png

點擊添加新渠道,如下所示。

wKgZO2dtK_uAAeSxAAEftk5zhCg828.png

加完成后可以點擊測試按鈕測試添加是否成功。

4.2 添加令牌

添加完大模型后,點擊令牌生成密鑰。

wKgZPGdtK_uAaCf8AACB9QU3uvs670.png

點擊添加新的令牌,輸入令牌名稱,過期時間可以默認,表示永不過期,如下所示。

wKgZO2dtK_yAFO_1AACusGn_DCQ642.png

添加完成后,點擊復(fù)制即可復(fù)制密鑰,用于通過 one-api 連接大模型時填寫密鑰。

wKgZPGdtK_yAAoyxAACgcEJwHWU782.png

五、總結(jié)

通過 Flexus 云服務(wù)器 X 實例 上部署 one-api,能夠流暢支持多種大模型接入,方便了大模型的開發(fā)工作。而且,F(xiàn)lexus 云服務(wù)器 X 實例提供了豐富的公共鏡像,可靈活自定義鏡像版本,支持智能感知業(yè)務(wù)動態(tài)升降配,負載范圍更高,支持靈活自定義 vCPU、內(nèi)存實例規(guī)格,支持按需計費更精細和靈活的定價模式,可基于實際負載畫像智能推薦規(guī)格。趕緊用起來吧!

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 云服務(wù)器
    +關(guān)注

    關(guān)注

    0

    文章

    837

    瀏覽量

    14677
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3648

    瀏覽量

    5179
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    硬件通脹下的生存戰(zhàn)!華為Flexus X服務(wù)器,讓中小企業(yè)不做“接盤俠”

    通知”成了企業(yè)IT采購的常態(tài)。 DRAM合同價同比暴漲171.8%,NAND Flash價格累計飆升246%,服務(wù)器整機采購成本上升15%-20%。硬件市場的瘋狂漲價,正讓無數(shù)中小企業(yè)面臨“買得起用不起、想買卻沒貨”的絕境。而__華為
    的頭像 發(fā)表于 12-31 13:05 ?278次閱讀

    DRAM 暴漲 171%! 171% 下的企業(yè)突圍:華為 Flexus X 服務(wù)器成 IT 成本管控利器

    Flexus X 服務(wù)器憑借獨有的柔性算力黑科技與智能調(diào)度能力,助力企業(yè)實現(xiàn)核心應(yīng)用性能最高達友商 6 倍、綜合成本降低 30% 的雙
    的頭像 發(fā)表于 12-31 13:00 ?252次閱讀

    什么是企業(yè)服務(wù)器-計算

    地擴展和管理其IT基礎(chǔ)設(shè)施。華納的企業(yè)服務(wù)器基于虛擬化技術(shù),在環(huán)境中運行多個虛擬服務(wù)器實例
    的頭像 發(fā)表于 12-29 17:57 ?782次閱讀

    香港服務(wù)器支持Docker和Kubernetes嗎?

    在云原生技術(shù)成為主流的今天,Docker和Kubernetes(K8s)已成為現(xiàn)代化應(yīng)用開發(fā)和部署的事實標準。對于選擇香港服務(wù)器的開發(fā)者與企業(yè)而言,一個核心問題是:香港服務(wù)器能否完美支持
    的頭像 發(fā)表于 10-21 15:47 ?679次閱讀

    如何快速在服務(wù)器部署Web環(huán)境?

    如何快速在服務(wù)器部署Web環(huán)境
    的頭像 發(fā)表于 10-14 14:16 ?656次閱讀

    DeepSeek模型如何在服務(wù)器部署

    隨著大型語言模型(LLM)的應(yīng)用日益普及,許多開發(fā)者和企業(yè)希望將像DeepSeek這樣的優(yōu)秀模型部署到自己的服務(wù)器上,以實現(xiàn)私有化、定制化
    的頭像 發(fā)表于 10-13 16:52 ?935次閱讀

    Jtti服務(wù)器上怎么部署網(wǎng)站嗎

    在互聯(lián)網(wǎng)快速發(fā)展的今天,網(wǎng)站已經(jīng)成為公司和個人溝通和展示自我的重要渠道。無論是一個簡單的個人博客,還是一個復(fù)雜的電子商務(wù)平臺,部署網(wǎng)站的過程都是相似的。服務(wù)器因其高可用性、靈活性和經(jīng)濟性,成為
    的頭像 發(fā)表于 09-26 17:16 ?1171次閱讀

    輕量服務(wù)器服務(wù)器區(qū)別:2025年終極選擇指南

    資源、穩(wěn)定計算性能及完整管理權(quán)限,支持垂直與水平擴展,適合企業(yè)級應(yīng)用和高并發(fā)場景。選擇取決于業(yè)務(wù)需求:輕量服務(wù)器適用于成本敏感型場景,標準服務(wù)器則為高性能、高穩(wěn)定性要求的業(yè)務(wù)提供保障
    的頭像 發(fā)表于 09-01 13:58 ?1247次閱讀
    輕量<b class='flag-5'>云</b><b class='flag-5'>服務(wù)器</b>和<b class='flag-5'>云</b><b class='flag-5'>服務(wù)器</b>區(qū)別:2025年終極選擇指南

    HarmonyOS5服務(wù)技術(shù)分享--ArkTS開發(fā)Node環(huán)境

    氣的方式探索這個功能,結(jié)尾還有實用總結(jié)和鼓勵彩蛋哦~? ? 一、HarmonyOS函數(shù)開發(fā):核心能力與價值 HarmonyOS的函數(shù)(Serverless)為開發(fā)者提供了??無服務(wù)器架構(gòu)??的便捷
    發(fā)表于 05-22 17:21

    電競服務(wù)器 工作原理

    電競服務(wù)器工作原理詳解 一、核心架構(gòu)原理 虛擬化資源池? 通過 ?KVM/VMware? 等虛擬化技術(shù)將物理服務(wù)器(含NVIDIA GPU集群)抽象為可動態(tài)分配的算力資源池,每個用戶獨享獨立虛擬機
    的頭像 發(fā)表于 05-14 07:44 ?594次閱讀
    <b class='flag-5'>云</b>電競<b class='flag-5'>服務(wù)器</b> 工作原理

    基于RAKsmart服務(wù)器的AI大模型實時推理方案設(shè)計

    面對高并發(fā)請求、嚴格的響應(yīng)延遲要求及波動的業(yè)務(wù)負載,傳統(tǒng)本地化部署的算力瓶頸愈發(fā)顯著。RAKsmart服務(wù)器憑借其彈性計算資源池、分布式網(wǎng)絡(luò)架構(gòu)與全棧AI加速能力,為AI大模型實時推
    的頭像 發(fā)表于 05-13 10:33 ?603次閱讀

    如何在RAKsmart服務(wù)器上實現(xiàn)企業(yè)AI模型部署

    AI模型的訓(xùn)練與部署需要強大的算力支持、穩(wěn)定的網(wǎng)絡(luò)環(huán)境和專業(yè)的技術(shù)管理。RAKsmart作為全球領(lǐng)先的服務(wù)器托管與計算
    的頭像 發(fā)表于 03-27 09:46 ?936次閱讀

    DeepSeek企業(yè)級部署服務(wù)器資源計算 以raksmart裸機服務(wù)器為例

    以RakSmart裸機服務(wù)器為例,針對DeepSeek企業(yè)級部署服務(wù)器資源計算指南,涵蓋GPU/CPU/內(nèi)存/存儲/網(wǎng)絡(luò)等核心維度的詳細計算方法與配置推薦,主機推薦小編為您整理發(fā)布
    的頭像 發(fā)表于 03-21 10:17 ?1073次閱讀

    RAKsmart美國裸機服務(wù)器DeepSeek的高級定制化部署方案

    在RAKsmart美國裸機服務(wù)器上進行DeepSeek的高級定制化部署,需結(jié)合高性能硬件與靈活的軟件配置,以實現(xiàn)模型優(yōu)化、多任務(wù)并行及安全性提升。以下是針對企業(yè)級需求的詳細方案,主機
    的頭像 發(fā)表于 03-13 11:55 ?897次閱讀

    Raksmart服務(wù)器如何支持AIGC創(chuàng)作

    為了支持AIGC創(chuàng)作的高效運行,高性能的服務(wù)器成為不可或缺的基礎(chǔ)設(shè)施。Raksmart作為一家領(lǐng)先的服務(wù)提供商,憑借其強大的計算能力、靈
    的頭像 發(fā)表于 03-12 11:32 ?709次閱讀