国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

如何為Orca-2-13B創(chuàng)建一個與OpenAI兼容的API服務呢?

jf_wN0SrCdH ? 來源:Second State ? 2023-11-27 10:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Orca-2-13B[1] 是微軟最新發(fā)布的 Orca 2 系列中的一款模型,Orca 2 另外還提供 7B 版本。Orca 2系列模型是由 LLAMA 2 基礎模型中微調(diào)而來。Orca 2系列模型擅長推理、文本總結(jié)、數(shù)學問題解決和理解任務,是在原始 13B Orca 模型的基礎上進一步發(fā)展而來,模仿更強大的 AI 系統(tǒng)推理過程從而提高小型模型在復雜任務中的能力。

本文將以 Orca-2-13B 為例,將介紹:

如何在你自己的設備上運行 Orca-2-13B

如何為 Orca-2-13B 創(chuàng)建一個與 OpenAI 兼容的 API 服務

你也可以使用同樣的方式運行 Orca-2-7B 模型,只需要替換 Orca-2-7B模型的 GGUF 格式的下載鏈接。

我們將用 Rust + Wasm 技術棧來開發(fā)和部署這個模型的應用程序。無需安裝復雜的 Python 包或 C++ 工具鏈!了解我們?yōu)槭裁催x擇 Rust+Wasm 技術棧[2]。

在自己的設備上運行 Orca-2-13B

步驟 1:通過以下命令行安裝 WasmEdge[3]。

curl-sSfhttps://raw.githubusercontent.com/WasmEdge/WasmEdge/master/utils/install.sh|bash-s----pluginwasi_nn-ggml

步驟 2:下載模型 GGUF 文件[4]。由于模型文件有幾 GB,所以可能需要很長時間。

curl-LOhttps://huggingface.co/second-state/Orca-2-13B-GGUF/resolve/main/Orca-2-13b-ggml-model-q4_0.gguf

步驟 3:下載一個跨平臺的可移植 Wasm 文件,用于聊天應用。該應用能讓你用命令行與模型進行交流。戳這里[5]查看該應用的 Rust 源代碼。

curl-LOhttps://github.com/second-state/llama-utils/raw/main/chat/llama-chat.wasm

就這樣。接下來,可以通過輸入以下命令在終端與模型進行聊天。

wasmedge--dir.:.--nn-preloaddefaultAUTO:Orca-2-13b-ggml-model-q4_0.ggufllama-chat.wasm-pchatml-s'YouareOrca,anAIlanguagemodelcreatedbyMicrosoft.Youareacautiousassistant.Youcarefullyfollowinstructions.Youarehelpfulandharmlessandyoufollowethicalguidelinesandpromotepositivebehavior.'--stream-stdout

這個可移植的 Wasm 應用會自動利用你設備上的硬件加速器(如 GPU)。

在我的 Mac M1 32G 內(nèi)存設備上,它的速度約為每秒 9.15 個token。

[USER]:What isanOrca?

[ASSISTANT]:
Anorca,orkillerwhale,isalargetoothedpredatorbelongingtotheoceanicdolphinfamily.Theyarehighlyintelligentandsocialanimals,knownfortheircuriosityandplayfulness.

[USER]:

為 Orca-2-13B 創(chuàng)建一個與 OpenAI 兼容的 API 服務

一個與 OpenAI 兼容的網(wǎng)絡 API 能讓 Orca-2-13B 與大量的 LLM 工具和代理框架(如 flows.network、LangChain 和 LlamaIndex)一起工作。

首先,先下載一個 API 服務器應用。它也是一個可以在許多 CPU 和 GPU 設備上運行的跨平臺可移植 Wasm 應用。

curl-LOhttps://github.com/second-state/llama-utils/raw/main/api-server/llama-api-server.wasm

然后,使用以下命令行啟動模型的 API 服務器。

wasmedge--dir.:.--nn-preloaddefaultAUTO:Orca-2-13B.Q5_K_M.ggufllama-api-server.wasm-pchatml

從另一個終端,你可以使用 curl 與 API 服務器進行交互。

curl-XPOSThttp://0.0.0.0:8080/v1/chat/completions-H'accept:application/json'-H'Content-Type:application/json'-d'{"messages":[{"role":"system","content":"YouareahelpfulAIassistant"},{"role":"user","content":"WhatisthecapitalofFrance?"}],"model":"Orca-2-13B"}'

就這樣。WasmEdge 是運行 Orca-2-13B 大模型應用程序最簡單、最快、最安全的方式[6]。試試看吧!





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • C++語言
    +關注

    關注

    0

    文章

    147

    瀏覽量

    7685
  • python
    +關注

    關注

    57

    文章

    4876

    瀏覽量

    90032
  • 硬件加速器
    +關注

    關注

    0

    文章

    43

    瀏覽量

    13477
  • Rust
    +關注

    關注

    1

    文章

    240

    瀏覽量

    7586
  • OpenAI
    +關注

    關注

    9

    文章

    1245

    瀏覽量

    10072

原文標題:跨設備運行微軟最新大語言模型 Orca-2-13B,只需4個命令行

文章出處:【微信號:Rust語言中文社區(qū),微信公眾號:Rust語言中文社區(qū)】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    調(diào)用樂天平臺API獲取商品詳情數(shù)據(jù)

    。 1. 準備工作 在開始調(diào)用API之前,你需要完成以下準備工作: 注冊開發(fā)者賬號 :訪問樂天開發(fā)者門戶,注冊并創(chuàng)建開發(fā)者賬號。 創(chuàng)建應用 :在開發(fā)者門戶中創(chuàng)建
    的頭像 發(fā)表于 02-02 16:25 ?207次閱讀
    調(diào)用樂天平臺<b class='flag-5'>API</b>獲取商品詳情數(shù)據(jù)

    1688交易APIB2B訂單自動化,加速成交!

    ? 在B2B電商領域,訂單處理效率直接影響供應鏈響應速度。1688開放平臺的交易API為商家提供了自動化訂單管理能力,可顯著縮短交易周期。本文將從技術實現(xiàn)角度解析核心功能與應用場景。 AP
    的頭像 發(fā)表于 01-04 15:46 ?285次閱讀
    1688交易<b class='flag-5'>API</b>:<b class='flag-5'>B2B</b>訂單自動化,加速成交!

    1688商品詳情API指南

    、摘要 1688平臺為開發(fā)者提供了完整的商品詳情API接口,支持獲取商品的詳細信息、規(guī)格參數(shù)、價格庫存等核心數(shù)據(jù)。基于您之前了解的工廠數(shù)據(jù)API,商品詳情API
    的頭像 發(fā)表于 12-11 11:09 ?772次閱讀

    系統(tǒng)調(diào)用和API有什么區(qū)別

    很棒的功能模塊,恰好我也想使用這個模塊,但我又懶的去看你的代碼,我只想使用你的代碼,不像去關心實現(xiàn)細節(jié),你想了想把所有的功能封裝在了幾個函數(shù)上,這幾個函數(shù)就是這個功能模塊對外提供的API。 現(xiàn)在
    發(fā)表于 12-03 06:52

    如何評價OpenRouter這樣的大模型API聚合平臺?

    我個人認為OpenRouter的商業(yè)模式特別優(yōu)雅,大模型時代的輕資產(chǎn) “賣水人”。 open router自己不訓練模型,也不買顯卡推理,他做的就是調(diào)用別家的API,聚合了各家的API成為
    的頭像 發(fā)表于 10-28 10:04 ?461次閱讀

    RESTful API設計原則: 構建易用、可擴展的API接口

    (Representational State Transfer)架構原則,構建易用、可擴展的API接口,幫助開發(fā)者創(chuàng)建經(jīng)得起時間考驗的服務、理解REST架構的核心約束 1.1
    的頭像 發(fā)表于 10-20 13:45 ?801次閱讀

    什么是 API接口?

    API接口的工作原理理解 API接口最簡單的方式,是從“請求-響應”模型入手: 1.客戶端發(fā)起請求:比如在電商網(wǎng)站點擊“使用支付寶付款”,此時系統(tǒng)會通過
    的頭像 發(fā)表于 10-08 08:57 ?1012次閱讀

    別再搜了!國內(nèi)用戶搞定OpenAI API Key的兩種最佳實踐(保姆級教程)

    需要國際卡? 拿到Key了,卻不知道怎么在代碼里安全地使用? 別慌,你遇到的坑,我都踩過。這篇教程就是你的避坑指南,我將以“技術學長”的身份,帶你走通兩條獲取OpenAI API Key的路徑,從注冊到代碼調(diào)用,幫你搞定!
    的頭像 發(fā)表于 08-24 19:02 ?1.2w次閱讀

    OpenAI發(fā)布2款開源模型

    OpenAI開源了兩款高性能權重語言模型gpt-oss-120b和gpt-oss-20bOpenAI CEO Sam Altman表示:「gpt-oss 發(fā)布了!我們做了
    的頭像 發(fā)表于 08-06 14:25 ?1028次閱讀

    電商API的微服務架構優(yōu)化策略

    ,電商API在高并發(fā)、低延遲和數(shù)據(jù)致性方面面臨嚴峻挑戰(zhàn)。本文將從基礎概念出發(fā),逐步分析優(yōu)化策略,幫助開發(fā)者構建高性能、可靠的電商API系統(tǒng)。 1. 微服務架構在電商中的應用 微
    的頭像 發(fā)表于 07-23 14:30 ?623次閱讀
    電商<b class='flag-5'>API</b>的微<b class='flag-5'>服務</b>架構優(yōu)化策略

    具有載波聚合的 RX 分集 FEM(B26、B8、B12/13B2/25、B4 和 B7) skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()具有載波聚合的 RX 分集 FEM(B26、B8、B12/13B2/25、B
    發(fā)表于 06-19 18:35
    具有載波聚合的 RX 分集 FEM(<b class='flag-5'>B</b>26、<b class='flag-5'>B</b>8、<b class='flag-5'>B</b>12/<b class='flag-5'>13</b>、<b class='flag-5'>B2</b>/25、<b class='flag-5'>B</b>4 和 <b class='flag-5'>B</b>7) skyworksinc

    安卓原生兼容服務

    安卓原生兼容服務器的定義 安卓原生兼容服務器?指基于Android系統(tǒng)內(nèi)核和服務框架構建的服務
    的頭像 發(fā)表于 06-19 17:32 ?580次閱讀

    如何獲取 OpenAI API Key?API 獲取與代碼調(diào)用示例 (詳解教程)

    OpenAI API Key 獲取與使用詳解:從入門到精通 OpenAI 正以其 GPT 和 DALL-E 等先進模型引領全球人工智能創(chuàng)新。其 API 為開發(fā)者和企業(yè)提供了強大的 AI
    的頭像 發(fā)表于 05-04 11:42 ?1.6w次閱讀
    如何獲取 <b class='flag-5'>OpenAI</b> <b class='flag-5'>API</b> Key?<b class='flag-5'>API</b> 獲取與代碼調(diào)用示例 (詳解教程)

    濱松光子的相機研發(fā)史:ORCA系列與qCMOS的誕生(下)

    往前走。從ORCA?系列的誕生,到C7190-20的突破,再到ImagEM?和ORCA?-Flash的升級,以及最新的qCMOS? ORCA? -QUEST2 C15550-22UP,
    的頭像 發(fā)表于 03-17 06:23 ?819次閱讀
    濱松光子的相機研發(fā)史:<b class='flag-5'>ORCA</b>系列與qCMOS的誕生(下)

    HarmonyOS NEXT開發(fā)實戰(zhàn):DevEco Studio中DeepSeek的使用

    。安裝完成后,打開DevEco Studio,創(chuàng)建新的鴻蒙應用項目,選擇適合的模板(如Empty Ability)。 第二步:安裝CodeGPT插件 在DevEco Studio上安裝插件:打開
    發(fā)表于 03-07 14:56