国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

沐曦曦云C500/C550 GPU產品適配PaddleOCR-VL-1.5模型

沐曦MetaX ? 來源:沐曦metaX ? 2026-01-30 10:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

PaddleOCR-VL 系列的全新迭代版本PaddleOCR-VL-1.5今天正式上線,沐曦曦云C500/C550 Day 0 適配PaddleOCR-VL-1.5模型,助力PaddleOCR-VL-1.5第一時間面向企業與開發者提供模型服務。

PaddleOCR-VL-1.5創新性地支持了文檔元素的異形框定位,使得PaddleOCR-VL-1.5 在掃描、傾斜、彎折、屏幕拍攝及復雜光照等真實落地場景中均表現卓越,實現了全面的 SOTA。此外,模型進一步集成了印章識別與文本檢測識別任務,關鍵指標持續領跑主流模型。

曦云C系列基于沐曦自主研發的高性能核心GPU IP,具備高能效和高通用性的天然優勢。曦云C系列支持大模型訓練及推理,可廣泛應用于推薦系統、自動語音識別、語音合成、圖像分割檢測、數據庫加速、大語言模型、文生圖、文生視頻等多種場景。作為沐曦主力訓推一體GPU產品,曦云C500/C550具備強勁的算力支撐與靈活的部署優勢,支持多種混合精度計算,可充分釋放PaddleOCR-VL-1.5的模型潛力,實現推理效率與部署體驗的雙重提升,降低企業與開發者的模型應用門檻。

目前,沐曦已構建了從硬件架構到軟件棧的完整自研技術體系。為了讓長周期迭代的硬件適配短周期更新的應用與算法,沐曦打造了全棧自主可控的MXMACA軟件棧原生兼容主流生態,這意味著AI應用可以幾乎零成本地遷移到沐曦的平臺上,基本做到“即插即用”。MXMACA軟件棧于2025年2月份開源,現已擁有超過15萬用戶。

1PaddleOCR-VL-1.5關鍵能力

在 OmniDocBench v1.5 上以 0.9B 的參數量實現 94.5% 的精度,超越了上一代 SOTA 模型 PaddleOCR-VL,表格、公式及文本識別能力大幅提升。

全球首個支持異形框定位的文檔解析模型,可精準返回傾斜、彎折場景下的多邊形檢測框。在掃描、彎折、傾斜、屏幕拍照、光線變化 5 個場景下,精度均優于目前主流的開源與閉源模型。

新增文本行定位/識別與印章識別能力,各項技術指標均刷新領域 SOTA。

精進特殊場景及多語種識別能力。優化了生僻字、古籍、多語種表格、下劃線及復選框的識別效果,并擴展了藏語和孟加拉語的識別支持。

支持跨頁表格自動合并與跨頁段落標題識別,解決了長文檔解析中的斷層問題。

推理速度進一步提升。

2模型架構

3927c454-fd1e-11f0-92de-92fbcf53809c.png

3如何使用

在線使用:https://www.paddleocr.com

開源項目地址:https://github.com/PaddlePaddle/PaddleOCR

模型下載地址:https://huggingface.co/PaddlePaddle/PaddleOCR-VL-1.5

PaddleOCR-VL-1.5使用步驟(詳情可點擊下方閱讀全文):

啟動容器(使用官方鏡像)

dockerrun -it
 --user root
 --privileged
 --device /dev/dri:/dev/dri
 --device /dev/dri
 --device /dev/mxcd:/dev/mxcd
 --security-opt seccomp=unconfined
 --security-opt apparmor=unconfined
 --shm-size64g
 --network host
 ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/paddleocr-genai-fastdeploy-server:latest-metax-gpu bash

安裝PaddleOCR-VL-1.5

python-m pip install -U"paddleocr[doc-parser]"
pip install openai

(可選): 快速測試PaddleOCR-VL-1.5原生推理(基于paddlex)

paddleocr doc_parser-i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/paddleocr_vl_demo.png
# 可選參數:
--layout_detection_model_name(版面區域檢測排序模型的名稱,不設置將會使用默認模型)
--layout_detection_model_dir(版面區域檢測排序模型的路徑,不設置將會使用默認模型)
--vl_rec_model_name(多模態識別模型目錄名稱,不設置將會下載官方模型)
--vl_rec_model_dir(多模態識別模型目錄路徑,不設置將會下載官方模型)
--device(用于推理的設備,不設置默認使用cpu, 如要使用gpu,請設--device metax_gpu, 如要指定某張卡,請先設置環境變量 MACA_VISIBLE_DEVICES={gpu_id})

啟動fastdeploy服務

paddleocrgenai_server --model_name PaddleOCR-VL-1.5-0.9B --host0.0.0.0--port8118--backend fastdeploy --model_dir {model_dir} 

注:model_dir為下載的PaddeOCR-VL-1.5模型的路徑

啟動客戶端程序

方式一:通過CLI調用

paddleocr doc_parser--inputpaddleocr_vl_demo.png--vl_rec_backendfastdeploy-server--vl_rec_server_urlhttp://127.0.0.1:8118/v1 --device metax_gpu

注:model_dir為下載的PaddeOCR-VL-1.5模型的路徑

方式二:通過Python API調用

frompaddleocrimportPaddleOCRVL
#基于paddlex推理
# pipeline = PaddleOCRVL() 
#基于fd server推理
pipeline = PaddleOCRVL(vl_rec_backend="fastdeploy-server", vl_rec_server_url="http://127.0.0.1:8118/v1", device="metax_gpu", layout_detection_model_name="PP-DocLayoutV2", vl_rec_model_name="PaddleOCR-VL-0.9B")
# pipeline = PaddleOCRVL(use_doc_orientation_classify=True) # 通過 use_doc_orientation_classify 指定是否使用文檔方向分類模型
# pipeline = PaddleOCRVL(use_doc_unwarping=True) # 通過 use_doc_unwarping 指定是否使用文本圖像矯正模塊
# pipeline = PaddleOCRVL(use_layout_detection=False) # 通過 use_layout_detection 指定是否使用版面區域檢測排序模塊
output = pipeline.predict("./paddleocr_vl_demo.png")
forresinoutput:
  res.print()## 打印預測的結構化輸出
  res.save_to_json(save_path="output")## 保存當前圖像的結構化json結果
  res.save_to_markdown(save_path="output")## 保存當前圖像的markdown格式的結果

關于沐曦股份

沐曦股份致力于自主研發全棧高性能GPU芯片及計算平臺,為智算、通用計算、云渲染等前沿領域提供高能效、高通用性的算力支撐,助力數字經濟發展。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135422
  • 模型
    +關注

    關注

    1

    文章

    3751

    瀏覽量

    52097
  • 沐曦
    +關注

    關注

    1

    文章

    80

    瀏覽量

    1810

原文標題:曦云C500/C550 Day 0 適配PaddleOCR-VL-1.5

文章出處:【微信號:沐曦MetaX,微信公眾號:沐曦MetaX】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    股份C系列GPU全面適配通義千問Qwen3.5三款新模型

    今日,通義千問團隊正式開源發布Qwen3.5系列中等規模模型,推出包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Qwen3.5-27B三個版本。股份旗下
    的頭像 發表于 02-28 10:05 ?384次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b><b class='flag-5'>云</b><b class='flag-5'>C</b>系列<b class='flag-5'>GPU</b>全面<b class='flag-5'>適配</b>通義千問Qwen3.5三款新<b class='flag-5'>模型</b>

    股份C系列GPU深度適配通義千問Qwen3.5模型

    今天,通義千問今天正式發布 Qwen3.5,并推出Qwen3.5系列的第一款模型 Qwen3.5-397B-A17B 的開放權重版本。股份
    的頭像 發表于 02-26 14:26 ?407次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b><b class='flag-5'>云</b><b class='flag-5'>C</b>系列<b class='flag-5'>GPU</b>深度<b class='flag-5'>適配</b>通義千問Qwen3.5<b class='flag-5'>模型</b>

    C500/C550 GPU產品深度適配MiniMax M2.5模型

    2月13日晚間,MiniMax正式開源MiniMax M2.5模型技術團隊依托MXMACA軟件棧,在24小時內完成
    的頭像 發表于 02-26 14:19 ?562次閱讀

    C系列GPU Day 0 適配智譜全新一代大模型GLM-5

    智譜AI正式上線并開源全新一代大模型 GLM-5,股份實現?Day 0 深度適配。 GLM-5目前可于
    的頭像 發表于 02-12 10:53 ?792次閱讀
    <b class='flag-5'>曦</b><b class='flag-5'>云</b><b class='flag-5'>C</b>系列<b class='flag-5'>GPU</b> Day 0 <b class='flag-5'>適配</b>智譜全新一代大<b class='flag-5'>模型</b>GLM-5

    C500/C550 GPU產品適配智譜GLM-OCR模型

    今天,智譜AI正式發布并開源GLM-OCR,以 “小尺寸、高精度” 實現文檔解析能力新標桿。股份C500/
    的頭像 發表于 02-03 11:36 ?647次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b><b class='flag-5'>云</b><b class='flag-5'>C500</b>/<b class='flag-5'>C550</b> <b class='flag-5'>GPU</b><b class='flag-5'>產品</b><b class='flag-5'>適配</b>智譜GLM-OCR<b class='flag-5'>模型</b>

    C600 GPU產品適配階躍星辰基座模型Step 3.5 Flash

    今天,階躍星辰技術團隊發布并開源最新旗艦基座模型 Step 3.5 Flash。股份已實現C
    的頭像 發表于 02-02 14:44 ?361次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b><b class='flag-5'>云</b><b class='flag-5'>C</b>600 <b class='flag-5'>GPU</b><b class='flag-5'>產品</b><b class='flag-5'>適配</b>階躍星辰基座<b class='flag-5'>模型</b>Step 3.5 Flash

    C500/C550 GPU產品適配騰訊混元圖像3.0圖生圖模型

    近日,騰訊混元團隊宣布開源混元圖像3.0圖生圖版本(HunyuanImage 3.0-Instruct),股份C500/
    的頭像 發表于 02-02 14:43 ?369次閱讀

    C500/C550 GPU產品適配騰訊混元開源翻譯模型1.5版本

    種民漢/方言,除了中文、英語、日語等常見語種,也包含捷克語、馬拉地語、愛沙尼亞語、冰島語等小語種。目前兩個模型均在騰訊混元官網上線,通過開源社區也可以直接下載使用。
    的頭像 發表于 01-06 14:13 ?369次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b><b class='flag-5'>云</b><b class='flag-5'>C500</b>/<b class='flag-5'>C550</b> <b class='flag-5'>GPU</b><b class='flag-5'>產品</b><b class='flag-5'>適配</b>騰訊混元開源翻譯<b class='flag-5'>模型</b><b class='flag-5'>1.5</b>版本

    股份C系列GPU Day 0適配智譜GLM-4.6V多模態大模型

    12月8日智譜AI發布并開源 GLM-4.6V 系列多模態大模型股份C系列
    的頭像 發表于 12-17 14:28 ?617次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b><b class='flag-5'>云</b><b class='flag-5'>C</b>系列<b class='flag-5'>GPU</b> Day 0<b class='flag-5'>適配</b>智譜GLM-4.6V多模態大<b class='flag-5'>模型</b>

    DLInfer聯手股份實現數據生成場景的實際落地

    近期,上海 AI 實驗室 DeepLink 團隊推出的 DLInfer 通過支持 LMDeploy 主流模型推理,助力股份
    的頭像 發表于 12-09 14:55 ?707次閱讀
    DLInfer聯手<b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份實現數據生成場景的實際落地

    首款全國產通用GPU芯片發布 集成推出C600

    集成電路(南京)有限公司近日正式發布了首款全國產通用GPU——C600,這標志著國產高性
    的頭像 發表于 10-19 20:04 ?4.6w次閱讀

    C系列產品已支持TileLang

    近日,DeepSeek宣布在其新版本中擁抱國產GPU語言TileLang,引發業界廣泛關注。作為國產高性能GPU的代表,
    的頭像 發表于 10-14 09:25 ?1180次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b><b class='flag-5'>云</b><b class='flag-5'>C</b>系列<b class='flag-5'>產品</b>已支持TileLang

    硅基流動攜手首發基于的Kimi K2推理服務

    天網絡”)運營的C550 三千卡通用 GPU 國產集群。此次合作標志著硅基流動正式將該國
    的頭像 發表于 07-23 17:33 ?1926次閱讀

    C500通用計算GPU與百度飛槳完成Ⅱ級兼容性測試

    近日,C500通用計算GPU與百度飛槳已完成Ⅱ級兼容性測試。測試結果顯示,雙方兼容性表現
    的頭像 發表于 03-31 14:22 ?1815次閱讀

    加速DeepSeek滿血版單卡C500異構推理

    近日,基于開源KTransformers架構的 CPU/GPU 異構推理能力,C500
    的頭像 發表于 03-20 15:52 ?2233次閱讀