伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

哈工大提出Myriad:利用視覺專家進行工業異常檢測的大型多模態模型

CVer ? 來源:CVer ? 2023-11-21 16:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一句話總結

通過應用視覺專家進行工業異常檢測,以實現明確的異常檢測和高質量的異常描述,還可進行多輪對話,性能表現出色!優于AnomalyGPT等網絡,代碼即將開源!

Myriad

81612fa6-8842-11ee-939d-92fbcf53809c.png

Myriad: Large Multimodal Model by Applying Vision Experts for Industrial Anomaly Detection

單位:哈工大(左旺孟團隊), 琶洲實驗室

論文:https://arxiv.org/abs/2310.19070

代碼:https://github.com/tzjtatata/Myriad

現有的工業異常檢測(IAD)方法可以預測異常檢測和定位的異常分數。然而,它們很難對異常區域進行多輪對話和詳細描述,例如工業異常的顏色、形狀和類別。

最近,大型多模態(即視覺和語言)模型(LMM)在圖像描述、視覺理解、視覺推理等多種視覺任務上表現出了卓越的感知能力,使其成為更易于理解的異常檢測的有競爭力的潛在選擇。然而,現有的通用 LMM 中缺乏有關異常檢測的知識,而訓練特定的 LMM 進行異常檢測需要大量的注釋數據和大量的計算資源。

本文提出了一種新穎的大型多模態模型,通過應用視覺專家進行工業異常檢測(稱為Myriad),從而實現明確的異常檢測和高質量的異常描述。

8174db1e-8842-11ee-939d-92fbcf53809c.png

具體來說,采用 MiniGPT-4 作為基礎 LMM,并設計一個專家感知模塊,將視覺專家的先驗知識嵌入到大型語言模型(LLM)可以理解的標記中。

817bd270-8842-11ee-939d-92fbcf53809c.png

為了彌補視覺專家的錯誤和困惑,引入了域適配器來彌合通用圖像和工業圖像之間的視覺表示差距。此外,提出了一個視覺專家講師,它使 Q-Former 能夠根據視覺專家先驗生成 IAD 領域視覺語言標記。

實驗結果

在MVTec-AD 和 VisA 基準上的大量實驗表明,本文提出的方法不僅在 1-class 和少樣本設置下比最先進的方法表現更好,而且還提供了明確的異常預測以及 IAD 中的詳細描述領域。

818720f8-8842-11ee-939d-92fbcf53809c.png

8193e388-8842-11ee-939d-92fbcf53809c.png

81d184e0-8842-11ee-939d-92fbcf53809c.png

81ed7236-8842-11ee-939d-92fbcf53809c.png

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3806

    瀏覽量

    52232
  • 視覺
    +關注

    關注

    1

    文章

    181

    瀏覽量

    24852
  • 大模型
    +關注

    關注

    2

    文章

    3727

    瀏覽量

    5258

原文標題:工業異常檢測大模型來了!哈工大提出Myriad:利用視覺專家進行工業異常檢測的大型多模態模型

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    商湯科技日日新V6.5榮獲2025年模態模型全國第一

    近日,權威大模型評測基準 SuperCLUE 發布《中文模態視覺語言模型測評基準12月報告》,商湯日日新V6.5(SenseNova V6
    的頭像 發表于 01-06 14:44 ?880次閱讀
    商湯科技日日新V6.5榮獲2025年<b class='flag-5'>多</b><b class='flag-5'>模態</b>大<b class='flag-5'>模型</b>全國第一

    模態感知大模型驅動的密閉空間自主勘探系統的應用與未來發展

    ? ? 模態感知大模型驅動的密閉空間自主勘探系統 ? ?北京華盛恒輝模態感知大模型驅動的密閉
    的頭像 發表于 12-29 11:27 ?384次閱讀

    商湯科技正式發布并開源全新模態模型架構NEO

    商湯科技正式發布并開源了與南洋理工大學S-Lab合作研發的全新模態模型架構 —— NEO,為日日新SenseNova
    的頭像 發表于 12-08 11:19 ?1126次閱讀
    商湯科技正式發布并開源全新<b class='flag-5'>多</b><b class='flag-5'>模態</b><b class='flag-5'>模型</b>架構NEO

    格靈深瞳模態模型Glint-ME讓圖文互搜更精準

    在電商、安防等場景下,圖文互搜應用廣泛。隨著以CLIP為代表的模態表征方法相繼提出,過去單一模態搜索(文搜文、圖搜圖)被突破,模型可以同時
    的頭像 發表于 11-02 15:56 ?1817次閱讀
    格靈深瞳<b class='flag-5'>多</b><b class='flag-5'>模態</b>大<b class='flag-5'>模型</b>Glint-ME讓圖文互搜更精準

    亞馬遜云科技上線Amazon Nova模態嵌入模型

    Embeddings模態嵌入模型現已在Amazon Bedrock上線,這是一款專為Agentic RAG與語義搜索應用打造的頂尖模態
    的頭像 發表于 10-29 17:15 ?344次閱讀
    亞馬遜云科技上線Amazon Nova<b class='flag-5'>多</b><b class='flag-5'>模態</b>嵌入<b class='flag-5'>模型</b>

    工業視覺網關:RK3576賦能多路檢測與邊緣AI

    工業4.0與智能制造的推動下,產線對檢測效率、良率與可追溯提出了更高要求。傳統IPC方案在通道數、功耗、體積與集成成本之間難以平衡,尤其在 AOI(自動光學檢測)、裝配工序監控、不良
    發表于 10-16 17:56

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    2)滲透式AI的優勢 5、大型模態模型 模態模型
    發表于 09-18 15:31

    米爾RK3576部署端側模態輪對話,6TOPS算力驅動30億參數LLM

    細化需求,系統需實時調整響應策略 1.2 輪對話系統鳥瞰:三顆“核心”協同驅動RK3576 模態交互對話方案基于 RKLLM 的核心運作,依賴于圖像視覺編碼器、大語言
    發表于 09-05 17:25

    如何利用AI算法進行裝置數據的異常檢測

    利用 AI 算法進行裝置數據異常檢測,需結合工業裝置的數據特性(如實時性、源性、強時序性、噪聲
    的頭像 發表于 09-05 15:27 ?2159次閱讀
    如何<b class='flag-5'>利用</b>AI算法<b class='flag-5'>進行</b>裝置數據的<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>?

    淺析模態標注對大模型應用落地的重要性與標注實例

    ”的關鍵工序——模態標注重要性日益凸顯。 一、什么是模態標注? 模態標注是指對文本、圖像、
    的頭像 發表于 09-05 13:49 ?2664次閱讀

    基于米爾瑞芯微RK3576開發板的Qwen2-VL-3B模型NPU模態部署評測

    是對 Qwen2-VL-3B 模態模型進行部署,其中視覺 + 投影組件通過 rknn-toolkit2 導出為 RKNN
    發表于 08-29 18:08

    研華科技攜手創新奇智推出模態模型AI一體機

    這是一款基于研華高性能邊緣計算平臺MIC-733,深度集成創新奇智視覺模型模態模型的邊緣智能終端,通過創新的“
    的頭像 發表于 07-17 17:14 ?1044次閱讀
    研華科技攜手創新奇智推出<b class='flag-5'>多</b><b class='flag-5'>模態</b>大<b class='flag-5'>模型</b>AI一體機

    NVIDIA助力圖靈新訊美推出企業級模態視覺模型融合解決方案

    中國推出企業級模態視覺模型融合解決方案,推動先進 AI 模型在交通治理、工業質檢、金融風控等
    的頭像 發表于 06-26 09:17 ?1473次閱讀

    愛芯通元NPU適配Qwen2.5-VL-3B視覺模態模型

    InternVL2.5-1B/8B/MPO,Huggingface推出的全球最小模態模型SmloVLM-256M。為工業界提供了離線部署
    的頭像 發表于 04-21 10:56 ?3582次閱讀
    愛芯通元NPU適配Qwen2.5-VL-3B<b class='flag-5'>視覺</b><b class='flag-5'>多</b><b class='flag-5'>模態</b>大<b class='flag-5'>模型</b>

    基于MindSpeed MM玩轉Qwen2.5VL模態理解模型

    模態理解模型是讓AI像人類一樣,通過整合多維度信息(如視覺、語言、聽覺等),理解數據背后的語義、情感、邏輯或場景,從而完成推理、決策等任務。
    的頭像 發表于 04-18 09:30 ?3188次閱讀
    基于MindSpeed MM玩轉Qwen2.5VL<b class='flag-5'>多</b><b class='flag-5'>模態</b>理解<b class='flag-5'>模型</b>