国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

GPT-4V在異常檢測上有多少強?華科大等最新測評來了!

CVer ? 來源:機器之心 ? 2023-11-13 16:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

異常檢測任務旨在識別明顯偏離正常數(shù)據(jù)分布的異常值,在工業(yè)檢驗、醫(yī)學診斷、視頻監(jiān)控和欺詐檢測等多個領域都發(fā)揮了重要作用。傳統(tǒng)的異常檢測方法主要依賴于描述正常數(shù)據(jù)分布以進行正異常樣本的區(qū)分。然而,對于實際的應用而言,異常檢測也需要理解數(shù)據(jù)的高層語義,從而深入理解 “什么是異常”。

要實現(xiàn)更準確且智能的異常檢測,我們需要關注以下關鍵步驟:

1. 理解多樣數(shù)據(jù)類型和類別

不同領域的數(shù)據(jù)集包含各種數(shù)據(jù)類型和類別,如圖像、視頻、點云、時間序列等。每種數(shù)據(jù)類型可能需要不同的異常檢測方法,每個物體類別可能對應不同的正常標準,因此深入理解數(shù)據(jù)的多樣性至關重要。

2. 確定正常狀態(tài)標準

一旦理解了數(shù)據(jù)的類型和類別,我們需要推斷正常狀態(tài)的標準。這需要高級數(shù)據(jù)語義信息的理解,以確保我們能夠正確識別正常數(shù)據(jù)的特征和模式。

3. 評估數(shù)據(jù)的符合度

最后,我們需要評估提供的數(shù)據(jù)是否符合已建立的正常數(shù)據(jù)分布。任何偏離這些數(shù)據(jù)分布的情況都可以被歸類為異常。

最近,大型多模態(tài)模型(LMM)迅猛發(fā)展,其中 OpenAI 最近推出的 GPT-4V (ision) 表現(xiàn)最為出色,具有強大的多模態(tài)感知能力,在場景理解,圖片生成等多個任務中都取得了良好表現(xiàn)。我們認為,LMM 的出現(xiàn)為通用異常檢測的研究提供了新的范式和新的機會。

為了評估 GPT-4V 在通用異常檢測中的性能,來自華中科技大學、密歇根大學和多倫多大學的研究者聯(lián)合進行了一項研究,在涉及 4 個數(shù)據(jù)模態(tài),9 個異常檢測任務的 15 個異常檢測數(shù)據(jù)集上對 GPT-4V 進行了全面的測試。具體而言,測試的數(shù)據(jù)集包括圖像、點云、視頻、時序等模態(tài),并涵蓋了工業(yè)圖像異常檢測 / 定位,醫(yī)療圖像異常檢測 / 定位,點云異常檢測,邏輯異常檢測,行人異常檢測,交通異常檢測,時序異常檢測等 9 個異常檢測任務。

bfec7a86-81ef-11ee-939d-92fbcf53809c.png

論文地址:https://arxiv.org/pdf/2311.02782.pdf

項目地址:https://github.com/caoyunkang/GPT4V-for-Generic-Anomaly-Detection

c00701b2-81ef-11ee-939d-92fbcf53809c.png

觀察與分析

本文在多種模態(tài)和領域的異常檢測數(shù)據(jù)集上對 GPT4V 的性能進行了測試。我們認為,GPT4V 已經(jīng)初步具備了多模態(tài)的通用異常檢測能力。具體而言,GPT-4V 不僅能夠有效理解多樣數(shù)據(jù)類型和類別,而且可以建模正常數(shù)據(jù)的空間分布,并評估測試數(shù)據(jù)的分布情況。

除此以外,GPT-4V 在異常檢測任務中還具有以下特點:

GPT-4V 能夠在零 / 單樣本下處理多模態(tài)、多領域的異常檢測任務

多模態(tài)異常檢測:GPT-4V 可有效處理多種模態(tài)數(shù)據(jù)的異常檢測任務。例如,它在識別圖像、點云、MRI、X-ray 等數(shù)據(jù)模態(tài)上均表現(xiàn)出了不俗的異常檢測能力。多模態(tài)異常檢測能力使 GPT-4V 能夠突破傳統(tǒng)單模態(tài)異常檢測器的限制,完成現(xiàn)實世界的復雜異常檢測任務。

多領域異常檢測:GPT-4V 在工業(yè)、醫(yī)療、行人、交通和時間序列異常檢測等多個領域表現(xiàn)優(yōu)異。

零 / 單樣本下的異常檢測:GPT-4V 在零樣本及單樣本(即提供了一張正常的參考圖片)任務中均表現(xiàn)不俗。在沒有參考圖像的情況下,GPT-4V 可以有效地使用語言提示信息來檢測異常。當提供正常參考圖像時,GPT-4V 能夠更好的對齊文本格式的正常標準與正常的圖像內(nèi)容,其異常檢測準確性進一步提高。

GPT-4V 可以理解異常檢測任務所需的全局和細粒度語義

全局語義理解能力:GPT-4V 對全局語義的理解能力表現(xiàn)在它能夠識別整體的異常模式或行為。例如,在交通異常檢測中,它可以分辨正常的交通流和不規(guī)則事件之間的區(qū)別,并且提供了關于異常檢出的詳細解釋。這種全局理解使其非常適合在開放世界中識別偏離正常分布的異常點。

細粒度語義理解能力:GPT-4V 對細粒度語義的理解能力在一些情況下表現(xiàn)出色,使得它不僅能夠檢測異常,還能夠精確地在復雜數(shù)據(jù)中定位異常。例如,在工業(yè)圖像異常檢測中,它可以準確定位細節(jié),如傾斜的蠟燭燭芯、瓶口周圍的輕微劃痕。這種細粒度理解增強了它在復雜數(shù)據(jù)中檢測微小異常的能力,從而提高了其整體檢測。

GPT-4V 具備自動推理異常檢測的能力

GPT-4V 能夠根據(jù)復雜的正常標準自動推理、拆分子任務。例如,在邏輯異常檢測中,GPT-4V 能夠理解所給的正常圖像標準,并拆分為子任務,依次檢驗圖像內(nèi)容是否滿足指定內(nèi)容。這種內(nèi)在的推理能力增強了其異常檢測結果的可解釋性,使其成為理解和解決通用異常檢測的有效工具。

GPT-4V 可以通過增加提示進一步增強異常檢測能力

評估結果顯示,提供更多文本和圖像信息對 GPT-4V 的異常檢測性能有積極影響。通過增加類別信息、人類專業(yè)知識、參考圖像,模型獲得了更多的上下文信息,異常檢測性能也得到顯著提升。該特點允許用戶通過提供相關的補充信息來微調(diào)和增強模型的性能。

GPT-4V 在實際應用中可能受到限制,但仍具有潛力

本報告發(fā)現(xiàn) GPT-4V 在實際應用中仍面臨一些挑戰(zhàn)。例如,GPT-4V 可能在處理工業(yè)應用中的復雜場景時面臨困難,導致其出現(xiàn)錯誤檢測。醫(yī)療領域的倫理約束也使其在判斷腫瘤等異常情況時趨于保守。但我們相信它在各種異常檢測任務中仍然具有潛力。為了有效解決這些挑戰(zhàn),可能需要進一步增強、專門的精細調(diào)整或補充技術。總結而言,GPT-4V 在通用異常檢測中具有明顯潛力,有望開啟異常檢測任務的高層次感知時代。

應用場景展示

工業(yè)圖像異常檢測

工業(yè)圖像異常檢測旨在維護產(chǎn)品質(zhì)量,是制造過程的重要環(huán)節(jié)。近年來,許多方法在此領域蓬勃發(fā)展,其中一些方法著眼于開發(fā)適用于任意產(chǎn)品類別的統(tǒng)一模型。本研究探討了 GPT-4V 在工業(yè)圖像異常檢測中的應用,包括對不同類型的信息進行測試,以及展示其性能和局限性。

我們從工業(yè)圖像中選擇了幾個示例,如瓶子和蠟燭的圖像。即使只提供簡單的語言提示,GPT-4V 能夠有效地識別這些圖像中的異常,展示了其能力和多樣性。此外,GPT-4V 不僅能夠檢測期望的異常,還能夠識別微觀結構異常。在復雜情況下,如電路板中的異常檢測,GPT-4V 能夠識別圖像中的細節(jié),但也存在一定的局限性。總的來說,GPT-4V 在圖像上下文理解和類別特定異常理解方面表現(xiàn)出色。

c031e198-81ef-11ee-939d-92fbcf53809c.png

c05db1f6-81ef-11ee-939d-92fbcf53809c.png

工業(yè)圖像異常定位

與工業(yè)圖像異常檢測不同,工業(yè)圖像異常定位旨在精確識別異常的位置。為了實現(xiàn)這一目標,我們采用了與 SoM(Set-of-mark)類似的方法,使用圖像 - 掩模對來提示 GPT-4V。我們研究了 GPT-4V 在不同場景下的表現(xiàn),展示了其在細粒度異常定位方面的能力和局限性。

我們展示了 GPT-4V 在工業(yè)圖像異常定位中的性能,包括定位彎曲的電線、堅果上的空洞以及識別電路板異常。GPT-4V 在一些情況下能夠準確識別異常位置,例如能夠有效定位堅果中的空洞,并且由于結合了視覺提示技術,GPT-4V 將異常定位問題轉化為了對掩膜的分類問題,有效降低了問題復雜度,且提升了定位精度。因此,結合視覺提示技術和 GPT-4V 可有效解決工業(yè)圖像異常定位問題。

c0905b38-81ef-11ee-939d-92fbcf53809c.png

點云異常檢測

點云異常檢測在工業(yè)領域具有重要作用。CPMF 提出了一種新方法,將點云轉化為深度圖像,以利用圖像基礎模型來提高點云異常檢測的性能。我們借助 CPMF,將點云轉為深度圖像,從而使得 GPT-4V 可處理點云異常檢測任務。

我們展示了 GPT-4V 在點云異常檢測中的性能,包括識別袋圈中的小突起、檢測繩子上的異常以及查找工件中的異常。GPT-4V 能夠有效地識別這些異常,但在某些情況下也存在局限性,特別是在渲染質(zhì)量較低的情況下。總的來說,GPT-4V 在點云異常檢測中表現(xiàn)出了潛力。

c0c3a0d8-81ef-11ee-939d-92fbcf53809c.png

c0f0c914-81ef-11ee-939d-92fbcf53809c.png

邏輯異常檢測

邏輯異常檢測任務由 MVTec LOCO 數(shù)據(jù)集提出。該任務通常出現(xiàn)在裝配過程中,需要識別各個組件是否正確組合。現(xiàn)有的邏輯異常檢測方法通常依賴于視覺全局 - 局部對應關系,但本質(zhì)上并沒有真正理解圖像內(nèi)容。我們研究了 GPT-4V 在邏輯異常檢測中的應用,探討了其對圖像內(nèi)容的理解能力。

我們展示了 GPT-4V 在邏輯異常檢測中的性能,包括識別復雜的邏輯規(guī)則、檢測邏輯異常并提供詳細的解釋。盡管 GPT-4V 在大多數(shù)情況下能夠準確識別邏輯異常,但在某些復雜情況下存在一定的局限性,尤其是對于細節(jié)問題。不過,結合多輪對話和特定語言提示有望顯著改善 GPT-4V 在這些情況下的性能。

c11ebae0-81ef-11ee-939d-92fbcf53809c.png

醫(yī)學圖像異常檢測

醫(yī)學圖像異常檢測是醫(yī)學影像領域的關鍵任務,旨在識別不符合預期數(shù)據(jù)分布的異常值。我們研究了 GPT-4V 在醫(yī)學圖像異常檢測中的應用,包括不同疾病和成像模式的醫(yī)學圖像。我們測試了 GPT-4V 的泛化能力,揭示了其在醫(yī)學圖像異常檢測中的性能和局限性。

我們展示了 GPT-4V 在醫(yī)學圖像異常檢測中的性能,包括識別不同疾病和成像模式的異常圖像。即使只提供簡單的語言提示,GPT-4V 能夠有效地識別異常,并提供詳細的解釋。此外,引入更多信息,如疾病信息和專業(yè)知識,可以進一步提高 GPT-4V 的性能。然而,GPT-4V 在某些情況下可能會產(chǎn)生錯誤的異常檢測,因此仍需要醫(yī)生的最終判斷。

c14f9ca0-81ef-11ee-939d-92fbcf53809c.png

c1792f98-81ef-11ee-939d-92fbcf53809c.png

醫(yī)學圖像異常定位

在檢測到醫(yī)學異常后,需要進一步精確定位醫(yī)學圖像中存在的異常,例如病灶等。對醫(yī)學圖像異常的準確的定位可有效幫助臨床醫(yī)生理解病理的程度和性質(zhì)。然而,在現(xiàn)實世界的醫(yī)學圖像異常定位任務中使用 GPT-4V 直接預測異常掩膜十分困難。受到 SoM 的啟發(fā),我們希望測試 GPT-4V 模型在視覺提示下的異常定位能力。

結合 SoM,我們標定了醫(yī)療圖像中可能存在的異常位置。在圖像中的視覺提示指導下,GPT-4V 傾向于學習和描述標記周圍的區(qū)域。對于容易識別和定位的案例,GPT-4V 可以清楚地區(qū)分異常區(qū)域和背景。但在一個人工合成異常的案例中,由于感興趣區(qū)域與背景具有相似的紋理和形狀,GPT4V 的判斷出現(xiàn)了偏差。這表明該模型在對抗攻擊和復雜背景下仍需要增強其檢測和定位能力。

c19e6cea-81ef-11ee-939d-92fbcf53809c.png

交通檢測

交通檢測是城市交通管理和自動駕駛領域的關鍵任務,它旨在監(jiān)測交通情況,檢測交通違規(guī)行為和危險情況。我們研究了 GPT-4V 在交通檢測中的應用,包括車輛識別、交通標志識別和交通違規(guī)檢測。我們測試了 GPT-4V 在不同場景下的性能,展示了其潛力和局限性。

我們展示了 GPT-4V 在交通檢測中的性能,包括識別不同類型的車輛、檢測各種交通標志和識別交通違規(guī)行為。GPT-4V 能夠有效地處理這些任務,尤其是在規(guī)范場景下。然而,在復雜交通環(huán)境中,性能可能會下降,因為它需要理解并解釋復雜的情境。

c1c04f68-81ef-11ee-939d-92fbcf53809c.png

行人檢測

行人檢測是自動駕駛、安全監(jiān)控和智能城市等領域的關鍵任務,它旨在識別圖像或視頻中的行人。我們研究了 GPT-4V 在行人檢測中的應用,測試了其對行人的識別能力和性能。

我們展示了 GPT-4V 在行人檢測中的性能,包括檢測行人在不同背景下的能力。GPT-4V 通常能夠識別行人,但在復雜背景下可能會出現(xiàn)錯誤。與專門的行人檢測模型相比,性能可能相對較差,但它的優(yōu)勢在于它能夠提供更多的語言解釋。

c1f6324a-81ef-11ee-939d-92fbcf53809c.png

時序檢測

時序檢測是一種涉及到時間序列數(shù)據(jù)的異常檢測任務,例如傳感器數(shù)據(jù)、金融時間序列等。我們研究了 GPT-4V 在時序檢測中的應用,測試了其在分析和檢測時間序列異常方面的能力。

我們展示了 GPT-4V 在時序檢測中的性能,包括檢測傳感器數(shù)據(jù)中的異常、金融交易數(shù)據(jù)中的異常等。GPT-4V 在分析時間序列數(shù)據(jù)方面表現(xiàn)出色,能夠識別不同類型的異常情況。然而,需要注意的是,時序檢測通常需要更多的領域專業(yè)知識,而 GPT-4V 在這些情況下可能需要結合專家的建議。

c224a99a-81ef-11ee-939d-92fbcf53809c.png

結論

GPT-4V 在工業(yè)圖像異常檢測、工業(yè)圖像異常定位、點云異常檢測、邏輯異常檢測、醫(yī)學圖像異常檢測、交通檢測、行人檢測和時序檢測等領域都展示出了出色的潛力。它能夠理解多模態(tài)數(shù)據(jù),對圖像內(nèi)容進行有效理解,并在很多情況下都能準確檢測并解釋異常。然而,在復雜場景中,GPT-4V 的異常檢測能力仍然存在一定的局限性。綜合來看,GPT-4V 為通用異常檢測提供了全新的研究范式,但其實際應用仍需要進一步的研究和改進。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)集

    關注

    4

    文章

    1236

    瀏覽量

    26196
  • GPT
    GPT
    +關注

    關注

    0

    文章

    368

    瀏覽量

    16873
  • OpenAI
    +關注

    關注

    9

    文章

    1245

    瀏覽量

    10073

原文標題:GPT-4V在異常檢測上有多少強?華科大等最新測評來了!

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    智芯公司RISC-V實時CPU芯片通過賽西實驗室權威檢測

    近日,智芯公司研發(fā)的RISC-V實時CPU芯片成功通過工信部中國電子技術標準化研究院賽西實驗室(CESI)的權威檢測,這標志著智芯公司基于RISC-
    的頭像 發(fā)表于 12-19 14:55 ?531次閱讀

    GPT-5.1發(fā)布 OpenAI開始拼情商

    -5.1 Thinking:高級推理模型,簡單任務上更快,復雜任務上更持久,也更容易理解。 對于新上線的GPT-5.1大模型,OpenAI?官方表示出色的 AI 不僅是要夠聰明,還要讓人與之對
    的頭像 發(fā)表于 11-13 15:49 ?704次閱讀

    時間同步測試儀檢測電能質(zhì)量裝置時鐘同步異常時有哪些優(yōu)勢?

    時間同步測試儀檢測電能質(zhì)量裝置時鐘同步異常時,核心優(yōu)勢在于 專業(yè)性、精度高、功能全面且場景適配性好 ,能覆蓋 “多協(xié)議兼容、偏差精準測量、異常
    的頭像 發(fā)表于 10-22 14:29 ?372次閱讀

    【作品合集】玄鐵BPI-CanMV-K230D-Zero開發(fā)板測評

    玄鐵BPI-CanMV-K230D-Zero開發(fā)板測評作品合集 產(chǎn)品介紹: Banana Pi BPI-CanMV-K230D-Zero 采用嘉楠科技 K230D RISC-V芯片設計,探索
    發(fā)表于 09-18 10:13

    【作品合集】群芯閃耀Milk-V Duo S 開發(fā)板測評

    群芯閃耀Milk-V Duo S開發(fā)板測評作品合集 產(chǎn)品介紹: Milk-V Duo S 是 Duo 的升級型號,配備升級版 SG2000 主控制器、更大的 512MB 內(nèi)存和更豐富的輸入/輸出功能
    發(fā)表于 09-16 11:03

    【作品合集】合眾HZ-T536開發(fā)板測評

    合眾HZ-T536開發(fā)板測評作品合集 產(chǎn)品介紹: HZ-T536_MiniEVM是一款基于全志T536系列處理器設計的工業(yè)評估板,集成了4核Cortex-A55和RISC-V E907協(xié)處理器。該
    發(fā)表于 09-12 09:37

    【RA4E2開發(fā)板評測】PWM 驅動舵機

      本篇使用 RA4E2 的 PWM 輸出,來驅動舵機轉動,使用 RA4E2 驅動舵機非常方便,只要配置好 GPT PWM 模塊,就能輕松實現(xiàn)角度控制。 硬件準備 1、RA4E2 開發(fā)
    發(fā)表于 09-09 15:13

    如何利用AI算法進行裝置數(shù)據(jù)的異常檢測

    利用 AI 算法進行裝置數(shù)據(jù)異常檢測,需結合工業(yè)裝置的數(shù)據(jù)特性(如實時性、多源性、時序性、噪聲干擾)和業(yè)務需求(如故障預警、安全合規(guī)、工藝優(yōu)化),通過 “數(shù)據(jù)預處理 - 算法選型 - 模型部署
    的頭像 發(fā)表于 09-05 15:27 ?1860次閱讀
    如何利用AI算法進行裝置數(shù)據(jù)的<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>?

    【RA4M2-SENSOR】3、使用GPT定時器-PWM輸出

    GPT介紹 通用 PWM 定時器(GPT,General PWM Timer)是 RA MCU 的其中一種 32/16 位的定時器外設。 GPT 當中,可分為
    發(fā)表于 09-01 15:20

    IGBT 樣品異常檢測案例解析

    通過利用Thermal EMMI(熱紅外顯微鏡)去檢測IGBT 樣品異常
    的頭像 發(fā)表于 08-15 09:17 ?1903次閱讀
    IGBT 樣品<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>案例解析

    機器學習異常檢測實戰(zhàn):用Isolation Forest快速構建無標簽異常檢測系統(tǒng)

    本文轉自:DeepHubIMBA無監(jiān)督異常檢測作為機器學習領域的重要分支,專門用于缺乏標記數(shù)據(jù)的環(huán)境中識別異常事件。本文深入探討異常
    的頭像 發(fā)表于 06-24 11:40 ?1414次閱讀
    機器學習<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>實戰(zhàn):用Isolation Forest快速構建無標簽<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>系統(tǒng)

    提高IT運維效率,深度解讀京東云AIOps落地實踐(異常檢測篇)

    基于深度學習對運維時序指標進行異常檢測,快速發(fā)現(xiàn)線上業(yè)務問題 時間序列的異常檢測是實際應用中的一個關鍵問題,尤其是 IT 行業(yè)。我們沒有采
    的頭像 發(fā)表于 05-22 16:38 ?1030次閱讀
    提高IT運維效率,深度解讀京東云AIOps落地實踐(<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>篇)

    秋DFM】V4.6正式上線:工程師的PCB設計“好搭子”來了

    /焊接生產(chǎn)細節(jié),讓設計優(yōu)化有的放矢。 操作體驗方面,秋DFM兼顧專業(yè)深度與操作便捷;新手工程師可通過直觀界面快速完成基礎檢測,資深工程師則可根據(jù)經(jīng)驗實現(xiàn)精細分析和優(yōu)化。其特有的生
    發(fā)表于 05-22 16:07

    德州儀器與盛昌發(fā)布AFD-80拉弧信號檢測

    今年慕尼黑上海電子展期間,德州儀器 (TI) 與深圳市盛昌科技實業(yè)股份有限公司(后簡稱“盛昌”)發(fā)布了AFD-80拉弧信號檢測器,適用于光伏發(fā)電系統(tǒng)中智能電弧故障
    的頭像 發(fā)表于 04-18 14:37 ?1589次閱讀
    德州儀器與<b class='flag-5'>華</b>盛昌發(fā)布AFD-80拉弧信號<b class='flag-5'>檢測</b>器

    如何設計基于AI的異常檢測解決方案

    汽車制造部門一直致力于提高產(chǎn)品質(zhì)量和最小化運營費用之間實現(xiàn)平衡。基于 AI 的異常檢測是一種識別機器數(shù)據(jù)中的不規(guī)則模式以潛在問題發(fā)生前預測這些問題的方法,它是對提高流程效率、減少停
    的頭像 發(fā)表于 03-20 15:26 ?1212次閱讀