国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

半導體缺陷檢測升級:機器學習(ML)攻克類別不平衡難題,小數據也能精準判,降本又提效!

PDF Solutions ? 2025-11-05 11:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、引言

機器學習(ML)在半導體制造領域的應用,正面臨傳統算法難以突破的核心瓶頸。盡管行業能產生海量生產數據,但兩大關鍵問題始終未能有效解決:一是極端類別不平衡,二是初始生產階段訓練數據集匱乏。這兩個問題在半導體測試環節尤為突出 —— 該環節芯片故障率常低于 0.5%,且新產品需在歷史數據極少的情況下,實現實時質量預測。


這一問題的影響極為深遠:若有缺陷的芯片(die)在早期晶圓分選測試中未被檢出,會流入后續高成本加工流程(封裝、最終測試),最終仍會失效,不僅造成巨額成本損失,還會導致工期延誤,而更高效的早期檢測算法本可完全規避此類問題;反之,若合格芯片在晶圓分選階段被誤判為不合格,也會直接造成成本浪費與產能損耗。


近期研究表明,專用機器學習方法已能突破上述限制 ——即便訓練數據嚴重不足,仍能實現顯著的性能提升。其核心在于兩點:一是選擇專為制造場景設計的算法,二是采用貼合實際部署場景的評估方法。


PDF

二、類別不平衡挑戰深度解析


(一)制造數據不平衡的極端性


在工業領域,半導體制造是類別不平衡問題最嚴峻的場景之一。高良率生產環境下,芯片故障率通常低于 1%,部分產品甚至低至 0.5%;若通過軟分箱(soft bin)分類法分析特定失效模式,不平衡問題會進一步加劇 —— 部分失效類型在初始數據集中完全沒有樣本記錄。


這種極端的數據偏差會直接導致傳統機器學習算法 “失效”:傳統模型以 “整體準確率” 為核心優化目標,若分類器對所有樣本一概預測 “合格”,雖能實現 99% 以上的準確率,但二類錯誤(Type II Error,俗稱 “漏檢缺陷”)率會飆升至 100%,這類模型對實際缺陷識別毫無實用價值。


(二)制造時序的制約


半導體數據收集的 “時序性”,進一步放大了類別不平衡問題。生產數據需數月時間才能逐步積累(積累速度取決于生產爬坡率與實際產量),而在初始生產階段,制造商亟需預測模型支撐質量決策,但此時往往缺乏足夠的歷史數據,根本無法訓練傳統機器學習系統。


這便形成了典型的 “雞生蛋” 困境:制造商需要預測模型優化早期生產流程,而傳統機器學習方法又依賴大規模均衡數據集 —— 但這類數據集在早期關鍵階段完全不存在。


PDF

三、制造場景專用算法方案


(一)算法選擇標準


研究團隊針對 59 個生產批次(每批次含 25 片晶圓,單顆芯片的測試參數約 17500 項),開展了系統評估,最終鎖定 3 類算法方案。選擇核心聚焦兩點:一是能有效處理類別不平衡問題,二是具備適配制造環境的計算效率


評估框架采用雙重方法設計:一是 “時間驗證法”(模擬真實生產場景下的模型重訓過程,貼合實際運維需求),二是傳統的 5 折交叉驗證(用于客觀評估模型基準性能)。這種雙重評估模式既確保了算法的落地實用性,又保障了評估方法的科學嚴謹性。


(二)現有基準分類器特性


作為基準的現有分類器(Incumbent Classifier),通過集成提升(boosting)技術,能夠高效應對大規模數據集、數據缺失值與異常值問題。該方法能有效降低模型偏差,并支持增量學習 —— 這一特性對數據持續積累的制造環境至關重要(畢竟生產數據是實時新增的)。


但 boosting 算法也存在明顯短板:在小數據集上極易出現過擬合現象,且訓練過程需消耗大量計算資源,對制造場景的硬件配置有一定要求。


其核心性能指標如下:


具備分布式計算能力,可隨生產規模擴展

支持增量學習,能實時整合新增生產數據

對數據缺失值和異常值的處理能力較強

訓練階段的計算成本相對較高


(三)基于采樣的高級分類器(Classifier-A)


專用算法(分類器 A,Classifier-A)在核心架構中,創新性整合了對多數類(合格芯片樣本)的隨機下采樣策略與少數類(缺陷芯片樣本)的過采樣策略。該設計專門針對半導體測試數據的極端類別不平衡問題,同時還能保持對數據異常值的魯棒性,無需額外增加數據預處理步驟。


其核心性能優勢具體體現在:


通過自動化采樣實現訓練數據內部平衡,全程無需人工干預,降低運維成本

借助隨機特征選擇降低模型方差,減少 “個別異常數據影響整體預測” 的情況

內置正則化機制,增強對數據異常值的抗干擾能力,適配制造場景的復雜數據環境

大幅減少人工超參數調優工作量,從 “反復試錯” 變為 “開箱即用”,加速部署節奏


該算法通過集成技術聚焦方差優化,能顯著提升模型整體準確率,尤其適配制造早期階段的小數據集場景 —— 正好解決了 “初始生產沒數據” 的痛點。


(四)傳統局部信息分類器(Classifier-B)


傳統機器學習方法(分類器 B,Classifier-B)依賴數據點周圍的局部信息做預測決策。盡管這類方法訓練速度快,且支持增量學習,但存在兩大致命局限:一是處理高維測試數據時性能明顯下滑(半導體測試參數多達上萬項,正好命中短板),二是對數據噪聲和異常值高度敏感—— 這些缺陷在制造環境中會直接導致測試準確率大幅下降,難以落地實用。


PDF

四、性能分析與實驗結果


(一)AUC-ROC 性能對比


在模擬小數據集的時序驗證場景下(還原初始生產階段的數據狀態),基于采樣的專用分類器(Classifier-A)表現始終最優:當使用前 10 個批次的數據訓練時,其中位 AUC-ROC 得分比現有基準分類器高約 2 個百分點,缺陷識別能力顯著更強。


dfdf8f3e-b9f8-11f0-8ce9-92fbcf53809c.png

前 10 批次中位 AUC 值均值對比表(數據來源:研究實驗)


更關鍵的是,在訓練初期(數據量最少的時候),專用算法的性能優勢更為顯著 —— 正好匹配 “初始生產階段最缺數據、最需要精準模型” 的場景。隨著訓練數據逐步增加,各算法的性能差距會有所縮小,但專用算法的優勢始終穩定保持,不會出現 “數據多了反而不準” 的情況。


(二)計算效率權衡


運行時間分析結果顯示,算法的訓練速度與推理性能之間存在明顯的權衡關系,具體表現為:


Classifier-B:訓練速度最快,但推理速度最慢(每秒處理的芯片測試量少),難以適配半導體測試的實時性需求(生產線不能等模型“慢慢算”);

現有基準分類器:推理速度略優于Classifier-A,在對實時性要求極高的場景(如高速晶圓測試線)中具備一定優勢;

Classifier-A:推理耗時約為現有基準分類器的 3 倍,但從實際價值看,2個百分點的 AUC 提升能大幅減少漏檢缺陷,避免的下游成本損失,遠超過推理環節的計算開銷。



簡單說:多花一點計算時間,能省一大筆返工成本,這筆 “賬” 對制造商來說很劃算。


(三)統計顯著性與穩定性


為了驗證算法性能的可靠性,時序驗證過程中,研究團隊通過多組不同隨機種子的實驗,量化了算法性能的波動性。結果顯示:無論數據劃分方式、模型初始化條件如何變化,Classifier-A 的性能優勢均保持一致—— 這說明其性能提升是算法本身的穩健性優化帶來的,不是 “碰巧選對了數據集”,落地到不同產線、不同產品時,效果都能穩定復現。


PDF

五、制造場景實施要點


(一)特征工程與篩選


半導體測試數據具有典型的高維特性(每顆芯片約 17500 個測試參數),其中很多參數對缺陷預測毫無意義,因此必須構建穩健的特征篩選流程。有效的實施需滿足兩大核心目標:一是精準篩選出具有強預測信號的特征(留下 “有用的”),二是嚴格控制模型計算復雜度(去掉 “沒用的”),避免在小數據集場景下出現過擬合。


在平衡模型復雜度與可用訓練數據時,參數篩選尤為關鍵。專用算法(如 Classifier-A)通過內置的特征選擇機制,能自主處理高維特征空間,不用工程師手動 “一個個試參數”,大幅減輕人工特征工程的工作量,降低部署難度。


(二)超參數優化


傳統機器學習算法需要大量人工調優超參數(比如學習率、正則化系數),往往要試幾十組甚至上百組參數才能找到最優解,耗時耗力。而專用分類器(如 Classifier-A)內置了方差控制與自動化采樣策略大部分超參數能 “自動適配”,不用工程師反復調試,顯著降低部署復雜度,實現 “快速上線、快速用”。


更重要的是,其內置的正則化機制能同時實現 “防止過擬合” 與 “保留少數類(缺陷樣本)模式敏感性”——這一平衡是半導體缺陷檢測的核心需求:既不能 “把合格的判成缺陷”(過擬合導致誤判),也不能 “把缺陷的當成合格”(對少數類不敏感導致漏檢)。


(三)與現有系統集成


現代制造場景不是 “重新建一套系統”,而是 “在現有基礎上升級”,因此算法必須能與現有數據處理、決策系統無縫銜接。專用算法支持增量學習:隨著生產數據的持續積累,模型能實現動態迭代優化,不用 “推倒重來” 做全量重訓,完全適配制造運營的時序需求。


這種特性帶來的好處是:從生產爬坡期到滿產期,模型能跟著數據 “一起成長”,不用工程師頻繁停機更新模型,為 “從生產爬坡到滿產” 的全階段,提供了可持續的模型維護方案,不會影響生產線正常運行。


PDF

六、業務價值與成本影響


(一)早期缺陷檢測的核心價值


專用算法的核心價值,在于 “把缺陷檢測的時間點提前”—— 在晶圓分選階段(而非最終測試階段)就精準識別潛在失效芯片,避免對失效芯片進行后續高成本加工(封裝、組裝的成本比晶圓測試高 10 倍以上)。


考慮到封裝和最終測試環節的高昂成本,即便早期檢測準確率僅實現小幅提升(比如 2 個百分點),也能為企業帶來顯著的成本節約,相當于 “花小錢,省大錢”。


(二)縮短投資回報周期


采用專用類別不平衡算法后,制造商從生產第一天起就能獲得可用的預測模型,不用像傳統方法那樣,等數月積累均衡訓練數據 ——這一特性可即時為質量決策提供支撐,顯著縮短 AI/ML 項目的投資回報周期(比如從 6 個月縮短到 1 個月),讓技術投入更快看到收益。


對制造商來說,這意味著 “新產品一投產,AI 就能用”,不用承擔 “等待數據期間的質量風險”,還能加速技術價值轉化。


(三)減少下游浪費


晶圓分選到最終測試的預測準確率提升,能直接減少下游加工浪費:避免缺陷芯片流入高成本制造環節,不用再做 “無用功”。Classifier-A 等專用算法能精準識別 “難判樣本”(比如參數接近合格線的芯片),同時降低一類錯誤(誤拒合格芯片)與二類錯誤(漏檢缺陷芯片)的發生率 ——既不浪費好芯片,也不放走壞芯片,工程實用價值顯著


PDF

七、未來方向與可擴展性


(一)數據增長與模型演進


隨著制造產量的提升、生產數據的持續積累,專用算法的增量學習能力可支持模型實現動態迭代優化,不用全量重訓—— 這種模式既能以低成本實現模型維護(不用每次都花大量計算資源訓模型),又能保留早期學習成果,確保模型性能隨數據積累穩步提升,不會出現 “數據多了性能反而倒退” 的情況。


(二)集成方法探索


當前單一專用算法(如 Classifier-A)已展現出顯著的性能優勢,未來可進一步探索 “多專用分類器集成” 方案(比如讓 Classifier-A 與其他算法 “協同工作”)。但需要注意的是:Classifier-A 等專用算法已內置集成技術,外部集成策略可能難以帶來額外的性能增益,后續需要結合實際制造場景(如不同芯片類型、不同測試設備)開展驗證,不能盲目 “為了集成而集成”


(三)制造場景 AI 部署優化


dfef8894-b9f8-11f0-8ce9-92fbcf53809c.png


PDF

八、結論


半導體行業的獨特約束 ——數據收集的時效性(數據慢積累)、極端類別不平衡(缺陷太少)、對預測模型的即時需求(投產就要用)—— 要求行業必須采用超越傳統算法的專用機器學習方法。研究結果明確表明:精心選擇的專用算法,即便在訓練數據嚴重不足的情況下,仍能實現顯著的性能提升,不是 “紙上談兵”,而是 “能落地用”。


專用類別不平衡算法帶來的 2 個百分點 AUC 提升,可直接轉化為三大核心價值:制造成本降低(少返工、少浪費)、質量控制改善(漏檢少、誤判少)、AI 投資回報加速(早用早收益)。隨著行業持續擴大人工智能應用規模,這類專用方法將成為突破制造環境固有數據局限性的核心工具,不是 “可選方案”,而是 “必選方案”。


從工程實踐角度看,半導體制造場景的 AI 應用,不能 “照搬互聯網行業的模型”,必須跳出傳統機器學習的固有框架,采用專為制造約束設計的算法。大量研究證據表明,在半導體測試場景中應用專用類別不平衡技術,既能快速創造業務價值(投產就能省成本),又能為后續數據積累后的模型優化筑牢基礎,實現 “短期見效、長期向好” 的目標。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 半導體
    +關注

    關注

    339

    文章

    30719

    瀏覽量

    263990
  • 檢測
    +關注

    關注

    5

    文章

    4856

    瀏覽量

    94134
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136928
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何理解矢量測量中“平衡”與“不平衡

    在矢量測試中,經常需要測量信號的不平衡性,會遇到相關的幾個名詞:Balance(平衡),Unbalance(不平衡/非平衡)和Imbalance(
    發表于 03-29 10:51 ?3594次閱讀
    如何理解矢量測量中“<b class='flag-5'>平衡</b>”與“<b class='flag-5'>不平衡</b>

    三相不平衡的原因、危害以及解決措施

    ,以便于及時發現一些三相的不平衡狀況。當在檢測過程中發現有安全隱患的部位,要及時的進行調整和修改。對于檢測過程中未發現問題的部位,應當提高瞽惕。在
    發表于 04-22 22:00

    三相不平衡治理裝置的應用優勢

    市場需求優勢引言:由于由于電力電子技術的快速發展,電網中出現了大量非線性負載和不平衡負荷(如LED燈、UPS、變頻器等)以及新的發電方式與儲方式的推廣使用(其中有大量的整流與逆變器),出現大量三相不平衡
    發表于 02-18 13:06

    天線與饋線匹配中的平衡不平衡變換有什么區別?

    (不對稱)饋線,其內導體是饋電點,而外導體是地線點,不參與饋電。所以就算天線的特性租抗與同軸電纜相同不能直接連接,否則,會破壞天線的對稱性,使天線兩臂上的電流大小不等,這種不平衡性會
    發表于 08-13 06:32

    怎么解決變頻器電流不平衡的問題

    載成為可能的操作條件。在這種情況下,即使是NEMA規范內的電壓不平衡會導致不平衡的電流相位與最高線電壓同相,從而提供大部分電流。這是由于整流器的設計,其像止回閥那樣通過電流,并且供電功率從正負(AC
    發表于 01-19 15:36

    基于主動學習不平衡多分類AdaBoost改進算法

    ,基于不確定性動態間隔的樣本選擇策略,降低訓練集的不平衡性;最后,利用代價敏感方法對多分類AdaBoost算法進行改進,對不同的類別給予不同的錯分代價,調整樣本權重更新速度,強迫弱分類器關注小類樣本。在臨床經胸超聲心動圖(TTE)測量
    發表于 11-30 17:12 ?3次下載

    不平衡類別機器學習

    前一項后一項 本作品采用知識共享"署名-非商業使用-禁止演繹 2.5 中國大陸"許可協議授權 訂閱最新更新! 不平衡類別機器學習 作者:燕繼坤 提交人:yanjk (2004年10月
    發表于 06-27 18:32 ?465次閱讀

    手把手教你解決-深度學習訓練數據不平衡問題

    當我們解決任何機器學習問題時,我們面臨的最大問題之一是訓練數據不平衡不平衡數據的問題在于學術界
    的頭像 發表于 07-24 13:34 ?8997次閱讀

    教你如何處理不平衡數據

    在分析用于分類的數據集時,類別不平衡是常見問題之一。
    的頭像 發表于 06-07 11:27 ?5564次閱讀
    教你如何處理<b class='flag-5'>不平衡</b><b class='flag-5'>數據</b>集

    三相電壓不平衡產生原因_三相電壓不平衡的治理措施

    電力系統中三相電壓不平衡產生的主要原因是負荷的不平衡和系統阻抗的不平衡。其中負荷的不平衡是造成三相電壓不平衡的主要原因,比較明顯的單相負荷由
    的頭像 發表于 10-28 16:43 ?2.7w次閱讀

    機器學習中樣本比例不平衡應該怎樣去應付

    這種現象往往是由于本身數據來源決定的,如信用卡的征信問題中往往就是正樣本居多。樣本比例不平衡往往會帶來不少問題,但是實際獲取的數據往往是不平衡
    發表于 03-30 09:57 ?1457次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>中樣本比例<b class='flag-5'>不平衡</b>應該怎樣去應付

    基于有效樣本的類別不平衡損失

    樣本數的類平衡損失(CB損失)。在本文中,設計了一種重新加權的方案,利用每個類的有效樣本數來重新平衡損失,稱為類別平衡損失。 1. 類別
    的頭像 發表于 08-16 11:14 ?2404次閱讀
    基于有效樣本的<b class='flag-5'>類別</b><b class='flag-5'>不平衡</b>損失

    三相電壓不平衡是什么原因造成的?三相不平衡會跳閘嗎?

    ,產生過電流、過熱和損壞等問題。因此,要保持電力系統的穩定性和可靠性,必須了解三相電壓不平衡的原因和如何進行檢測和控制。 三相電壓不平衡的原因主要有以下幾個方面: 1. 線路電阻和電感不平衡
    的頭像 發表于 09-25 17:36 ?1.2w次閱讀

    三相不平衡最佳解決辦法 三相不平衡多少范圍內是合理的

    電力系統的穩定運行和設備的正常工作非常重要。本文將介紹一些解決三相不平衡的最佳方法。 檢測和監測三相不平衡 解決三相不平衡的第一步是檢測和監
    的頭像 發表于 02-06 10:07 ?6286次閱讀

    平衡電阻器可以改為不平衡

    在電子電路中,平衡電阻器與不平衡電阻器各自扮演著重要的角色。平衡電阻器主要用于實現電路的平衡和穩定性,減少噪音和干擾,提高信號質量。而不平衡
    的頭像 發表于 01-30 14:31 ?2061次閱讀