国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習中賦予了什么數學意義

姚小熊27 ? 來源:雷鋒網 ? 作者:雷鋒網 ? 2020-10-14 09:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機器學習中的用于聲稱性能的指標標準很少被討論。由于在這個問題上似乎沒有一個明確的、廣泛的共識,因此我認為提供我一直在倡導并盡可能遵循的標準可能會很有趣。它源于這個簡單的前提,這是我的科學老師從中學開始就灌輸給我的:

科學報告的一般規則是,您寫下的每個數字都應為“真”的,因為“真”的定義是什么。

讓我們來研究一下這對測試性能等統計量意味著什么。當你在科學出版物中寫下以下陳述時:

測試準確率為52.34%。你所表達的是,據你所知,你的模型在從測試分布中提取的未見數據上成功的概率在0.52335和0.52345之間。

這是一個非常強有力的聲明。

考慮你的測試集是從正確的測試分布中抽取的N個樣本IID組成的。成功率可以表示為一個二項式變量,其平均概率p由樣本平均值估計:p?s/N

其標準差為:σ=√p(1-p)。

其中當p=0.5時,其上限為0.5。

在正態近似下,估計量的標準差為:δ=σ/√N。

這個精度估計上的誤差δ是這樣的,在最壞的情況下,有約50%的精度:

換句話說,為了保證上述報告中例子52.34%的準確率,你的測試集的大小至少應該在30M樣本的數量級上!這種粗略的分析很容易轉化為除了準確率以外的任何可計算的數量,盡管不能轉化為像似然率或困惑度這樣的連續數字。

下面是一些常見的機器學習數據集的說明。

在ImageNet上可以合理地報告多少位數的精度?準確率在80%左右,測試集是15萬張圖片:

√(0.8*0.2/150000)=0.103%

這意味著你幾乎可以報告XX.X%的數字,而實際上每個人都是這樣做的。

MNIST呢,準確率在99%:

√(0.99*0.01/10000)=0.099%

噗,也報個XX.X%就OK了!

然而,最值得注意的是,在大多數情況下,性能數據并不是單獨呈現的,而是用來比較同一測試集上的多種方法。在這種情況下,實驗之間的抽樣方差會被抵消,即使在樣本量較小的情況下,它們之間的準確度差異也可能在統計學上很顯著。估計圖方差的一個簡單方法是執行bootstrap重采樣。更嚴格、通常更嚴格的檢驗包括進行配對差異檢驗或更普遍的方差分析。

報告超出其內在精度的數字可能很具有極大的吸引力,因為在與基線進行比較的情況下,或者當人們認為測試集是一成不變的情況下,同時也不是從測試分布中抽取的樣本時,性能數字往往更加重要。當在生產中部署模型時,這種做法會讓人感到驚訝,并且固定的測試集假設突然消失了,還有一些無關緊要的改進。更普遍的是,這種做法會直接導致對測試集進行過擬合。

那么,在我們的領域中數字為“真”意味著什么?好吧,這確實很復雜。對于工程師而言,很容易辯稱不應該報告的尺寸超出公差。或者對于物理學家來說,物理量不應超過測量誤差。對于機器學習從業者,我們不僅要應對測試集的采樣不確定性,而且還要應對獨立訓練運行,訓練數據的不同初始化和改組下的模型不確定性。

按照這個標準,在機器學習中很難確定哪些數字是“真”的。解決辦法當然是盡可能地報告其置信區間。置信區間是一種更精細的報告不確定性的方式,可以考慮到所有隨機性的來源,以及除簡單方差之外的顯著性檢驗。它們的存在也向你的讀者發出信號,表明你已經考慮過你所報告的內容的意義,而不僅僅是你的代碼所得到的數字。用置信區間表示的數字可能會被報告得超出其名義上的精度,不過要注意的是,你現在必須考慮用多少位數來報告不確定性,正如這篇博文所解釋的那樣。一路走來都是烏龜。

數字少了,雜亂無章的東西就少了,科學性就強了。

避免報告超出統計學意義的數字結果,除非你為它們提供一個明確的置信區間。這理所當然地被認為是科學上的不良行為,尤其是在沒有進行配對顯著性測試的情況下,用來論證一個數字比另一個數字好的時候。僅憑這一點就經常有論文被拒絕。一個良好的習慣是對報告中帶有大量數字的準確率數字始終持懷疑態度。還記得3000萬、30萬和30萬的經驗法則對最壞情況下作為“嗅覺測試”的統計顯著性所需樣本數量的限制嗎?它會讓你避免追逐統計上的“幽靈”。
責任編輯:YYX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8554

    瀏覽量

    136983
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    人工智能與機器學習在這些行業的深度應用

    自人工智能和機器學習問世以來,多個在線領域的數字化格局迎來了翻天覆地的變化。這些技術從誕生之初就為企業賦予競爭優勢,而在線行業正是受其影響最為顯著的領域。人工智能(AI)與
    的頭像 發表于 02-04 14:44 ?501次閱讀

    賦予機器人靈動雙眸:匠芯創D13x系列芯片在AI陪伴機器人中的創新應用

    在人工智能浪潮席卷全球的今天,AI陪伴機器人正從科幻概念加速走入現實生活。無論是家庭的智能玩伴、養老機構的情感陪護助手,還是教育場景的智能導師,機器人不再僅僅是執行指令的工具,而是被賦予
    的頭像 發表于 02-02 19:30 ?789次閱讀
    <b class='flag-5'>賦予</b><b class='flag-5'>機器</b>人靈動雙眸:匠芯創D13x系列芯片在AI陪伴<b class='flag-5'>機器</b>人中的創新應用

    避繁就簡!商湯日日新大模型靈性巧解數學難題,獲贊“機器的審美”

    、字節跳動,讓數學與AI同臺碰撞,開展一場真刀真槍的“圖靈測試”。 現場,面對數學家拋出的難題,商湯科技“日日新”大模型在解答復分析計算積分、微分幾何證明等問題中,展示驚人的進化力
    的頭像 發表于 01-12 11:41 ?287次閱讀
    避繁就簡!商湯日日新大模型靈性巧解<b class='flag-5'>數學</b>難題,獲贊“<b class='flag-5'>機器</b>的審美”

    機器學習和深度學習需避免的 7 個常見錯誤與局限性

    無論你是剛入門還是已經從事人工智能模型相關工作一段時間,機器學習和深度學習中都存在一些我們需要時刻關注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發諸多麻煩!只要我們密切關注數據、模型架構
    的頭像 發表于 01-07 15:37 ?204次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b><b class='flag-5'>中</b>需避免的 7 個常見錯誤與局限性

    學習RTOS的意義

    對于嵌入式軟件工程師,學習RTOS非常有必要。 1. 項目需要 隨著產品要實現的功能越來越多,單純的裸機系統已經不能完美地解決問題,反而會使編程變得更加復雜,如果想降低編程的難度,就必須引入
    發表于 11-27 08:16

    CRC校驗的本質和物理意義

    工業控制系統,Modbus RTU協議的CRC校驗如同通信網絡的\"免疫系統\",某石化廠DCS系統曾因CRC計算錯誤導致0.3%的數據包丟失,引發連鎖控制故障。 一、CRC
    發表于 11-13 07:58

    奧比光助力開源人形機器人Reachy 2能力升級

    在法國Pollen Robotics的實驗室里,今年4月發布的人形機器人Reachy 2正在完成一項頗具挑戰的任務:根據食譜精準分揀水果和蔬菜。Reachy 2能區分新鮮蘋果和枯萎生菜,靠的不是編程,而是奧比光Gemini 336雙目3D相機所
    的頭像 發表于 11-05 15:53 ?564次閱讀

    量子機器學習入門:三種數據編碼方法對比與應用

    在傳統機器學習數據編碼確實相對直觀:獨熱編碼處理類別變量,標準化調整數值范圍,然后直接輸入模型訓練。整個過程更像是數據清洗,而非核心算法組件。量子機器
    的頭像 發表于 09-15 10:27 ?784次閱讀
    量子<b class='flag-5'>機器</b><b class='flag-5'>學習</b>入門:三種數據編碼方法對比與應用

    綠葉學子北京昱櫟研學行:以交流為翼,讓學習領航未來

    近日,新鄉市綠葉學子們在北京昱櫟技術有限公司(以下簡稱“昱櫟技術”)開啟一場意義深遠的研學之旅。這場旅程不僅是一次企業探訪,更是一場思想的盛宴,讓學子們在交流收獲滿滿,對學習、成長
    的頭像 發表于 08-06 16:17 ?858次閱讀
    綠葉學子北京昱櫟研學行:以交流為翼,讓<b class='flag-5'>學習</b>領航未來

    FPGA在機器學習的具體應用

    ,越來越多地被應用于機器學習任務。本文將探討 FPGA 在機器學習的應用,特別是在加速神經網
    的頭像 發表于 07-16 15:34 ?2905次閱讀

    【「# ROS 2智能機器人開發實踐」閱讀體驗】視覺實現的基礎算法的應用

    人部署,詳細介紹基于顏色閾值和深度學習的巡線方法。 二維碼識別則廣泛應用于機器人定位與任務觸發,例如AGV(自動導引車)的路徑規劃。 深度學習
    發表于 05-03 19:41

    【「# ROS 2智能機器人開發實踐」閱讀體驗】+ROS2應用案例

    這一部分內容,我掌握了如何在ROS 2實現SLAM,這對于提高機器人的自主導航能力具有重要意義。 其他內容概述 除了二維碼識別和SLAM技術,書中還介紹其他視覺應用和地圖構建的內
    發表于 04-27 11:42

    LD Gen2 Lite激光雷達:賦予機器人 “感知力” 的關鍵

    機器人的感知世界里,激光雷達宛如一雙敏銳的“慧眼”,賦予機器人“看”清周圍環境、自主決策的能力。亮道智能最新推出的純固態Flash短距激光雷達LD Gen2 Lite,憑借其獨特的技術優勢,在
    的頭像 發表于 04-25 10:42 ?739次閱讀

    嵌入式AI技術之深度學習:數據樣本預處理過程中使用合適的特征變換對深度學習意義

    ? 作者:蘇勇Andrew 使用神經網絡實現機器學習,網絡的每個層都將對輸入的數據做一次抽象,多層神經網絡構成深度學習的框架,可以深度理解數據中所要表示的規律。從原理上看,使用深度學習
    的頭像 發表于 04-02 18:21 ?1524次閱讀

    工業機器人工作站的建設意義

    生產流程,減少生產環節的浪費和延誤,進一步提升生產效率。上海桐爾提供的解決方案能夠幫助企業實現高效、穩定的生產模式,提升市場競爭力。 其次,工業機器人工作站的建設有助于改善作業環境,降低操作難度。通過
    發表于 03-17 14:49