国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習引發對科學見解的反思簡析

中科院半導體所 ? 來源:悅智網 ? 2023-03-03 09:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數學和物理是一對老朋友。長期以來,它們見證了技術發展的起落,包括計算尺、計算器和Wolfram Alpha等輔助工具。如今,隨著機器學習的最新進展應用于解決數學和物理問題,這些進展提出了一個根本性的問題:讓算法學會我們思考方式有何意義?

為什么要這么做?

“計算機非常擅長數學,指的是它們很擅長解決非常具體的問題。”谷歌研究院的機器學習專家蓋伊?古爾阿里(Guy Gur-Ari)說。計算機擅長運算,填入數字并計算是相對簡單的。但在形式結構之外,計算機則舉步維艱。

解決數學文字問題或“定量推理”看起來比較棘手,因為它需要更為穩健和嚴密,而解決許多其他問題也許并不需要。雖然機器學習模型接受訓練的數據越多,產生的錯誤越少,但對于定量推理,改進的程度卻很有限。研究人員開始意識到,對于機器學習生成模型在解決語言文字問題時產生的錯誤,需要更有針對性的方法。

2021年,來自加州大學伯克利分校和OpenAI的兩個不同團隊分別發布了MATH和GSM8K兩個數據集,這兩個數據集包含了涉及幾何、代數和微積分基礎等的數千個數學問題。“我們就是想要看看,數據集是否有問題。”在人工智能安全中心研究MATH的研究員史蒂文?巴薩特(Steven Basart)說。用格式更好的、更大的數據集進行訓練,是否能夠修復機器學習定量推理的錯誤?MATH團隊發現,定量推理對最高級的機器學習語言模型也頗具挑戰,其得分不到7%。(人類研究生的得分為40%,而國際數學奧林匹克競賽冠軍的得分為90%。)

GSM8K數據集則是更簡單的小學階段問題,受訓模型的準確率達到了約20%。為了實現這種準確率,OpenAI的研究人員使用了兩種技術:精調和驗證。在精調中,研究人員采用一個包含不相關信息的預訓練語言模型,在訓練中僅展示相關信息(數學問題);驗證則允許模型重新審視其錯誤。

當時,OpenAI預測,需要使用100倍的數據對模型進行訓練,才能在GSM8K上達到80%的準確率。但2022年6月,谷歌的Minerva宣布,小規模擴大訓練即可實現78%的準確率。OpenAI的機器學習專家卡爾·科布(Karl Cobbe)說:“這超出我們所有的預期。”巴薩特表示同意,他說:“這太令人震驚了,我還以為要花很長的時間。”

Minerva使用了谷歌自己的通路語言模型(PaLM),根據來自arXiv的科學論文和其他來源進行格式化數學精調。此外,幫助Minerva的還有另外兩個策略。在“思維鏈提示”中,要求Minerva將較大的問題分解為更容易接受的小問題。該模型還使用多數投票,而不是僅要它提供一個答案或將一個問題解算100次。在這些結果中,Minerva選出最常見的答案。

這些新策略帶來了巨大的好處。Minerva在MATH上實現了高達50%的準確率,在GSM8K上的準確率接近80%。在MMLU上也是這樣,MMLU是一個包含化學和生物的STEM普通問題集。對問題略微調整后隨機取樣,讓Minerva重新進行計算,其表現也很好,這表明,這個能力不僅源自記憶。

關于數學,Minerva了解哪些、不了解哪些,是很模糊的。這與數學家使用的帶有內置結構的“證明助手”不同,Minerva和其他語言模型沒有形式結構。它們可能會產生奇怪、混亂的推理,但仍然可得出正確的答案。隨著數字的增大,語言模型的準確度會下降,這對于可靠的老式TI-84 Plus計算器,是絕不會發生的。

“它到底是聰明?還是不聰明?”科布問。雖然像Minerva一樣的模型也許能夠得出與人類一樣的答案,但其遵循的實際過程可能完全不相同。另一方面,曾被要求“展示自己的作業”的學生都很熟悉“思維鏈提示”。

谷歌研究院的機器學習專家伊桑?戴爾(Ethan Dyer)說:“我認為人們有這樣一個概念,做數學的人有某種嚴格的推理系統,在已知和未知之間有明顯的區別。”但人也可能得出不一致的答案、會犯錯誤和未能應用核心概念。在機器學習的這一前沿,邊界是模糊的。

像物理學家一樣思考

粒子物理的數據與眾不同。雖然已經證實卷積神經網絡(CNN)對樹木、貓和食物等日常物體圖片的分類非常高效,但它并不適合粒子碰撞。加州大學圣地亞哥分校的粒子物理學家哈維爾?杜爾特(Javier Duarte)表示,問題在于來自大型強子對撞機(LHC)的碰撞數據無法作為圖像。

華而不實地描述LHC碰撞可誤導甚至堵塞整個探測器。實際上,在數百萬個輸入中只有少量幾個輸入在記錄信號,就像白屏中有幾個黑色像素。這導致卷積神經網絡中的圖像質量很差,但在一個被稱為圖形神經網絡(GNN)的不同新框架中,效果則很好。

除了格式奇怪以外,還有大量的數據,大約為每秒約1拍字節,其中只有少量高質量數據被保存下來。為了更好地篩選數據,研究人員想要訓練更敏銳的算法。杜爾特說,要想提高效率,這種算法要具備驚人的速度,在微秒內執行。剪裁和量化等機器學習技術能使算法達到目標。

借助機器學習,粒子物理學家可以從不同的角度觀察數據。他們不僅關注單個事件,還學習和思考碰撞期間發生的幾十個其他事件,例如希格斯玻色子衰變為兩個光子。雖然任意兩個事件之間沒有因果關系,但研究人員現在接受一個更全面的數據視圖,而不僅是單個事件分析得出的零碎視圖。

更引人注目的是,機器學習還迫使物理學家重新審視基本概念。麻省理工學院的理論粒子物理學家杰西?泰勒(Jesse Thaler)說:“過去,我自己對對稱性的看法不嚴密,強迫自己教授計算機什么是對稱,也是幫助自己理解對稱到底是什么。”對稱需要參考系,換言之,鏡子中變形的球體圖像到底是否對稱?如果不知道鏡子本身是否變形,就無法知道答案。

粒子物理學中的機器學習仍然處于早期階段,實際上,研究人員現在對待相關技術就像對待廚房的洗碗池。杜爾特承認:“它也許不適合粒子物理學中的每一個問題。”

在一些粒子物理學家深入研究機器學習的同時,腦中浮現出一個令人不安的問題:他們是在研究物理學還是在研究計算機科學?往往不被視為“真正的物理學”的編程已經存在;類似的擔憂也在困擾機器學習。有的研究人員擔心機器學習會遮掩非常復雜的情況,他們正在構建算法,使用人類能夠理解的語言來提供反饋。而算法也許不是唯一負責溝通的主體。

泰勒說:“另一方面,我們希望機器能夠學習如何像物理學家那樣思考。我們也要多學習如何像機器那樣思考。我們需要學會講對方的語言。”







審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 探測器
    +關注

    關注

    15

    文章

    2763

    瀏覽量

    75896
  • 神經網絡
    +關注

    關注

    42

    文章

    4838

    瀏覽量

    107767
  • 計算機
    +關注

    關注

    19

    文章

    7807

    瀏覽量

    93202
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136948
  • GNN
    GNN
    +關注

    關注

    1

    文章

    31

    瀏覽量

    6780

原文標題:機器學習引發對科學見解的反思

文章出處:【微信號:bdtdsj,微信公眾號:中科院半導體所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    人工智能與機器學習在這些行業的深度應用

    自人工智能和機器學習問世以來,多個在線領域的數字化格局迎來了翻天覆地的變化。這些技術從誕生之初就為企業賦予了競爭優勢,而在線行業正是受其影響最為顯著的領域。人工智能(AI)與機器學習
    的頭像 發表于 02-04 14:44 ?475次閱讀

    機器學習和深度學習中需避免的 7 個常見錯誤與局限性

    無論你是剛入門還是已經從事人工智能模型相關工作一段時間,機器學習和深度學習中都存在一些我們需要時刻關注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發諸多麻煩!只要我們密切關注
    的頭像 發表于 01-07 15:37 ?191次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>中需避免的 7 個常見錯誤與局限性

    NST1002單總線型溫度傳感器,以“極”實現“極致”

    前言從醫療健康到人形機器人,從工業物聯到消費電子,精準感知環境溫度,是驅動設備智慧化、決策科學化的核心變量之一。傳統溫度感知方案,或因響應遲緩而錯失關鍵數據,或因精度不足而引入系統誤差,已成為眾多
    的頭像 發表于 12-09 11:55 ?640次閱讀
    NST1002單總線型溫度傳感器,以“極<b class='flag-5'>簡</b>”實現“極致”

    儀科技開源測控技術走進西安交通大學創新港校區

    10月26日上午,由西安交通大學儀器科學與技術學院主辦的“C# 開源測控技術培訓交流會”在西安交大創新港校區順利舉行。儀科技資深工程師王孟美受曾翔君教授邀請,與20余名儀器科學與技術專業研究生圍繞AI與模擬采集展開深入交流。
    的頭像 發表于 11-04 10:20 ?638次閱讀

    利用 Banana Pi BPI-CM5 Pro(ARMSoM CM5 SoM) 加速保護科學

    Cat M-1 用于遙測/連接。 用于邊緣處理和機器學習的 ARMSoM 計算模塊 (CM5)。 項目背景 []() 通過聆聽自然界的聲音,我們可以監測動物之間的交流方式,并獲得基本的基線數據,從而
    發表于 10-27 09:18

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用

    和量子計算的兩項新興的技術,將在生產假說方面發揮重要作用,從而改變科學發現的范式。 生成式AI: 2、窮舉搜索 3、分析排錯與組合優化 分析排錯是生成假說的重要手段。強化學習也在優化假說組合、尋找科學發現
    發表于 09-17 11:45

    如何在機器視覺中部署深度學習神經網絡

    人士而言往往難以理解,人們也常常誤以為需要扎實的編程技能才能真正掌握并合理使用這項技術。事實上,這種印象忽視了該技術為機器視覺(乃至生產自動化)帶來的潛力,因為深度學習并非只屬于計算機科學家或程序員。 從頭開始:什么
    的頭像 發表于 09-10 17:38 ?901次閱讀
    如何在<b class='flag-5'>機器</b>視覺中部署深度<b class='flag-5'>學習</b>神經網絡

    如何解決開發機器學習程序時Keil項目只能在調試模式下運行,但無法正常執行的問題?

    如何解決開發機器學習程序時Keil項目只能在調試模式下運行,但無法正常執行的問題
    發表于 08-28 07:28

    超小型Neuton機器學習模型, 在任何系統級芯片(SoC)上解鎖邊緣人工智能應用.

    Neuton 是一家邊緣AI 公司,致力于讓機器 學習模型更易于使用。它創建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進的邊緣設備上進行人工智能處理。在這篇博文中,我們將介紹
    發表于 07-31 11:38

    NVIDIA展示機器人領域的研究成果

    在今年的機器科學與系統會議 (RSS) 上,NVIDIA 研究中心展示了一系列推動機器人學習的研究成果,展示了在仿真、現實世界遷移和決策制定領域的突破。
    的頭像 發表于 07-23 10:43 ?1418次閱讀

    FPGA在機器學習中的具體應用

    隨著機器學習和人工智能技術的迅猛發展,傳統的中央處理單元(CPU)和圖形處理單元(GPU)已經無法滿足高效處理大規模數據和復雜模型的需求。FPGA(現場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發表于 07-16 15:34 ?2890次閱讀

    Modbus和MQTT協議

    Modbus和MQTT協議在設計目標、通信模式、應用場景、網絡結構、數據傳輸效率、設備兼容性及安全性等方面存在顯著差異,具體分析如下: 一、設計目標與定位 Modbus :誕生于1979年,由施耐德公司開發,最初為串行通信(RS232/RS485)設計。其目標是解決工業設備(如PLC、傳感器、儀表)之間的短距離、點對點或小范圍組網通信,核心是設備間直接的數據讀寫控制。Modbus屬于工業現場總線協議,側重底層設備的高效數據交互。 MQTT :2013年由OASIS標準化,最初
    的頭像 發表于 07-10 14:25 ?774次閱讀

    Modbus與MQTT的區別

    Modbus和MQTT是工業領域中兩種不同的通信協議,在設計目標、應用場景、通信模式等方面存在顯著差異,以下從多個維度兩者的區別: 1.設計目標與起源 Modbus 誕生于1979年,由施耐德
    的頭像 發表于 07-10 14:10 ?994次閱讀

    **【技術干貨】Nordic nRF54系列芯片:傳感器數據采集與AI機器學習的完美結合**

    【技術干貨】nRF54系列芯片:傳感器數據采集與AI機器學習的完美結合 近期收到不少伙伴咨詢nRF54系列芯片的應用與技術細節,今天我們整理幾個核心問題與解答,帶你快速掌握如何在nRF54上部署AI
    發表于 04-01 00:00

    請問STM32部署機器學習算法硬件至少要使用哪個系列的芯片?

    STM32部署機器學習算法硬件至少要使用哪個系列的芯片?
    發表于 03-13 07:34