国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一文看懂AI算法的秘密

電子工程師 ? 2018-03-25 10:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

這篇文章的主角是AlphaGo,谷歌DeepMind團隊開發出的圍棋AI。其憑借著2016年擊敗全球頂尖棋手李世石的壯舉而廣受矚目。下面就隨網絡通信小編一起來了解一下相關內容吧。

圍棋是一種古老的棋類游戲,每一步都存在諸多選擇,因此接下來的落子位置很參議會預測——要求對弈棋手擁有強大的直覺與抽象思維能力。正因為如此,人們長久以來一直認為只有人類擅長下圍棋。大多數研究人員甚至認定,還需要數十年才會出現真正具備這種思考能力的AI。但如今距離AlphaGo對李世石的比賽已經過去了兩年(3月8日至3月15日),而本篇文章正是為了紀念這個偉大的日子!

不過更可怕的是,AlphaGo并沒有停止自己的前進腳步。8個月之后,它在某圍棋網站上以“Master”為名與全球各地的冠軍棋手進行了60盤職業對弈,且拿下全勝成績。

這當然是人工智能領域的一項巨大成就,并在全球引起了一股新的討論熱潮——我們到底該對人工智能的發展速度感到興奮,還是擔心?

今天,我們將以DeepMind在《自然》雜志上發表的原始研究論文作為基礎,逐段對其內容進行簡單清晰的解讀,詳細介紹AlphaGo是什么以及它的工作原理。我也希望大家能夠在閱讀本文之后,不再被媒體頭條拋出的聳人聽聞的標題所恐嚇,而真正對關于人工智能的發展感到振奮。

當然,你不需要掌握圍棋技巧,也同樣可以理解本文的觀點。事實上,我本人只讀過網絡百科上的一丁點圍棋說明。相反,我其實會使用基礎的國際象棋示例來解釋相關算法。大家只需要了解雙人棋類游戲的基本規則即可——每位選手輪流行動,最后將產生一位贏家。除此之外,你不需要了解任何物理學或高數知識。

這樣盡可能降低入門門檻,是為了能讓剛剛接觸機器學習或者神經網絡的朋友更容易接受。本文也刻意降低了表述復雜度,也是希望大家能把注意力盡量集中在內容本身。

眾所周知,AlphaGo項目的目標在于建立一款AI程序,并保證其能夠與世界頂級人類選手在圍棋領域一較高下。

為了理解圍棋帶來的挑戰,我們首先聊聊與之類似的另一種棋類運動——國際象棋。早在上世紀九十年代初,IBM公司出打造出深藍計算機,其在國際象棋比賽中擊敗了偉大的世界冠軍加里·卡斯帕羅夫。那么,深藍是如何做到這一點的?

事實上,深藍使用了一種非常“暴力”的作法。在游戲的每一步,深藍都會對所有可能作出的合理棋步作出考量,并沿著每種棋步探索以分析未來的局勢變化。在這樣的前瞻性分析之下,計算結果很快形成一種千變萬化的巨大決策樹。在此之后,深藍會沿著樹狀結構返回原點,觀察哪些棋步最可能帶來積極的結果。然而,何謂“積極的結果”?事實上,眾多優秀的國際象棋棋手為深藍精心設計出了國際象棋策略,旨在幫助其作出更好的決策——舉例來說,是決定保護國王,還是在盤面的其它位置獲得優勢?他們針對此類目的構建起特定的“評估算法”,從而比較不同盤面位置的優勢或劣勢權重(IBM公司將專家們的象棋策略以硬編碼形式引入該評估函數)。最終,深藍會據此選擇出經過精心計算的棋步。在接下來的回合中,整個過程再次重復。

這意味著,深藍在每一步之前都會考量數百萬個理論位置。因此,深藍最令人印象深刻的表現并不在于人工智能軟件層面,而體現在其硬件之上——IBM公司宣稱,深藍是當時市場上最為強大的計算機之一。其每秒能夠計算2億個盤面位置。

現在讓我們回到圍棋方面。圍棋顯然更為開放,因此如果在這里重復深藍的戰略,將根本無法獲得理想效果。由于每個棋步都擁有過多可選擇的位置,因此計算機根本無法涵蓋這么多潛在的可能性。舉例來說,在國際象棋的開局當中,只有20種可能的下法; 但在圍棋方面,先手選手將擁有361個可能的落子點——而且這種選擇范圍在整個對弈過程中一直非常廣泛。

這就是所謂“巨大搜索空間”。而且在圍棋當中,判斷某個特定盤面位置的有利或不利權重并沒那么容易——在官子階段,雙方甚至還需要再排布一陣才能最終確定誰才是勝利者。但有沒有一種神奇的方法能夠讓計算機在圍棋領域有所建樹?答案是肯定的,深度學習能夠完成這項艱巨的任務!

因此在本次研究當中,DeepMind方面利用神經網絡來完成以下兩項任務。他們訓練了一套“策略神經網絡(policy neural network)”以決定哪些才是特定盤面位置當中最為明智的選項(這類似于遵循某種直觀策略選擇移動位置)。此外,他們還訓練了一套“估值神經網絡(value neural network)”以估算特定盤面布局對選手的有利程度(或者說,下在這個位置對贏得游戲這一目標的實際影響)。他們首先使用人類棋譜對這些神經網絡進行訓練(也就是最傳統但也非常有效的監督式學習方法)。經歷了這樣的訓練,我們的人工智能已經可以在一定程度上模仿人類的下棋方式——這時的它,就像一位菜鳥級人類選手。而后,為了進一步訓練神經網絡,DeepMind方面讓AI與自己進行數百萬次對弈(也就是“強化學習”的部分)。如此一來,憑借著更為充分的練習,AI的棋力得到了極大提升。

憑借這兩套網絡,DeepMind的人工智能方案就足以擁有等同于此前最先進的圍棋程序的棋藝水平。二者的區別在于,原有程序使用了此前更為流行的預置游戲算法,即“蒙特卡洛樹搜索(Monte Carlo Tree Search,簡稱MCTS)”,我們將在稍后具體進行介紹。

不過很明顯,到這里我們還沒有談到真正的核心。DeepMind的人工智能方案絕不僅僅依賴于策略與估值網絡——其并非利用這兩套網絡來替代蒙特卡洛樹搜索; 相反,其使用神經網絡以進一步提升MCTS算法的成效。實際結果也確實令人滿意——MCTS的表現達到了超人的高度。這種經過改進的MCTS變種正是“AlphaGo”,其成功擊敗了李世石,并成為人工智能發展歷史上最大的突破之一。

下面讓我們回想一下本文的第一段內容。上述提到,深藍計算機是如何在國際象棋的每一步當中構建起包含數以百萬計盤面位置與棋步的決策樹——計算機需要進行模擬、觀察并比較每一種可能的落點——這是一種簡單且非常直接的方法,如果一般的軟件工程師必須要設計出一種棋類程序,那么他們很可能會選擇類似的解決方案。

但讓我們想想,人類是怎樣下棋的?假設目前您身處比賽中的特定階段。根據游戲規則,你可以作出十幾種不同的選擇——在此處移動棋子或者在那里移動皇后等等。然而,你真的會在腦袋里列出所有能走的棋步,并從這份長長的清單中作出選擇嗎?不不,你會“直觀地”將可行范圍縮小至少數幾種關鍵性棋步(這里假定您提出了3種明智的棋步),而后思考如果選擇其中某一種,那么棋盤上的局勢將發生怎樣的轉變。對于其中每一種棋步,你可能需要15到20秒的時間進行考量——但請注意,在這15秒內,我們并不是在非常精確地推衍接下來的交鋒與變化。事實上,人類往往會在未經太多思考的情況下“拋出”一些由直覺引導的選擇結果(當然,優秀的選手會比普通選手想得更遠更深)。之所以這樣做,是因為你的時間有限,而且無法準確預測你的對手會勾勒出怎樣的后續應對策略。因此,你只能讓直覺引導自己。我將這一部分思考過程稱為“鋪展”,請大家在后文中注意這一點。

在完成了對幾種明智棋步的“鋪展”之后,你最終決定放棄這種令人頭痛的思考,直接下出你認為最科學的一步。

在此之后,對手也會作出對應的回應。這一步可能早在你的預料當中,這意味著你對于下一步要做的事情更具信心——換言之,不必耗費太多時間進行后續“鋪展”。或者,也可能你的對手下出了一手妙招,導致你被迫回防并不得不更謹慎地思考下一步選擇。

游戲就這樣持續進行,而隨著局勢的推進,你將能夠更輕松地預測每步棋的結果,鋪展耗時也將相應縮短。

之所以說了這么多,是希望以較為淺顯的方式為大家講述MCTS算法的作用——它通過反復構建棋步與位置“搜索樹”以模擬上述思考過程。但其創新之處在于,MCTS算法不會在每個位置(與深藍有所不同)都進行潛在棋步推衍; 相反,其會更智能地選擇一小組合理棋步并加以探索。在探索過程中,它會“鋪展”這些棋步引發的局勢變化,并根據計算出的結果對其加以比較。

(好了,只要理解了以上內容,本文的閱讀就算基本達標。)

現在,讓我們回到論文本身。圍棋是一種“完美信息游戲”。也就是說,從理論層面講,無論您身處這類游戲的哪個階段(即使剛剛走出一、兩步),大家都有可能準確猜出最終誰輸誰贏(假定兩位選手都會以‘完美’的方式下完整盤)。我不知道是誰提出了這項基本理論,但作為本次研究項目的前提性假設,其確實非常重要。

換句話來說,在游戲狀態下,我們將可通過一條函數v*(s)來預測最終結果——例如你贏得這盤對弈的概率,區間為0到1。DeepMind的研究人員

[1] [2] [3]

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301430
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265395
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    什么是TPU?萬協通帶你看懂AI算力的“變形金剛”

    ”——TPU(Tensor Processing Unit)。 今天,作為國產可重構TPU芯片的先行者,萬協通將帶你剝開晦澀的技術外殼,看懂這塊決定AI未來的核心硬件,以及中國芯片如何換道超車,上演場精彩的“變形記”。
    的頭像 發表于 01-13 13:22 ?263次閱讀
    什么是TPU?萬協通帶你<b class='flag-5'>看懂</b><b class='flag-5'>AI</b>算力的“變形金剛”

    AI硬件全景解析:CPU、GPU、NPU、TPU的差異化之路,看懂!?

    CPU作為“通用基石”,支撐所有設備的基礎運行;GPU憑借并行算力,成為AI訓練與圖形處理的“主力”;TPU在Google生態中深耕云端大模型訓練;NPU則讓AI從“云端”走向“身邊”(手機、手表
    的頭像 發表于 12-17 17:13 ?1747次閱讀
    <b class='flag-5'>AI</b>硬件全景解析:CPU、GPU、NPU、TPU的差異化之路,<b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>看懂</b>!?

    看懂AI大模型的并行訓練方式(DP、PP、TP、EP)

    大家都知道,AI計算(尤其是模型訓練和推理),主要以并行計算為主。AI計算中涉及到的很多具體算法(例如矩陣相乘、卷積、循環層、梯度運算等),都需要基于成千上萬的GPU,以并行任務的方式去完成。這樣
    的頭像 發表于 11-28 08:33 ?1858次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>看懂</b><b class='flag-5'>AI</b>大模型的并行訓練方式(DP、PP、TP、EP)

    SM4算法實現分享(算法原理

    對明文進行分組加密變換。SM4加密算法由32次迭代運算和次反序變換R組成。 設輸入明文為(X0,X 1,X 2,X 3),共128位,設密輸出為(Y0,Y 1,Y 2,Y 3),輪密鑰為rki
    發表于 10-30 08:10

    看懂國產存儲公司有哪些?

    的需求分別為普通服務器的8倍和3倍,單臺配置高達2TB。隨著三星、美光、SK海力士等國際大廠集體上調產品報價,場由AI技術驅動的存儲漲價潮席卷全球,這也為國產存
    的頭像 發表于 10-16 15:59 ?2231次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>看懂</b>國產存儲公司有哪些?

    看懂AI訓練、推理與訓推體的底層關系

    (Inference)。它們就像“學霸的高考備考”和“考試當天的答題表現”,缺不可。1、什么是AI訓練(Training)?通過大量數據訓練模型參數,使其具備特定
    的頭像 發表于 09-19 11:58 ?2421次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>看懂</b><b class='flag-5'>AI</b>訓練、推理與訓推<b class='flag-5'>一</b>體的底層關系

    看懂晶豐明源BP2525x系列的區別

    看懂BP2525x之間的區別
    的頭像 發表于 09-13 15:22 ?2862次閱讀
    <b class='flag-5'>一</b>圖<b class='flag-5'>看懂</b>晶豐明源BP2525x系列的區別

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰

    的我我們講解了這幾種芯片的應用場景,設計流程、結構等。 CPU: 還為我們講解了算法:哈希表算法 GPU: 介紹了英偉達H100GPU芯片。使用了下關鍵技術: ①張量
    發表于 09-12 16:07

    AI的核心操控:從算法到硬件的協同進化

    ? ? ? ?人工智能(AI)的核心操控涉及算法、算力和數據三大要素的深度融合,其技術本質是通過硬件與軟件的協同優化實現對復雜任務的自主決策與執行。這過程依賴多層技術棧的精密配合,從底層的芯片架構
    的頭像 發表于 09-08 17:51 ?988次閱讀

    AI的未來,屬于那些既能寫代碼,又能焊電路的“雙棲人才”

    的信號:AI真正的未來,不只屬于“算法天才”,更屬于那些既能寫代碼,又能焊電路的“雙棲工程師”。無論是在AI芯片、智能終端、機器人、邊緣計算還是大模型下沉的討論中,我們不斷聽到同個問
    發表于 07-30 16:15

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    到AGI,起來探索AI芯片 本書從創新視角出發,系統梳理了AI芯片的前沿技術與未來方向,串聯起從算法到系統的實現路徑,全景式展現AI芯片的
    發表于 07-28 13:54

    AI視頻分析和算法集合

    AI
    jf_02235694
    發布于 :2025年07月23日 16:10:12

    看懂AI算力集群

    最近這幾年,AI浪潮席卷全球,成為整個社會的關注焦點。大家在討論AI的時候,經常會提到AI算力集群。AI的三要素,是算力、算法和數據。而
    的頭像 發表于 07-23 12:18 ?1616次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>看懂</b><b class='flag-5'>AI</b>算力集群

    讀懂,可重構芯片為何是AI的完美搭檔

    在當今數字化時代,人工智能(AI)無疑是最為耀眼的技術領域之。從早期簡單的機器學習算法,到如今復雜的深度學習和Transformer模型,AI算法
    的頭像 發表于 03-31 12:05 ?1127次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b>讀懂,可重構芯片為何是<b class='flag-5'>AI</b>的完美搭檔

    機器人驅動部件如何選型?看懂!(電機、減速器)

    電子發燒友網報道(/梁浩斌)人形機器人伴隨AI技術的爆發,開始從實驗室逐步邁入量產。Precedence Research預測,2032年全球人形機器人市場規模將超過2000億元人民幣,2022年
    的頭像 發表于 03-15 00:22 ?3931次閱讀
    機器人驅動部件如何選型?<b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>看懂</b>!(電機、減速器)