機器學習和數(shù)據(jù)科學離不開數(shù)學,本文從數(shù)學基礎的角度入手,推薦了數(shù)據(jù)科學和機器學習方面的七本參考書以及兩本補充讀物。相信對打好數(shù)學基礎的相關人士會有所幫助。
大多數(shù)人學習數(shù)據(jù)科學的人都會把重點放在編程上,實際上編程能力確實是機器學習和數(shù)據(jù)科學領域的重要技能。但是,要真正精通數(shù)據(jù)科學和機器學習,必然不能忽視的數(shù)據(jù)科學背后的數(shù)學基礎。
出于這個目的,本文介紹了七本在注重打好數(shù)據(jù)科學的數(shù)學基礎上的技術讀物。當然,涉及到數(shù)學,往往閱讀體驗可能不會很舒服,但要搞好機器學習,數(shù)學基礎是必須要打牢的,所以努力讀書吧!
先說一說為什么在數(shù)據(jù)科學學習時打好數(shù)學基礎。
以下是我總結的幾個原因:
AI領域無時無刻不在迅速變化。Hinton認為,我們也許應該重新思考反向傳播。掌握牢固的數(shù)學知識有助于更好地理解AI的演變。一個數(shù)學基礎深厚的人,對AI的理解和認識與其他僅從表面認識AI的人有很大的區(qū)別。此外,掌握數(shù)學知識還能更好地了解AI技術帶來知識產(chǎn)權的潛力。最后,了解數(shù)據(jù)科學背后的數(shù)學知識,也可以讓人更容易獲得AI和數(shù)據(jù)科學的高端職位。
此外,作者推薦這幾本書,還有兩點個人原因:
1.作者在牛津大學教授物聯(lián)網(wǎng)數(shù)據(jù)科學的課程,也包括一些AI技術應用方面的教學事務,在教學過程中涉及到數(shù)學基礎知識和課程。
2.其次,作者在寫一本書來簡述人工智能,從數(shù)學的角度入手,目標讀者是14到18歲的少年。要深入了解數(shù)學科學和人工智能數(shù)學的數(shù)學基礎,你需要了解四個方面知識:線性代數(shù),概率論,多元微積分和優(yōu)化。目前在高中階段至少會教授這些課程的一部分內(nèi)容。因此,我試圖將高中數(shù)學與人工智能和數(shù)據(jù)科學聯(lián)系起來,重點是數(shù)學建模。
下面進入正題:
(1) The Nature Of Statistical Learning Theory《統(tǒng)計學習理論的本質(zhì)》
作者:VladimirVapnik
PDF資源:
https://statisticalsupportandresearch.files.wordpress.com/2017/05/vladimir-vapnik-the-nature-of-statistical-learning-springer-2010.pdf
如果說要列一份關于數(shù)學的書單,這本書是繞不過去的。本書單中排名第一的就是俄羅斯著名數(shù)學家VladimirVapnik的《統(tǒng)計學習理論的本質(zhì)》。在這份清單中的所有書籍中,Vapnik這本是最不好找的。VladimirVapnik是支持向量機(SVM)的創(chuàng)始人。他的維基百科頁面中提供了更多關于他研究成果的介紹。
(2)Pattern Classification(2007-12-24)《模式分類》
作者:RichardODuda
PDF資源:
https://cds.cern.ch/record/683166/files/0471056693_TOC.pdf
就像Vapnik的著作一樣,Duda的著作時另一個時代的另一部經(jīng)典。本書初版于1973年,在二十多年后的2000年才推出第二版,此后一直未再版。時隔近二十年,本書仍然是一個重要資源。本書采用模式識別方法,并涵蓋了廣泛的算法。
(3)
MachineLearning:AnAlgorithmicPerspective,SecondEdition(Chapman&Hall/CrcMachineLearning&PatternRecognition)
《機器學習:算法視角》
PDF資源:
https://doc.lagout.org/science/Artificial%20Intelligence/Machine%20learning/Machine%20Learning_%20An%20Algorithmic%20Perspective%20%282nd%20ed.%29%20%5BMarsland%202014-10-08%5D.pdf
這本書現(xiàn)在已經(jīng)出版了第二版。此書第一版是我讀過的最早的書關于機器學習和算法的著作之一,第二版增加了更多Python代碼。與前兩本書一樣,本書也非常強調(diào)算法。
(4)
TheElementsofStatisticalLearning:DataMining,Inference,andPrediction,SecondEdition
《統(tǒng)計學習基礎:數(shù)據(jù)挖掘、推理和預測》(第二版)
作者:TrevorHastie,RobertTibshirani,JeromeFriedman
PDF資源:https://web.stanford.edu/~hastie/Papers/ESLII.pdf
另一本經(jīng)典之作,可以作為參考書。
(5)Pattern Recognition and Machine Learning (Information Science and Statistics)
《模式識別與機器學習(信息科學與統(tǒng)計)》
作者:ChristopherM.Bishop
PDF資源:http://users.isr.ist.utl.pt/~wurmd/Livros/school/Bishop%20-%20Pattern%20Recognition%20And%20Machine%20Learning%20-%20Springer%20%202006.pdf
ChristopherM.Bishop的模式識別和機器學習(信息科學和統(tǒng)計學)也是一本深入而精心設計的參考書。
(6)
MachineLearning:TheArtandScienceofAlgorithmsthatMakeSenseofData
作者:PeterFlach
PDF資源:http://www.cs.put.poznan.pl/tpawlak/files/ZMIO/W02.pdf
我喜歡PeterFlach的書,盡管亞馬遜網(wǎng)站上的一些評論說這書寫得太羅嗦,而且代碼量顯得不足。我特別喜歡這本書中的算法分組(邏輯模型,線性模型,概率模型)章節(jié)以及這些主題的整體講述方式。
最后,是我最推薦的一本書:
(7)Deep Learning《深度學習》
作者:Goodfellow、Bengio、Corville
相關資源:https://www.deeplearningbook.org/
如果你在找一本值得逐頁讀完的書,就是它了!這本書既詳細,又有現(xiàn)代感,書中內(nèi)容幾乎涵蓋了你能想到的關于深度學習的一切知識。
補充兩本書:
A First Course in Machine Learning, Second Edition (Machine Learning & Pattern Recognition) by Simon Rogers, Mark Girolami
作者:SimonRogers,MarkGirolami
我覺得這本書并不太適合初學者,但它仍然是一本好書(特別是第二版)
MachineLearning:AProbabilisticPerspective
作者:KevinMurphy
這本書中評價也很高,但我個人沒有讀過(因此沒有收集)。
寫在最后:
除了最后一本《深度學習》之外,我建議其他書不必逐頁閱讀,而是將其作為參考書,根據(jù)需要按相應主題閱讀相應的書籍。這些書教會了我時刻保持謙遜。無論我們現(xiàn)在知道了多少,掌握了多少知識,都總能在閱讀過程中發(fā)現(xiàn),這個領域原來是如此的龐大和復雜。
這些書已經(jīng)超越了時間。VladimirVapnik現(xiàn)年已經(jīng)81歲。Duda的著作初版于1973年。我預計50年以后,這個行業(yè)里的人們?nèi)匀粫喿x這些著作。就像與那些經(jīng)歷了時間考驗的老朋友們重逢一樣。多年之后,也許你會發(fā)現(xiàn),在眼花繚亂的技術、模型和框架背后,數(shù)學是永恒的。
-
AI
+關注
關注
91文章
39853瀏覽量
301506 -
機器學習
+關注
關注
66文章
8554瀏覽量
136982 -
數(shù)據(jù)科學
+關注
關注
0文章
168瀏覽量
10794
原文標題:【薦書】提升機器學習數(shù)學基礎,這7本書一定要讀(附pdf資源)
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
使用NORDIC AI的好處
從手工到自動:焊球剪切測試的技術演進與科學原理
AES加解密算法邏輯實現(xiàn)及其在蜂鳥E203SoC上的應用介紹
利用 Banana Pi BPI-CM5 Pro(ARMSoM CM5 SoM) 加速保護科學
Photonis 科學圖像增強器介紹
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用
能量收集技術在物聯(lián)網(wǎng)設備上的應用與解決方案
【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》
【書籍評測活動NO.62】一本書讀懂 DeepSeek 全家桶核心技術:DeepSeek 核心技術揭秘
《電子電路原理第七版》電子教材
(專家著作,建議收藏)電機的數(shù)學研究方法
國產(chǎn)首款量產(chǎn)型七位半萬用表!青島漢泰開啟國產(chǎn)高精度測量新篇章。
【「芯片通識課:一本書讀懂芯片技術」閱讀體驗】圖文并茂,全面詳實,值得閱讀的芯片科普書
馬達控制上必要的知識 三角函數(shù)
NRK3301離線語音識別模塊在七彩燈上的應用方案
介紹七本在注重打好數(shù)據(jù)科學的數(shù)學基礎上的技術讀物
評論