數(shù)據(jù)科學(xué)中的知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘的詳細(xì)資料介紹
資料介紹
本文從數(shù)據(jù)科學(xué)的角度講述了筆者對(duì)信息科學(xué)的認(rèn)識(shí)與感悟,有選取數(shù)據(jù)科學(xué)中的知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘做出來(lái)具體的介紹,主要介紹了知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘的形成背景、發(fā)展歷史、概念分析、研究過(guò)程、方法技術(shù)、應(yīng)用實(shí)例和問(wèn)題不足。
一切科學(xué)都來(lái)源于事實(shí),而我們?nèi)绾螌⑹聦?shí)轉(zhuǎn)變成可以記錄交流傳承發(fā)展的知識(shí)并進(jìn)一步為人類所用呢?數(shù)據(jù)是一個(gè)切入點(diǎn)。數(shù)據(jù)具有客觀性、真實(shí)性、通用性、持久性,它實(shí)實(shí)在在的存在著,記錄著世界的精彩,隱藏著世界的奧秘,等待我們?cè)跀?shù)據(jù)中發(fā)現(xiàn),認(rèn)識(shí)世界。
數(shù)據(jù)如此強(qiáng)大,那么必然要有一個(gè)與它相關(guān)的學(xué)科——數(shù)據(jù)科學(xué)。數(shù)據(jù)科學(xué)包含了兩層意味,一是用科學(xué)的方法研究數(shù)據(jù),二是用數(shù)據(jù)的方法研究科學(xué),也就是說(shuō)它本身是一門科學(xué),而它用可以應(yīng)用到各個(gè)學(xué)科中,是很多學(xué)科有力的武器和堅(jiān)實(shí)的基礎(chǔ)。
可見(jiàn)數(shù)據(jù)科學(xué)覆蓋面極廣,下文就著重談一談知識(shí)發(fā)現(xiàn)與數(shù)據(jù)挖掘方面。

隨著數(shù)據(jù)庫(kù)技術(shù)的成熟和數(shù)據(jù)應(yīng)用的普及,人類積累的數(shù)據(jù)量正在以指數(shù)速度迅速增長(zhǎng)。進(jìn)入九十年代,伴隨著因特網(wǎng)的出現(xiàn)和發(fā)展,將整個(gè)世界聯(lián)成一個(gè)小小的地球村,人們可以跨越時(shí)空地在網(wǎng)上交換數(shù)據(jù)信息和協(xié)同工作。這樣,展現(xiàn)在人們面前的已不是局限于本部門,本單位和本行業(yè)的龐大數(shù)據(jù)庫(kù),而是浩瀚無(wú)垠的信息海洋,數(shù)據(jù)洪水正向人們滾滾涌來(lái)。當(dāng)數(shù)據(jù)量極度增長(zhǎng)時(shí),人們會(huì)感到面對(duì)數(shù)據(jù)的海洋像大海撈針一樣束手無(wú)策。據(jù)估計(jì),一個(gè)大型企業(yè)數(shù)據(jù)庫(kù)中數(shù)據(jù),只有百分之七得到很好應(yīng)用。這樣,相對(duì)于“數(shù)據(jù)過(guò)剩”和“信息爆炸”,人們又感到“信息貧乏”和“數(shù)據(jù)關(guān)在牢籠中”,奈斯伯特驚呼“We are drowning in information,but starving for knowledge” 面臨浩渺無(wú)際的數(shù)據(jù),人們呼喚從數(shù)據(jù)汪洋中出來(lái)一個(gè)去粗存精、去偽存真的技術(shù)。從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)知識(shí)(KDD knowledge discovering in database)及其核心技術(shù)——數(shù)據(jù)挖掘(DM data mining)便應(yīng)運(yùn)而生了。
1989年8月在第11屆國(guó)際聯(lián)合人工智能學(xué)術(shù)會(huì)議上KDD一詞首次出現(xiàn)。1989~1994年,由美國(guó)人工智能協(xié)會(huì)主辦KDD國(guó)際研討會(huì),從1995年開(kāi)始,召開(kāi)KDD和Data Mining國(guó)際學(xué)術(shù)研討會(huì)。從此開(kāi)啟了KDD和DM的浪潮。
所謂知識(shí)發(fā)現(xiàn),就是從數(shù)據(jù)集中識(shí)別出有效的、新穎的、潛在有用的,以及最終可理解的模式的非平凡過(guò)程。數(shù)據(jù)集就是指由一組事實(shí)組成的集合,有效指發(fā)現(xiàn)的模式對(duì)于新的數(shù)據(jù)仍保持有一定的可信度,潛在有用強(qiáng)調(diào)了它的實(shí)際效用,非平凡指這個(gè)過(guò)程要有一定程度的智能性、自動(dòng)性。
而所謂數(shù)據(jù)挖掘就是從數(shù)據(jù)庫(kù)中抽取隱含的、以前未知的、具有潛在應(yīng)用價(jià)值的信息的過(guò)程,即知識(shí)發(fā)現(xiàn)中的一個(gè)核心步驟。
- 西門子PLC教程之數(shù)據(jù)塊中的數(shù)據(jù)存儲(chǔ)詳細(xì)資料說(shuō)明 27次下載
- SQL數(shù)據(jù)庫(kù)中dbo注入語(yǔ)句大全的詳細(xì)資料說(shuō)明 5次下載
- MSP430G2x52的數(shù)據(jù)和數(shù)字系統(tǒng)綜合設(shè)計(jì)開(kāi)發(fā)環(huán)境的詳細(xì)資料概述 1次下載
- 數(shù)據(jù)庫(kù)教程之PHP數(shù)組和字符串的理論知識(shí)詳細(xì)資料說(shuō)明 3次下載
- UART中的硬件流控RTS與CTS的知識(shí)點(diǎn)詳細(xì)資料說(shuō)明
- 數(shù)據(jù)流頻繁模式挖掘的詳細(xì)資料說(shuō)明 2次下載
- PHP基礎(chǔ)知識(shí)的詳細(xì)資料總結(jié) 7次下載
- C++教程之數(shù)據(jù)線性結(jié)構(gòu)的詳細(xì)資料介紹 1次下載
- 電學(xué)知識(shí)和基本元器件的詳細(xì)資料介紹 44次下載
- 數(shù)據(jù)挖掘算法入門教程資料免費(fèi)下載 6次下載
- 數(shù)據(jù)庫(kù)教程之關(guān)系數(shù)據(jù)庫(kù)知識(shí)點(diǎn)總結(jié)的詳細(xì)資料概述 4次下載
- BCI的ADC系列產(chǎn)品的詳細(xì)資料和數(shù)據(jù)免費(fèi)下載 7次下載
- 為什么要學(xué)習(xí)數(shù)據(jù)結(jié)構(gòu)?數(shù)據(jù)結(jié)構(gòu)的應(yīng)用詳細(xì)資料概述免費(fèi)下載 13次下載
- Python網(wǎng)頁(yè)爬蟲,文本處理,科學(xué)計(jì)算,機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘工具集 39次下載
- 數(shù)據(jù)挖掘淺析
- 三菱PLC計(jì)數(shù)器和數(shù)據(jù)寄存器介紹 9.3k次閱讀
- labview怎么記錄時(shí)間和數(shù)據(jù) 6.9k次閱讀
- 一文弄懂數(shù)據(jù)挖掘的十大算法,數(shù)據(jù)挖掘算法原理講解 2.3k次閱讀
- MATLAB文件讀寫和數(shù)據(jù)處理的詳細(xì)解釋 4k次閱讀
- 大數(shù)據(jù)和數(shù)據(jù)科學(xué)的原理和區(qū)別 1.3w次閱讀
- RS232接口串口取電電路的詳細(xì)資料介紹 10k次閱讀
- 如何進(jìn)行PLC控制程序的設(shè)計(jì)詳細(xì)資料PPT說(shuō)明 6.9k次閱讀
- 干貨 數(shù)據(jù)科學(xué)入門指南 3.8k次閱讀
- 淺析嵌入式數(shù)據(jù)挖掘模型應(yīng)用到銀行卡業(yè)務(wù)中的相關(guān)知識(shí) 1.3k次閱讀
- PPT教程之伺服電機(jī)及其驅(qū)動(dòng)技術(shù)的詳細(xì)資料講解 8.9k次閱讀
- 代碼實(shí)例及詳細(xì)資料帶你入門Python數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí) 4k次閱讀
- 介紹從數(shù)據(jù)分析師轉(zhuǎn)型為數(shù)據(jù)科學(xué)家的具體方法 3.6k次閱讀
- 十大經(jīng)典數(shù)據(jù)挖掘算法—Apriori 4.4k次閱讀
- 怎么學(xué)習(xí)數(shù)據(jù)挖掘_如何系統(tǒng)地學(xué)習(xí)數(shù)據(jù)挖掘 6.7k次閱讀
- 什么叫數(shù)據(jù)挖掘_數(shù)據(jù)挖掘技術(shù)解析 2w次閱讀
下載排行
本周
- 1PD取電芯片 ECP5702規(guī)格書
- 0.88 MB | 3次下載 | 免費(fèi)
- 2氮化鎵GaN FET/GaN HEMT 功率驅(qū)動(dòng)電路選型表
- 0.10 MB | 2次下載 | 免費(fèi)
- 3EMC PCB設(shè)計(jì)總結(jié)
- 0.33 MB | 2次下載 | 免費(fèi)
- 41節(jié)電池用電池保護(hù)IC S-8261D系列數(shù)據(jù)手冊(cè)
- 3.07 MB | 1次下載 | 1 積分
- 5PD取電芯片,可取5/9/12/15/20V電壓ECP5702數(shù)據(jù)手冊(cè)
- 0.88 MB | 1次下載 | 免費(fèi)
- 6飛騰FT2000-4 COM Express核心板技術(shù)手冊(cè)0603
- 1.22 MB | 1次下載 | 免費(fèi)
- 7飛騰S5000C-64雙路服務(wù)器系列應(yīng)用宣傳冊(cè)--一乘科技
- 945.81 KB | 1次下載 | 免費(fèi)
- 8IP2345支持PD3.0等多種快充協(xié)議 支持4~6節(jié)串聯(lián)電池最大充電功率30W異步升降壓充電IC
- 1.41 MB | 次下載 | 免費(fèi)
本月
- 1美的電磁爐電路原理圖資料
- 4.39 MB | 22次下載 | 10 積分
- 2反激式開(kāi)關(guān)電源設(shè)計(jì)解析
- 0.89 MB | 16次下載 | 5 積分
- 3耗盡型MOS FET產(chǎn)品目錄選型表
- 0.14 MB | 3次下載 | 免費(fèi)
- 4PD取電芯片 ECP5702規(guī)格書
- 0.88 MB | 3次下載 | 免費(fèi)
- 5氮化鎵GaN FET/GaN HEMT 功率驅(qū)動(dòng)電路選型表
- 0.10 MB | 2次下載 | 免費(fèi)
- 6EMC PCB設(shè)計(jì)總結(jié)
- 0.33 MB | 2次下載 | 免費(fèi)
- 7PC5200 700V_10A GaN HEMT驅(qū)動(dòng)器數(shù)據(jù)手冊(cè)
- 1.63 MB | 1次下載 | 免費(fèi)
- 81節(jié)電池用電池保護(hù)IC S-8261D系列數(shù)據(jù)手冊(cè)
- 3.07 MB | 1次下載 | 1 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935137次下載 | 10 積分
- 2開(kāi)源硬件-PMP21529.1-4 開(kāi)關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233095次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191457次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183360次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81605次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73831次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發(fā)燒友App





創(chuàng)作
發(fā)文章
發(fā)帖
提問(wèn)
發(fā)資料
發(fā)視頻
上傳資料賺積分
評(píng)論