国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深入了解一下到底什么是大數(shù)據

kus1_iawbs2016 ? 來源:lq ? 2019-01-24 11:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

這些年,大數(shù)據作為一個時髦概念,出現(xiàn)頻率很高,關注度也很高。

對于很多人來說,當他第一次聽到“大數(shù)據”這個詞,會自然而然從字面上去理解——認為大數(shù)據就是大量的數(shù)據,大數(shù)據技術就是大量數(shù)據的存儲技術。

但是,事實并非如此。

大數(shù)據比想象中復雜。它不只是一項數(shù)據存儲技術,而是一系列和海量數(shù)據相關的抽取、集成、管理、分析、解釋技術,是一個龐大的框架系統(tǒng)。

更進一步來說,大數(shù)據是一種全新的思維方式和商業(yè)模式。

圖片來自網絡

今天這篇文章,就讓我們花五分鐘的時間,來深入了解一下,到底什么是大數(shù)據。

大數(shù)據的定義

首先,還是要重新審視大數(shù)據的定義。

行業(yè)里對大數(shù)據的定義有很多,有廣義的定義,也有狹義的定義。

廣義的定義,有點哲學味道——大數(shù)據,是指物理世界到數(shù)字世界的映射和提煉。通過發(fā)現(xiàn)其中的數(shù)據特征,從而做出提升效率的決策行為。

狹義的定義,是技術工程師給的——大數(shù)據,是通過獲取、存儲、分析,從大容量數(shù)據中挖掘價值的一種全新的技術架構。

相比較而言,我還是喜歡技術定義,哈哈。

大家注意,關鍵詞我都在上面原句加粗了哈!

要做什么?——獲取數(shù)據、存儲數(shù)據、分析數(shù)據

對誰做?——大容量數(shù)據

目的是什么?——挖掘價值

獲取數(shù)據、存儲數(shù)據、分析數(shù)據,這一系列的行為,都不算新奇。我們每天都在用電腦,每天都在干這個事。

例如,每月的月初,考勤管理員會獲取每個員工的考勤信息,錄入Excel表格,然后存在電腦里,統(tǒng)計分析有多少人遲到、缺勤,然后扣TA工資。

但是,同樣的行為,放在大數(shù)據身上,就行不通了。換言之,傳統(tǒng)個人電腦,傳統(tǒng)常規(guī)軟件,無力應對的數(shù)據級別,才叫“大數(shù)據”。

大數(shù)據,到底有多大?

我們傳統(tǒng)的個人電腦,處理的數(shù)據,是GB/TB級別。例如,我們的硬盤,現(xiàn)在通常是1TB/2TB/4TB的容量。

TB、GB、MB、KB的關系,大家應該都很熟悉了:

1 KB = 1024 B (KB - kilobyte)

1 MB = 1024 KB (MB - megabyte)

1 GB = 1024 MB (GB - gigabyte)

1 TB = 1024 GB (TB - terabyte)

而大數(shù)據是什么級別呢?PB/EB級別。

大部分人都沒聽過。其實也就是繼續(xù)翻1024倍:

1 PB = 1024 TB (PB - petabyte)

1 EB = 1024 PB (EB - exabyte)

只是看這幾個字母的話,貌似不是很直觀。我來舉個例子吧。

1TB,只需要一塊硬盤可以存儲。容量大約是20萬張照片或20萬首MP3音樂,或者是671部《紅樓夢》小說。

普通硬盤

1PB,需要大約2個機柜的存儲設備。容量大約是2億張照片或2億首MP3音樂。如果一個人不停地聽這些音樂,可以聽1900年。。。

2個機柜

1EB,需要大約2000個機柜的存儲設備。如果并排放這些機柜,可以連綿1.2公里那么長。如果擺放在機房里,需要21個標準籃球場那么大的機房,才能放得下。

21個籃球場

阿里、百度、騰訊這樣的互聯(lián)網巨頭,數(shù)據量據說已經接近EB級。

阿里數(shù)據中心內景

EB還不是最大的。目前全人類的數(shù)據量,是ZB級。

1 ZB = 1024 EB (ZB - zettabyte)

2011年,全球被創(chuàng)建和復制的數(shù)據總量是1.8ZB。

而到2020年,全球電子設備存儲的數(shù)據,將達到35ZB。如果建一個機房來存儲這些數(shù)據,那么,這個機房的面積將比42個鳥巢體育場還大。

數(shù)據量不僅大,增長還很快——每年增長50%。也就是說,每兩年就會增長一倍。

目前的大數(shù)據應用,還沒有達到ZB級,主要集中在PB/EB級別。

大數(shù)據的級別定位

1 KB = 1024 B (KB - kilobyte)

1 MB = 1024 KB (MB - megabyte)

1 GB = 1024 MB (GB - gigabyte)

1 TB = 1024 GB (TB - terabyte)

1 PB = 1024 TB (PB - petabyte)

1 EB = 1024 PB (EB - exabyte)

1 ZB = 1024 EB (ZB - zettabyte)

數(shù)據的來源

數(shù)據的增長,為什么會如此之快?

說到這里,就要回顧一下人類社會數(shù)據產生的幾個重要階段。

大致來說,是三個重要的階段。

第一個階段,就是計算機被發(fā)明之后的階段。尤其是數(shù)據庫被發(fā)明之后,使得數(shù)據管理的復雜度大大降低。各行各業(yè)開始產生了數(shù)據,從而被記錄在數(shù)據庫中。這時的數(shù)據,以結構化數(shù)據為主(待會解釋什么是“結構化數(shù)據”)。數(shù)據的產生方式,也是被動的。

世界上第一臺通用計算機-ENIAC

第二個階段,是伴隨著互聯(lián)網2.0時代出現(xiàn)的。互聯(lián)網2.0的最重要標志,就是用戶原創(chuàng)內容。隨著互聯(lián)網和移動通信設備的普及,人們開始使用博客、facebook、youtube這樣的社交網絡,從而主動產生了大量的數(shù)據。

第三個階段,是感知式系統(tǒng)階段。隨著物聯(lián)網的發(fā)展,各種各樣的感知層節(jié)點開始自動產生大量的數(shù)據,例如遍布世界各個角落的傳感器、攝像頭。

經過了“被動-主動-自動”這三個階段的發(fā)展,最終導致了人類數(shù)據總量的極速膨脹。

大數(shù)據的4Vs

行業(yè)里對大數(shù)據的特點,概括為4個V。前面所說的龐大數(shù)據體量,就是Volume(海量化)。除了Volume之外,剩下三個,分別是Variety、Velocity、Value。

我們一個一個來介紹。

Variety(多樣化)

數(shù)據的形式是多種多樣的,包括數(shù)字(價格、交易數(shù)據、體重、人數(shù)等)、文本(郵件、網頁等)、圖像、音頻、視頻、位置信息(經緯度、海拔等),等等,都是數(shù)據。

數(shù)據又分為結構化數(shù)據和非結構化數(shù)據。

從名字可以看出,結構化數(shù)據,是指可以用預先定義的數(shù)據模型表述,或者,可以存入關系型數(shù)據庫的數(shù)據。

結構化數(shù)據

例如,一個班級所有人的年齡、一個超市所有商品的價格,這些都是結構化數(shù)據。

而網頁文章、郵件內容、圖像、音頻、視頻等,都屬于非結構話數(shù)據。

在互聯(lián)網領域里,非結構化數(shù)據的占比已經超過整個數(shù)據量的80%。

大數(shù)據,就符合這樣的特點:數(shù)據形式多樣化,且非結構化數(shù)據占比高。

Velocity(時效性)

大數(shù)據還有一個特點,那就是時效性。從數(shù)據的生成到消耗,時間窗口非常小。數(shù)據的變化速率,還有處理過程,越來越快。例如變化速率,從以前的按天變化,變成現(xiàn)在的按秒甚至毫秒變化。

我們還是用數(shù)字來說話:

就在剛剛過去的這一分鐘,數(shù)據世界里發(fā)生了什么?

Email:2.04億封被發(fā)出

Google:200萬次搜索請求被提交

Youtube:2880分鐘的視頻被上傳

Facebook:69.5萬條狀態(tài)被更新

Twitter:98000條推送被發(fā)出

12306:1840張車票被賣出

……

怎么樣?是不是瞬息萬變?

Value(價值密度)

最后一個特點,就是價值密度。

大數(shù)據的數(shù)據量很大,但隨之帶來的,就是價值密度很低,數(shù)據中真正有價值的,只是其中的很少一部分。

例如通過監(jiān)控視頻尋找犯罪分子的相貌,也許幾TB的視頻文件,真正有價值的,只有幾秒鐘。

2014年美國波士頓爆炸案,現(xiàn)場調取了10TB的監(jiān)控數(shù)據(包括移動基站的通訊記錄,附近商店、加油站、報攤的監(jiān)控錄像以及志愿者提供的影像資料),最終找到了嫌疑犯的一張照片。

大數(shù)據的價值

剛才說到價值密度,也就說到了大數(shù)據的核心本質,那就是價值。

人類提出大數(shù)據、研究大數(shù)據的主要目的,就是為了挖掘大數(shù)據里面的價值。

大數(shù)據,究竟有什么價值?

早在1980年,著名未來學家阿爾文·托夫勒在他的著作《第三次浪潮》中,就明確提出:“數(shù)據就是財富”,并且,將大數(shù)據稱為“第三次浪潮的華彩樂章”。

第一次浪潮:農業(yè)階段,約1萬年前開始

第二次浪潮:工業(yè)階段,17世紀末開始

第三次浪潮:信息化階段,20世紀50年代后期開始

進入21世紀之后,隨著前面所說的第二第三階段的發(fā)展,移動互聯(lián)網崛起,存儲能力和云計算能力飛躍,大數(shù)據開始落地,也引起了越來越多的重視。

2012年的世界經濟論壇指出:“數(shù)據已經成為一種新的經濟資產類別,就像貨幣和黃金一樣”。這無疑將大數(shù)據的價值推到了前所未有的高度層面上。

如今,大數(shù)據應用開始走進我們的生活,影響我們的衣食住行。

滴滴的大數(shù)據殺熟,相信大家都有所耳聞

之所以大數(shù)據會有這么快的發(fā)展,就是因為越來越多的行業(yè)和企業(yè),開始認識到大數(shù)據的價值,開始試圖參與挖掘大數(shù)據的價值。

歸納來說,大數(shù)據的價值主要來自于兩個方面:

1 幫助企業(yè)了解用戶

大數(shù)據通過相關性分析,將客戶和產品、服務進行關系串聯(lián),對用戶的偏好進行定位,從而提供更精準、更有導向性的產品和服務,提升銷售業(yè)績。

典型的例子就是電商。

像阿里淘寶這樣的電子商務平臺,積累了大量的用戶購買數(shù)據。在早期的時候,這些數(shù)據都是累贅和負擔,存儲它們需要大量的硬件成本。但是,現(xiàn)在這些數(shù)據都是阿里最寶貴的財富。

通過這些數(shù)據,可以分析用戶行為,精準定位目標客群的消費特點、品牌偏好、地域分布,從而引導商家的運營管理、品牌定位、推廣營銷等。

大數(shù)據可以對業(yè)績產生直接影響。它的效率和準確性,遠遠超過傳統(tǒng)的用戶調研。

除了電商,包括能源、影視、證券、金融、農業(yè)、工業(yè)、交通運輸、公共事業(yè)等,都是大數(shù)據的用武之地。

大數(shù)據甚至能夠幫助競選總統(tǒng)

2 幫助企業(yè)了解自己

除了幫助了解用戶之外,大數(shù)據還能幫助了解自己。

企業(yè)生產經營需要大量的資源,大數(shù)據可以分析和鎖定資源的具體情況,例如儲量分布和需求趨勢。這些資源的可視化,可以幫助企業(yè)管理者更直觀地了解企業(yè)的運作狀態(tài),更快地發(fā)現(xiàn)問題,及時調整運營策略,降低經營風險。

總而言之,“知己知彼,百戰(zhàn)百勝”。大數(shù)據,就是為決策服務的。

大數(shù)據和云計算

說到這里,我們要回答一個很多人心里都存在的疑惑——大數(shù)據和云計算之間,到底有什么關系?

可以這么解釋:數(shù)據本身是一種資產,而云計算,則是為挖掘資產價值提供合適的工具。

從技術上,大數(shù)據是依賴于云計算的。云計算里面的海量數(shù)據存儲技術、海量數(shù)據管理技術、分布式計算模型等,都是大數(shù)據技術的基礎。

云計算就像是挖掘機,大數(shù)據就是礦山。如果沒有云計算,大數(shù)據的價值就發(fā)揮不出來。

相反的,大數(shù)據的處理需求,也刺激了云計算相關技術的發(fā)展和落地。

也就是說,如果沒有大數(shù)據這座礦山,云計算這個挖掘機,很多強悍的功能都發(fā)展不起來。

套用一句老話——云計算和大數(shù)據,兩者是相輔相成的。

大數(shù)據和物聯(lián)網(5G

第二個問題,大數(shù)據和物聯(lián)網有什么關系?

這個問題我覺得大家應該能夠很快想明白,前面其實也提到了。

物聯(lián)網就是“物與物互相連接的互聯(lián)網”。物聯(lián)網的感知層,產生了海量的數(shù)據,將會極大地促進大數(shù)據的發(fā)展。

同樣,大數(shù)據應用也發(fā)揮了物聯(lián)網的價值,反向刺激了物聯(lián)網的使用需求。越來越多的企業(yè),發(fā)覺能夠通過物聯(lián)網大數(shù)據獲得價值,就會愿意投資建設物聯(lián)網。

其實這個問題也可以進一步延伸為“大數(shù)據和5G之間的關系”。

即將到來的5G,通過提升連接速率,提升了“人聯(lián)網”的感知,也促進了人類主動創(chuàng)造數(shù)據。

另一方面,它更多是為“物聯(lián)網”服務的。包括低延時、海量終端連接等,都是物聯(lián)網場景的需求。

5G刺激物聯(lián)網的發(fā)展,而物聯(lián)網刺激大數(shù)據的發(fā)展。所有通信基礎設施的強大,都是為大數(shù)據崛起鋪平道路。

大數(shù)據的產業(yè)鏈

接下來再說說大數(shù)據的產業(yè)鏈。

大數(shù)據的產業(yè)鏈,和大數(shù)據的處理流程是緊密相關的。簡單來說,就是生產數(shù)據、聚合數(shù)據、分析數(shù)據、消費數(shù)據。

每個環(huán)節(jié),都有相應的角色玩家。如下圖:

從目前的情況來看,國外廠商在大數(shù)據產業(yè)占據了較大的份額,尤其是上游領域,基本上都是國外企業(yè)。國內IT企業(yè)相比而言,存在較大的差距。

大數(shù)據相關重點領域及企業(yè)(技術)

大數(shù)據的挑戰(zhàn)

說了那么多大數(shù)據的好話,并不代表大數(shù)據是完美的。

大數(shù)據也面臨著很多挑戰(zhàn)。

除了數(shù)據管理技術難度之外,大數(shù)據的最大挑戰(zhàn),就是安全。

數(shù)據是資產,也是隱私。沒有人愿意自己的隱私被暴露,所以,人們對自己的隱私保護越來越重視。政府也在不斷加強對公民隱私權的保護,出臺了很多法律。

歐盟在2018年出臺了有史以來最嚴厲的GDPR(《一般數(shù)據保護法案》),把網絡數(shù)據保護上升到前所未有的高度

在這種情況下,企業(yè)獲取用戶數(shù)據,就需要慎重考慮,是否符合倫理和法律。一旦違法,將付出極為沉重的代價。

此外,即使企業(yè)合法獲取數(shù)據,也要擔心是否會被惡意攻擊和竊取。這里面的風險也是不容忽視的。

除了安全之外,大數(shù)據還要面臨能耗等方面的問題。

換言之,如果不能很好地保護和利用手里的大數(shù)據,那么它就是一個燙手的山芋,有還不如沒有。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 硬盤
    +關注

    關注

    3

    文章

    1361

    瀏覽量

    59881
  • 存儲數(shù)據

    關注

    0

    文章

    90

    瀏覽量

    14471
  • 大數(shù)據
    +關注

    關注

    64

    文章

    9063

    瀏覽量

    143743

原文標題:五分鐘解讀“大數(shù)據”

文章出處:【微信號:iawbs2016,微信公眾號:寬禁帶半導體技術創(chuàng)新聯(lián)盟】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    深入了解示波器

    深入了解示波器
    發(fā)表于 11-14 22:32

    專家開講:深入了解電池技術 ──Part 1

    。筆者不會一一詳細介紹所有的電池技術,只選擇些常見或是值得認識的;而在接下來的專欄里,筆者將開始介紹電池分類、常見規(guī)格以及專業(yè)術語,如果你有特別想知道的電池技術,歡迎留言!擴展閱讀:專家開講:深入了解
    發(fā)表于 08-18 09:33

    專家開講:深入了解電池技術──Part 3

    資深工程師 Ivan Cowie 的「深入了解電池技術」專欄Part 3來啰!這次要介紹的是鉛酸電池(lead-acidbatteries)技術。鉛酸電池是在1859年由法國物理學家Gaston
    發(fā)表于 08-18 09:37

    專家開講:深入了解電池技術──Part 4 (堿性電池)

    擴展閱讀:專家開講:深入了解電池技術 ──Part 1專家開講:深入了解電池技術 ──Part 2-1專家開講:深入了解電池技術──Part 2-2專家開講:深入了解電池技術──Par
    發(fā)表于 08-18 09:39

    單片機的深入了解

    項目名稱:單片機的深入了解!項目是否開源:否申請開發(fā)板數(shù)量:1 塊申請人團隊介紹:我們團隊由五個人組成,我們打算開始著手單片機的程序改編,設計些比較特殊新穎的東西!希望給以支持!
    發(fā)表于 10-12 20:00

    深入了解LabVIEW FPGA資料分享

    深入了解LabVIEW FPGA
    發(fā)表于 05-27 08:35

    深入了解DSP

    深入了解DSPDSP(digital singnal processor)是種獨特的微處理器,有自己的完整指令系統(tǒng),是以數(shù)字信號來處理大量信息的器件。個數(shù)字信號處理器在塊不大的芯
    發(fā)表于 05-16 17:06

    深入了解u-boot該看什么書?

    深入了解u-boot 有哪些書推薦一下
    發(fā)表于 08-15 01:44

    深入了解獨立式數(shù)據采集系統(tǒng)CompactDAQ

    深入了解獨立式數(shù)據采集系統(tǒng)CompactDAQ
    發(fā)表于 05-11 07:10

    采用抓取波形的方式對SPI進行一下深入了解

    SPI分析平時會使用硬件SPI,但是只用于應用沒有具體深入了解SPI的執(zhí)行流程,此處我采用抓取波形的方式對SPI進行了一下深入了解。STM32配置void SPI1_Init(void
    發(fā)表于 02-17 06:01

    起來認識深入了解水銀

    起來認識深入了解水銀    汞在常溫呈液態(tài),
    發(fā)表于 10-23 09:22 ?2874次閱讀

    深入了解一下,到底什么是大數(shù)據

    對于很多人來說,當他第次聽到“大數(shù)據”這個詞,會自然而然從字面上去理解——認為大數(shù)據就是大量的數(shù)據,大數(shù)據技術就是大量
    的頭像 發(fā)表于 12-06 15:39 ?4894次閱讀

    帶你深入了解示波器

    帶你深入了解示波器
    發(fā)表于 02-07 14:26 ?19次下載

    深入了解安全光柵

    深入了解安全光柵
    的頭像 發(fā)表于 06-25 13:53 ?3050次閱讀
    <b class='flag-5'>深入了解</b>安全光柵

    深入了解 GaN 技術

    深入了解 GaN 技術
    的頭像 發(fā)表于 12-06 17:28 ?7947次閱讀
    <b class='flag-5'>深入了解</b> GaN 技術