大數(shù)據出現(xiàn)的時間只有十幾年,被人們廣泛接受并應用只有幾年的時間,但就是這短短幾年的時間,大數(shù)據呈現(xiàn)出爆炸式增長的態(tài)勢。在各個領域,大數(shù)據的身影幾乎無處不在。今天我們通過一些大數(shù)據典型的應用場景分析,一起來看看大數(shù)據到底能做些什么,我們學大數(shù)據究竟有什么用,應該關注大數(shù)據的哪些方面。
大數(shù)據在醫(yī)療健康領域的應用
健康醫(yī)療領域是最近幾年獲得最多創(chuàng)業(yè)者和投資人青睞的大數(shù)據領域。為什么這么說呢?首先,醫(yī)療健康領域會產生大量的數(shù)據;其次,醫(yī)療健康領域有一個萬億級的市場規(guī)模;最關鍵的是,醫(yī)療健康領域里很多工作依賴人的經驗,而這正是機器學習的強項。醫(yī)學影像智能識別
圖像識別是機器學習獲得的重大突破之一,使用大量的圖片數(shù)據進行深度機器學習訓練,機器可以識別出特定的圖像元素,比如貓或者人臉,當然也可以識別出病理特征。
比如X光片里的異常病灶位置,是可以通過機器學習智能識別出來的。甚至可以說醫(yī)學影像智能識別在某些方面已經比一般醫(yī)生擁有更高的讀圖和識別能力,但是鑒于醫(yī)療的嚴肅性,現(xiàn)在還很少有臨床方面的實踐。
雖然在臨床實踐方面應用有限,但是醫(yī)療影像AI還是在一些領域取得一定的進展。醫(yī)學影像智能識別,一方面可以幫助醫(yī)生進行輔助診療,另一方面對于皮膚病等有外部表現(xiàn)的病癥,病人可以自己拍照然后使用AI智能識別做一個初步診斷。
病歷大數(shù)據智能診療
病歷,特別是專家寫的病歷,本身就是一筆巨大的知識財富,利用大數(shù)據技術將這些知識進行處理、分析、統(tǒng)計、挖掘,可以構成一個病歷知識庫,可以分享給更多人,即構成一個智能輔助診療系統(tǒng)。下面這張圖是我曾經參與設計過的一個醫(yī)療輔助診療系統(tǒng)的架構。
針對同類疾病和其他上下文信息(化驗結果、病史、年齡性別、病人回訪信息等)可以挖掘出針對同樣的疾病情況,哪種治療手段可以用更低的治療成本、更少的病人痛苦,獲得更好的治療效果。從上面的架構圖你能看到,將這些病歷知識和循證醫(yī)學知識、科研文獻知識、用藥知識共同構成一個輔助診療知識庫,通過知識匹配搜索引擎可以對外提供服務。患者或者醫(yī)生錄入病史、檢查結果等信息,系統(tǒng)匹配初步診斷結果,搜索診療計劃,產生多個輔助診療建議,供患者和醫(yī)生進行參考。
大數(shù)據在教育領域的應用
教育倡導“因人施教”,但是在傳統(tǒng)教育過程中要做到因人施教,需要老師本身能力很強才能把握好。但是大數(shù)據在線教育利用大數(shù)據技術進行分析統(tǒng)計,完全可以做到根據學生能力和學習節(jié)奏,及時調整學習大綱和學習進度,提供個性化和自適應的學習體驗。除此之外,人工智能在教育的其他方面也取得很好的進展。AI外語老師
得益于語音識別和語音合成技術的成熟(語音識別與合成技術同樣是利用大數(shù)據技術進行機器學習與訓練),一些在線教育網站嘗試用人工智能外語老師進行外語教學。這里面的原理其實并不復雜,聊天機器人技術已經普遍應用,只要將學習的知識點設計進聊天的過程中,就可以實現(xiàn)一個簡單的AI外語老師了。
智能解題
比較簡單的智能解題系統(tǒng)其實是利用搜索引擎技術,在收集大量的試題以及答案的基礎上,進行試題匹配,將匹配成功的答案返回。這個過程看起來就像智能做題一樣,表面看給個題目就能解出答案,而實際上只是找到答案。
進階一點的智能解題系統(tǒng),通過圖像識別與自然語言處理(這兩項技術依然使用大數(shù)據技術實現(xiàn)),進行相似性匹配。更改試題的部分數(shù)字、文字表述,但是不影響實質性解答思路,依然可以解答。
高階的智能解題系統(tǒng),利用神經網絡機器學習技術,將試題的自然語言描述轉化成形式語言,然后分析知識點和解題策略,進行自動推導,從而完成實質性的解題。
大數(shù)據在社交媒體領域的應用
大數(shù)據有一個重要的、和我們大多數(shù)人密切相關,但是又不太引人注目的一個應用領域是輿情監(jiān)控與分析。我們日常在各種互聯(lián)網應用和社交媒體上發(fā)表各種言論,這些言論事實上反映了最準確的民情輿論。一個個體的言論基本沒有意義,但是大量的、全國乃至全球的言論數(shù)據表現(xiàn)出的統(tǒng)計特性,就有了非常重要的意義。
編寫數(shù)據爬蟲,實時爬取各個社交新媒體上的各種用戶內容和媒體信息,然后通過自然語言處理,就可以進行情感分析、熱點事件追蹤等。輿情實時監(jiān)控可用于商業(yè)領域,引導智能廣告投放;可用于金融領域,輔助執(zhí)行自動化股票、期權、數(shù)字貨幣交易;可用于社會管理,及時發(fā)現(xiàn)可能引發(fā)社會問題的輿論傾向。
在美國總統(tǒng)大選期間,候選人就曾雇傭大數(shù)據公司利用社交媒體的數(shù)據進行分析,發(fā)現(xiàn)選票可能搖擺的地區(qū),有針對性前去進行競選演講。并利用大數(shù)據分析選民關注的話題,包裝自己的競選主張。Facebook也因為授權大數(shù)據公司濫用自己用戶的數(shù)據而遭到調查和譴責,市值蒸發(fā)了數(shù)百億美元。
大數(shù)據在金融領域的應用
大數(shù)據在金融領域應用比較成熟的是大數(shù)據風控。在金融借貸中,如何識別出高風險用戶,要求其提供更多抵押、支付更高利息、調整更低的額度,甚至拒絕貸款,從而降低金融機構的風險?事實上,金融行業(yè)已經沉淀了大量的歷史數(shù)據,利用這些數(shù)據進行計算,可以得到用戶特征和風險指數(shù)的曲線(即風控模型)。當新用戶申請貸款的時候,將該用戶特征帶入曲線進行計算,就可以得到該用戶的風險指數(shù),進而自動給出該用戶的貸款策略。
利用股票、外匯等歷史交易記錄,分析交易規(guī)律,結合當前的新聞熱點、輿論傾向、財經數(shù)據構建交易模型,進行自動化交易,這就是金融領域的量化交易。這些數(shù)據量特別巨大,交易涉及金額也同樣巨大,所以金融機構在大數(shù)據領域常常不惜血本,大手筆投入。
大數(shù)據在新零售領域的應用
區(qū)別于傳統(tǒng)零售,新零售使用大數(shù)據進行全鏈路管理。從生產、物流、購物體驗,使用大數(shù)據進行分析和預判,實現(xiàn)精準生產、零庫存、全新的購物體驗。
亞馬遜Go無人店使用大量的攝像頭,實時捕捉用戶行為,判斷用戶取出還是放回商品、取了何種商品等。這實際上是大數(shù)據流計算與機器學習的結合,最終實現(xiàn)的購物效果是,無需排隊買單,進去就拿東西,拿好了就走,超級科幻有沒有。
雖然無人店現(xiàn)在看起來噱頭的意味更多一點,但是利用大數(shù)據技術提升購物體驗、節(jié)省商家人力成本一定是正確的方向。
大數(shù)據在交通領域的應用
交通也是一個對大數(shù)據實時采集與處理應用比較廣的領域?,F(xiàn)在幾乎所有的城市路段、交通要點都有不止一個監(jiān)控攝像頭在實時監(jiān)控,一線城市大約有百萬計的攝像頭在不停地采集數(shù)據。這些數(shù)據一方面可以用于公共安全,比如近年來一些警匪片里會有一些場景:犯罪嫌疑人駕車出逃,警方只要定位了車輛,不管它到哪里,系統(tǒng)都可以自動調出相應的攝像頭,實時看到現(xiàn)場畫面。應該說這項技術已經成熟,大數(shù)據流計算可以對百萬計的流數(shù)據實時處理計算,電影里的場景計算其實并不復雜。
此外,各種導航軟件也在不停采集數(shù)據,通過分析用戶當前位置和移動速度,判斷道路擁堵狀態(tài),并實時修改推薦的導航路徑。你如果經常開車或者打車,對這些技術一定深有體會。
還有就是無人駕駛技術,無人駕駛就是在人的駕駛過程中實時采集車輛周邊數(shù)據和駕駛控制信息,然后通過機器學習,獲得周邊信息與駕駛方式的對應關系(自動駕駛模型)。然后將這個模型應用到無人駕駛汽車上,傳感器獲得車輛周邊數(shù)據后,就可以通過自動駕駛模型計算出車輛控制信息(轉向、剎車等)。計算自動駕駛模型需要大量的數(shù)據,所以我們看到,這些無人駕駛創(chuàng)業(yè)公司都在不斷攀比自己的訓練數(shù)據有幾十萬公里、幾百萬公里,因為訓練數(shù)據的量意味著模型的完善程度。
小結
正如我前面所說,利用大數(shù)據和機器學習,發(fā)掘數(shù)據中的規(guī)律,進而對當前的事情做出預測和判斷,使機器表現(xiàn)出智能的特性,正變得越來越普及。
大數(shù)據主要來自企業(yè)自身所產生,還有一些數(shù)據來自互聯(lián)網,通過網絡爬蟲可以獲取;再有就是公共數(shù)據,比如氣象數(shù)據等。所有這些數(shù)據匯聚在一起,計算其內在的關系,可以發(fā)現(xiàn)很多肉眼和思維無法得到的知識。然后進一步計算其內在的模型,可以使系統(tǒng)獲得智能的特性。當系統(tǒng)具備智能的特性,可以使機器對當前的事情做出預測和判斷,正如我今天和你聊的,大數(shù)據技術應用正變得越來越普及。
但是,這些數(shù)據通常非常巨大,存儲、計算、應用都需要一套不同以往的技術方案。通過前面3期內容,我?guī)懔私饬舜髷?shù)據技術和應用的發(fā)展史,以及當今大數(shù)據典型的應用領域。從第4期開始,我將會從大數(shù)據主要產品的架構原理、大數(shù)據分析與應用、數(shù)據挖掘與機器學習算法等幾個維度,全面講解大數(shù)據的方方面面,相信你一定有所收獲。
-
醫(yī)療健康
+關注
關注
2文章
297瀏覽量
26651 -
機器學習
+關注
關注
66文章
8553瀏覽量
136928 -
大數(shù)據
+關注
關注
64文章
9062瀏覽量
143740
發(fā)布評論請先 登錄
Neway電機方案的替代兼容性體現(xiàn)在哪些方面
購買六類網線時應該注意哪些方面呢
MCU低功耗主要體現(xiàn)在哪些方面?
大數(shù)據解決方案如何實施
最受歡迎的大數(shù)據可視化工具
大數(shù)據平臺運營的基礎是什么
低噪聲開關電源的用途有哪些?
蜂鳥e203移植要從哪些方面入手,在bsp中哪里修改引腳對應關系,約束文件?
御控工業(yè)物聯(lián)網大數(shù)據解決方案:排水設備遠程監(jiān)控與大數(shù)據統(tǒng)計系統(tǒng)
EDA是什么,有哪些方面
AI語音控制模塊能做些什么
大數(shù)據能做些什么,應該關注哪些方面
評論