大數(shù)據(jù)解決方案實施的難點在于以下幾點:
1.很少有優(yōu)質(zhì)可用的數(shù)據(jù)
在數(shù)聚股份看來,這幾年數(shù)據(jù)交易機構(gòu)如雨后春筍,“數(shù)據(jù)變現(xiàn)”成為很多擁有數(shù)據(jù)積累的傳統(tǒng)企業(yè)的新的生財法。目前,我國大數(shù)據(jù)需求端以互聯(lián)網(wǎng)企業(yè)為主,覆蓋面不廣,在O2O趨勢下,大型互聯(lián)網(wǎng)廠商嘗試引入外部數(shù)據(jù)支撐金融、生活、語音、旅游、健康和教育等多種服務(wù)。
然而在具體的領(lǐng)域或行業(yè)內(nèi),我國普遍未形成成型的數(shù)據(jù)采集、加工、分析和應(yīng)用鏈條,大量數(shù)據(jù)源未被激活,大多數(shù)數(shù)據(jù)擁有者沒有數(shù)據(jù)價值外化的路徑。比如,各醫(yī)療健康類應(yīng)用收集了大量的數(shù)據(jù),但沒有像那樣面向醫(yī)藥公司售賣數(shù)據(jù)。與國外相比我國的政府、公共服務(wù)、農(nóng)業(yè)應(yīng)用基本缺位,電信和銀行業(yè)更缺少與外部數(shù)據(jù)的碰撞。
另外,其實數(shù)據(jù)交易這件事本身就是一個悖論。數(shù)據(jù)作為一種商品有一定的特殊性,我用了別人也可以用,沒有任何消耗,可以在市場賣很多遍。這就產(chǎn)生一個問題,你這個數(shù)據(jù)到市場賣,根據(jù)經(jīng)濟學觀點它的價值是零,你賣給我我可以用更低的價格賣給別人,所以數(shù)據(jù)交易理論上來說也是不可行的。
大數(shù)據(jù)概念火了以后,很多機構(gòu)覺得數(shù)據(jù)存起來就是寶,于是積攢了大量零碎數(shù)據(jù)放在那里,到底能發(fā)揮什么作用也未可知。而在和許多真正想用數(shù)據(jù)做些事情的機構(gòu)的合作中我們發(fā)現(xiàn),即便是政府機構(gòu)這樣的權(quán)威數(shù)據(jù)持有方,也存在很多數(shù)據(jù)缺失、數(shù)據(jù)錯誤、噪音多各方面的問題。
我們常常在講大數(shù)據(jù)就用大數(shù)據(jù)方法,小數(shù)據(jù)就用小數(shù)據(jù)方法,完美的數(shù)據(jù)是永遠等不來的。但這樣會導致什么問題呢?在實際項目實施過程中,我們的數(shù)據(jù)科學家們不得不花費大量時間在數(shù)據(jù)清洗上,這其實是對本來就緊缺的數(shù)據(jù)人員的一種浪費。
理論上我們中國有很多數(shù)據(jù),但不同部門數(shù)據(jù)存在在不同的地方,格式也不一樣。政府內(nèi)部本身整合各部門的數(shù)據(jù)就已經(jīng)是一件很頭大的事情,更不要提大規(guī)模的數(shù)據(jù)開放。同時數(shù)據(jù)開放面臨一個嚴重問題就是隱私問題,脫敏遠遠不夠,隱私問題是一個無底洞。比如我們把一個人的支付寶3個月數(shù)據(jù)拿過來,就可以很輕易的知道這個人今天在門口便利店買了一瓶水,昨天在淘寶買了沙發(fā),每隔三個月會有一筆萬元的支出。那我們就可以很容易推斷這個人剛換了一個租房子的地方,就能了解他的消費習慣。這個數(shù)據(jù)其實完全是脫敏的,沒有名字、沒有號碼,但絲毫不妨礙我們通過算法完全的勾勒出這個人的畫像。
2.實際技術(shù)與業(yè)務(wù)之間還有很大距離
在數(shù)聚股份看來,大數(shù)據(jù)行業(yè)發(fā)展至今,技術(shù)與業(yè)務(wù)之間依然存在巨大著鴻溝。首先,就是數(shù)據(jù)分析技術(shù)本身。數(shù)據(jù)源企業(yè)為實現(xiàn)數(shù)據(jù)價值變現(xiàn),嘗試多種方法,甚至自己組建數(shù)據(jù)分析團隊,可是數(shù)據(jù)分析是個技術(shù)活,1%的誤差都會極大地影響市場份額,術(shù)業(yè)有專攻,數(shù)據(jù)變現(xiàn)還是需要專業(yè)的數(shù)據(jù)分析人才來實現(xiàn)。
大數(shù)據(jù)概念的火熱,做大數(shù)據(jù)的公司越來越多,產(chǎn)品做得五花八門,數(shù)據(jù)建模看似誰都可以涉足,但現(xiàn)在數(shù)據(jù)分析的技術(shù),方法,模型,算法都有了非常大的改進,跟過去六七十年代完全不一樣,不是說做幾個SAAS軟件或者RAAS軟件就是大數(shù)據(jù)了,雖然短期看市場火熱,但長遠來說這條路是走不通的,大數(shù)據(jù)行業(yè)發(fā)展,技術(shù)才是真正的發(fā)力點,提高行業(yè)準入門檻尤為重要。
其次中國的數(shù)據(jù)有它的特色,例如在金融行業(yè),目前大部分銀行采用的是風險評分卡,運用專家經(jīng)驗定義風險變量,基于定性認識進行評分,通過事后風險回檢優(yōu)化評分卡,風險預(yù)警功能較差。雖然央行征信中心與國內(nèi)少數(shù)技術(shù)領(lǐng)先銀行使用的是風險評分模型,但模型方法相對陳舊,如央行所用FICO評分模型為上世紀80年代基于邏輯回歸算法構(gòu)建的評分體系,邏輯回歸算法適合處理線性數(shù)據(jù),但實際問題往往是非線性的,特別是信用風險評估場景下。此外,F(xiàn)ICO模型沒有針對我國具體業(yè)務(wù)進行場景細分,建模邏輯并不完全符合我國實際情況,因此導致準確率不足,風險預(yù)警能力差?;诖耍袊嗣胥y行征信中心首次與國內(nèi)大數(shù)據(jù)公司合作,這次合作中普林科技應(yīng)用國際領(lǐng)先的大數(shù)據(jù)建模分析技術(shù)運用決策樹隨機森林,AdaBOOST,GBDT,SVM等算法,通過對信用報告的數(shù)字化解讀與深入洞察,準確預(yù)測了違約風險,對貸款審批、貸中管理形成指導,新模型對好壞賬戶的區(qū)分度遠高于行業(yè)平均水平。此次合作表明我國的大數(shù)據(jù)難題更需要適應(yīng)國情的解決方案與本土的技術(shù)人才,這對我們的市場提出了一個新問題。
3.人才稀缺
在數(shù)聚股份看來,我們國家大數(shù)據(jù)發(fā)展最大的優(yōu)勢就是市場大,最大的劣勢恰巧就是缺乏相應(yīng)人才,人才缺乏的程度非常嚴重。首先在國際市場方面,我們要跟國外公司爭人才,然而國外大數(shù)據(jù)行業(yè)同樣十分火熱。而不論在國內(nèi)還是國外,跟企業(yè)競爭人才都是一項艱巨的事業(yè),比如在世界上最好的大學之一的美國普林斯頓大學,想找數(shù)學家也是非常困難,人才很容易被大公司挖走,每年都有非常好的數(shù)據(jù)分析人才被企業(yè)挖走。所以人才難覓不只是口頭說說,更是一個亟待解決的問題 大數(shù)據(jù)是一個交叉學科,涉及統(tǒng)計學,管理編程等多學科,知識點復(fù)雜,缺乏系統(tǒng)的學習教程。
審核編輯 黃宇
-
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
9088瀏覽量
143962
發(fā)布評論請先 登錄
黑M-狂野大數(shù)據(jù)5期|網(wǎng)盤無密Mp4+大數(shù)據(jù)直播課-狂野大數(shù)據(jù)
海光3350便攜機主板:大數(shù)據(jù)處理利器
低功耗物聯(lián)網(wǎng)農(nóng)業(yè)氣象監(jiān)測系統(tǒng)設(shè)計與實施方案
大數(shù)據(jù)平臺運營的基礎(chǔ)是什么
Amphenol LTW:數(shù)據(jù)中心互連解決方案的創(chuàng)新先鋒
東軟集團領(lǐng)跑中國醫(yī)療大數(shù)據(jù)解決方案市場
軟通動力攜手華為推出智帷司庫解決方案
御控工業(yè)物聯(lián)網(wǎng)大數(shù)據(jù)解決方案:排水設(shè)備遠程監(jiān)控與大數(shù)據(jù)統(tǒng)計系統(tǒng)
軟通動力數(shù)據(jù)庫專業(yè)服務(wù)全棧解決方案亮相2025數(shù)博會
電科網(wǎng)安亮相2025中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會
封閉式園區(qū)安全管控解決方案應(yīng)該如何實施?
沖壓PLC類設(shè)備的數(shù)據(jù)采集解決方案
大數(shù)據(jù)解決方案如何實施
評論