国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

關于數據挖掘原理分析及其在量化投資中的應用介紹

MATLAB ? 來源:djl ? 2019-09-19 09:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、什么是數據挖掘

數據挖掘(Data Mining),也叫數據開采,數據采掘等,就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。

數據挖掘基于的數據庫類型主要有關系型數據庫、面向對象數據庫、事務數據庫、演繹數據庫、時態數據庫、多媒體數據庫、主動數據庫、空間數據庫、文本型、 Internet信息庫 以及新興的數據倉庫(Data Warehouse)等。而挖掘后獲得的知識包括關聯規則、特征規則、區分規則、分類規則、總結規則、偏差規則、聚類規則、模式分析及趨勢分析等。數據挖掘是一門交叉學科,它把人們對數據的應用從低層次的簡單查詢,提升到從數據中挖掘知識,提供決策支持。數據挖掘在數據由數據庫轉化為知識的過程中,所處的位置如圖1所示。

關于數據挖掘原理分析及其在量化投資中的應用介紹

圖1 數據由數據庫轉化為知識的過程

數據挖掘與傳統的數據分析(如查詢、報表、聯機應用分析)的本質區別是數據挖掘是在沒有明確假設的前提下去挖掘信息、發現知識(也包括大量的不公開的數據)。數據挖掘使數據庫技術進入了一個更高級的階段。數據挖掘是要發現那些不能靠直覺發現的信息或知識,甚至是違背直覺的信息或知識,挖掘出的信息越是出乎意料,就可能越有價值。能夠比市場提前知道這種信息,提前做出決策就會獲得超額利潤。

二、數據挖掘的原理

數據本來只是數據,直觀上并沒有表現出任務有價值的知識。當我們用數據挖掘方法,從數據中挖掘出知識后,這種知識是否值得信賴呢?為了說明這種知識是可信的, 現在來簡要介紹一下數據挖掘的原理。

關于數據挖掘原理分析及其在量化投資中的應用介紹


圖2 數據挖掘與其他學科的關系

數據挖掘其實質是綜合應用各種技術,對于業務相關的數據進行一系列科學的處理,這這過程中需要用到數據庫、統計學、應用數學、機器學習、可視化、信息科學、程序開發以及其他學科(如圖2所示)。其核心是利用算法對處理好的輸入和輸出數據進行訓練,并得到模型, 然后再對模型進行驗證,使得模型能夠在一定程度上刻畫出數據由輸入到輸出的關系, 然后再利用該模型,對新輸入的數據進行計算,從而得到我們希望得到的新的輸出。所以雖然這種模型不容易解釋或很難看到, 但它是基于大量數據訓練并經過驗證的,所以能夠反映輸入數據和輸出數據之間的大致關系,這種關系(模型)就是我們需要的知識。這就是數據挖掘的原理。從數據挖掘的原理可以看出, 數據挖掘是有一定科學依據的, 數據挖掘的結果也是值得信賴的。

三、數據挖掘在量化投資的應用

1、宏觀經濟分析

股市的影響因素很多,但中國股市對宏觀政策尤其敏感,從根本上說,股市的運行與宏觀的經濟運行應當是一致的,經濟的周期決定著股市的周期,股市周期的變化反映了經濟周期的變動。其中經濟周期包括衰退、危機、復蘇和繁榮四個階段。按照一般常理來說,在經濟衰退時期,股價指數會逐漸下跌;到經濟危機時期,股價指數跌至最低點;當經濟復蘇開始時,股價指數又會逐步上升;到經濟繁榮時,股價指數則上漲至最高點。由此看來宏觀經濟走勢影響著股市的波動,但宏觀經濟走勢與股市趨勢的變動周期也不是完全同步的。所以無論從量化投資角度還是傳統投資方式角度,對宏觀經濟進行深入的分析是必須的。

在量化投資領域, 數據挖掘技術可以做以下幾個方面的工作:

分析GDP對股市及個股的影響。

分析分析貨幣供應量對股票價格的影響及對個股的影響。

分析利率對股市的影響及利率變化對個股的影響。

分析匯率對股市及個股的影響。

在宏觀經濟分析方面, 經常用到回歸、關聯分析、分類、預測等方法。比如利用回歸、預測等技術確定經濟周期, 并研究不同股票于各經濟周期的關聯性, 這樣就可以在不同的經濟周期,制定不同的投資策略,這樣不僅可以在不同的經濟周期實現持續盈利,還可以規避風險。 比如有的投資機構在2008年前就利用數據挖掘技術確認當時的經濟周期,提前減倉,改變投資策略,不僅避免了風險,而且實現了高額收益。 其實,如果將08年之前的宏觀經濟數據可視化之后(圖3所示), 就會發現這期間的經濟環境了。

關于數據挖掘原理分析及其在量化投資中的應用介紹

圖3 08年前后的宏觀經濟趨勢圖

2、估價

國內外大量實證研究結果表明:上市公司定期公布的財務報告具有很強的信息含量,但是當期會計盈余數據的信息會在披露前后在股票市價中迅速得以體現。因此對于中長期投資者來說,重要的是預見未來。質地優良且未來具有較高盈利增長能力的公司是中長期投資者(包括普通投資者,證券投資基金和券商)普遍關注的對象,因為只有這類公司才能給投資。

通過對上市公司的價值的評估,來進行股票的選擇。這是現在占據主流地位的基本面分析的基本方法。通過各種不同的方法對于上市公司的價值進行一個評估,然后結合股票市場上的表現來決定市場上的價格是否被低估或者高估。如果低估則買入,如果高估則賣出。當然,中國市場現在還沒有賣空的途徑,剛剛獲批的融資融券業務也只是在限定標的的情況下進行部分的賣空,所以中國市場還是主要以買入為主。于是,我們更多的是選擇那些價格被低估的股票。分析未來股票發行和上市價格的合理定位。

數據挖掘技術在估價方面的應用就是去挖掘價值被低估的股票, 比如可以用最近鄰方法確定基本面相似的股票的市場估價, 然后根據實際價格很容易確定哪些股票被低估或者高估。 該方法對于新股的認購策略也同樣非常有幫助, 因為可以用來評估新股的合理價格區間。

3、量化選股

量化選股是數據挖掘在量化投資領域研究和應用最多的課題,畢竟選股是量化投資的最重要的內容。像上面剛介紹的多因子選股模型,主要是靠數據挖掘中的回歸方法得到的。當然量化選股的內容不僅限于此,數據挖掘技術在選股上有多重應用,有時是為策略提供決策基礎, 有時是根據策略進行挖掘。 比如,可以用聚類方法對股票進行聚類,從而對股票進行分池, 選股的時候就2可以從上漲概率比較大的池子中選擇股票。 再比如,可以用神經網絡方法預測股票的漲跌概率,具體實現方法這里先不贅述, 這些內容在本書中將都會進行介紹。

4、量化擇時

量化投資領域中,一個好的選股策略是比較容易實現的。這是因為在長時間跨度里能夠跑贏市場的一些投資組合一般會滿足某種特性,例如低估值、例如高成長、例如小市值、例如隱形資產低估等等。 但擇時就不是那么簡單了, 這里會有一個簡單的問題:大盤明天是漲還是跌?

這個看似簡單的問題其實并不好回答,尤其是從量化的角度去處理,甚至我們從傳統的策略研究——技術面+基本面+政策面會更加好回答一些。為什么?因為量化擇時無法處理來自政策面的消息。還有就是量化擇時經常會有很強的時域特性,太短的時域預測例如一天,太長的時域預測例如一年,量化擇時是很難處理的。

正因為擇時比較難處理, 所以采用數據挖掘技術, 用大量的數據去尋找最佳的賣點相對顯得更理性些。 比如用上面剛介紹的SVM方法進行擇時, 或采用神經網絡預測近期的漲跌趨勢, 再或者采用分類方法判斷近期的最佳交易周期。

5、算法交易

算法交易(algorithmic trading),是指把一個指定交易量的買入或者賣出指令放入模型,該模型包含交易員確定的某些目標。 根據這些特殊的算法目標,該模型會產生執行指令的時機和交易額。而這些目標往往基于某個基準、價格或時間。這種交易有時候被稱“黑箱交易”。算法交易通過程序系統交易,將一個大額的交易拆分成數十個小額交易,以此來盡量減少對市場價格造成沖擊,降低交易成本,且還能幫助機構投資者快速增加交易量。

算法交易系統的核心是通過一套計算機程序,可以在一秒鐘內產生數千個交易指令,其中許多指令瞬間就可以被取消或被新的指令取代,從而把大額委托化整為零,減小對市場的沖擊,并且可以尋求最佳的成交執行路徑,減少交易成本。但程序的核心是交易算法,而這種敢于在市場上進行實操的算法往往都是在大量的歷史交易數據挖掘中得到的, 然后再經過嚴格的測試,確定算法的可靠且有效后方可投入實際的算法交易。 在算法交易方面,可用到的數據挖掘技術比較廣, 往往涉及到多種方法的綜合。 在算法交易方面,目前用的比較多的數據挖掘方法是集成決策樹, 其核心是當不同的指標(信號)出現不同的情況時,給出具體的交易操作(買入或賣出),采用這種方法不僅是穩定、靈活,而且還可以采用優化算法對其進行優化,提高收益, 圖4即為采用遺傳算法優化交易指標的迭代效果圖。

關于數據挖掘原理分析及其在量化投資中的應用介紹


圖4 遺傳算法優化交易指標的迭代效果圖

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據挖掘
    +關注

    關注

    1

    文章

    406

    瀏覽量

    25084
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    生成式AI賦能工程師挖掘非結構化數據價值

    您是否知道,生成式 AI(GenAI)可以幫助工程師幾秒鐘內診斷汽車故障,甚至設備出現問題之前預測潛在失效?GenAI 正在通過加速數據分析和算法開發,讓這些場景從設想走向現實,使工程師能夠充分發揮專業知識,
    的頭像 發表于 02-28 10:24 ?417次閱讀

    關于MT6901的直線DEMO介紹

    關于MT6901的直線DEMO介紹
    的頭像 發表于 01-30 10:54 ?410次閱讀
    <b class='flag-5'>關于</b>MT6901的直線DEMO<b class='flag-5'>介紹</b>

    關于NFC鎳鋅鐵氧體片的介紹

    關于NFC鎳鋅鐵氧體片的介紹
    的頭像 發表于 12-04 10:52 ?410次閱讀
    <b class='flag-5'>關于</b>NFC鎳鋅鐵氧體片的<b class='flag-5'>介紹</b>

    RT-Thread睿賽德科技受邀參加“投資中國·2025上海城市投資推介大會”|新聞速遞

    近日,由上海市人民政府主辦的“投資中國·2025上海城市投資推介大會”在上海國際會議中心隆重舉行。上海市委書記陳吉寧出席并致辭,上海市委副書記、市長龔正作主旨推介。作為全球領先的嵌入式操作系統提供商
    的頭像 發表于 11-07 17:37 ?1298次閱讀
    RT-Thread睿賽德科技受邀參加“<b class='flag-5'>投資中</b>國·2025上海城市<b class='flag-5'>投資</b>推介大會”|新聞速遞

    關于系統鏈接腳本的介紹

    起來后所處于的地址,程序中的相對尋址都會遵從此虛擬地址。 四、關于ITCM和DTCM(若使用FLASH下載模式) (1) 代碼段上載到ITCM,ITCM起始地址(0x80000000)存儲的代碼就是主函數的入口。 (2)數據段上載到DTCM,DTCM起始地址(0x
    發表于 10-30 08:26

    【新啟航】深度學習玻璃晶圓 TTV 厚度數據智能分析中的應用

    一、引言 玻璃晶圓總厚度偏差(TTV)是衡量晶圓質量的關鍵指標,其精確分析對半導體制造、微流控芯片等領域至關重要 。傳統 TTV 厚度數據分析方法依賴人工或簡單算法,效率低且難以挖掘數據
    的頭像 發表于 10-11 13:32 ?623次閱讀
    【新啟航】深度學習<b class='flag-5'>在</b>玻璃晶圓 TTV 厚度<b class='flag-5'>數據</b>智能<b class='flag-5'>分析</b>中的應用

    XKCON祥控輸煤皮帶智能機器人巡檢系統對監測數據進行挖掘分析

    XKCON祥控輸煤皮帶智能機器人巡檢系統通過智能機器人在皮帶運行過程中對皮帶的運行狀態和環境狀況進行實時檢測,應用過程中,不但提升了巡視周期頻次,還通過大數據分析和深度學習算法,對監測數據進行
    的頭像 發表于 09-15 11:22 ?624次閱讀
    XKCON祥控輸煤皮帶智能機器人巡檢系統對監測<b class='flag-5'>數據</b>進行<b class='flag-5'>挖掘</b><b class='flag-5'>分析</b>

    商湯科技亮相2025中國國際投資貿易洽談會

    9月8日,第二十五屆中國國際投資貿易洽談會在福建廈門開幕。作為我國唯一以促進投資為主題的國家級重大展會,本屆投洽會吸引了120多個國家和地區、11個國際組織的代表團參會。本屆投洽會突出“投資中
    的頭像 發表于 09-10 09:59 ?1014次閱讀

    云知聲亮相2025中國國際投資貿易洽談會

    9月8日-11日,“攜手中國 投資未來丨第二十五屆中國國際投資貿易洽談會”廈門成功舉辦。本屆投洽會聚焦“投資中國”“中國投資”“國際
    的頭像 發表于 09-09 10:49 ?940次閱讀

    如何根據設備健康狀態數據進行分析決策?

    要根據設備健康狀態數據做好分析決策,需先明確數據核心價值,再通過 “數據預處理→多維度分析→風險評估→決策落地” 的閉環流程推進,既依托技術
    的頭像 發表于 08-20 10:07 ?759次閱讀
    如何根據設備健康狀態<b class='flag-5'>數據</b>進行<b class='flag-5'>分析</b>決策?

    用樹莓派挖掘5種頂級加密貨幣!

    加密貨幣是用于在線交易的數字貨幣。挖掘這些貨幣通常需要專門的硬件,如ASIC礦機或高性能GPU。然而,有些加密貨幣仍可用樹莓派來挖掘本文中,我將為您介紹可在樹莓派上
    的頭像 發表于 07-21 16:34 ?1455次閱讀
    用樹莓派<b class='flag-5'>挖掘</b>5種頂級加密貨幣!

    瑞芯微模型量化文件構建

    模型是一張圖片輸入時,量化文件如上圖所示。但是我現在想量化deepprivacy人臉匿名模型,他的輸入是四個輸入。該模型訓練時數據集只標注了人臉框和關鍵點,該模型的預處理是放到模型外的,不在模型
    發表于 06-13 09:07

    永磁無刷電機及其驅動技術

    結構電機以及Halbach 陣列布置的電機等。第2章簡要介紹了功率器件和它們的開關特性與損耗,整流器及逆變器。逆變 器主要介紹了其模型、開關方案及其優缺點。同時介紹了四象限運行常用的學
    發表于 03-31 15:25

    是德示波器觸發模式及其使用

    到我們能否準確捕捉并分析目標信號。以下是關于是德示波器觸發模式及其使用的簡要介紹。 一、觸發模式概述 是德示波器通常具備三種基本觸發模式:自動模式(AUTO)、常規模式(NORM)和單
    的頭像 發表于 03-17 11:42 ?1951次閱讀
    是德示波器觸發模式<b class='flag-5'>及其</b>使用

    三一挖掘機一鍵啟動開關易壞的原因及更換注意事項

    三一挖掘機一鍵啟動開關易壞的原因雖然三一挖掘機的一鍵啟動系統設計旨在提高便利性和安全性,但在實際使用中,可能會出現一些問題導致開關易壞。這些問題可能包括:頻繁使用:挖掘施工過程中頻
    發表于 03-12 09:29