中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

馳騁股市!手把手教你如何用Python和數(shù)據(jù)科學(xué)賺錢?

2018-10-09    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

金融領(lǐng)域或許是數(shù)據(jù)科學(xué)應(yīng)用場景中最充滿想象力的部分,畢竟它跟財富結(jié)合地?zé)o比緊密。

不管是否是經(jīng)濟達人,數(shù)據(jù)科學(xué)都是一種幫你了解一支股票的高效方式。本文作者把數(shù)據(jù)科學(xué)和機器學(xué)習(xí)技術(shù)應(yīng)用到金融領(lǐng)域中,向你展示如何通過數(shù)據(jù)分析的方式馳騁股市,搭建自己的金融模型!

讓我們先了解一些基本定義。

 

 

定義和假設(shè)

什么是交易算法?

Quantopian定義:

交易算法是一種計算機程序,它定義了一套買賣資產(chǎn)的規(guī)則。大多數(shù)交易算法基于研究歷史數(shù)據(jù)得出的數(shù)學(xué)或統(tǒng)計模型來做出決策。

我們使用什么平臺?

我使用Anaconda, Jupyter Notebooks, 和 PyCharm實現(xiàn)Python建模,使用這些工具非常容易。但是,你也可以使用Quantopian平臺內(nèi)置內(nèi)核工具,或者甚至可以根據(jù)需要將代碼修改為R或者其他語言。

我使用Mac系統(tǒng),并將全程分享所用的UNIX命令。Windows用戶請自行搜索答案!

我們關(guān)注哪些資產(chǎn)?

Apple蘋果(AAPL)是一支很好的股票,因為目前為止(2018年9月)它已經(jīng)是世界上價值最高的公司,不僅擁有相對穩(wěn)定的股票價格,而且擁有足夠多與品牌相關(guān)的體量、新聞和人氣。

需要提醒:此處涵蓋的原則對于較小的公司股本,或不同的行業(yè)等的適用性有所不同。

環(huán)境搭建

要在本地電腦上獲取Quantopian平臺,請在終端執(zhí)行以下命令:

 

 

為了確保Quandl正常運行,請根據(jù)賬號創(chuàng)建說明和API文檔加載金融數(shù)據(jù)。另外,請保存好你的API key,因為需要用到它來加載所有重要數(shù)據(jù)。

加載數(shù)據(jù)

讓我們開始使用代碼庫:

 

 

現(xiàn)在讓我們來拉取些Apple股票數(shù)據(jù):

 

 

注意觀察這些列,注意其中一個名為“分割比例”的列。這是一個非常重要的指標(biāo);它標(biāo)志著股票拆分發(fā)生。在2014年,Apple決定采用7:1進行股票分割,我們可以使用Python 和pandas 來查詢發(fā)生的日期:

 

 

我們從而找到了2014-06-09。讓我們拉取這個日期后的股票價格信息:

 

 

順便說一句,我在GitHub上找到了所有財富500強的股票代碼清單。如果你想將自己的分析擴展到股票集,可以像這樣將它們加載到列表中:

 

 

關(guān)鍵統(tǒng)計數(shù)據(jù)

增廣迪基-福勒檢驗(Augmented Dickey-Fuller test),簡稱ADF檢驗。

我們需要檢驗單位根是否存在,可以使用ADF測試完成檢驗。簡而言之,單位根存在則預(yù)示存在驅(qū)動AAPL的潛在趨勢,從而我們可以提取模式并用于預(yù)測。

 

 

我們將上面的測試統(tǒng)計值與臨界值進行比較;如果它低于我們選擇的閾值,則拒絕存在單位根的零假設(shè)。正如你所見,p-value比較大,所以我們必須接受原假設(shè)(Ho):即AAPL存在單位根。這個結(jié)果很好,因為我們可以利用潛在的趨勢和模式進行預(yù)測。

與其他股票的相關(guān)性

Apple被認為是一個巨頭技術(shù)品牌。假如我們能夠計算與其他股票的強相關(guān)性會怎么樣?

請注意相關(guān)性并不意味著因果關(guān)系,并且可能存在著哪個股票是先行者的問題,但是模式和關(guān)系對于提高模型性能總是一件好事。

我建議你查看三支股票,以及AAPL如何與它們關(guān)聯(lián):

微軟Microsoft (MSFT)

因特爾Intel (INTC)

蒂芙尼Tiffany & Co. (TIF)

 

 

時間緣故,我們在這里只關(guān)注Intel數(shù)據(jù);讓我們繪制AAPL與INTC的收盤價:

 

 

 

 

Intel vs. Apple

我們還可以看看相關(guān)值數(shù)據(jù)( correlation value ):

 

 

我們注意到r-value為0.7434;就預(yù)測來說不錯,但我們需要記住一個重要的事實:如果我們知道INTC的收盤價,我們也可以看查AAPL的收盤價。所以讓我們查看下INTC七天前的收盤價的相關(guān)性,來獲得更可行的指標(biāo):

 

 

這次我們得到r-value為0.7332;還是很不錯的!

谷歌趨勢(Google Trends)

我們可以比較Twitter和其他社交網(wǎng)絡(luò)人氣數(shù)據(jù)如何影響股價,F(xiàn)在讓我們看看Google Trends是否與AAPL相關(guān)。請確保為指定時間范圍,或使用此鏈接(https://trends.google.com/trends/explore?date=2014-06-10%202018-04-02&q=%2Fm%2F0k8z)來進行準(zhǔn)確搜索(注意我在四月多添加了幾天來處理半周問題),然后將CSV加載到Python中:

 

 

注意每周的數(shù)據(jù)格式,因此我們需要使用 pandas.resample() 轉(zhuǎn)換我們的股票價格數(shù)據(jù)集:

API鏈接:

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.resample.html

aapl_split_week = aapl_split.resample('W', convention='end').last()

現(xiàn)在讓我們檢查相關(guān)性并繪制給定周的Google搜索請求數(shù)據(jù)總和圖表,以及該周最后一個工作日的收盤價格:

 

 

哎呀!我們得到了一個微不足道的0.0454,這個數(shù)據(jù)有些道理,我們可以想一下:AAPL相關(guān)的新聞/活動/閑談并不是影響股票價格的積極因素。像人氣這種對其有重要影響應(yīng)該能提供更強的信號,但我們在下次再做討論。

結(jié)語

我們只是淺顯的討論了下部分EDA( Exploratory Data Analysis)可以做的金融分析,但是在下一篇文章中,我們將過渡到建立預(yù)測模型并通過高級軟件包來為我們實現(xiàn)繁重的工作。

我們希望這篇文章對你有幫助,并且很樂意在評論中聽到你的意見:

運行代碼是否遇到任何問題?有時候環(huán)境和版本會搞砸一切……

• 你使用什么包和技術(shù)?

• 那些可視化工具有助于了解股票價格的變動?

你認為哪些因素會最大化模型預(yù)測效果?

最后,如果你恰好知道一種持續(xù)賺大錢的建模技術(shù),請直接告訴我們 ! 如果你們喜歡這個系列,請持續(xù)關(guān)注大數(shù)據(jù)文摘的后續(xù)文章。

最后的最后,本文提供的信息和隨附材料僅供參考。本文不應(yīng)被當(dāng)做法律或財務(wù)建議。你應(yīng)咨詢律師或其他專業(yè)人士來確定什么最適合你的個人需求。

相關(guān)報道:

https://towardsdatascience.com/on-making-money-with-python-and-data-science-1-setup-and-statistics-1d69f1a68661?from=singlemessage&isappinstalled=0

標(biāo)簽: Google 大數(shù)據(jù) 代碼 谷歌 金融 數(shù)據(jù)分析 搜索 網(wǎng)絡(luò)

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:英特爾人工智能副總裁:AI不是一種技能,而是一種對于工作的描述

下一篇:大數(shù)據(jù)應(yīng)用正深入經(jīng)濟生活