R語言金融基礎:tidyquant獲取數據(標普500與納斯達克)
摘要:這個包的詳細介紹見:https://business-science.github.io/tidyquant/index.html。納斯達克(NASDAQ,National Association of Securities Dealers Automated Quotations)又稱納指、美國科技指數,是美國全國證券交易商協會於1968年着手創建的自動報價系統名稱的英文簡稱。
作者:黃天元,復旦大學博士在讀,目前研究涉及文本挖掘、社交網絡分析和機器學習等。希望與大家分享學習經驗,推廣並加深R語言在業界的應用。
最近科研任務繁重,沒有時間對一些複雜性問題進行深入的探究,閒暇之時只能零敲碎打學習一些包。今天來拔草tidyquant包。該包簡潔易懂,方便實用,是做金融回測重要的工具。
這個包的詳細介紹見:https://business-science.github.io/tidyquant/index.html
先加載一下:
library(pacman)
p_load(tidyquant)
隨後,我們獲取標普500指數和納斯達克掛牌公司信息。這裏先對兩者概念做簡要介紹然後再進行演示。
S&P500,中文全稱爲標準普爾500指數,是記錄美國500家上市公司的一個股票指數。這個股票指數由標準普爾公司創建並維護。 標準普爾是世界權威金融分析機構,由普爾先生(Mr Henry Varnum Poor)於1860年創立。標準普爾由普爾出版公司和標準統計公司於1941年合併而成。標準普爾爲投資者提供信用評級、獨立分析研究、投資諮詢等服務,其中包括反映全球股市表現的標準普爾全球1200指數和爲美國投資組合指數的基準的標準普爾500指數等一系列指數。詳情見百度
然後我們在R中直接獲得標普500指數的信息:
tq_index("SP500") -> a
a
# A tibble: 505 x 5
symbol company weight sector shares_held
<chr> <chr> <dbl> <chr> <dbl>
1 MSFT Microsoft Corporation 0.0408 Information Technology 88132910
2 AAPL Apple Inc. 0.0366 Information Technology 51457600
3 AMZN Amazon.com Inc. 0.0324 Consumer Discretionary 4739754
4 FB Facebook Inc. Class A 0.0188 Communication Services 27403264
5 BRK.B Berkshire Hathaway Inc. Class B 0.0172 Financials 22337340
6 JPM JPMorgan Chase & Co. 0.0155 Financials 37612196
7 JNJ Johnson & Johnson 0.0153 Health Care 30592244
8 GOOG Alphabet Inc. Class C 0.0149 Communication Services 3531023
9 GOOGL Alphabet Inc. Class A 0.0146 Communication Services 3438793
10 XOM Exxon Mobil Corporation 0.0139 Energy 48671748
# ... with 495 more rows
可以看到,顯示的表格是一個tibble,包括公司代號、公司名稱、股票在指數中所佔比例、公司類型和股票持有量。
納斯達克(NASDAQ,National Association of Securities Dealers Automated Quotations)又稱納指、美國科技指數,是美國全國證券交易商協會於1968年着手創建的自動報價系統名稱的英文簡稱。納斯達克的特點是收集和發佈場外交易非上市股票的證券商報價。它現已成爲全球最大的證券交易市場之一。目前的上市公司有5200多家。納斯達克又是全世界第一個採用電子交易的股市,它在55個國家和地區設有26萬多個計算機銷售終端。
tq_exchange("NASDAQ") -> b
b
# A tibble: 3,475 x 7
symbol company last.sale.price market.cap ipo.year sector industry
<chr> <chr> <dbl> <chr> <dbl> <chr> <chr>
1 YI 111, Inc. 8.15 $664.58M 2018 Health Care Medical/Nursing Services
2 PIH 1347 Property Insurance ~ 5.05 $30.36M 2014 Finance Property-Casualty Insurers
3 PIHPP 1347 Property Insurance ~ 24.8 $17.33M NA Finance Property-Casualty Insurers
4 TURN 180 Degree Capital Corp. 1.94 $60.37M NA Finance Finance/Investors Services
5 FLWS 1-800 FLOWERS.COM, Inc. 21.3 $1.37B 1999 Consumer Se~ Other Specialty Stores
6 BCOW 1895 Bancorp of Wisconsi~ 9.61 $46.86M 2019 Finance Banks
7 FCCY 1st Constitution Bancorp~ 18.8 $162.05M NA Finance Savings Institutions
8 SRCE 1st Source Corporation 46.8 $1.2B NA Finance Major Banks
9 VNET 21Vianet Group, Inc. 7.86 $883.41M 2011 Technology Computer Software: Programmin~
10 TWOU 2U, Inc. 60.5 $3.54B 2014 Technology Computer Software: Prepackage~
# ... with 3,465 more rows
返回的tibble包含公司代碼、公司名稱、當前成交價、市場總值、發行年、所屬分類和工業類型信息。
這些數據能夠爲投資者提供有價值的參考,從而在宏觀的層面上對大市有所瞭解。這兩個函數還能夠獲得其他的數據源,詳見官網介紹:https://business-science.github.io/tidyquant/articles/TQ01-core-functions-in-tidyquant.html
後面會持續更新學習這個包。
——————————————