a hidden markov model for predicting global stock market index

15
The Korean Journal of Applied Statistics 2021, Vol. 34, No. 3, 461–475 DOI: https://doi.org/10.5351/KJAS.2021.34.3.461 Print ISSN1225-066X / Online ISSN 2383-5818 A hidden Markov model for predicting global stock market index Hajin Kang a , Beom Seuk Hwang 1, a a Department of Applied Statistics, Chung-Ang University Abstract Hidden Markov model (HMM) is a statistical model in which the system consists of two elements, hidden states and observable results. HMM has been actively used in various fields, especially for time series data in the financial sector, since it has a variety of mathematical structures. Based on the HMM theory, this research is intended to apply the domestic KOSPI200 stock index as well as the prediction of global stock indexes such as NIKKEI225, HSI, S&P500 and FTSE100. In addition, we would like to compare and examine the dierences in results between the HMM and support vector regression (SVR), which is frequently used to predict the stock price, due to recent developments in the artificial intelligence sector. Keywords: global stock market index, hidden Markov model, KOSPI200, stock index prediction, support vector regression 1. 1%X ˜, \ü T\19\ xt m· 0 1% l<\ t 8| t ü @ x U\ H<\ ·Xp, \ ,| t D, ü ` æü@ /l| \ 5 `D · , L<\ \'X$ 5 D t · . \, ,\ mT Tt 50ü 0¯ D¨| x ,˜ X D HXtL˜ tx ,\ t D . ü¥@ ¥ LXt˜ t 5 ¥ `iD E t. KOSPI200 ü \mD \X ü 200 'X aD T\ <\ 1990D 1 3| 100D 0<\ ¨ ¨| ·p, ,\ /X¨l \\ ' m· \ t. ü¥t ·/ PD !X @ 5 ¥ !I¥ \ tp, )t ü !\'· \ l . l l ü X(, t( æü@ ˜ pt0i\ @ ¨tT ¤x(hidden Markov model; HMM)Dt'˜ !'X \. m· tx ü| 'X \X ¤xD \t t| t ¥˜X| 0X ü¥\ t )¥1 l `\ !t ¥t. This research was supported by the Chung-Ang University Research Scholarship Grants in 2020. 1 Corresponding author: Department of Applied Statistics, Chung-Ang University, 84 Heukseok-ro, Dongjak-gu, Seoul 06974, Korea. E-mail: [email protected] Published 30 June 2021 / journal homepage: http://kjas.or.kr © 2021 The Korean Statistical Society. All rights reserved.

Upload: others

Post on 02-Jan-2022

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: A hidden Markov model for predicting global stock market index

The Korean Journal of Applied Statistics2021, Vol. 34, No. 3, 461–475

DOI: https://doi.org/10.5351/KJAS.2021.34.3.461Print ISSN1225-066X / Online ISSN 2383-5818

A hidden Markov model for predicting global stock marketindex

Hajin Kanga, Beom Seuk Hwang1,a

aDepartment of Applied Statistics, Chung-Ang University

Abstract

Hidden Markov model (HMM) is a statistical model in which the system consists of two elements, hiddenstates and observable results. HMM has been actively used in various fields, especially for time series data inthe financial sector, since it has a variety of mathematical structures. Based on the HMM theory, this research isintended to apply the domestic KOSPI200 stock index as well as the prediction of global stock indexes such asNIKKEI225, HSI, S&P500 and FTSE100. In addition, we would like to compare and examine the differencesin results between the HMM and support vector regression (SVR), which is frequently used to predict the stockprice, due to recent developments in the artificial intelligence sector.

Keywords: global stock market index, hidden Markov model, KOSPI200, stock index prediction, supportvector regression

1.서론

연 1%대의저금리시대가계속되고,특히최근코로나19로인해국내기준금리가 1%미만으로변경및유지되면서자산보호를위해서는금과부동산같은다른확실한안전자산으로대체하거나,반대로투자를위해서는채권,주식또는파생상품등과같은리스크를동반한금융상품을대체투자수단으로활용하려는금융소비자들이 늘어나고 있다. 또한, 투자에 대한 국제화가 심화되면서 금융기관과 기업뿐만 아니라 개인 투자자도환 위험을 감안하면서까지도 해외 투자에 대한 관심이 높아지고 있다. 주식 시장은 가장 간단하면서도 빠르게 금융 시장 상황을 파악할 수 있는 곳이다. KOSPI200 주가지수는 한국을 대표하는 주식 200개 종목의시가총액을지수화한것으로 1990년 1월 3일 100을기준으로얼마나변동되었는지를나타내며,투자에대한벤치마크 지표로 사용되는 국내 대표 지수이다. 주식 시장이 어떤 흐름을 나타낼지 예측하는 것은 경제 및금융시장예측에굉장히중요한부분이며,여러가지방법들이주가예측에활용되어활발히연구되고있다.

본연구에서는주가및환율,이자율등과같은시계열데이터에적합한은닉마르코프모델(hidden Markovmodel; HMM)을이용해향후예측에적용하고자한다.실제국내및해외주가지수를적용하여최적의모델을추정한다면이를통해서향후의일정기간의주식시장에대한추이및방향성그리고움직임에대한예측이

가능할것이다.

This research was supported by the Chung-Ang University Research Scholarship Grants in 2020.1 Corresponding author: Department of Applied Statistics, Chung-Ang University, 84 Heukseok-ro, Dongjak-gu, Seoul

06974, Korea. E-mail: [email protected]

Published 30 June 2021 / journal homepage: http://kjas.or.kr© 2021 The Korean Statistical Society. All rights reserved.

Page 2: A hidden Markov model for predicting global stock market index

462 Hajin Kang, Beom Seuk Hwang

음성인식 분야에서 주로 활용되기 시작한 은닉 마르코프 모델은 유전학과 생물정보학을 포함한 다양한

분야에서 시계열의 패턴을 활용하는 도구로 널리 이용되고 있으며 금융 관련 데이터 분석에서도 활발하게

사용되고있다 (Zucchini등, 2017).옵션의가격결정과 LIBOR시장의모델연구그리고이자율의기간구조모델 구축과 관련해서도 HMM이 활발하게 이용되어 왔다 (Mamon과 Elliott, 2007). 또한, HMM을 활용한채권가격산출 (Landen, 2000)및은행고객을군집화하는연구도진행되었으며 (Knab등, 2003),주식가격에대한예측에도 HMM이활용되어왔다 (Hassan과 Nath, 2005).

본논문에서는 HMM방법을국가별주가지수예측에적용해보고자한다.먼저 AIC, BIC, HQC (Hannan과Quinn, 1979), CAIC (Bozdogan, 1987)와같은정보기준을사용하여HMM의최적의상태의수를결정한다.그후 HMM의모수추정에사용되는훈련데이터에대하여종가,시가,고가,저가를이용하여 Hassan과 Nath(2005)의방법을적용하고자한다.실제데이터로는국내 KOSPI200주가지수와일본의 NIKKEI225,홍콩의HSI, 미국의 S&P500, 영국의 FTSE100 등 주가연계증권(equity linked securities; ELS)의 기초자산으로 주로사용하는 대표적인 해외 주가지수를 이용한다. 2010년 1월부터 2019년 12월까지 총 10년 동안의 데이터를이용하여추정한모형이실제데이터예측에얼마나정확하게적용될수있는지알아보려고한다.또한,인공지능분야의발전으로인해주식가격예측에널리사용되고있는서포트벡터회귀(support vector regression;SVR)방법 (Cao와 Tay, 2001)을비교군으로사용하여그결과를비교하고자한다.본논문의구성은다음과같다. 2장에서는 은닉 마르코프 모델 이론과 관련된 주요 문제들에 대해 소개한다. 3장에서는 국내 및 해외주가지수 데이터를 이용한 예측 방법과 결과를 제시하며 4장에서는 본 논문의 결론과 후속 연구의 방향을언급하며마무리한다.

2.은닉마르코프모델(Hidden Markov model)

2.1.은닉마르코프모델소개

은닉마르코프모델(hidden Markov model; HMM)은마르코프모델의하나로,은닉된상태와관찰가능한결과의두가지요소로구성된통계적모델이다.은닉상태들은마르코프과정을따르고이를직접적인원인으로하여관찰가능한결과가발생한다.상태를직접적으로볼수없고이로부터야기된결과들만관찰할수있어‘은닉(hidden)’이라는단어가붙게되었다.방법론은 1960년대에알려졌지만, 1970년대에모델의파라미터추정을위한방법들이연구되면서은닉마르코프모델에대한연구가더욱활발히진행되었다 (Baum과 Petrie,1966; Baum등, 1970).은닉마르코프모델은 1970년대음성인식분야에서응용되기시작하여,생물정보학,생태학, 언어학, 환경, 통신 및 금융 등 다양한 분야에서 사용되고 있다 (Cappe 등, 2006; Zucchini 등, 2017).특히 은닉 마르코프 모델은 관찰 가능한 확률 과정의 경우 마르코프 연쇄가 주어진 상황에서 조건부 독립이

며,각시점의조건부분포는오직해당시점의마르코프연쇄에만의존하는기본구조를가지고있는데,이는주가지수움직임에적합한구조라고할수있다.임의의시점의주가지수가은닉된여러상태에의해영향을받으며마르코프과정을따른다고가정을할수있기때문이다.따라서은닉마르코프모델은주가지수자료분석에많이응용되고있다 (Zucchini등, 2017).

은닉 마르코프 모델의 구조와 이를 나타내는 구성 요소들은 Figure 1과 Table 1에 각각 나타내었다. 본논문에서는 Idvall과 Jonsson (2008)과 Nguyen (2018)에나와있는기호를참고하여사용하였다.관측되지않는마르코프연쇄 Q는전이확률행렬 A와초기확률 p를가진다.관찰가능한확률과정 O는마르코프연쇄가주어진상황에서조건부독립이며,각시점의조건부분포는오직해당시점의마르코프연쇄에만의존한다.

Page 3: A hidden Markov model for predicting global stock market index

A hidden Markov model for predicting global stock market index 463

Figure 1: Illustration of hidden Markov model.

Table 1: Basic elements of HMM

Element Definition/NotationLength of observation data TNumber of states NNumber of symbols MObservation sequence O = {Ot , t = 1, 2, . . . ,T }Hidden states sequence Q = {qt , t = 1, 2, . . . ,T }Possible values of states {S i, i = 1, 2, . . . ,N}Possible symbols {vk , k = 1, 2, . . . ,M}Initial probability p = (pi), pi = P(q1 = S i), i = 1, 2, . . . ,NTransition probability matrix A = (ai j), ai j = P(qt = S j |qt−1 = S i), i, j = 1, 2, . . . ,NEmission probability matrix B = (bik), bik = P(Ot = vk |qt = S i), i = 1, . . . ,N, k = 1, . . . ,M

이를수식으로표현하면다음과같다.

P(qt |q1, q2, . . . , qt−1) = P(qt |qt−1), t = 2, 3, . . . ,

P(Ot |O1, . . . ,Ot−1, q1, . . . , qt) = P(Ot |qt), t = 1, 2, 3 . . . .

마코르프 연쇄가 주어졌을 때 관찰 가능한 확률과정이이산형 분포라면 이산형 HMM이고, 연속형 분포라면 연속형 HMM이 된다. Table 1을 참고하면, HMM를 나타내기 위해서 필요한 파라미터는 λ ≡ {A, B, p}임을알수있다.예를들어,연속형 HMM에서가우시안분포를가정한다면,파라미터는다음과같이나타낼수있다.

λ ≡ {A, B, p} ≡ {A, µ, σ, p}.

2.2.은닉마르코프모델의주요문제

HMM을실제로활용하기위해서는우선 3가지주요문제에대해생각해보아야한다 (Rabiner, 1989).첫번째문제는관찰가능한수열 {Ot}와모델의파라미터 λ ≡ {A, B, p}가주어졌을때,주어진모델에서관측수열의확률을 계산하는 평가 문제이다. 같은 상황에서 관측 수열을 나타낼 확률이 가장 큰 은닉 상태 수열을 찾는

Page 4: A hidden Markov model for predicting global stock market index

464 Hajin Kang, Beom Seuk Hwang

해독 문제, 그리고 관측 수열만 주어진 경우 이를 가장 잘 나타내는 모델 파라미터를 찾는 학습 추정 문제가나머지주요문제이다.

(i) 평가문제(evaluation question)

(a) 관찰 가능한 수열 O = {Ot, t = 1, 2, . . . ,T }와 모델의 파라미터 λ ≡ {A, B, p}가 주어졌을 때, 관측수열의확률 P(O|λ)를계산한다.

(ii) 해독문제(decoding question)

(a) 관찰 가능한 수열 O = {Ot, t = 1, 2, . . . ,T }와 모델의 파라미터 λ ≡ {A, B, p}가 주어졌을 때, 관측수열을나타내는데가장적합한은닉상태수열을확인한다. argmaxQP(Q|O, λ)를계산한다.

(iii) 학습추정문제(learning question)

(a) 관찰가능한수열O = {Ot, t = 1, 2, . . . ,T }만주어진경우,이를가장잘나타내는HMM의파라미터λ가무엇인지확인한다. argmaxλP(O|λ)를계산한다.

평가 문제는 확률의 추정 문제와 같으며, 직접적인 방법을 사용한 계산보다는 전향(forward) 또는 후향 알고리즘(backward algorithm)을이용하여문제를해결한다.해독문제는최적의상태수열을찾는문제와같으며비터비 알고리즘(Viterbi algorithm)을 이용한다 (Viterbi, 1967). 마지막으로 학습 추정 문제는 모수 추정 및재추정의문제와같으며,최적의모델로개선하기위해서반복적인해법을필요로한다. EM알고리즘의하나인바움-웰치알고리즘(Baum-Welch algorithm)은국소최우추정치로서수렴이잘되기때문에 HMM에서의학습 추정 문제를 해결하기 위해 일반적으로 사용된다 (Welch, 2003). 여기서는 바움-웰치 알고리즘에 대해간략히소개한다.먼저알고리즘을이해하는데필요한확률 α, β를다음과같이정의한다.

α(l)t (i) = P

(O(l)

1 ,O(l)2 , . . . ,O

(l)t , qt = S i|λ

), t = 1, 2, . . . ,T and l = 1, 2, . . . , L,

β(l)t (i) = P

(O(l)

t+1,O(l)t+2, . . . ,O

(l)T | qt = S i, λ

), t = 1, 2, . . . ,T and l = 1, 2, . . . , L.

α(l)t (i)는 l번째 샘플에 대해 모델의 파라미터 λ가 주어졌을 때, t시점의 상태가 S i이면서 t시점까지의 관측된데이터가 나타날 확률을 의미하고, β(l)

t (i)는 t시점의 상태가 S i로 주어졌을 때, t시점 이후의 데이터가 나타날확률을의미한다.또한,모델의파라미터와관측수열이주어졌을때, t시점의상태가 S i일확률 γ(l)

t (i)은다음과같이정의한다.

γ(l)t (i) = P

(qt = S i|O(l), λ

)=α(l)

t (i)β(l)t (i)

P(O(l)|λ)=

α(l)t (i)β(l)

t (i)∑Nk=1 α

(l)t (k)β(l)

t (k).

t시점의 상태가 S i이고 t + 1시점의 상태가 S j일 확률 ξ(l)t (i, j)은 다음과 같이 나타낼 수 있고, 이때 γ(l)

t (i)와의관계또한다음과같이표현할수있다.

ξ(l)t (i, j) = P

(qt = S i, qt+1 = S j| O(l), λ

)=α(l)

t (i)ai jb j(O(l)t+1)β(l)

t+1( j)P(O(l)|λ)

,

γ(l)t (i) =

N∑j=1

ξ(l)t (i, j).

바움-웰치알고리즘의과정은다음과같이나타낼수있다.

Page 5: A hidden Markov model for predicting global stock market index

A hidden Markov model for predicting global stock market index 465

Algorithm 1 Baum-Welch algorithm

1: 길이가 T인 L개의독립관측수열 O = (O(1),O(2), . . . ,O(L))을고려한다.2: (λ, δ,∆)에대한초기값을설정한다.3: 다음조건을만족할때까지아래과정을반복한다.이때, ∆ < δ.

(a) 전향알고리즘을이용해다음을계산한다.

P(O, λ) =

L∏l=1

P(O(l)|λ

),

(b) 1 ≤ i ≤ N에대해서새로운파라미터 λ∗ = {A∗, B∗, p∗}를계산한다.

p∗i =1L

L∑l=1

γ(l)1 (i),

a∗i j =

∑Ll=1

∑T−1t=1 ξ

(l)t (i, j)∑L

l=1∑T−1

t=1 γ(l)t (i)

, 1 ≤ j ≤ N,

b∗i (k) =

∑Ll=1

∑T−1t=1 I(O(l)

t = v(l)k )γ(l)

t (i)∑Ll=1

∑T−1t=1 γ

(l)t (i)

, 1 ≤ k ≤ M.

(c) ∆ = P(O, λ∗) − P(O, λ)를계산한다.

(d) 다음을업데이트한다.

λ = λ∗.

4: 파라미터결과를확인할수있다.

2.3.다변량 Gaussian은닉마르코프모델

주가지수 데이터는 종가, 시가, 고가, 저가를 포함하고 있다. 4개의 관찰 가능한 데이터를 이용하여 은닉 마르코프 모델(HMM)에 적용할 때 관찰 가능한 데이터가 연속형 변수이므로 가장 기본이 되는 모형인 다변량(multivariate) Gaussian은닉마르코프모델을고려해볼수있다.다변량 Gaussian은닉마르코프모델은관찰가능한 데이터의 확률분포가 정규분포를 따르는 유한 상태공간(finite state space)이면서 동질적인(homoge-neous) 은닉 마르코프 모델의 형태를 띠고 있다. 마르코프 연쇄 상태가 qt = S i로 주어진 경우 관측치 Ot의

조건부분포는혼합가우시안분포를나타내며확률밀도함수는다음과같다.

bi(Ot) =

M∑k=1

wikbik(Ot) =

M∑k=1

wikN(Ot; µik,Σik), i = 1, 2, . . . ,N.

이때, wik는상태가 S i일때 k번째혼합그룹에대한가중치를나타내며 wik ≥ 0과 wi1 + wi2 + · · · + wiM = 1를만족한다.그리고, µik,Σik는각각 i번째상태의 k번째혼합그룹의평균과공분산행렬을나타낸다.즉,다변량Gaussian은닉마르코프모델을구성하는파라미터는전이확률행렬 A와초기확률 p,평균 µ,공분산행렬 Σ로

구성된 λ = (A, µ,Σ, p)이다.

Page 6: A hidden Markov model for predicting global stock market index

466 Hajin Kang, Beom Seuk Hwang

Figure 2: Daily changes in KOSPI200 closing price.

3.실제데이터분석

3.1.주가지수데이터

주가지수란거래소에상장및등록된주식의시장가격을토대로형성되어전반적인주가의동향을나타내는

대표적인지수로각나라의벤치마크지수로사용된다.나라마다시장을대표하는주가지수는다양하지만,본논문에서는 주가연계증권(equity linked securities; ELS)에서 주로 사용되는 기초자산을 바탕으로 다섯 개의국가별 주가지수를 선택하였다. 한국의 KOSPI200 지수, 일본의 NIKKEI225 지수, 홍콩의 HSI 지수, 미국의S&P500지수,영국의 FTSE100지수이다.데이터는 2010년 1월부터 2019년 12월말까지총 10년동안의일별주가지수데이터이며,출처는야후파이낸스(finance.yahoo.com)와한국거래소(krx.co.kr)이다.

Figure 2은 국내 KOSPI200 데이터의 일별 변화 추이를 나타내며, 해외 주가지수들의 데이터 그래프는Figure 3를 통해 확인할 수 있다. 국내 KOSPI200 그래프와 해외 주가지수들의 그래프를 살펴보면, 2010년부터 2019년까지 10년 동안 전반적으로 상승하는 추세가 있음을 알 수 있다. 그러나 각 국가 주가지수마다자세한추이나,전체적인패턴은다른양상을나타낸다.아시아권지수들인 KOSPI200과 HSI지수의경우그래프의패턴은비슷해보이나NIKKEI225지수의패턴은둘과는다른패턴을나타낸다.영국지수인 FTSE100의경우아시아권지수들과는또다른패턴의모습을지난 10년간보여왔으며세계적으로기준지수가되는미국의 S&P500은지수의전체적인변동폭이아주작아안정적으로움직이는것에비해,나머지 4개지수의경우상대적으로큰변동폭으로움직이고있음을알수있다.

3.2.주가지수예측방법

은닉마르코프모델은경제적상황예측이나변동성,주식움직임예측등과같이금융분야에서널리사용되고 있다 (박형준 등, 2007; Lee와 Oh, 2007; Nguyen, 2018). 본 논문에서는 HMM을 이용해 세계 주가지수를분석해보고, 각 국가별 주가지수의 추이와 움직임 그리고 가격 등을 예측해 보고자 한다. 특히 국내 시장의벤치마크지수로가장널리이용하는 KOSPI200지수를자세히살펴보고모델에적용하고자한다. 2010년 1월부터 2019년 12월 말까지 전체 데이터 중에서 마지막 100 영업일에 해당하는 데이터를 예측하고자 하는데이터로써선택하였다.

HMM을 이용해서 주가지수를 예측하는 과정은 다음과 같다. HMM 모델의 성과를 평가하기 위해 AIC,

Page 7: A hidden Markov model for predicting global stock market index

A hidden Markov model for predicting global stock market index 467

Figure 3: Daily changes in NIKKEI225, HSI, S&P500 and FTSE100 closing prices.

BIC등과같은기준을도입하고,이를바탕으로각각은닉상태의수에따른모델을비교하여데이터내에내재하는 최적의 상태의 수를 선택한다. 추정된 상태의 수를 바탕으로 은닉 마르코프 모델을 학습하는 데에는전체 데이터를 학습 데이터와 실험 데이터로 나누어 진행한다. 학습 데이터를 이용해 구축한 모형을 예측에활용하고, 실험 데이터와의 예측 오차를 측정하여 예측 모델이 최적으로 생성되었는지 결과를 확인한다. 본논문에서사용된모든분석에는 Python hmmlearn패키지를이용하였다 (Lebedev등, 2017).

3.2.1.모델선택:상태의수결정

은닉마르코프모델에서은닉상태의수를결정하는것은굉장히중요하다.은닉상태의수가많을수록모델이더적절한것처럼보일수도있으나,이럴경우모델을구축하기위해추정해야할모수의수가증가하므로간결성의 원칙에서 벗어나거나 계산 과정이 오래 걸리는 등 비효율적인 모습을 나타내기도 한다. 상태 수에따른모델의성능을평가하기위해다음네가지정보기준을사용한다. L은모델의가능도함수를나타내고,M은전체관측한기간의데이터의수를의미하며, k는모델에서추정된모수의수를나타낸다.네가지지표모두각각의기준값이작을수록더좋은모델이라고판단할수있다.

(i) Akaike information criterion (AIC): AIC = −2 ln L + 2k.

(ii) Bayesin information criterion (BIC): BIC = −2 ln L + k ln M.

(iii) hannan-quinn information criterion (HQC): HQC = −2 ln L + 2k ln(ln M).

(iv) bozdogan consistent Akaike information criterion (CAIC): CAIC = −2 ln L + k(ln M + 1).

Page 8: A hidden Markov model for predicting global stock market index

468 Hajin Kang, Beom Seuk Hwang

3.2.2.모델학습

HMM의모수를추정하기위해바움-웰치알고리즘을적용한다.이때,전체데이터를학습데이터와실험데이터로나누고,학습데이터를임의의단위블록으로분할하여각각블록별학습을진행한다.그리고임의의시점에 대해서 관측치가 주어진 경우, 과거에 비슷한 가능도를 나타낸 유사 데이터를 찾는 방법을 이용해다음 시점에 대한 가격을 예측한다 (Hassan과 Nath, 2005). 이후에 관측 데이터가 추가되면 이를 다시 학습데이터로하여모델을재학습하고다음시점의예측을진행한다.

주가지수 데이터에 적용하여 예측 과정을 조금 더 자세히 살펴보면 다음과 같다. 우선, 학습 데이터에서길이가 D인 고정된 구간을 선택한다. HMM의 모수인 λ를 추정하기 위해 T − D + 1부터 T까지 구간을 단위블록으로하여학습데이터로사용한다.주가지수데이터는연속형데이터이므로가우시안분포를따른다고가정하며, HMM의 모수인 λ = {A, B, p}에서 행렬 B는 가우시안 분포의 평균 µ와 표준편차 σ를 나타낸다.주가지수데이터에서관측가능한수열은종가,시가,고가,저가를의미하며다음과같이나타낼수있다.

O ={O(1)

t ,O(2)t ,O(3)

t ,O(4)t , t = T − D + 1,T − D + 2, . . . ,T

}.

임의의초기모수와데이터를이용하여관측값의확률 P(O|λ)를계산할수있다.그이후엔데이터블록을일별로이동시켜다음의새로운관측데이터를얻으며확률 P(Onew|λ)를계산할수있다.

Onew ={O(1)

t ,O(2)t ,O(3)

t ,O(4)t , t = T − D,T − D + 1, . . . ,T − 1

}.

이러한과정을반복하여 P(O∗|λ) ' P(O|λ)를만족하는데이터 O∗를찾아낸다.

O∗ ={O(1)

t ,O(2)t ,O(3)

t ,O(4)t , t = T ∗ − D + 1,T ∗ − D + 2, . . . ,T ∗

}.

마지막으로 관측 가능한 수열 중 종가를 예로 든다면 T + 1시점의 종가O(1)T+1의 가격은 다음 식을 이용하여

계산할수있다.

O(1)T+1 = O(1)

T +(O(1)

T ∗+1 − O(1)T ∗

)× sign(P(O|λ) − P(O∗|λ)).

마찬가지로 T + 2시점의가격을예측하기위해서는새로운데이터 O를학습데이터로사용한다.

O ={O(1)

t ,O(2)t ,O(3)

t ,O(4)t , t = T − D + 2,T − D + 3, . . . ,T + 1

}.

처음예측과정에서추정된 HMM의모수 λ는두번째예측을진행할때초기모수로사용하며,나머지는위의과정을동일하게반복하여예측을진행한다.

3.2.3.모델검증

예측 결과를 비교하기 위한 효율성 측도로 평균절대백분율오차(MAPE)와 평균절대오차(AAE), 제곱근평균제곱오차(RMSE)를사용하며다음과같이정의된다.

(i) mean absolute percentage error (MAPE)

MAPE =1N

N∑i=1

|True(i) − Predicted(i)|True(i)

,

Page 9: A hidden Markov model for predicting global stock market index

A hidden Markov model for predicting global stock market index 469

Table 2: Criterion values for the number of states in KOSPI200

Criteria 2 States 3 States 4 States 5 States 6 StatesAIC 41669.8 39766.9 38283.5 37099.6 36508.5BIC 41698.9 39830.8 38393.9 37268.1 36746.8HQC 41670.1 39767.5 38284.6 37101.2 36510.8CAIC 41698.9 39830.8 38393.9 37268.1 36746.8

(ii) average absolute error (AAE)

AAE =1N

N∑i=1

|True(i) − Predicted(i)|,

(iii) root-mean-square error (RMSE)

RMSE =

√√1N

N∑i=1

(True(i) − Predicted(i))2.

세가지측도모두상대적으로작을수록예측이잘이루어졌다고판단할수있다.

3.3.모델설정

주가지수데이터는연속형변수이므로 2.3에서언급한다변량 Gaussian HMM을사용할것이다.모델을설정할때은닉상태의수를충분하게설정하면모형의선택폭도다양하고더적합한모형이선택될수는있으나,파라미터의해석과모형에대한이해가어렵다는단점이있다.따라서절약성의원리(principle of parsimony)를 고려하여 은닉 상태의 수는 2에서 6까지로 제한하고, 각 상태의 수에 따라 AIC, BIC, HQC, CAIC 기준을사용하여 적절한 은닉 상태의 수를 결정하였다. 기준값이 작을수록 더 좋은 모형이며, Table 2은 KOSPI200지수에대한상태의수에따른기준값들을나타내고있다.

국내 KOSPI200지수뿐만아니라해외주가지수들모두 4가지기준에의해결정된최적의상태수는 6개이다. KOSPI200의경우상태의수를제한없이충분히크게하면, AIC, HQC를기준으로는 25 States가최적인것으로, BIC, CAIC를기준으로는 15 States가최적인것으로확인할수있었으나상태의수가큰경우모형을위해 추정해야 할 파라미터의 수도 기하급수적으로 증가하므로 여러 가지 효율성을 위해 제한된 상태에서

최적의 상태 수인 6개를 최적으로 선택하기로 하였다. 최적의 모형으로 선택된 6 States HMM을 기반으로적합한모델의 100영업일시점예측에대한파라미터의값은 Figure 4에서확인할수있고,그해석은다음과같이 할 수 있다. 초기 확률이 p = (1, 0, 0, 0, 0, 0)으로 주어졌을 때 t = 1 시점에서 q1 = S 1 값을 갖고, t = 2시점에서 q2 = S 1 값을 가질 확률이 0.995가 됨을 알 수 있다. 마찬가지로 t = 2 시점에서 q2 = S 2 값을 가질

확률은 0에근접하고, q2 = S 3 값을가질확률은 0.007이된다.일반화하면,전이확률행렬 A의 i행 j열원소는임의의 t 시점에서 qt = S i값을 갖고 t + 1 시점에서 qt+1 = S j 값을 가질 확률을 나타낸다. 행렬의 대각원소값이대부분 0.95보다크게나타나는것으로보아동일상태로전이될확률이가장큰것을알수있다.

실제 주가지수 데이터 분석에서 다변량 가우시안 분포를 가정했으므로, 출력확률행렬 B는 파라미터 µ

와 Σ를의미한다.행렬 µ의의미는다음과같다.임의의 t 시점에서 1행은첫번째상태가 S 1값을가질때,즉qt = S 1일때종가,시가,고가,저가에해당하는평균값들의벡터를의미한다.즉, µik는상태가 S i일때,심볼(Symbols) vk값에대한평균을의미한다.해당예에서가능한심볼은 {v1, v2, v3, v4}이고각각은종가,시가,고가, 저가를 나타낸다. 행렬 Σ도 마찬가지로 종가, 시가, 고가, 저가에 해당하는 공분산행렬이 상태의 수만큼

Page 10: A hidden Markov model for predicting global stock market index

470 Hajin Kang, Beom Seuk Hwang

Figure 4: 6 states HMM parameters in KOSPI200.

6개가 나타남을 알 수 있다. Figure 4을 통해서 상태가 S i일 때, 이에 해당하는 각각의 공분산을 확인할 수있으며,평균과공분산행렬모두상태에따라값의수준이군집화된것처럼구분되어나타난것을확인할수있다.

3.4.분석결과

Figure 5는 KOSPI200 지수의 종가, 시가, 고가, 저가에 대한 2019년 8월 5일부터 2019년 12월 30일까지 100영업일 동안의 예측 결과를 나타낸다. 실제 주가지수 가격은 붉은색 점선, 모델을 통한 예측가격은 검정색실선으로표현되고있다.은닉마르코프모델(HMM)을이용한예측이전체적인주가지수움직임이나추이를잘 나타내고 있음을 보여주고 있다. 예측의 성과를 확인하기 위해 학습 데이터와 실험 데이터로 나눈 전체데이터중에서실험데이터와의예측오차를확인하였다. Table 3에는 HMM과비교모델인서포트벡터회귀(support vector regression; SVR) 모델 (Basak 등, 2007)을 통해서 나온 예측 오차를 비교하고 있다. HMM 모델이 SVR 모델보다 전반적으로 더 작은 예측 오차를 보여주고 있지만, 제곱근평균제곱오차(RMSE)의 경우주가지수시가와고가는 SVR모델이더작은예측오차를가지고있다. KOSPI200의경우비교대상으로한SVR 모델이 RBF 커널(radial basis function kernel)을 이용한 결과이지만, 각각의 주가지수 데이터에 따라서선형(linear), 다항(polynomial), 시그모이드(sigmoid) 커널 등과 같은 다른 옵션을 이용하게 되면 결과는 조금씩 달라질 수 있을 것이다. 서포트 벡터 회귀 모델은 순서에 따른 근접한 데이터의 조건부 의존성에 대한고려가부족하고,모형적합및예측까지의계산시간이 HMM보다상대적으로많이소요되는단점을가지고있다. HMM모델은관찰가능한확률과정의경우마르코프연쇄가주어진상황에서조건부독립이며,각시점의조건부분포는오직해당시점의마르코프연쇄에만의존하는기본구조를가지고있다.이는주가지수

Page 11: A hidden Markov model for predicting global stock market index

A hidden Markov model for predicting global stock market index 471

Figure 5: Prediction results for closing, open, high and low prices in KOSPI200.

Table 3: Prediction error for closing, open, high and low prices in KOSPI200

Model Method Closing Open High LowMAPE 0.0088 0.0079 0.0083 0.0081

HMM AAE 2.41 2.18 2.29 2.21RMSE 3.05 2.95 2.84 2.92MAPE 0.0098 0.0083 0.0083 0.0085

SVR AAE 2.69 2.28 2.29 2.31RMSE 3.39 2.91 2.73 2.95

움직임에 적합한 구조라고 할 수 있는데 임의의 시점의 주가지수가 은닉된 여러 상태에 의해 영향을 받으며

마르코프 과정을 따른다고 가정을 할 수 있기 때문이다. 또한 HMM 모델은 파라미터 등을 이용하여 모델을설명및해석할수있으므로데이터의특성상 HMM을이용한예측이더좋은결과를제공하고있다고볼수있다.

Figure 6는 해외 주가지수에 대한 HMM을 이용한 종가의 예측 결과를 나타내는데 실제 주가지수 가격은 붉은색 점선, 모델을 통한 예측가격은 검정색 실선으로 표현하고 있다. Table 4는 이에 대한 예측 오차를비교한결과를보여주고있다.

본연구에서적용한 HMM이최근주가예측에많이활용되고있는 SVR에못지않게전반적으로우수한예측정확도를보이고있음을확인할수있다.이는국내및해외주가지수를예측하기위한방법으로 HMM이효과적인수단이될수있다는점을뒷받침하는연구결과라고할수있다.

Page 12: A hidden Markov model for predicting global stock market index

472 Hajin Kang, Beom Seuk Hwang

Figure 6: Prediction results for closing prices in NIKKEI225, HSI, S&P500 and FTSE100.

Table 4: Prediction error for closing prices in NIKKEI225, HSI, S&P500 and FTSE100

Model Method NIKKEI225 HSI S&P500 FTSE100MAPE 0.0082 0.0113 0.0080 0.0086

HMM AAE 182.73 303.18 23.98 62.64RMSE 243.43 379.43 33.06 78.65MAPE 0.0085 0.0112 0.0084 0.0086

SVR AAE 190.91 298.41 25.18 62.90RMSE 246.36 388.83 33.47 82.56

4.결론및논의

본논문에서는은닉마르코프모델을기반으로국내 KOSPI200주가지수와해외 NIKKEI225, HSI, S&P500,FTSE100주가지수예측에적용하여얼마나우수한예측정확도를나타내는지실증분석을시도하였다. AIC,BIC, HQC, CAIC기준을이용해모델의최적상태수를결정하였고,이를통해생성한모형으로주가지수들의움직임을잘따라가며가격또한잘예측하는지를살펴보았다.그결과, HMM방법이비교모형인서포트벡터회귀모형과비교해뒤처지지않는우수한예측정확도를보임을확인할수있었다.특히, HMM방법은마르코프연쇄와조건부독립이라는기본구조가주가데이터의특성을잘반영할수있는모형이라는점에서

주가지수예측의수단으로써적합하다는사실을확인하였다.또한,본연구를참고하여추후환율데이터나,

Page 13: A hidden Markov model for predicting global stock market index

A hidden Markov model for predicting global stock market index 473

금리,주식의변동성뿐만아니라신용데이터등금융시장의여러데이터에도 HMM방법을다양하게활용할수있을것으로기대해볼수있었다 (Idvall과 Jonsson, 2008; Liu, 2018).

본연구의한계점및향후연구방향은다음과같다.첫째,관찰가능한데이터인주가지수데이터모형에대해 가우시안 분포 외에 다양한 분포를 가정하여 적용하고, 금융 시장의 특성을 반영한 더 적합한 모델을적용하는것에대한연구가필요하다.주가지수데이터의경우양쪽극단값의밀도가더높은 fat-tail형태의분포를가지고있다는것이알려져있기때문에가우시안분포외에로그정규분포나웨이블분포,코시분포등과 같이 데이터의 특성을 반영한 HMM을 적용하여 결과를 보다 개선할 수 있을 것이다. 둘째, 본 논문은2010년부터 2019년까지 해당 10년 동안의 데이터 세트에만 근간하고 있어서 과거 2008년 세계 금융위기나,현재코로나19사태로인한금융시장침체등금융시장에큰충격을준사건들이포함되지않았다는한계점이있다.이슈가없는보통의금융시장에서주식의움직임을예측하는것외에도금융시장에큰충격이발생했을때의주식움직임또한예측이가능하도록연구가진행된다면리스크관리차원에서도효율적으로활용될수

있을것으로기대해볼수있다.

References

Park HJ, Hong DH, and Kim MH (2007). Using hidden Markov model for stock flow forecasting. The Proceed-ings of the Korean Institute of Electrical Engineers Summer Conference, 1860-1861

Basak D, Pal S, and Patranabis DC (2007). Support vector regression. Neural Information Processing-Lettersand Reviews, 11, 203–224.

Baum LE and Petrie T (1966). Statistical inference for probabilistic functions of finite state Markov chains. TheAnnals of Mathematical Statistics, 37, 1554–1563.

Baum LE, Petrie T, Soules G, and Weiss N (1970). A maximization technique occurring in the statistical analysisof probabilistic functions of Markov chains, The Annals of Mathematical Statistics, 41, 164–171.

Bozdogan H (1987). Model selection and Akaike’s information criterion (AIC): The general theory and its ana-lytical extensions, Psychometrika, 52, 345–370.

Cao L and Tay FE (2001). Financial forecasting using support vector machines, Neural Computing & Applica-tions, 10, 184–192.

Cappe, O, Moulines E, and Ryden T(2006). Inference in Hidden Markov Models. Springer, New York.Hannan EJ and Quinn BG (1979). The determination of the order of an autoregression, Journal of the Royal

Statistical Society, Series B, 41, 190–195.Hassan MR and Nath B (2005). Stock market forecasting using hidden Markov model: a new approach. In

Proceedings of the 5th International Conference on Intelligent Systems Design and Applications, IEEEComputer Society, 192–196.

Idvall P and Jonsson C (2008). Algorithmic trading: Hidden Markov models on foreign exchange data, Master’sThesis, Department of Mathematics, Linkopings Universitet.

Knab B, Schliep A, Steckemetz B, and Wichern B (2003). Model-based clustering with hidden Markov modelsand its application to financial time-series data, Between Data Science and Applied Data Analysis, Springer,New York.

Landen C (2000). Bond pricing in a hidden Markov model of the short rate, Finance and Stochastics, 4, 371–389.Lee S and Oh C (2007). A smoothing method for stock price prediction with hidden Markov models, Journal of

the Korean Data and Information Science Society, 18, 945–953.Liu W (2018). Hidden Markov model analysis of extreme behaviors of foreign exchange rates, Physics A: Statis-

Page 14: A hidden Markov model for predicting global stock market index

474 Hajin Kang, Beom Seuk Hwang

tical Mechanics and its Applications, 503, 1007–1019.Mamon RS and Elliott RJ (2007). Hidden Markov Models in Finance. Springer, New York.Nguyen N (2018). Hidden Markov model for stock trading, International Journal of Financial Studies, 6, 1–17.Rabiner LR (1989). A tutorial on hidden Markov models and selected applications in speech recognition. In

Proceedings of the IEEE, 77, 257–286.Viterbi A (1967). Error bounds for convolutional codes and an asymptotically optimum decoding algorithm,

IEEE Transactions on Information Theory, 13, 260–269.Welch LR (2003). Hidden Markov models and the Baum-Welch algorithm, IEEE Information Theory Society

Newsletter, 53, 10–13.Zucchini W, MacDonald IL, and Langrock R (2017). Hidden Markov Models for Time Series: An Introduction

Using R. CRC Press, New York.

Received January 15, 2021; Revised February 5, 2021; Accepted February 15, 2021

Page 15: A hidden Markov model for predicting global stock market index

475

은닉마르코프모델을이용한국가별주가지수예측

강하진a 황범석1,a

a중앙대학교응용통계학과

요 약

은닉 마르코프 모델(hidden Markov model, HMM)은 은닉된 상태와 관찰 가능한 결과의 두 가지 요소로이루어진통계적모형으로확률론적접근이가능하고,다양한수학적인구조를가지고있어여러분야에서활발하게사용되고있다.특히금융분야의시계열데이터에응용되어다양한연구가진행되고있다.본연구는HMM이론을국내 KOSPI200주가지수와더불어 NIKKEI225, HSI, S&P500, FTSE100과같은해외주가지수예측에적용해보고자한다.또한,최근인공지능분야의발전으로인해주식가격예측에빈번하게사용되는서포트벡터회귀(support vector regression, SVR)결과와어떤차이가있는지비교하여살펴보고자한다.

주요용어:서포트벡터회귀,은닉마르코프모델,주가지수예측,코스피200지수,해외주가지수

이논문은 2020년도중앙대학교연구장학기금지원에의한것임.1교신저자: (06974)서울시동작구흑석로 84,중앙대학교경영경제대학응용통계학과. E-mail: [email protected]