tendÊncias e r unitÁrias - ufjfsíntese de alguns testes de raíz unitária muito usados em est....

50
T ENDÊNCIAS E R AÍZES U NITÁRIAS Rogério Silva de Mattos Universidade Federal de Juiz de Fora Departamento de Economia [email protected] 20 de setembro de 2019 Este texto foi produzido para suporte ao ensino de econometria de séries temporais. Ao longo dos últimos nove anos, o autor vem lecionando esta matéria na disciplina Econometria III do curso de graduação em economia da Universidade Federal de Juiz de Fora. O texto foi feito com o objetivo de contribuir para um melhor entendimento da matéria não só por alunos de graduação em economia, mas por todos aqueles interessados no assunto. Devido ao seu caráter introdutório, o texto evita abordar a teoria assintótica que é típica da teoria estatística subjacente à moderna econometria de séries temporais. A grande motivação para escrever o documento veio da escassez de bons textos introdutórios, tanto em português como em outras línguas, que apresentem os conceitos de forma clara e ao mesmo tempo com boa dose de precisão. Quaisquer comentários são bem vindos. - O autor agradece a Lucas Picardi por comentários a uma prévia versão deste texto, sem lhe atribuir qualquer responsabilidade por erros e omissões aqui presentes.

Upload: others

Post on 05-Oct-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

TENDÊNCIAS E RAÍZES UNITÁRIAS

Rogério Silva de MattosUniversidade Federal de Juiz de Fora

Departamento de [email protected]

20 de setembro de 2019

Este texto foi produzido para suporte ao ensino de econometria de séries temporais. Ao longo dos últimosnove anos, o autor vem lecionando esta matéria na disciplina Econometria III do curso de graduação emeconomia da Universidade Federal de Juiz de Fora. O texto foi feito com o objetivo de contribuir para ummelhor entendimento da matéria não só por alunos de graduação em economia, mas por todos aquelesinteressados no assunto. Devido ao seu caráter introdutório, o texto evita abordar a teoria assintótica queé típica da teoria estatística subjacente à moderna econometria de séries temporais. A grande motivaçãopara escrever o documento veio da escassez de bons textos introdutórios, tanto em português como emoutras línguas, que apresentem os conceitos de forma clara e ao mesmo tempo com boa dose de precisão.Quaisquer comentários são bem vindos.

- O autor agradece a Lucas Picardi por comentários a uma prévia versão deste texto, sem lhe atribuirqualquer responsabilidade por erros e omissões aqui presentes.

Page 2: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

Sumário

1 Introdução 11.1 Tendência Determinística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Tendência Estocástica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.3 Processo Estacionário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.4 Processo Integrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.5 Raíz Unitária . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.6 Decomposição de Beveridge e Nelson . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.7 Diferença Estacionária . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.8 Média e Variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.9 Passeio Aleatório . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.10Memória e Choques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151.11Os Quatro Processos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2 Testes de Raiz Unitária 172.1 Representação Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172.2 Teste de Dickey-Fuller . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.2.1 Opção 1: Sem intercepto e sem termo de tendência . . . . . . . . . . . . . . . 222.2.2 Opção 2: Só com intercepto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222.2.3 Opção 3: com intercepto e termo de tendência . . . . . . . . . . . . . . . . . 232.2.4 Teste Aumentado de Dickey-Fuller . . . . . . . . . . . . . . . . . . . . . . . . 242.2.5 Passos de implementação do teste ADF . . . . . . . . . . . . . . . . . . . . . . 25

2.3 Teste de Phillips–Perron . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292.4 Teste DF–GLS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

2.4.1 Processo para Yt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322.4.2 Estatística do teste DF–GLS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

2.5 Teste Ponto-Ótimo de ERS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352.5.1 Estatística do teste ERS-PO . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352.5.2 Passo a passo do teste ERS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

2.6 Teste ADF com Sazonalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3 Comentários Finais 40

A Decomposição de Beveridge e Nelson 42

B Relações Entre Conceitos 44

Page 3: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

Lista de Figuras

1 Tipos de Tendência Determinística . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Processos estacionário e tendência estacionária. . . . . . . . . . . . . . . . . . . 33 Tendência estocástia e tendência geral. . . . . . . . . . . . . . . . . . . . . . . . 54 Processos com Raíz Unitária (i.e. que apresentam tendência estocástica) e

primeiras diferenças. Dados simulados. . . . . . . . . . . . . . . . . . . . . . . . . 125 Tipos de memória em processos estocásticos. Dados simulados. . . . . . . . . 166 Índice de quantum (base 2005=100) das exportações brasileiras 1950–2007. . 297 Série Mensal de Comércio de Bens de Consumo na Região Metropolitana de São

Paulo, Janeiro de 1990 a Dezembro de 2013. . . . . . . . . . . . . . . . . . . . . . . 408 Fonte: Elaboração do autor usando conceitos e definições apresentados no texto. As re-

lações foram estabelecidas com base na definição restrita de Engle e Granger (1987) paraprocesso integrado. Os termos ARMA(p, q) e ARIMA(p, d, q) se referem à representação comconstante e condição de invertibilidade. O conceito de processo com d raízes unitárias (naparte AR) não aparece na figura, mas equivale ao de processo integrado ou I(d). . . . . . . 44

Lista de Tabelas

1 Teste ADF de raiz unitária para séries simuladas . . . . . . . . . . . . . . . . . . . . 272 Teste Phillips-Perron de raiz unitária para séries simuladas . . . . . . . . . . . . . 313 Teste de raiz unitária DF-GLS para séries simuladas . . . . . . . . . . . . . . . . . . 354 Teste ponto–ótimo de Elliot, Rotemberg e Stock . . . . . . . . . . . . . . . . . . . . . 385 Equação de Teste com variáveis dummy sazonais para o Comércio de Bens de

Consumo (Variável Dependente: ∆CBCt) da RMSP . . . . . . . . . . . . . . . . . . . 416 Equação de teste com variáveis dummy Sazonais para a primeira diferença do

Comércio de Bens de Consumo (variável dependente ∆2CBCt) da RMSP . . . . . . 42

Page 4: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

1 Introdução

Uma boa e adequada compreensão dos métodos da Econometria de Séries Temporais (EST)pode ser obtida a partir das noções de tendência. Em estatística, o termo “tendência” hámuito tempo é visto como um padrão de crescimento ou decrescimento persistente no com-portamento de uma série temporal1 a longo prazo. Atualmente, no âmbito da moderna EST,o conceito de tendência também tem a ver com padrões especiais de não-estacionariedadedo mecanismo real que gera uma série temporal. Há duas noções básicas de tendência queestudaremos aqui: a tendência determinística e a tendência estocástica 2. Inicialmente,visando um bom entendimento da primeira, usaremos a noção mais antiga de tendência, aopasso que, para entender a segunda, precisaremos do conceito de não-estacionariedade emprocessos estocásticos.

As noções de tendência determinística e estocástica são muito importantes na forma queos econometristas descrevem modernamente a não estacionariedade das séries econômicas. Oconceito central usado para isso é o de processo integrado e, em particular, sua representaçãoatravés de modelos lineares do tipo ARIMA(p, d, q). Dessa última, vem o conceito de processoscom raízes unitárias. O uso de processos integrados em EST é motivado pelo fato de que suasrealizações revelam comportamentos semelhantes aos de muitas séries econômicas, inclusiveno que respeita à presença típica de tendências. Veremos que, dependo da forma como se usaa representação de processo integrado, os dois tipos de tendência, determinística e estocástica,se manifestam isoladamente ou em conjunto. Em particular, a presença da tendência esto-cástica confere a uma série econômica um padrão de reação permanente a choques exógenosque tem grande relevância para a análise de políticas econômicas. Assim, ser capaz de distin-guir nos dados temporais essas duas formas de tendência adquire importância praticamenteequivalente à verificação de não estacionariedade.

Essa verificação, por outro lado, também é fundamental como o primeiro estágio da cons-trução de modelos econométricos de ST. Ela é feita através dos chamados testes de raíz unitá-ria. Assim, além de discutir o conceito de tendência, este documento também apresenta umasíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes,faz–se uma breve discussão sobre a estrutura de teste proposta inicialmente por Dickey e Ful-ler (1979 e 1981) e que depois veio a ser seguida pela maioria dos econometristas, embora nãotodos, que desenvolveram testes de raíz unitária. Feito isso, são então apresentados os testesde Dickey–Fuller aumentado, de Phillips–Perron e os dois procedimentos de Elliot et all (1995;testes DF–GLS e Ponto Ótimo). Todos esses testes são apresentados para análise de sériessem sazonalidade, mas, ao final, o procedimento do teste ADF para séries com sazonalidade éabordado.

O texto pressupõe que o leitor possua noções de modelos clássicos de decomposição de sé-ries temporais (em componentes de tendência, ciclo e sazonalidade) e de modelos de regressãolinear múltipla. Além disso, é importante que possua também conhecimentos sobre a metodo-logia de Box e Jenkins para construção de modelos ARIMA, uma vez que a moderna EST estábastante desenvolvida sobre conceitos típicos dessa metodologia.

1.1 Tendência Determinística

Considere que Yt representa uma variável econômica qualquer, como o PIB ou o nível de em-prego. Assuma que esta variável é gerada por um processo estocástico simples, como segue:

Yt = TDt + utTDt = a+ bt

(1)

onde a e b são constantes reais, t é a variável tempo e ut é um processo estocástico estacionáriocom média nula. O componente de Yt dado por TDt = a+bt é chamado usualmente de tendên-cia determinística. Essa forma de denominar esse componente decorre de dois aspectos. O

1O termo “tendência”, na sua versão em inglês trend, aparece pela primeira vez no estudo de Hooker (1901), quepropôs uma forma de modelar os movimentos seculares de uma série temporal através de médias móveis.

2De ambas essas noções, derivam ainda outras interpretações do componente de tendência de uma série temporal.Uma discussão instrutiva a esse respeito é feita por Phillips (2010).

1

Page 5: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

primeiro é que, visualmente no plano cartesiano t×Y , a expressão TDt = a+bt representa umalinha reta. Quando b 6= 0, esta linha possui uma inclinação que pode ser positiva ou negativa.A inclinação, por sua vez, indica que uma parte de Yt cresce ou decresce persistentementeno tempo, daí representar uma tendência. Será uma tendência de crescimento ou positiva seb > 0 e de decrescimento ou negativa se b < 0. Observe as figuras 1.1.a) e 1.1.b).

(a) Linear Positiva (b) Linear Negativa

(c) Quadrática Explosiva (d) Quadrática Amortecida

Figura 1: Tipos de Tendência Determinística

Fonte: Elaborado pelo autor.

O segundo aspecto decorre de que a tendência assim caracterizada, segundo uma relaçãomatemática exata, expressa um padrão fixo e previsível. Ou seja, um padrão “determinístico”,porque esta palavra se refere a algo que se pode determinar ou prever com certeza. De fato,TDt = a+ bt significa que uma parte de Yt sofre um acréscimo fixo e previsível de b unidades acada período de tempo, isto é:

∆TDt = (a+ bt)− (a+ b(t− 1)) = b (2)

Juntando, então, a noção de persistência com a de padrão fixo e previsível, a expressãoTDt = a + bt representa um tendência determinística embutida na evolução temporal de Yt.

2

Page 6: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

Além desses aspectos, essa expressão caracteriza um padrão linear, isto é, a tendência deter-minística é uma função afim de t que, visualmente, corresponde a uma reta. Por esse motivo,diz-se que ela representa uma tendência determinística linear.

Vale ressaltar, no entanto, que é possível falar-se de outros padrões de tendência determi-nística. Suponha que, ao invés de (1), a seríe Yt evoluísse no tempo segundo:

Yt = TDt + utTDt = a+ bt+ ct2

onde c é também uma constante real. Agora, a parte de Yt correspondente à TDt também é umpadrão determinístico de crescimento no tempo. A cada período, uma parte de Yt cresce oudecresce em ∆TDt = (b − c) + 2ct unidades. Portanto, segundo um padrão previsível também.Porém, esse crescimento se dá de forma variável, isto é, que depende de t. Agora, a tendênciadeterminística é uma função não–linear de t e sua visualização no plano t × Y não é mais deuma linha reta, mas de uma linha em curva. Note também que essa curva representará umpadrão de crescimento explosivo, se c > 0, ou amortecido, se c < 0. Observe as figuras 1.1.c) e1.1.d). No caso aqui considerado, TDt = a+ bt+ ct2 representa uma tendência determinísticaquadrática (portanto, não-linear). É fácil imaginar ainda vários outros padrões não linearesque podem ser representados, como tendência determinística cúbica, tendência determinísticaexponencial, etc.

O modelo (1) para Yt é usualmente chamado na literatura de EST de tendência estacioná-ria. Esse nome vem do fato de que Yt possui uma parte representada pela tendência determi-nística linear TDt = a+ bt e outra parte representada pelo processo estocástico estacionário ut.Assim, Yt representa um tipo de processo que oscila aleatoriamente de forma estacionária emtorno de uma tendência determinística linear. É importante distinguir aqui essas duas partesda tendência estacionária. Usaremos as figuras 2.a) e 2.b) como ilustração.

A figura 2.a) mostra um exemplo de série temporal que segue um processo estocásticopuramente estacionário. Esta série foi simulada artificialmente segundo um processo AR(1),caracterizado como Yt = 0, 6Yt−1 + εt, onde εt é um ruído branco normal. Note que a sérienão apresenta qualquer tendência, isto é, qualquer padrão de crescimento ou decrescimentopersistente no tempo. Parece apenas que a série fica oscilando em torno de uma constantepróxima de zero ao longo do tempo.

Observe agora a figura 2.b). Ela mostra um exemplo de série temporal que segue umatendência estacionária propriamente dita. Repare que, nitidamente, a série parece oscilaraleatoriamente em torno de um padrão de crescimento persistente que se assemelha a umatendência determinística linear, no caso crescente. De fato, esta série foi simulada artificial-mente segundo o modelo (1), onde TDt = 2 + 0, 15t e ut = 0, 6ut−1 + εt. Ou seja, a série foisimulada como a soma de uma tendência determinística linear mais um processo estocásticoestacionário, portanto exatamente como a tendência estacionária do modelo (1).

(a) Processo Estacionário (b) Tendência Estacionária

Figura 2: Processos estacionário e tendência estacionária.

Fonte: Elaborado pelo autor. Gráfico a) foi simulado como Yt = 0, 6Yt−1 + εt e gráfico b) como Yt =

2 + 1, 5t+ ut e ut = 0, 6ut−1 + εt.

3

Page 7: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

Naturalmente, a noção de tendência estacionária pode ser estendida ao modelo em que Ytrepresenta um processo estocástico que oscila de forma estacionária em torno de uma tendên-cia determinística quadrática. No entanto, ao longo deste texto, quando falarmos de tendênciaestacionária, estaremos pensando usualmente naquele tipo representado pelo modelo (1), queembute uma tendência determinística linear.

Há ainda dois aspectos interessantes a observar sobre a tendência determinística linear domodelo (1). Neste texto, em geral estaremos assumindo que o instante t = 0 corresponde aum momento inicial em que o valor do processo estocástico é conhecido. Assim, a constante acorresponde ao valor inicial da tendência determinística, de modo que podemos dizer TD0 = a.Isso é importante porque podemos entender a tendência determinística linear de um modo umpouco diferente. Observe que ela pode ser escrita alternativamente como:

TDt = TD0 + b+ b+ · · ·+ b︸ ︷︷ ︸t vezes

= TD0 + bt (3)

Ou seja, a tendência determinística linear é tal que, a cada instante de tempo a partir de t = 1,um choque determinístico de magnitude b é aplicado sobre TD0. O efeito de cada choquepersiste na dinâmica temporal de TDt de modo que os efeitos dos choques vão se acumulando.Em um dado instante t, o termo bt corresponde à acumulação desses choques determinísticosadicionados t vezes ao valor inicial TD0.

Chamares aqui o termo bt de núcleo da tendência determinística linear. Faremos assimporque na expressão TDt = a + bt é ele que faz a tendência determinística linear ser o que é.Se não houvesse ele, isto é, se fosse b = 0, então seria simplesmente TDt = a, mas neste casonão teríamos tendência alguma. Por outro lado, se o termo constante é que fosse nulo, isto éa = 0, a tendência determinística seria igual ao seu núcleo:

TDt = bt

Neste caso, o valor inicial seria nulo, isto é, TD0 = a = 0, mas continuaríamos tendo umatendência determinística linear.

Finalmente, vale observar que a representação de processo tipo tendência estacionária paraYt em (1) fornece um princípio para remoção da tendência de uma série temporal. Conhecidoem inglês como detrending, este procedimento já foi muito usado por estatísticos e econome-tristas interessados em estudar ciclos embutidos no comportamento de séries econômicas. Deacordo com o modelo em (1), remover a tendência de Yt é simplesmente computar:

ut = Yt − TDt = Yt − a− bt

Na prática, esse procedimento é implementado estimando-se antes os parâmetros a e b, o queé feito normalmente usando-se o método dos mínimos quadrados ordinários. Computa-seYt − a − bt, isto é, uma estimativa de Yt com a tendência removida e então analisa-se paraidentificação de padrões cíclicos e/ou sazonais. O estudo de ciclos é um tópico fascinante daanálise de séries temporais, mas não iremos nos deter sobre ele neste texto.

1.2 Tendência Estocástica

Há outro conceito muito importante em EST que é o de tendência estocástica. Em geral, oseconometristas entendem tendência estocástica como um crescimento persistente no tempoque é aleatório, e não fixo como a constante b no caso da tendência determinística linear em(1)-(2). Se designarmos a tendência estocástica por TEt, isso significa que:

∆TEt = εt (4)

onde εt é uma variável aleatória. Em particular, os econometristas costumam assumir que εt éum processo estocástico estacionário com média nula, variância constante e descorrelatado notempo3. Repare que, se reescrevermos a expressão (4) de outra forma, subtraindo de ambos

3O termo “tendência estocástica” é bastante usado na literatura de EST, mas nunca é definido de um modo explícito.Por isso, acontece de diferentes autores conceituá-lo de diferentes maneiras. Por exemplo, Box e Jenkins (1970, p.92)definem “tendência estocástica” de modo genérico como E(∆dYt) = µ, onde µ é uma constante não nula. Atualmente,parece haver certa unanimidade entre a maioria dos autores de que tendência estocástica seria a definição queestamos usando aqui nas expressões (4) ou (5).

4

Page 8: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

os lados da equação, obtemos:

TEt = TEt−1 + εt (5)

Essa nova expressão (5) é que representa efetivamente a tendência estocástica porque carac-teriza a evolução no tempo para a variável em nível TEt. A figura 3.a) ilustra o comportamentodinâmico de uma tendência estocástica através de uma série temporal simulada segundo (5).

(a) Tendência Estocástica (b) Tendência Geral

Figura 3: Tendência estocástia e tendência geral.

Fonte: Elaborado pelo autor. Gráfico a) foi simulado como TEt = 0, 6TEt−1 + εt e gráfico b) como TGt =

TDt + TEt, onde TDt = 0, 25t e TEt = TEt−1 + εt.

Os econometrias costumam chamar o termo de erro εt de choque exógeno ou choquealeatório. Assim como fizemos no caso da tendência determinística linear, podemos trabalharmais a expressão (5) e verificar que a tendência estocástica também pode ser vista como umaacumulação de incrementos, ou melhor, de choques. Assumindo que o valor inicial é conhecido(assim como fizemos com TD0) e realizando substituições sucessivas da expressão (5) dentrodela mesma:

TEt = TE0 + ε1 + ε2 + · · ·+ εt = TE0 +

t∑j=1

εj (6)

Ou seja, a tendência estocástica no período t corresponde ao valor inicial mais a acumula-ção de todos os erros ou choques passados até t. Aqui, chamaremos o termo

∑tt=1 εj de núcleo

da tendência estocástica porque ele é que a caracteriza enquanto tal. Se o valor inicial fornulo, isto é, TE0 = 0, então a tendência estocástica se torna idêntica ao seu núcleo:

TEt =

t∑j=1

εj (7)

Agora, considere uma variável Yt que segue um processo estocástico simples composto poruma tendência estocástica mais um erro, isto é:

Yt = TEt + utTEt = TEt−1 + εt

(8)

onde ut é um erro aleatório com média nula e variância constante. Esse tipo de processoestocástico veremos muitas vezes ao longo deste texto. Se quisermos remover a tendênciaestocástica de Yt, procedemos de modo análogo ao que fizemos no caso da tendência determi-nística, isto é:

ut = Yt − TEt (9)

5

Page 9: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

Basta, portanto, subtrair a tendência estocástica da variável Yt. Outro tipo de processo esto-cástico que veremos também várias vezes embute ambas as formas de tendência:

Yt = TDt + TEt + utTDt = a+ btTEt = TEt−1 + εt

(10)

Este caso também é de grande interesse porque muitas séries econômicas aparentam ter essecomportamento, isto é, parecem apresentar um padrão de persistência que resulta de umacréscimo fixo, como em (2), somado a um acréscimo aleatório, como em (4). Este tipo depadrão dá origem à chamada tendência geral:

TGt = TDt + TEt (11)

A figura 3.b) ilustra esse padrão de tendência geral. Ele engloba ambas as formas de tendênciadeterminística e estocástica juntas. O processo para Yt em (10), portanto, é composto por umatendência geral mais um erro estacionário. Note aqui que, para remover a tendência destetipo de processo, não basta subtrair TDt de ambos os lados, porque permaneceria a tendênciaestocástica TEt. A remoção completa da tendência envolveria expurgá-la da tendência geral,isto é:

ut = Yt − TGt

A tendência estocástica tal como definida acima segue um tipo particular de processo es-tocástico não estacionário conhecido como processo integrado de ordem um. Esse conceito deprocesso integrado possui um papel central na moderna EST. No intuito de compreender bemseu significado, vamos a seguir introduzir alguns conceitos relevantes associados às noções deestacionariedade e não-estacionariedade de um processo estocástico.

1.3 Processo Estacionário

Seja Yt um processo estocástico com as seguintes características:

E(Yt) = µ (12)

V ar(Yt) = σ2 (13)

Cov(Yt, Yt−s) = γs (14)

Onde µ, σ2 e γs (s = 1, 2, . . . ) são constantes reais. Isso significa que Yt apresenta médiae variâncias constantes no tempo e autocovariâncias que dependem apenas da distância sentre os períodos t e t − s. Ou seja, nem a média, nem a variância, nem as autocovariânciasdo processo Yt dependem do tempo t. Assim caracterizado, Yt é um processo estacionáriofraco. A propriedade “estacionariedade fraca” é uma forma restrita do conceito mais amplo de“estacionariedade”. Na prática, os econometristas de ST costumam trabalhar com essa forma“fraca” porque ela é mais operacional e atende satisfatoriamente à caracterização de processosestocásticos para séries temporais. Por isso, é esse conceito de estacionariedade que usaremosdaqui em diante. Isso quer dizer que sempre que nos referirmos a um processo estocásticocomo estacionário, será no sentido “fraco” tal como caracterizado pelas condições (12), (13) e(14).

Dado esse esclarecimento, um tipo de processo estacionário muito conhecido é o chamadoprocesso ruído branco. Ele é muito usado em estatística e econometria para representar oserros em modelos de regressão. Supondo que εt seja um processo ruído branco, isso significaque ele atende às características (12), (13) e (14) porque apresenta:

• média nula: E(εt) = 0;

• variância constante: V ar(εt) = σ2;

• autocorrelação nula: Cov(εt, εt−s) = 0, s = 1, 2, . . .

6

Page 10: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

Essas características do processo ruído branco estabelecem um tipo de variável “puramente”aleatória evoluindo no tempo, porém de forma estacionária segundo a caracterização dadapelas condições (12), (13) e (14). Repare que é um processo desse tipo que usamos paracaracterizar o termo de erro da tendência estocástica apresentada na expressão (5).

Outro tipo de processo estacionário muito conhecido é o chamado modelo ARMA(p, q), pro-posto por Box e Jenkins (1970) para se construir modelos estatísticos de séries temporais. Asigla refere-se a AutoRegressive Moving Average, porque a representação matemática é dadapor:

Yt = φ1Yt−1 + · · ·+ φpYt−p︸ ︷︷ ︸AR

+δ + εt − θ1εt−1 − · · · − θqεt−q︸ ︷︷ ︸MA

(15)

onde δ, θ1, . . . , θp, θ1, . . . , θq são parâmetros. A parte indicada como AR é a parte autorregressiva,onde se caracteriza a relação de Yt com seus valores passados até um lag máximo p. De formaanáloga, o termo indicado por MA é a parte média móvel dos erros presente e passados, ondese caracteriza a relação de Yt com esses erros até um lag máximo q. Assume-se que esses errosseguem um processo ruído branco. Esse tipo de modelo fez muito sucesso entre economistase econometristas e é usado até hoje para modelagem e previsão de várias séries econômicas.

O modelo ARMA(p, q) em (15) não necessariamente respeita as características (12), (13) e(14) para que Yt seja estacionário. Por exemplo, se o parâmetro autorregressivo φ1 for maiordo que um, com os demais parâmetros autorregressivos φ2, φ3, ..., φp assumindo valores nointervalo (−1, 1), Yt apresentará um comportamento explosivo. Então, sob que condições omodelo ARMA(p, q) é um processo estacionário para Yt? Para estabelecer isso com precisão,Box e Jenkins usaram uma representação mais compacta do modelo ARMA(p, q), como segue:

φ(B)Yt = δ + θ(B)εt (16)

onde:

• B é o operador de defasagens (i.e., Bmzt = zt−m),

• φ(B) = 1− φ1B − · · · − φpBp é o polinômio autorregressivo ou AR,

• θ(B) = 1− θ1B − · · · − θqBq é o polinômio média móvel ou MA.

O que garante que o modelo ARMA(p, q) de fato represente um processo estacionário é que opolinômio AR possua suas raízes fora do círculo unitário. É a chamada condição de esta-cionariedade. O polinômio MA pode ter suas raízes em qualquer região do plano complexoque isso não afeta a estacionariedade de Yt, segundo o modelo ARMA(p, q). É, portanto, nopolinômio AR que está incrustada a condição de estacionariedade.

No entanto, Box e Jenkins trabalham o tempo todo com a hipótese de que também o polinô-mio MA possui raízes fora do círculo unitário e chamam essa propriedade de invertibilidade.Fazem assim para garantir uma conveniência matemática, qual seja, a de que a razão entreambos os polinômios AR e MA resulte num outro polinômio que, apesar de possuir infinitostermos, é convergente (isto é, a razão é um número real). Isso garante que possamos escrevero modelo ARMA(p, q) de duas formas alternativas:

Yt = a+θ(B)

φ(B)εt (17)

εt =φ(B)

θ(B)(Yt − a) (18)

onde a = δ/φ(1). Resumindo, o importante é que os modelos ARMA(p, q) usados por Box e Jen-kins, e que formam a base para a moderna EST, são estacionários e invertíveis. Esse tipo deprocesso vai ser importante em uma das definições de processo integrado que apresentaremosa seguir.

7

Page 11: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

1.4 Processo Integrado

Quando um processo estocástico viola pelo menos uma das condições (12), (13) ou (14), eleapresenta a propriedade de ser não-estacionário. Portanto, a expressão “não-estacionariedade”refere-se à violação da propriedade de uma série ou processo estocástico ser estacionário. Seapenas a média de um processo estocástico variar com o tempo, isto é, se acontecer E(Yt) = µtcom as demais condições (13) e (14) mantidas, isso é suficiente para fazê-lo não-estacionário.Um exemplo seria quando a média de Yt é uma tendência determinística linear, isto é: µt =a + bt. De outra forma, se apenas a variância estiver variando com o tempo, por exemplosegundo V ar(Yt) = ct2 (com c constante e positiva), então Yt seria também não estacionário.Neste caso, Yt apresentaria um padrão heterocedástico. Em suma, basta que apenas uma dascondições (12), (13) ou (14) seja violada para termos Yt seguindo um processo não estacionário.

Na verdade, existem muitos padrões de não-estacionariedade. Por exemplo, alguns pro-cessos estocásticos podem gerar séries explosivas que crescem ou decrescem indefinidamentepara +∞ ou −∞, respectivamente. Outros geram séries que oscilam entre um valor positivo eoutro negativo, com amplitude crescente. Podem também embutir padrões diferentes de ten-dência que se misturam com um ciclo de modo aditivo ou multiplicativo. Neste texto, quandofalarmos de processo não-estacionário, vamos nos limitar a um tipo particular conhecido comoprocesso integrado. Dada a centralidade que esse tipo de processo estocástico tem na modernateoria de EST, é conveniente precisarmos seu conceito. A seguir, apresentamos duas defini-ções que aparecem na literatura de EST, iniciando com uma que é mais geral ou ampla:

Processo Integrado (definição ampla): Um processo estocástico não-estacionário para umavariável Yt é chamado processo integrado de ordem d, ou I(d), se é preciso diferenciá-lo aomenos d vezes para se tornar um processo estacionário.

Segue desta definição ampla que se Yt seguir um processo não–estacionário integrado deordem 2, ou I(2), ∆Yt seguirá também um processo não–estacionário e somente ∆2Yt é queseguirá um processo estacionário. Ou seja, precisamos diferenciar Yt, em ao menos duas vezespara obtermos um processo estacionário. Por sua vez, ∆Yt seguirá um processo integrado deordem um, ou I(1), porque basta diferenciar uma vez, para obtermos um processo estacionário.Segue ainda da definição que um processo estacionário não precisa ser diferenciado, logo é umprocesso não–integrado. Usa–se a terminologia processo integrado de ordem zero ou I(0) pararepresentar um processo estacionário.

O caso mais usual de processo integrado é o de ordem um, ou I(1). Ele nos permite carac-terizar o mecanismo gerador de muitas séries econômicas. Embora já exista uma significativaliteratura econométrica sobre processos I(2), falaremos neste texto somente de processos I(1).Um aspecto importante de um processo I(1) é que ele pode ser escrito como:

Yt =

t∑i=−∞

Zi (19)

onde Yt é um processo I(1) e Zt é um processo I(0). Ou seja, um processo I(1) é a soma ouacumulação dinâmica de valores para um processo I(0). Isso nos permite entender por queo termo “integrado” é usado. Ele é emprestado da área de cálculo em matemática, onde umaintegral representa uma “soma” de valores de uma função e a operação inversa, a derivada,uma “diferença”. De fato, veja que Yt , tal como definido em (19), atende à definição de processointegrado de ordem 1, ou I(1), porque sua primeira diferença:

∆Yt = Yt − Yt−1 =

t∑i=−∞

Zt =

t−1∑i=−∞

Zt = Zt (20)

segue um processo I(0). Observe que os fatos em (19) e (20) continuam valendo se conside-rarmos um período inicial arbitrário t = 0 em que Z0 = a, onde a é uma constante conhecida.Neste caso, basta trocar o símbolo “−∞” por a nas expressões (19) e (20).

O conceito de processo integrado de ordem d, ou I(d), vem da representação de proces-sos estocásticos como modelos lineares da classe ARIMA(p, d, q). De fato, o parâmetro d de

8

Page 12: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

um modelo ARIMA(p, d, q) representa o número de vezes que se tem de diferenciar o processoestocástico até ele se tornar estacionário. Por esse motivo, um adequado entendimento dosconceitos e técnicas da moderna EST fica facilitado se pensarmos processos integrados I(d)e modelos ARIMA(p, d, q) como sinônimos4 . Entretanto, isto nos leva aqui a introduzir outradefinição de processo integrado, apresentada por Engle e Granger (1987), que é mais restritado que a anterior:

Processo integrado (definição restrita de Engle e Granger (1987)): Um processo estocás-tico não-estacionário sem termos determinísticos para uma variável Yt é chamado processointegrado de ordem d, ou I(d), se é preciso diferenciá-lo ao menos d vezes para se tornar umprocesso estacionário do tipo ARMA(p, q) invertível.

Note que esta definição é mais restrita porque exige que o processo estacionário I(0) queresulta após diferenciarmos Yt por d vezes seja um modelo ARMA(p, q) estacionário e tam-bém invertível, tal como explicamos anteriormente. Mais ainda, também exige que o modeloARIMA(p, d, q) para Yt não possua termos determinísticos. Por exemplo, considere os três pro-cessos estocásticos ARIMA(0,1,1) a seguir:

∆Yt = εt − 2εt−1

∆Yt = 1 + εt − 0, 5εt−1

∆Yt = εt − 0, 5εt−1

Esses três processos são estacionários para ∆Yt e não estacionários para Yt. Apesar de ostrês serem estacionários para ∆Yt, somente o terceiro se enquadra na definição restrita deprocesso integrado. Note que o primeiro não atende à condição de invertibilidade porque opolinômio média móvel é igual a (1 − 2B) e, portanto, possui uma raiz B = 1/2 que fica dentrodo círculo unitário. O segundo atende essa condição, mas apresenta uma constante igual a 1,logo possui um termo determinístico. Só o terceiro se enquadra na definição restrita, porquenão tem constante (isto é, ela é igual a zero) e é invertível.

Muitos livros-texto e parte da literatura em geral sobre EST usa a definição ampla. Norestante deste documento, iremos seguir a definição restrita. Preferimos fazer assim porque elanos leva a apresentar a teoria de EST com menos inconsistências. Ela nos permite identificarum processo integrado I(d) com um modelo ARIMA(p, d, q) tal como na expressão (16), masassumindo que a constante é nula (δ = 0) e que o polinômio média móvel é invertível. Maisainda, a definição restrita implica uma associação íntima entre processo integrado e a presençade raízes unitárias na parte AR do modelo ARIMA(p, d, q). Este é o assunto da próxima seção.

1.5 Raíz Unitária

Vamos considerar agora o caso particular de um processo integrado escrito como um modeloARIMA(p, 1, q) da seguinte forma:

φ(B)∆Yt = θ(B) (21)

onde φ(B) é o polinômio autorregressivo de grau p e θ(B) o polinômio médias móveis de grauq, ambos definidos no operador de defasagens B, e εt é um processo estacionário de tipo ruídobranco. Repare que estamos omitindo a constante do lado direito de (21), ou seja, estamosassumindo que ela é nula. Vamos assumir que ambos os polinômios φ(B) e θ(B) são tais queapresentam raízes fora do círculo unitário, logo o processo em (21) respeita as condições deestacionariedade (para ∆Yt ) e de invertibilidade.

Assim, o processo para a variável em nível Yt é não estacionário do tipo I(1), no sentido deque precisa ser diferenciado uma vez para se tornar estacionário. Além disso, ele admite umarepresentação ARMA(p, q) invertível e assim atende a definição restrita de processo integradoque estamos usando. O termo em primeira diferença ∆Yt do lado esquerdo de (21) é, portanto,estacionário ou I(0). Uma outra forma de expressar tudo isso é dizer que o processo para

4O leitor deve ser avisado, porém, que há processos estocásticos não estacionários mais gerais, representados deforma não paramétrica, que podem ser caracterizados como integrados. A este respeito, pode ser visto o trabalho deStock (1994), mas avisamos desde já que trata-se de texto avançado.

9

Page 13: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

Yt possui uma raiz unitária. Este termo vem do fato que o polinômio autorregressivo φ(B)multiplica ∆ = (1 − B), constituindo assim o polinômio expandido φ(B)∆ = φ(B)(1 − B), degrau p + 1. Claramente, esse polinômio expandido possui uma raiz unitária dada por B = 1.Por essa razão, em EST o processo para Yt em (21) é chamado de processo de raíz unitária.Note que se refere a um processo com apenas uma raíz unitária no polinômio autorregressivoexpandido, ou na parte AR, e sem nenhuma raiz unitária no polinômio MA, ou na parte MA5.Observe que, obviamente, ele representa um processo sem raiz unitária para a variável emprimeiras diferenças ∆Yt. Perceba agora que, uma vez que o polinômio autorregressivo φ(B)atende às condições de estacionariedade, podemos invertê-lo e re-escrever (21) como:

∆Yt =θ(B)

φ(B)εt (22)

O termo no lado direito de (22) representa um processo estocástico estacionário, ou I(0), edo tipo ARMA(p, q) invertível devido às hipóteses que estamos adotando. Visando facilitar aexposição, vamos denominar esse termo como ut e re-escrever (22) de uma forma ainda maissimples:

∆Yt = ut (23)

Observe que a expressão (23) na verdade representa um processo com uma raiz unitária paraYt, porque foi desenvolvido a partir do modelo ARIMA(p, 1, q) da equação (21).Veja também queela representa um processo estacionário ou I(0) para ∆Yt (porque ut é I(0)) e um processo nãoestacionário ou I(1) para Yt. Subtraindo Yt−1 de ambos os lados de (23), obtemos:

Yt = Yt−1 + ut (24)

A expressão (24), e não a expressão (23), é a forma mais usual de se representar um processointegrado de ordem um ou I(1). Daqui para a frente, estaremos às vezes chamando o processoI(1) em (24), que não apresenta constante ou nenhum termo determinístico, de processo deraíz unitária. A figura 4.a) ilustra este tipo de processo, apresentando uma série simuladasegundo a expressão (24) com os erros seguindo um processo MA(1), isto é, ut = εt − 0, 5εt−1.

Assumindo que o processo para Yt começa em t = 0 com um valor conhecido Y0 e realizandosubstituições sucessivas da expressão (24) dentro dela mesma:

Yt = (Yt−2 + ut−1) + ut

= (Yt−3 + ut−2) + ut−1 + ut

=...

chegamos a:

Yt = Y0 + u1 + u2 + · · ·+ ut−1 + ut = Y0 +

t∑i=1

ui (25)

Assim, um processo I(1) ou de raiz unitária também pode ser visto como a acumulação deerros ou choques que seguem um processo estacionário ou I(0). Ele está representado pelotermo

∑ti=1 ui no lado direito de (25). De fato, como assumimos que Y0 é uma constante dada,

este termo é um processo I(1). Mas, a expressão (25) também nos chama a atenção para outroaspecto. Os choques passados ut−1, ut−2, . . . repercutem sobre o valor atual de Yt de formapersistente, isto é, sem decair de importância ao longo do tempo. Ou seja, em processos I(1)ou de raiz unitária, os choques passados possuem efeitos persistentes sobre Yt, caracterizandotais processos como de tipo memória longa e contrastando com processos estacionários, quesão do tipo memória curta. Falaremos sobre esses conceitos de memória de processos em maisdetalhe na seção 13.

5Estaremos chamando aqui de processo de raiz unitária (no singular) ao processo com uma única raiz unitária naparte AR, tal como descrito em (21). Neste caso, ele equivale a um processo I(1) segundo nossa definição definiçãode processo integrado. Quando houver mais de uma raiz unitária na parte AR, estaremos chamando de processo deraízes unitárias, isto é, no plural. Observe também que a expressão “raiz unitária” ao longo deste documento sempredirá respeito à parte AR, a menos que especificado de outra forma.

10

Page 14: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

É importante enfatizar aqui que um processo integrado, segundo a definição restrita queestamos usando, está intimamente ligado à presença de raízes unitárias. Por exemplo, oprocesso para Yt da equação (24) é I(1) devido à presença de uma raiz unitária na parte ARdo modelo ARIMA(p, 1, q) da equação (21). Assim, sempre que falarmos de processo integrado,estaremos falando de um processo não estacionário do tipo ARIMA(p, d, q), isto é, que possuid raízes unitárias na parte AR. Observe também que seria possível um modelo ARIMA(p, d, q)possuir raízes unitárias na parte MA, mas neste caso ele seria não-invertível. Daqui em diante,a menos que indicado de outra forma, quando falarmos em raízes unitárias estaremos nosreferindo à parte AR porque a parte MA estaremos assumindo sempre que não possui raízesunitárias.

1.6 Decomposição de Beveridge e Nelson

A figura 4.a) mostra um exemplo simulado de um processo de raiz unitária do tipo ARIMA(0, 1, 1)sem constante como descrito nas expressões (21)-(25). Note que a série se comporta de mododiferente de uma série estacionária. Ela não apresenta um padrão de retornar para umamédia constante. Ao contrário, mostra um padrão de evolução sem destino, entrelaçando fasesdistintas de crescimento ou decrescimento persistentes. Observe também que a série temporalda figura 4.a), embora não estacionária, não apresenta um comportamento explosivo.

Além disso, note que a expressão (24) é muito parecida com a expressão (5) para a tendênciaestocástica. A diferença entre ambas e que merece ser destacada é que:

• ut é um processo ARMA(p, q) com média nula, portanto estacionário e invertível, tambémchamado de processo ruído colorido;

• εt é um processo ruído branco

Ou seja, a diferença está na maneira como se caracterizam os erros. Em ambas as expressões,o erro é um processo I(0). Só que, no processo de raíz unitária ou I(1), o erro é um processoARMA(p, q) com média nula (ou ruído colorido) e, na tendência estocástica, o erro é um pro-cesso ruído branco. Em outras palavras, a tendência estocástica é um caso particular de umprocesso de raiz unitária ou I(1) em que o erro é um ruído branco.

No entanto, embora o processo de raiz unitária representado na expressão (24), com erroI(0) do tipo ARMA(p, q), não seja idêntico à uma tendência estocástica, Beveridge e Nelson(1981) argumentaram que na verdade ele embute este tipo de tendência. Esses autores mos-traram que todo modelo ARIMA(p, 1, q) como o da expressão (21) pode ser decomposto em umcomponente de tendência estocástica mais um termo I(0). Este fato é conhecido na literaturade EST como decomposição de Beveridge-Nelson (BN). Nós falamos disso em mais detalheno Apêndice 1, mas vale a pena aqui pelo menos expressar formalmente essa idéia dizendoque o processo de raiz unitária na expressão (24), que nada mais é do que outra forma derepresentar o modelo ARIMA(p, 1, q) da expressão (21), pode ser transformado em:

Yt = TEt + wt (26)

onde TEt representa uma tendência estocástica e wt é um processo ARMA(p, q), portanto esta-cionário. Assim, a mensagem implícita da decomposição BN é que:

• todo processo com uma raiz unitária, ou I(1), como o da expressão (24) pode ser decom-posto em uma tendência estocástica mais um processo estacionário, ou I(0).

Esse aspecto vai ser muito importante nas próximas seções deste documento e será funda-mental para um correto entendimento de como se aplicam os testes de raíz unitária.

1.7 Diferença Estacionária

Voltando ao processo integrado ou de raiz unitária descrito nas expressões (21)-(25), note queele representa uma forma de não estacionariedade puramente estocástica. Isso é importanteporque significa que não há uma tendência determinística envolvida, apenas um mecanismopuramente estocástico que imprime ao processo Yt um padrão não-estacionário. Vejamos

11

Page 15: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

(a) ARIMA(0,1,1) (b) ARIMA(0,1,1) com constante

(c) ARIMA(0,1,1) (d) ARIMA(0,1,1) com constante

Figura 4: Processos com Raíz Unitária (i.e. que apresentam tendência estocástica) eprimeiras diferenças. Dados simulados.

Fonte: Elaborado pelo autor. Equações usadas para simulação das séries: (a) Yt = Yt−1 + εt − 0, 5εt−1; (b)Yt = Yt−1 + 0, 5 + εt − 0, 5εt−1; (c) ∆Yt = εt − 0, 5εt−1 e (d) ∆Yt = 0, 5 + εt − 0, 5εt−1. Em ambos os gráficos,Y0 = 0 e εt é um ruído branco.

agora o que acontece se admitirmos que o processo ARIMA(p, 1, q) em (21) possui uma constanteδ 6= 0 do lado direito:

φ(B)∆Yt = δ + θ(B)εt

Podemos seguir os mesmos passos de antes e desenvolver uma nova versão da expressão (22):

∆Yt = a+ ut (27)

onde a = δ/φ(1) é uma constante não nula e, como antes, ut é um processo ARMA(p, q) do tiporuído colorido. Subtraindo Yt−1 de ambos os lados de (27):

Yt = a+ Yt−1 + ut (28)

Seguindo os mesmos passos que antes e realizando substituições sucessivas da expressão (28)dentro dela mesma:

Yt = a+ (a+ Yt−2 + ut−1) + ut

= a+ a+ (a+ Yt−3 + ut−2) + ut−1 + ut

=...

chegamos a:

Yt = Y0 + at+

t∑i=1

ui (29)

12

Page 16: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

A expressão (28) mostra que a simples presença de uma constante não nula num processoARIMA(p, 1, q) introduz mudanças importantes. Primeiro, aparece uma tendência determinís-tica linear, devido à presença do termo at, junto com um processo de raiz unitária (sem cons-tante) representado pelo termo

∑ti=1 ui . Segundo, de acordo com a decomposição BN, este

último termo pode ser decomposto em uma tendência estocástica mais um processo estacio-nário, como vimos na expressão (26). Desse segundo aspecto, decorre que o processo em (29)consiste de:

• tendência determinística linear + tendência estocástica + termo I(0).

A importância deste fato, e por isso o destacamos acima, é que um processo de raiz unitáriapuro como em (24) embute apenas tendência estocástica, mas a mera adição de uma cons-tante não nula em sua representação, como em (28), faz com que ele apresente dois tipos detendência: uma determinística e outra estocástica. A figura 4.b) mostra um exemplo de sériedesse tipo, isto é, que embute tendências determinística e estocástica juntas. Esta série foisimulada artificialmente como um processo ARIMA(0, 1, 1) com constante, segundo a equaçãoYt = 0, 5 + Yt−1 + εt − 0, 5εt−1.

Note que, pela definição restrita de processo integrado, apenas o processo de raiz unitáriaem (24) pode ser chamado de I(1). Porém, tanto este processo quanto aquele apresentadoem (28) se tornam estacionários se forem diferenciados, como nas expressões (23) e (27),respectivamente. Reiteramos que o processo na expressão (24) é o que chamamos aqui deprocesso de raiz unitária ou I(1). Agora, observe que o processo na expressão (28), ao serre-escrito de outra forma na expressão (29), é a soma de uma tendência determinística linearmais um processo de raiz unitária (sem constante como em (24)) ou I(1). Ao longo deste texto,vamos trabalhar com a noção de que ele é um processo não estacionário que embute umprocesso de raíz unitária ou I(1), mas não se identifica exatamente com o último.

Por esse motivo, estaremos usando um nome diferente de “raiz unitária” ou “I(1)” paradesignar o processo da expressão (28). Vamos chamá-lo aqui de diferença estacionária, umadenominação introduzida por Nelson e Plosser (1982) e que vem sendo usada recorrentementena literatura de EST. Ele recebe este nome porque, assim como um processo I(1), se tornaestacionário ao ser diferenciado uma vez (isto é, a diferenciação elimina conjuntamente astendências determinística e estocástica). As figuras 4.c) e 4.d) ilustram essa característica, poismostram as primeiras diferenças das séries nas figuras 4.a) e 4.b), respectivamente. Note quepara as duas séries geradas por modelos ARIMA(0, 1, 1) sem e com constante, suas primeirasdiferenças são séries estacionárias (mas só a segunda, na figura 4.b), é um processo de tipodiferença estacionária).

É interessante aqui comparar o processo de diferença estacionária segundo (28) com aqueleque chamamos anteriormente de tendência estacionária e que foi representado na expressão(1). Note que ambos têm em comum o fato de que embutem uma tendência determinística.De fato, o processo de tendência estacionária, como vimos, é uma tendência determinísticamais um processo estocástico estacionário, ou I(0), e está ilustrado na figura 2.b). O processode diferença estacionária, por sua vez, é uma tendência determinística mais um processoI(1) - ou melhor, se considerarmos a decomposição BN, uma tendência determinística maisuma tendência estocástica mais um processo estacionário - e está ilustrado na figura 4.b).Note que a tendência determinística, que é comum a ambos os processos, desempenha pa-péis diferentes em cada um. Na tendência estacionária, ela funciona como uma espécie de“atrator” da série temporal. Ou seja, é como se ela atraísse a série para andar junto com ela.Já no caso da diferença estacionária, é como se a tendência determinística “empurrasse” ou"puxasse"persistentemente o processo I(1) para cima. Como vimos antes, este último não é“atraído” para qualquer lugar justamente porque é não-estacionário.

Quando temos, de forma geral, um processo ARIMA(p, d, q):

φ(B)∆dYt = δ + θ(B)εt (30)

então, de forma análoga, o polinômio expandido φ(B)∆d = φ(B)(1−B)d é tal que possui d raízesunitárias. Neste caso, podemos seguir os mesmos passos de antes e escrever:

∆dYt = a+ ut (31)

13

Page 17: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

onde, novamente, a = δ/φ(1) e ut = (θ(B)/φ(B))εt . Isso significa que podemos ter padrões maiscomplexos de tendência estocástica e de tendência determinística. Por exemplo, no caso d = 2,deixamos como exercício para o leitor verificar que o processo para Yt embute uma tendênciadeterminística quadrática mais um processo I(2). Esse caso forma uma área ativa de pesquisaatualmente na moderna EST. Dado o caráter introdutório deste texto, iremos nos restringiraos casos em que d = 1 e isso já cobre um amplo espectro de aplicações em séries econômicas.

1.8 Média e Variância

Considere o processo de raiz unitária representado segundo a expressão (24). Dado que ut é umprocesso de tipo ruído colorido, é fácil ver que E(ut) = 0. Agora, considere o mesmo processorepresentado segundo (25). Lembrando que se assume que o valor inicial Y0 é conhecido, segueque:

E(Yt) = Y0 (32)

V ar(Yt) = σ2ut+ 2

t−1∑j=1

(t− j)σu,j (33)

onde σ2u = V ar(ut) e σu,j = Cov(ut, ut−j). Ou seja, um processo de raiz unitária possui mé-

dia constante mas uma variância que é função do tempo t, o que faz dele um processo nãoestacionário porque viola a condição (13).

Considere, agora, o processo diferença estacionária da expressão (28) reescrito conforme(29). Neste caso:

E(Yt) = Y0 + at (34)

V ar(Yt) = σ2u + 2

t−1∑j=1

(t− j)σu,j (35)

Ou seja, assim como a variância, a média também é uma função do tempo, no caso linear.Portanto, a diferença estacionária com constante também é não estacionária porque tambémviola as condições (12) e (13).

1.9 Passeio Aleatório

Um caso particular de processo de raiz unitária é dado quando θ(B)/φ(B) = 1. Observe que,neste caso, a expressão (24) pode ser reescrita da seguinte forma:

Yt = Yt−1 + εt (36)

onde agora o termo de erro é dado apenas por εt, que, lembramos, assumimos que é um ruídobranco normal. A equação (36), assim, é um caso particular de um processo não-estacionáriocom uma raiz unitária e que é muito conhecido na literatura de EST como passeio aleatório.

Por ser um processo estocástico com uma raiz unitária, o passeio aleatório puro em (36) éidêntico a uma tendência estocástica. Além disso, ele é I(1), de modo que a primeira diferençade Yt será um processo estacionário, isto é, sem raízes unitárias ou I(0):

∆Yt = εt (37)

De forma análoga, é possível re–escrevermos a expressão (25) como:

Yt = a+ Yt−1 + εt (38)

Quando a = 0, o processo em (38) é chamado de passeio aleatório com deslocamento (oudrift, em inglês). Este processo também possui uma raiz unitária e, consequentemente, embuteuma tendência estocástica. No entanto, a constante a sendo não nula introduz adicionalmente

14

Page 18: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

na representação em (38) uma tendência determinística, de modo que ela pode ser reescritacomo:

Yt = Y0 + at+

t∑i=1

εt (39)

Dado que Y0 é conhecido, então o termo Y0 + at no lado direito de (39) é uma tendência de-terminística. Por sua vez, o termo

∑ti=1 εt corresponde a um processo I(1), proveniente da

acumulação de “t” valores passados de um processo I(0) dado por εt. Se diferenciarmos Yt naexpressão (38), veremos que ele também se torna estacionário:

∆Yt = a+ εt (40)

Fica claro, portanto, que o passeio aleatório puro é um caso particular de um processode raiz unitária ou I(1) e o passeio aleatório com deslocamento um caso particular de umprocesso diferença estacionária.

O leitor já deve ter percebido que há uma vasta gama de conceitos que foram introduzidosaté aqui. Alguns são sinônimos um do outro, como processo I(1) e processo de raiz unitária6. Outros são pequenas particularidades de um conceito mais geral. Esta rica terminologiada EST tende a confundir o iniciante e com frequência atrapalha o entendimento da matéria.No intuito de ajudar a memorizar as especificidades dos vários conceitos, apresentamos umdiagrama no apêndice 2. Neste diagrama, procuramos estabelecer usando setas as relaçõesentre os conceitos.

1.10 Memória e Choques

A importância do conceito de memória em processos estocásticos integrados pode ficar maisclara através das figuras 5.a) e 5.b). Na figura 5.a), temos uma série simulada segundo umprocesso estacionário ARMA(1,1). Na representação do processo, incluímos uma variável in-dependente CQt que representa um choque dado na série no período t = 75. Esta variável ébinária, valendo 15 em t = 75 e 0 nos demais períodos de tempo. Observe que inicialmentea série oscila em torno de sua média, igual a 0. No momento do choque, ela dá um saltodiscrepante para cima e poucos períodos depois volta a oscilar em torno de sua média 0. Essacaracterística apresentada pela série da figura 5.a) resulta do fato que o processo estocásticoque a gera é estacionário. Esse tipo de processo possui memória curta, isto é, se um choqueé dado a ele, pouco depois ele “esquece” esse choque. Diz-se, neste caso, que o choque étransiente, porque tem efeito temporário e dura pouco.

Na figura 5.b), temos também um série simulada, porém agora segundo um processo nãoestacionário do tipo ARIMA(0,1,1). Aqui também, incluímos na representação deste processouma variável CQt representando um choque em t = 75 e definida da mesma maneira que antes.Observe que, agora, a reação ao choque apresentada pela série é diferente. Ela também dáum salto no momento do choque, mas agora ela não volta logo depois a oscilar no mesmopatamar que antes do choque. Essa característica da série da figura 5.b) resulta do fato queo processo é não estacionário, no caso um processo integrado ou I(1). Esse tipo de processopossui memória longa, isto é, se um choque é dado a ele, seu efeito persiste indefinidamente,ou seja, ele “não esquece” o efeito do choque. Diz-se, neste caso, que o choque é persistente,porque repercute indefinidamente.

Essas características de memória curta ou memória longa para processos estocásticos tevebastante relevância para o desenvolvimento da teoria macroeconomica nos anos 1980 e 1990.Em um artigo de grande repercussão, Nelson e Plosser (1982) verificaram que 13 séries macro-econômicas americanas apresentavam memória longa, inclusive a série de PNB. Isso levou-os aconcluir que choques de política econômica podiam não ser neutros, como defendido por váriosmacroeconomistas. Esta constatação provocou tanto macroeconomistas como econometristasa tentar explicar os resultados de Nelson e Plosser e dois tipos de resposta importantes aconte-ceram. Primeiro, dentro da teoria macroeconômica, isso motivou o desenvolvimento da teoriados ciclos reais de negócio (Kidland e Prescott, 1982). Segundo, dentro da EST, isso motivou

6São sinônimos quando o processo de raiz unitário diz respeito à raiz unitária presente apenas na parte AR.

15

Page 19: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

(a) Memória Curta: ARMA(1,1) (b) Memória Longa: ARIMA(0,1,1)

Figura 5: Tipos de memória em processos estocásticos. Dados simulados.

Fonte: Elaborado pelo autor. Equações usadas para simulação das séries: (a) Yt = 0, 7Yt−1 + CQt + εt −0, 5εt−1; (b) Yt = Yt−1 + CQt + εt − 0, 5εt−1. A variável CQt, representa um choque, valendo 15 em t = 70 e0 nos demais períodos. Em ambos os gráficos, Y0 = 0 e εt é um ruído branco.

o desenvolvimento de uma vasta literatura sobre testes de raiz unitária. Não iremos discor-rer sobre os efeitos na teria macroeconômica, por fugir aos objetivos deste texto focado emconceitos de EST. No entanto, abordaremos mais à frente em detalhe, ainda que num nívelintrodutório, alguns importantes testes de raiz unitária.

1.11 Os Quatro Processos

Em resumo, tendência estocástica é uma característica típica de um processo I(1) ou comuma raíz unitária, tal como representado pelos modelos ARIMA(p, 1, q). Ela pode vir ou nãoacompanhada de uma tendência determinística linear, dependendo da constante na represen-tação ARIMA(p, 1, q) ser nula, como na expressão (24), ou não nula, como na expressão (25). Noprimeiro caso, temos um processo I(1) ou de raiz unitária. No segundo, temos uma diferençaestacionária. Podemos, então, sintetizar tudo o que foi dito acima sobre processos estocásticospara representar séries temporais em quatro casos:

• Processo estacionário: Yt = a+ ρYt−1 + ut (|ρ| < 1)

• Processo I(1): Yt = Yt−1 + ut

• Tendência estacionária: Yt = a+ bt+ ut

• Diferença estacionária: Yt = a+ Yt−1 + ut

Do ponto de vista das possibilidades de tendências, os quatro casos acima devem ser interpre-tados da seguinte forma:

• O processo estacionário não possui qualquer tipo de tendência.

• O processo I(1) possui apenas tendência estocástica.

• O processo tendência estacionária possui apenas tendência determinística linear.

• O processo diferença estacionária possui tendência determinística linear e tendênciaestocástica.

Para uma melhor referência, essas situações estão esquematizadas no quadro 1.11.

16

Page 20: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

Processo Tipo de Tendência Representação Restrições daEstocástico Embutida Particular Representação

Geral

Estacionário Sem tendências Yt = a+ ρYt−1 + ut; ψ1 = 0, |ρ| < 1

Raiz Unitária ou I(1) Tendência Estocástica Yt = Yt−1 + ut φ1 = 0, ρ = 1

Tendência Estacionária Tendência Determinística Yt = a+ bt+ ρYt−1 + ut |ρ| < 1

Diferença Estacionária Tendência Estocástica eTendência Determinística

Yt = a+ Yt−1 + ut ρ = 1

Fonte: Elaborado pelo autor.

Quadro 1: Os quatro processos e tipos de tendências

2 Testes de Raiz Unitária

A discussão sobre os tipos de tendências que fizemos na seção anterior fornece um importantealicerce para entendermos vários aspectos da EST. Um desses aspectos diz respeito aos pro-cedimentos para verificar se uma série temporal é ou não estacionária. Esses procedimentossão conhecidos como testes de raiz unitária. Eles recebem essa denominação porque sãovoltados para verificar se o processo gerador da série apresenta ou não uma raiz unitária naparte AR. Ou seja, se é ou não um processo integrado. Veremos esses testes logo a seguir, masé válido desde já apontar que, apesar disso, eles também podem ser vistos sob outros ângulosinteressantes.

Primeiro, eles também são procedimentos para se detectar a presença ou não de tendênciasestocásticas no processo gerador das séries. Segundo, como no processo de diferença estaci-onária a tendência estocástica vem acompanhada de uma tendência determinística, os testesnormalmente usam uma representação geral de processo estocástico que permite abarcar asquatro possibilidades apresentadas na seção anterior. Ao testar restrições particulares impos-tas à esta representação geral, mais do que verificar a presença ou não de uma raiz unitária(ou de uma tendência estocástica) no processo gerador de uma série temporal, os testes deraiz unitária permitem também distinguir qual dentro os quatro tipos de processos estocásti-cos que acabamos de ver (listados no quadro 1.11) está gerando a série7. Inicialmente, vamosdesenvolver essa representação geral para só depois apresentar os testes de raiz unitária pro-priamente ditos.

2.1 Representação Geral

Considere o seguinte processo estocástico:

Yt = TDt + ZtTDt = ψ0 + ψ1t

(41)

onde ψ0 e ψ1 são constantes reais. Zt é um processo autorregressivo do tipo:

Zt = ρZt−1 + ut (42)

onde ut é um processo estacionário I(0) com média nula. Note aqui que o processo estocásticopara Yt em (41) representa a soma de uma tendência determinística linear mais um processo

7Um erro que desavisados costumam cometer é pensar que um teste de raíz unitária sempre verifica se a sérieé ou não estacionária. Como veremos, isso vai depender da opção escolhida para usar o teste. A opção mais geralconsidera tanto na hipótese nula como na alternativa séries não-estacionárias porque ambas admitem a presença deuma tendência determinística. A forma mais precisa de se encarar um teste de raiz unitária é como um procedimentopara se verificar se há ou não um processo I(1) embutido no mecanismo gerador da série, e não pensá-lo comosimplesmente um procedimento para se verificar se a série é ou não estacionária.

17

Page 21: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

AR(1) para Zt. Este pode ser estacionário se |ρ| < 1 ou não estacionário no sentido de possuiruma raiz unitária se ρ = 1. No último caso, Zt embute uma tendência estocástica mais umtermo estacionário, segundo a decomposição BN de que falamos em (26). Vamos descartaroutras possibilidades, em que ρ ≤ 1 ou ρ > 1. Assim, em princípio, a equação (41) poderepresentar um processo tendência estacionária (Zt estacionário) ou um processo diferençaestacionária (Zt segue um processo I(1)), mas ainda há essas outras possibilidades comofalaremos adiante. Para isso, vamos re-escrever a expressão (41) como segue:

Zt = Yt − ψ0 − ψ1t (43)

Substituindo (43) em (42) e fazendo algumas manipulações algébricas, chegamos a:

Yt = ψ0(1− ρ) + ψ1ρ+ ψ1(1− ρ)t+ ρYt−1 + ut (44)

Fazendo8:

a = ψ0(1− ρ) + ψ1ρ (45)

b = ψ1(1− ρ) (46)

Podemos re-escrever (44) como:

Yt = a+ bt+ ρYt−1 + ut (47)

A equação9 (47) é uma representação geral para os quatro processos que analisamos antes.Impondo restrições nos valores dos parâmetros ψ0, ψ1 e ρ, note que é possível usarmos estaequação para caracterizar os quatro tipos de processos estocásticos que vimos antes. Porexemplo, observe que:

• a = ψ1 se ρ = 1;

• a = 0 se ψ0 = ψ1 = 0;

• b = 0 se ρ = 1;

• b = 0 se ψ1 = 0.

8A expressão (44) aparece inicialmente no livro de Fuller(1976), mas não aparece explicitamente nos artigos deDickey e Fuller (1979, 1981). No entanto, em um artigo de divulgação, Dickey et al (1986) deixam claro que é nestaexpressão que se baseia o teste DF.

9Muitos livros–texto de EST não apresentam a relação entre as expressões (44) e (47), isto é, que a primeirarestringe a segunda. Normalmente, apresentam só a expressão (47). A consequência disso é que a formulação (44)admite a presença de uma tendência determinística apenas do tipo linear, porque não pode acontecer b 6= 0 comρ = 1. Se isso fosse possível, haveria uma tendência determinística quadrática junto com a tendência estocástica.Assim, a expressão (44) admite apenas os quatro tipos de processos estocásticos considerados até aqui. Além disso, aexpressão (47), se apresentada de forma independente sem as restrições dadas pela expressão (44), cria dificuldadespara uma interpretação adequada da estrutura do teste DF (ver, por exemplo, as críticas de Schmidt e Phillips, 1992).Isso tudo é muito importante para um adequado entendimento das opções disponíveis nos testes de raízes unitáriabaseados no procedimento de Dickey e Fuller. Cuidaremos de apontar todos esses aspectos ao falarmos dos testes deraiz unitária mais adiante.

18

Page 22: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

Assim, a equação (47) pode caracterizar as seguintes possibilidades:

• Processo estacionário: ψ1 = 0, |ρ| < 1→ Yt = a+ ρYt−1 + ut;

• Processo I(1): ψ1 = 0, ρ = 1→ Yt = Yt−1 + ut;

• Tendência estacionária: |ρ| < 1→ Yt = a+ bt+ ρYt−1 + ut10

• Diferença estacionária: ρ = 1→ Yt = a+ Yt−1 + ut.

Essas possibilidades estão todas reunidas e sintetizadas no quadro 1.11. O leitor deveficar atento a esse quadro e retornar de vez em quando a ele sempre que tiver dúvidas daquipara frente. O bom entendimento dos quatro processos estocásticos listados acima, de suasrepresentações particulares e em termos da representação geral, assim como de suas relaçõesparticulares com os dois tipos de tendência, determinística e estocástica, é muito importantepara uma boa análise de EST.

2.2 Teste de Dickey-Fuller

O teste de Dickey-Fuller (DF) é o mais antigo e famoso método formal para verificarmos seuma série temporal é ou não estacionária. Ele foi introduzido em uma versão básica pelostrabalhos de Fuller (1976), Dickey(1976) e Dickey e Fuller (1979). Posteriormente, foi objeto deuma generalização no trabalho de Dickey e Fuller (1981). A versão generalizada é conhecidacomo teste de Dickey-Fuller Aumentado, abreviadamente ADF, e constitui a modalidade desteteste que passou a ser usada desde então. Nesta subseção, vamos primeiro falar em detalhedo teste DF, em que se assume que na equação de teste o termo de erro segue um processoruído branco. Ao final, falaremos de sua versão generalizada, em que o termo de erro segueum processo I(0) autocorrelacionado.

O desenvolvimento do teste DF foi motivado pela necessidade de verificarmos se uma sérieprecisa ser diferenciada para se tornar estacionária. Essa verificação é a primeira etapa dametodologia proposta por Box e Jenkins (1970) para construção de modelos ARIMA para sériestemporais. Para aplicarmos corretamente essa metodologia, Box e Jenkins (1970) recomenda-ram que, se o gráfico da série temporal indicar que ela é não estacionária, então devemosdiferenciá-la até apresentar um padrão estacionário. Apesar da sofisticação da metodologiade Box-Jenkins, esse procedimento é limitado porque baseia-se simplesmente numa análisegráfica. A preocupação de DF foi propor um método estatístico formal para testarmos a hipó-tese de não estacionariedade da série e, assim, termos uma indicação mais precisa sobre se épreciso diferenciá-la ou não.

Veremos aqui que o teste de Dickey Fuller serve para isso, mas ele também possui impor-tantes versatilidades que permitem diferentes aplicações dependendo de como interpretamossuas hipóteses nula e alternativa. Por exemplo, como dissemos no início da seção anterior, eletambém serve como um teste para a presença de uma tendência estocástica, que pode ou nãoestar adicionada de uma tendência determinística. Em última instância, ele serve para distin-guir qual dentro os quatro tipos de processos estocásticos considerados no quadro 1.11 deveestar gerando uma série temporal. Essa forma de ver o teste tende a torná-lo mais intuitivo efacilita sua compreensão.

No entanto, antes de apresentarmos o teste propriamente dito, é importante chamar aatenção para alguns aspectos que tendem a confundir aqueles que estudam pela primeira vezo teste DF:

• primeiro, DF propuseram na verdade mais de um método para testar a não estacionarie-dade de uma série. Por exemplo, desenvolveram testes baseados na razão t e em outrasestatísticas, como F e de Durbin-Watson. O procedimento mais usado atualmente ébaseado na razão t e será apenas este que veremos aqui;

10O leitor deve ser alertado aqui que, nesta representação da tendência estacionária segundo a expressão (47), ocomponente de tendência determinística a+ bt é diferente de ψ0 +ψ1t e o termo restante ρYt−1 +ut não é estacionário(porque, embutindo uma tendência deterministica, Yt−1 é não estacionário). Mas a representação completa para Ytrepresenta de fato uma tendência estacionária se lembrarmos que (47) foi desenvolvida a partir de (41) e, portanto, ae b estão restringidos segundo as expressões (45) e (46).

19

Page 23: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

• segundo, a equação de teste inicialmente deixava dúvidas conceituais na interpretaçãodos parâmetros e essas dúvidas só foram esclarecidas num trabalho posterior, de Dickeyet al (1986). Nós já falamos disso, quando apresentamos o desenvolvimento da equaçãogeral para os quatro processos considerados antes;

• terceiro, as hipóteses do teste devem ser interpretadas como se fosse um teste unilate-ral, mas nosso interesse envolve apenas uma parte da hipótese alternativa. Este últimoaspecto veremos com cuidado logo adiante.

Por essas razões, o leitor desavisado poderá ficar confuso ao tentar entender e aplicar o testeDF. Buscaremos aqui contribuir para minimizar potenciais confusões.

Nesse sentido, o primeiro aspecto a destacar sobre o teste DF é que ele procura verificar seuma série é estacionária ou não testando a hipótese de que ela foi gerada por um processo comuma raiz unitária na parte AR. A maneira como fazemos isso é assumir que o modelo que geraa série é o mesmo da equação (47). Para simplificar o entendimento desse ponto, consideremosuma versão mais simples daquela equação, em que ψ0 = ψ1 = 0, o que implica a = b = 0, talcomo segue:

Yt = ρYt−1 + ut (48)

Observe que, para este modelo, o processo estocástico será:

• estacionário se |ρ| < 1 ou

• não-estacionário se |ρ| ≥ 1.

Entretanto, o procedimento do teste DF usa como enunciado:

H0 : ρ = 1H1 : ρ < 1

O leitor pode perceber que este enunciado caracteriza um teste unilateral. Uma forma imediatade testar a hipótese nula seria regredir a equação (48), por exemplo usando MQO, e computara razão tρ . Então, comparando o valor desta razão com um valor crítico t(α), associado a umnível de significância α, decidiríamos não rejeitar H0 se |tρ| ≥ t(α) ou rejeitar H0 se |tρ| < t(α).Veremos que é mais ou menos isso que está envolvido, mas não poderemos usar um valorcrítico associado a uma distribuição t de Student.

Agora, vejamos com cuidado o enunciado do teste DF apresentado acima. A hipótese nuladiz que a série é não estacionária, no sentido de que possui uma raiz unitária. De fato,vimos antes que, se ρ = 1, então Yt segue um processo de raiz unitária. Porém, note que,teoricamente, há outras possibilidades para a série ser não estacionária: por exemplo, se ρ > 1. O enunciado do teste descarta esta possibilidade porque, neste caso, Yt seguiria um processoexplosivo que cresce ou decresce indefinidamente. Mas, a hipótese nula como definida acimaconsidera uma possibilidade específica de que a série possui uma raiz unitária (e apenasuma). Por sua vez, a hipótese alternativa diz que a série é estacionária, se |ρ| < 1 , ou nãoestacionária, se |ρ| ≥ 1 . Portanto, é preciso cuidado aqui porque a alternativa admite duaspossibilidades conflitantes: a série pode ser estacionária ou não sob essa hipótese. Mas, noteque as possibilidades da série ser não estacionária sob H1 são: a) se ρ = −1, a série vaiapresentar um ciclo muito curto, com oscilações da série entre o positivo e negativo e comamplitude errática; b) se ρ < 1 , a série vai exibir o mesmo ciclo curto mas com amplitudeexplosiva.

Vemos, portanto, que o enunciado acima tanto na hipótese nula quanto na alternativaadmite várias formas de não estacionariedade. Porém, é exatamente esse o enunciado doteste DF. Apesar disso, o teste DF nos permite chegar à conclusão de que uma série é nãoestacionária, no sentido de possuir uma ou mais raízes unitárias, ou estacionária. Na prática,fica mais fácil entendermos o procedimento do teste DF se imaginarmos um enunciado que éum pouco diferente:

H0 : ρ = 1H∗1 : |ρ| < 1

20

Page 24: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

A diferença está na hipótese alternativa. Pusemos a estrela nela, isto é, em H∗1 , para destacarque esta é a hipótese alternativa de interesse. O enunciado re-escrito desta forma noscoloca exatamente na situação que nos interessa mais. Testaremos a hipótese nula de que asérie possui uma raiz unitária contra a alternativa de interesse de que a série não possui raizunitária, mas é estacionária. Assim, o leitor deve atentar para o fato de que, no material queapresentamos a seguir, pensaremos sempre desta forma.

O teste DF está disponível em três opções, e cada versão se baseia na estimação por MQOde uma variante de (47) para cômputo das estatísticas de teste. Nas três opções, o proce-dimento é o mesmo e, como dissemos, pode ser melhor pensado como H0 e H∗1 . Se H0 forverdadeira, então o processo estocástico gerador da série possui uma raiz unitária e embuteuma tendência estocástica. No entanto, se H0 for falsa, então o processo é estacionário semqualquer tendência (opções 1 e 2) ou é uma tendência estacionária (opção 3).

O teste DF, no entanto, não usa diretamente a equação (47). Subtraindo Yt−1 de ambos oslados dessa equação, obtemos:

∆Yt = a+ bt+ λYt−1 + ut (49)

onde λ = ρ−1 e a e b continuam definidos como em (45) e (46). Na versão original e mais simplesdo teste, Dickey e Fuller (1979) assumem que o termo de erro ut é um processo ruído branconormalmente distribuído. Na versão aumentada (ADF), Dickey e Fuller (1981) assumem queele segue um processo AR(p). A equação (49), com as mesmas restrições dadas pela equação(44), é que é usada no teste DF para cômputo das estatísticas de teste. Embora seja apenasuma representação alternativa do processo gerador de Yt na equação (44), a equação (49)também é chamada na literatura de equação de teste. É importante observar que, conforme aequação (49), as hipóteses nula e de interesse do teste passam a ser escritas como:

H0 : λ = 0 (há raiz unitária)H∗1 : −2 < λ < 0 (não há raiz unitária)

O teste é aplicado estimando-se por MQO a equação (49) e computando-se a razão t para oparâmetro λ:

τλ =λ

sλ(50)

Onde λ é o estimador de MQO de λ e sλ o erro–padrão de λ . A razão em (50) é denominada deestatística-τ porque segue uma distribuição de probabilidade diferente da usual t de Studentsob a hipótese nula de que λ = 0 . A distribuição da estatística-τ é conhecida como distribuiçãode Dickey e Fuller e seus valores críticos para diferentes níveis de significância foram tabuladasem Fuller (1976, 1995), Dickey e Fuller (1981) e em outros trabalhos, como McKinnon (1996).É interessante observar que as quatro possibilidades de processos estocásticos consideradasna seção anterior passam a ser, segundo a equação (49):

• Processo estacionário: ψ1 = 0, −2 < λ < 0→ ∆Yt = a+ λYt−1 + ut

• Processo I(1): ψ1 = 0, λ = 0→ ∆t = ut

• Tendência estacionária: −2 < λ < 0→ ∆Yt = a+ bt+ λYt−1 + ut

• Diferença estacionária: λ = 0→ ∆Yt = b+ ut

Essas diversas possibilidades podem ser tratadas no âmbito das três opções em que o testede Dickey Fuller está disponível. Apresentaremos a seguir essas três opções e atentamos paraque é muito importante saber quando se usa cada uma delas. Elas diferem na maneira comose restringe para a presença ou não do intercepto a e do termo de tendência bt na equaçãode teste. Usar a opção inadequada pode enviesar a conclusão obtida com o teste ou entãoperder-se desnecessariamente poder do mesmo.

21

Page 25: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

2.2.1 Opção 1: Sem intercepto e sem termo de tendência

Esta é a opção mais simples do teste DF. Ela assume ψ0 = ψ1 = 0, o que, de acordo com asexpressões (45) e (45), faz com que a = b = 0 na equação (49). Isso equivale a dizer que estaopção não considera a constante e nem o termo de tendência na equação de teste. Assim,a hipótese H0 : λ = 0 significa que a série segue um processo não estacionário com uma raizunitária mas sem constante ∆Yt = ut. Ou seja, um processo I(1). A hipótese H∗1 , por suavez, assume que o processo é ∆Yt = λYt−1 + ut com −2 < λ < 0. Note que isso equivale a umprocesso estacionário sem constante Yt = ρYt−1 + ut (i.e., com |ρ| < 1). Ou seja, um processoI(0). Do ponto de vista das tendências, H0 : λ = 0 significa que o processo que gera a sérieembute uma tendência estocástica, enquanto H∗1 significa que o processo não tem qualquertendência. Em suma, temos:

H0 : λ = 0 ∆Yt = ut Uma raiz unitária ou I(1); tendên-cia estocástica;

H∗1 : −2 < λ < 0 ∆Yt = λYt−1 + ut Sem raíz unitária ou I(0); processoestacionário sem tendência alguma

A equação de teste é estimada por MQO sem o intercepto a e sem o termo de tendência bt, istoé:

∆Yt = λYt−1 + ut (51)

e então computa-se a estatística de teste, que nesta opção é chamada apenas de estatística-τ(tau):

τ =λ

sλ(52)

Uma tabulação de valores críticos para diferentes níveis de significância para a estatística-τestá disponível em MacKinnon(1996). Se o valor de τ for menor do que o valor crítico tabuladoao nível de significância escolhido, rejeita-se a hipótese nula de presença de uma raíz unitária(ou de não estacionariedade).

2.2.2 Opção 2: Só com intercepto

Esta segunda opção é muito parecida com a primeira. Ela assume apenas ψ1 = 0, o que, deacordo com as expressões (45) e (46), faz com que a = ψ0(1 − ρ) e apenas b = 0 na equação(49). Logo, esta opção considera a possibilidade de uma constante não nula (mas aindasem o termo de tendência determinística) na equação de teste. Segue então que a hipóteseH0 : λ = 0 (ou ρ = 1) continua significando que o processo gerador da série é ∆Yt = ut, logocom uma raiz unitária e sem constante. Ou seja, continua sendo um processo I(1). O quemuda é que a hipótese H∗1 agora é ∆Yt = a + λYt−1 + ut com −2 < λ < 0, o que equivale a umprocesso estacionário com constante Yt = a+ρYt−1 +ut (com |ρ| < 1). Note que não há qualquerincoerência aqui. A hipótese H0 : λ = 0 (ou |ρ| < 1) implica a = ψ0(1 − ρ), mas H∗1 : −2 < λ < 0não. A interpretação de H∗1 continua a mesma: a série segue um processo I(0).

Em outras palavras, a comparação entre H0 e H∗1 nesta segunda versão é essencialmente amesma que a da opção 1, sendo no entanto mais geral porque admite na hipótese alternativaque o processo estacionário possua constante não nula. Do ponto de vista das tendências,também continua a mesma interpretação da opção 1. H0 assume que o processo que gera asérie é do tipo I(1) com tendência estocástica apenas e H∗1 que o processo não tem qualquertendência. Em suma, temos:

22

Page 26: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

H0 : λ = 0 ∆Yt = ut Uma raiz unitária ou I(1); tendên-cia estocástica;

H∗1 : −2 < λ < 0 ∆Yt = a+ λYt−1 + ut Sem raíz unitária ou I(0); processoestacionário sem tendência alguma

Novamente, a equação de teste é estimada por MQO, mas agora com o intercepto a e aindasem o termo de tendência bt, isto é:

∆Yt = a+ λYt−1 + ut (53)

Computa-se então a estatística de teste, que nesta segunda opção passa a ser chamada deestatística-τµ (tau-mi):

τµ =λ

sλ(54)

Aqui também, uma tabulação de valores críticos para diferentes níveis de significância para aestatística-τµ está disponível em McKinnon(1996). Se o valor de τµ for menor do que o valorcrítico tabulado ao nível de significância escolhido, rejeita-se a hipótese nula de presença deuma raíz unitária (ou de não estacionariedade). Na prática, esta segunda opção é preferível àprimeira, devido à constante ser não nula na hipótese alternativa de interesse. É a que deveser usada, a menos que se trabalhe com poucas observações ou se tenha forte convicção deque a constante na hipótese alternativa é nula (situação muito rara na prática).

2.2.3 Opção 3: com intercepto e termo de tendência

Esta terceira opção é diferente das duas anteriores porque admite a presença de uma tendênciadeterminística linear no processo para Yt. Ela assume que ψ0 6= 0 e ψ1 6= 0, de modo que, deacordo com as expressões (45) e (46), a = ψ0(1 − ρ) + ψ1ρ e b = ψ1(1 − ρ). Isso equivale a dizerque a equação de teste possui uma constante e um termo de tendência. Então, a hipóteseH0 : λ = 0 (ou ρ = 1) implica a = ψ1 6= 0 mas b = 0, de forma que o processo gerador da série é∆Yt = a+ ut, ou seja, processo de diferença estacionária. Lembre que tal processo é a soma deuma tendência determinística mais um processo I(1). Por sua vez, a alternativa de interesseH∗1 : −2 < λ < 0 (ou |ρ| < 1) implica a 6= 0 e b 6= 0, de modo que o processo gerador da série é∆Yt = a+ bt+λYt−1 +ut com −2 < λ < 0, o que equivale a um processo sem raiz unitária do tipotendência estacionária Yt = a+ bt+ ρYt−1 + ut (com |ρ| < 1). Vimos antes que este processo é asoma de uma tendência determinística mais um processo I(0).

É importante observar aqui um aspecto que frequentemente é negligenciado pelos usuá-rios do teste DF. Note que, nesta opção, tanto H0 quando H∗1 assumem que a série segue umprocesso não-estacionário, porque ambas consideram a presença de uma tendência determi-nística. Portanto, aqui o teste DF não verifica se a série é estacionária ou não. Ele verificase o processo que gera a série embute um processo I(1), como diz H0, ou não, como diz H∗1 .Além disso, do ponto de vista das tendências, H0 significa que o processo que gera a série écomposto de uma tendência determinística linear mais uma tendência estocástica (e mais umerro I(0)), como vimos na expressão (29), e H∗1 que o processo é composto de uma tendênciadeterminística linear mais um processo estacionário. Em suma, temos:

H0 : λ = 0 ∆Yt = a+ ut Contém um processo raiz unitáriaou I(1); tendência determinísticalinear mais tendência estocástica;diferença estacionária.

H∗1 : −2 < λ < 0 ∆Yt = a+ bt+ λYt−1 + ut Sem processo de raíz unitária; ten-dência determinística linear maiserro estacionário ou I(0); tendênciaestacionária.

23

Page 27: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

A equação de teste é estimada segundo a hipótese alternativa H1:

∆Yt = a+ bt+ λYt−1 + ut (55)

Computa-se então a estatística de teste, que nesta terceira opção passa a ser chamada deestatística-ττ (tau-tau):

ττ =λ

sλ(56)

Aqui também, uma tabulação de valores críticos para diferentes níveis de significância paraa estatística-ττ está disponível em MacKinnon (1996). A decisão de rejeitar ou não rejeitarH0 é tomada de forma análoga, pela comparação de ττ com o valor crítico tabulado ao nívelde significância escolhido. Esta opção é a que deve ser usada sempre que o gráfico da sérieindicar que ela possui uma tendência determinística. Se houver dúvida quanto a isso ao seexaminar o gráfico da série, também deve-se usar esta terceira opção. Mesmo que não existauma tendência determinística no processo gerador da série, isto não traz problemas porqueesta terceira opção engloba as duas anteriores.

O risco de se incorrer em erro surge quando se usa a primeira ou a segunda opções, masdeveria-se usar a terceira. Isto acontece quando há uma tendência determinística no processogerador da série, mas isso é ignorado pelo usuário. Como dissemos acima, este é um errocometido frequentemente. Neste caso, o uso da opção incorreta pode levar a se concluir queuma série é gerada por um processo de raíz unitária ou I(1) quando na verdade ela segue umprocesso de tendência estacionária. Este erro traz duas importantes consequências: primeiro,ao induzir à conclusão errônea de que a série possui memória longa, mas na verdade temmemória curta. Segundo, ao induzir à conclusão também errônea de que a série pode serco-integrada com outras séries, quando isso não é possível porque um processo de tendênciaestacionária não embute um processo integrado.

2.2.4 Teste Aumentado de Dickey-Fuller

A versão aumentada do teste DF, que chamamos antes de teste ADF, difere apenas por consi-derar a existência de alguma estrutura de autocorrelação para os erros da equação de teste.Se essa estrutura não for considerada, há perda de eficiência do estimador de MQO para λ e,o que é mais sério, as estatísticas τ , τµ e ττ ficam enviesadas. Na prática, isso é consideradousando uma versão aumentada da equação de teste em que se permite termos defasados de∆Yt como variáveis adicionais no lado direito da expressão (49):

∆Yt = a+ bt+ λYt−1 +

p∑j=1

λj∆Yt−j + εt (57)

onde λj (j = 1, . . . , p) são parâmetros e εt é um processo ruído branco. O objetivo desse procedi-mento é eliminar uma possível existência de autocorrelação serial no termo de erro ut. Assim,ao invés de estimar as equações (51), (53) e (55) de cada uma das três opções do teste DF,estima-se as seguintes equações:

Opção 1: ∆Yt = λYt−1 +

p∑j=1

λj∆Yt−j + εt (58)

Opção 2: ∆Yt = a+ λYt−1 +

p∑j=1

λj∆Yt−j + εt (59)

Opção 3: ∆Yt = a+ bt+ λYt−1 +

p∑j=1

λj∆Yt−j + εt (60)

Nas três opções, aplica-se o mesmo procedimento de testar H0 : λ = 0. E em cada uma delas,H0 continua tendo as mesmas interpretações. Um problema novo que aparece, porém, comesta versão aumentada é a necessidade de se determinar com antecedência o lag máximo p

24

Page 28: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

dos termos defasados de ∆Yt. Isto é feito estimando-se várias vezes a equação de teste comnúmeros diferentes de termos defasados, isto é, para o valor de p. Escolhe-se o valor de p queminimiza alguma estatística de critério de informação, como a de Schwarz, por exemplo. Umavez escolhido o lag máximo, implementa-se o teste ADF propriamente dito.

2.2.5 Passos de implementação do teste ADF

1. Escolha da opção (1, 2, ou 3) do teste: examine o gráfico da série para verificar a pre-sença ou ausência aparente de uma tendência determinística. Se parecer não haver umatendência determinística, escolha a opção 1 (sem intercepto nem termo de tendência de-terminística) ou a opção 2 (só intercepto), que assumem na hipótese H0 que o processo deraiz unitária possui uma tendência estocástica apenas. No caso de haver forte evidenciavisual de uma tendência determinística na evolução da série, escolha a opção 3 (inter-cepto mais termo de tendência). Havendo dúvida, escolha a opção 3, porque é a maisgeral e engloba as demais.

2. Lag máximo da equação de teste: uma vez escolhida a opção do teste, pode-se deter-minar qual a especificação da equação de teste que será estimada. Isso envolve antesdeterminar o lag máximo p dos termos defasados da variável dependente ∆Yt que serãousados na estimação da equação de teste. Para tanto, proceda da seguinte forma: Estimea equação de teste sem nenhum termo defasado de ∆Yt e registre o critério de infor-mação (Schwarz, por exemplo). Repita a estimação da equação de teste com um termodefasado ∆Yt−1 e novamente registre o critério de informação. Compare os dois critériosde informação: se o da última equação estimada for maior do que o da anterior, pare euse a equação anterior para implementar o teste; se for menor, continue. Estime entãoa equação de teste agora com dois termos defasados, ∆Yt−1 e ∆Yt−2, e proceda à mesmacomparação dos critérios de informação da equação atual e da anterior. Pare ou entãocontinue sucessivamente até o momento em que o critério de Schwarz da equação atualaumentar em relação ao da equação anterior. Isso significa que o valor de p da penúltimaequação é o lag máximo.

3. Estatística de teste: Tendo determinado o lag máximo p, estime em definitivo a equaçãode teste e compute a estatística–τ correspondente.

4. Decisão Final: Compare a estatística tau calculada com o valor crítico tabulado segundoo nível de significância escolhido. O valor crítico pode ser encontrado, por exemplo, natabela apresentada por Mckinnon (1996). Se a estatística-tau for maior ou igual ao valorcrítico, não rejeite H0, isto é, considere que a série é não estacionária e possui umaraiz unitária. Se a estatística-tau for menor, rejeite H0 e conclua que a série não possuiraiz unitária. Refine sua interpretação em termos da presença/ausência de tendênciasdeterminística e estocástica em função da opção do teste que você escolheu.

5. Reaplicando o teste: Se H0 não for rejeitada no passo 4, significa que o processo geradorda série possui uma raiz unitária. Em princípio, isso significa que seu processo geradoré, ou embute, um processo I(1). É possível, no entanto, que o processo gerador da sériepossua mais raízes unitárias e assim seja, ou possua, um processo integrado de ordemmaior. Para verificar isso, diferencie a série uma vez e repita todos os procedimentosanteriores do teste ADF para a série diferenciada. Se H0 for rejeitada, é porque a sériediferenciada não tem raiz unitária e, portanto, a série original é I(1). De outro modo,se H0 não for rejeitada é porque a série diferenciada possui uma raiz unitária. Nestecaso, diferencie novamente a série e aplique de novo o teste ADF. Proceda dessa maneiraiterativamente até chegar a um grau de diferenciação da série em que H0 é finalmenterejeitada. Isso significa que, para esse grau de diferenciação, o processo que gera a sérienão possui raiz unitária (i.e, é estacionário ou do tipo tendência estacionária)11.

11Há um outro procedimento na literatura para se determinar a ordem de integração, ou o número de raízes unitá-rias, de uma série temporal, proposto por Dickey e Pantula (1987). Esse procedimento é mais rigoroso para isso doque o teste ADF, mas optamos por não abordá-lo aqui devido ao caráter introdutório deste texto.

25

Page 29: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

A seguir, apresentamos um conjunto de exemplos de aplicação do teste de Dickey–Fuellerna sua versão aumentada. Os exemplos usam as séries simuladas pelo autor deste texto e queestão distribuídas pelas figuras 2, 3 e 4. Para facilitar a apresentação e comparação dessesexemplos, os resultados do teste ADF para cada série analisada estão apresentados de formaagrupada na tabela 1. Por ora, há uma vantagem de vermos esses exemplos com séries simula-das porque nesses casos conhecemos a priori os processos estocásticos que geraram as séries.Isso nos permite entender mais claramente como o teste ADF funciona. O leitor deve lembrar,porém, que na aplicação do teste a séries reais só teremos os dados observados das sériese, portanto, seus respectivos processos estocásticos geradores serão sempre desconhecidos.Mais adiante, veremos um exemplo do teste ADF com uma série real.

Exemplo 1: Séries simuladas sem raiz unitária

Neste primeiro exemplo, aplicamos os passos do teste ADF delineados acima para as duasséries da figura 2. Iniciaremos analisando a série da figura 2.a). O gráfico desta série sugereque a mesma segue um processo estacionário, porque ela parece oscilar em torno de umamédia fixa. Diante disso, a opção do teste ADF a ser usada deveria ser a 1 (sem constante)ou a 2 (com constante). Nós sabemos que, por ser uma série simulada, ela foi gerada por umprocesso estacionário sem constante (indicado logo abaixo da figura 2.a)), o que poderia noslevar aqui a escolher a opção 1. Porém, na prática, não sabemos qual o processo estocásticoque gerou uma série, normalmente temos apenas os dados da mesma e o gráfico desses dados,como a figura 2.a). Por isso, é mais adequado escolhermos a opção 2, pois esta assume nahipótese alternativa H1 a presença de uma constante no processo estacionário gerador dasérie, inclusive uma constante nula.

O resultado do teste ADF está apresentado na primeira linha, logo abaixo dos títulos, databela 1. Repare que na primeira coluna a tabela indica a série testada (i.e., da figura cor-respondente) e, no caso da série da figura 2.a) , fez–se o teste apenas para a variável em nívelYt. Na segunda coluna, a tabela reporta a opção do teste escolhida (no caso, como dissemos,usamos a opção 2 que admite uma constante na equação de teste), e na terceira coluna olag–máximo, que corresponde ao número de lags da variável dependente incluídos na equaçãode teste como variáveis explicativas. Lembre que a determinação desse número de lags tem deser feita antes de se aplicar o teste propriamente dito, estimando–se diferentes opções da equa-ção de teste (com diferentes lags) e escolhendo aquela que minimiza o critério de Schwarz12.Na quarta coluna, é apresentada a estatística–tau associada e, nas três colunas seguintes,os valores críticos para os níveis de significância de 1%, 5% e 10%, respectivamente. A ta-bela ainda apresenta, na última coluna, o valor de prova associado ao valor da estatística–taucalculado segundo um procedimento aproximado proposto por MacKinnon (1996).

Para a série da figura 2.a), repare que o valor da estatística tau foi de –7,65. Ele se situa àesquerda de qualquer um dos valores críticos apresentados, mesmo o de 1% que correspondeao valor mais negativo dos três. Segundo a regra de decisão do teste ADF, devemos rejeitara hipótese nula H0, que assume a presença de uma raiz unitária. Logo, concluímos quea série não apresenta raiz unitária. Dizendo de outra forma, concluímos que a série nãoapresenta tendência estocástica. Pela característica visual do gráfico da série, na prática,acabamos concluindo que ela não apresenta tendência alguma, ou seja, que ela é um processoestacionário. Se usássemos a regra de decisão pelo valor de prova, chegaríamos à mesmaconclusão, porque este encontra–se abaixo de 0,01, valor associado a um nível de significânciade 1%.

Passemos, agora, à série da figura 2.b). Observando o gráfico desta série, vemos que, niti-damente, ela apresenta um crescimento persistente sugerindo a presença de uma tendênciadeterminística linear. Neste caso, devemos usar então a opção 3 do teste ADF, que considerauma constante mais uma tendência determinística linear na equação de teste. Lembre que,nesta opção, a hipótese nula de raiz unitária é sinônimo de considerar que a série embute umatendência estocástica junto com uma tendência determinística linear, ou seja, um processo di-ferença estacionária com deslocamento. E a hipótese alternativa de ausência de raiz unitária

12O software Eviews 7.0 realiza a busca do lag–máximo automaticamente, podendo o usuário determinar qualestatística de critério de informação deve ser usada, entre Akaike, Schwarz, Hannan-Quinn e suas respectivas versõesmodificiadas.

26

Page 30: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

Tabela 1: Teste ADF de raiz unitária para séries simuladasSérie Var. Teste Aumentado de Dickey-Fuller

Opção Lag-Máx Tau 1% 5% 10% V. Prova

Fig. 2a Yt cte 0 -7,65 -3,46 -2,88 -2,57 0,00Fig. 2b Yt cte 3 -0,14 -3,46 -2,88 -2,57 0,94Fig. 2b Yt cte+tend 0 -7,94 -4,01 -3,43 -3,14 0,00Fig. 3a Yt cte 0 -1,46 -3,46 -2,88 -2,57 0,55Fig. 3b Yt cte+tend 0 -1,95 -4,00 -3,43 -3,14 0,63Fig. 4a Yt cte 2 -1,21 -3,46 -2,88 -2,57 0,67Fig. 4c ∆Yt cte 1 -8,80 -3,46 -2,88 -2,57 0,00Fig. 4b Yt cte+tend 1 -2,33 -4,01 -3,43 -3,14 0,41Fig. 4d ∆Yt cte 0 -8,54 -3,46 -2,88 -2,57 0,00

Fonte: Cálculos feitos a partir de dados simulados pelo autor usando o software Eviews7.0. Notas: Var. = variável; cte = com constante; tend = com termo de tendência; Lag–Máx= defasagem máxima da variável dependente na equação de teste. Tau = estatística–τ , τµou ττ , dependendo da versão utilizada. O cálculo dos valores de prova foram feitos porprocedimento descrito em McKinnon(1996).

é sinônimo de considerar que há só uma tendência determinística acrescida de um processoestacionário, ou seja, um processo tendência estacionária.

No entanto, observe na tabela 1 que fazemos o teste ADF duas vezes para esta série da figura2.b). Na primeira vez, usamos a opção incorreta, que é permitir só uma constante na equaçãode teste, ou seja, a opção 2. Fizemos assim propositalmente para o leitor perceber o tipo de erroque se pode incorrer quando se usa uma opção inadequada do teste ADF. Na aplicação usandoa opção 2 (só com constante), repare que a estatística tau associada apresenta o valor –0,14.Considerando os valores críticos reportados, a hipótese nula de presença de raiz unitária nãoé rejeitada nem mesmo a 5% de significância. O valor de prova de 0,94, bem elevado, indica,da mesma forma, não rejeição da hipótese nula. Ou seja, o teste admite que há uma tendênciaestocástica no comportamento da série. No entanto, o gráfico da série sugere fortemente umprocesso tendência estacionária (sabemos, inclusive, que a série foi gerada assim), que é umprocesso estocástico com tendência determinística apenas. A inconsistência do resultado doteste ADF aqui, usando–se a opção inadequada, se deve a que o teste possivelmente estáconfundindo a tendência determinística presente na série com uma tendência estocástica.Isso acontece porque a opção 2 do teste ADF não consegue identificar a presença de umatendência determinística, seja na hipótese nula ou na alternativa.

Agora, quando aplicamos novamente o teste ADF à mesma série da figura 2.b) mas usandoa opção 3 (constante mais termo de tendência), a estatística tau é de –7,94. Este valor émenor (está mais à esquerda na linha dos números reais) do que o valor crítico de 1%. Logo,neste caso, devemos rejeitar a hipótese nula de presença de raiz unitária. Concluímos, então,que o processo estocástico que gerou a série é do tipo tendência estacionária, o que significaque ele não apresenta tendência estocástica, só tendência determinística (mais um processoestacionário). Assim, usando a opção 3, o resultado fica mais consistente com o gráfico da série(e ainda com o fato de que sabemos que a série foi simulada segundo um processo tendênciaestacionária).

Exemplo 2: Séries simuladas com raiz unitária

A série da figura 3.a) representa uma tendência estocástica, que é um caso particular deum processo de raiz unitária ou I(1). A série da figura 3.b) representa uma tendência geral,dada pela soma de uma tendência determinística mais uma tendência estocástica, e é umcaso particular de um processo de diferença estacionária. O gráfico da figura 3.a) sugere que asérie não é estacionária e que não parece ter uma tendência determinística linear. Aplicamosentão o teste ADF com a opção 2. A estatística–tau obtida é –1,46, nos levando a não rejeitara hipótese nula de raiz unitária nem mesmo a 10% de significância. Por sua vez, o gráfico 3.b)

27

Page 31: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

sugere que a série possui uma tendência determinística. Então, aplicamos o teste ADF coma opção 3. A estatística–tau obtida foi de –1,95, nos levando a decidir pela não-rejeição dahipótese nula de raiz unitária mesmo a 10% de significância.

As séries das figuras 4.a) e 4.b) foram ambas geradas como processos que embutem raízesunitárias: a primeira como um processo de raiz unitária ou I(1) e a segunda como um pro-cesso de diferença estacionária. O gráfico da figura 4.a) sugere fortemente que a série não éestacionária, mas não indica, pelo menos de um modo nítido, a presença de uma tendênciadeterminística linear. Assim, aplicamos o teste ADF para essa série usando a opção 2, só comconstante, na equação de teste. O resultado, apresentado na quarta linha da tabela 1 mostrauma estatística–tau no valor de –1,21. Este valor está à direita do valor crítico de 10% de sig-nificância, levando, portanto, à não rejeição da hipótese nula de raiz unitária. Indica, assim,a presença de uma tendência estocástica sem tendência determinística. Mais uma vez, o testeADF com a opção adequada nos leva a concluir corretamente, em consonância com o modocomo a série foi gerada.

O teste ADF foi desenhado para detectar a presença de uma raiz unitária, mas a série podepossuir outras raízes unitárias. Ou seja, o teste ADF aplicado à uma série não permite detectara ordem de integração da mesma. Para verificar isso, é preciso diferenciar a série e repetir oteste ADF. Na linha seguinte da tabela 1, apresentamos o resultado do teste para a série dafigura 4.c), a qual consiste da primeira diferença da série da figura 4.a). O gráfico da figura 4.c)indica fortemente que a série é estacionária, portanto sem tendência alguma, e assim o testefoi aplicado usando–se a opção 2. O valor da estatística–tau neste caso é de –8,8, situando–seà esquerda do valor crítico de 1%. Logo, rejeitamos a hipótese nula de raiz unitária. Com ográfico e o teste indicando ausência de tendências, não é necessário diferenciar–se mais umavez a série. Podemos parar aqui e concluir que a série original da figura 4.a) é um processoI(1).

A série da figura 4.b) foi gerada como uma diferença estacionária, logo como uma tendên-cia estocástica mais uma tendência determinística linear. Por isso, o gráfico da série sugerenitidamente a presença de uma tendência determinística. Neste caso, usamos a opção 3 paraaplicar o teste ADF. O resultado é uma estatística–tau de –2,33, logo à direita do nível de sig-nificância de 10%, nos levando à não–rejeição da hipótese nula de raiz unitária. Consoante,portanto, com um processo com tendência estocástica mais tendência determinística linear.

Novamente, o teste ADF não indica o grau de integração da série, apenas que a mesmapossui uma raiz unitária. Para verificar se há mais raízes unitárias, deve–se diferenciar a sériee repetir o teste. O gráfico da figura 4.d) mostra a série da figura 4.b) diferenciada. Nítidamente,o gráfico sugere uma série estacionária, portanto aplicamos o teste ADF com a opção 2. Oresultado é uma estatística–tau de –8,54, situada à esquerda do nível de significância de 1%,que nos indica a rejeição da hipótese nula de raiz unitária. Com a rejeição da hipótese nula soba opção 2 do teste ADF, somos levados a concluir que a série é um processo estacionário semtendência alguma e que não é necessário diferenciar–se mais uma vez a série. Concluímos,então, que a série da figura 4.b) segue um processo I(1).

Exemplo 3: Exportações brasileiras (índice de quantum)

Agora, apresentamos a aplicação do teste ADF para uma série real. A figura 6.a) apresentaa série anual do índice de quantum das exportações brasileiras no período que vai de 1950 a2007, compondo um total de 58 observações. É nítido o comportamento fortemente ascendenteda série a ponto de esta aparentar um comportamento explosivo. Ao invés de trabalharmosdiretamente com esta série13, optamos por trabalhar com sua versão em log neperiano, aqual é muito usada em estudos econométricos voltados para estimação de elasticidades dasexportações. A série em log está apresentada na figura 6.b). Ela manifesta um comportamentoascendente que aparenta ser produzido por uma tendência determinística linear. Diante disso,o uso do teste ADF servirá para detectar se a série possui adicionalmente uma tendência

13Este comportamento explosivo da série original poderia decorrer da presença de mais de uma raiz unitária: porexemplo, série poderia seguir um processo I(2). No entanto, o que ocorre de fato é um aumento muito intenso davariância da série. O uso da série em log, neste caso, permite aproximar melhor o comportamento de um processodiferença estacionária ou I(1), que no entanto acabou sendo rejeitado no teste ADF em favor de uma tendênciaestacionária.

28

Page 32: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

estocástica (diferença estacionária) ou somente a tendência determinística linear mais umerro estacionário (tendência estacionária).

(a) Dados Brutos (b) Log Neperiano

Figura 6: Índice de quantum (base 2005=100) das exportações brasileiras 1950–2007.

Fonte: Série elaborada pelo IPEA com dados da Funcex (1973–2007) e do IBGE (1950–1972).

O teste ADF foi aplicado sob a opção 3 de intercepto mais termo de tendência, que é aadequada nesse caso. A busca pelo lag–máximo dos termos defasados da variável dependente,a serem usados como variáveis explicativas na estimação da equação de teste, indicou quenenhum lag seria preciso. O resultado obtido foi uma estatística tau–tau de –3,727, que selocaliza entre o valor crítico de –4,124, correspondente a 1% de nível de significância, e o valorcrítico de –3,489, correspondente a 5%. Assim, rejeitamos a hipótese nula a 5% e concluímosque a série segue um processo do tipo tendência estacionária. Neste caso, não se faz necessáriotestar para a primeira diferença da série.

2.3 Teste de Phillips–Perron

Phillips(1987) e Phillips e Perron (1988) propuseram outro teste de raiz unitária que generalizao teste ADF para uma ampla classe de modelos em que os erros na equação (49) são autocor-relacionados e heterogeneamente distribuídos. Ele é conhecido como teste de Phillips–Perronou, abreviadamente, teste PP. Essencialmente, o procedimento do teste PP é o mesmo que odo teste ADF e envolve a estimação da equação (49) para cômputo das estatísticas de teste,introduzindo apenas uma modificação nas últimas. Neste sentido, ele permite as mesmas trêsopções em que testa–se H0 : λ = 0 (uma raiz unitária) contra a alternativa H1 : −2 < λ < 0 (semraiz unitária). Na primeira opção, considera–se um modelo para Yt sem constante (i.e., cons-tante nula), logo ∆Yt = λYt + ut; na segunda, considera–se a possibilidade de uma constantenão nula, logo ∆Yt = a + λYt−1 + ut; e, na terceira, admite–se também um termo de tendência∆Yt = a+ bt+ λYt−1 + ut. Nos três casos, tanto a hipótese nula quanto a alternativa são inter-pretadas da mesma maneira que antes no que concerne à presença ou ausência de tendênciasdeterminística e estocástica, conforme descrito em detalhe na seção 2.2.

Para permitir situações mais abrangentes para o termo de erro e também desenvolver umateoria assintótica de teste conveniente, o teste PP difere do teste ADF em dois aspectos princi-pais. O primeiro é que as fórmulas das estatísticas de teste em cada situação são diferentesdas fórmulas da estatística–tau do teste ADF. As expressões para as estatísticas do teste PPsão:

Opção 1: Z(τ) =s

σTlτ −

T (σ2Tl − s2)sλ2σTl · s

(61)

Opção 2: Z(τµ) =s

σTlτµ −

T (σ2Tl − s2)sλ2σTl · s

(62)

Opção 3: Z(ττ ) =s

σTlττ −

T (σ2Tl − s2)sλ2σTl · s

(63)

De forma análoga ao teste ADF, essas estatísticas são obtidas a partir da estimação por MQOdas equações de teste correspondentes a cada opção, mas sem os termos defasados na variável

29

Page 33: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

dependente. Isto é, a partir da estimação de expressões como (51), (53) e (55), respectivamente.Assim, no lado direito das expressões (61), (62) e (63), as estatísticas τ , τµ e ττ foram obtidascomo em (52), (54) e (56). O termo sλ é o erro–padrão do estimador de MQO λ para λ. O termos2 é a variância residual da regressão de teste e corresponde a um estimador consistente davariância do erro ut sob a hipótese de que este segue um processo ruído branco. O termo σTlé um estimador consistente da variância do erro ut sob a hipótese de que este é estacionáriofraco mas admitindo condições mais genéricas de autocorrelação e heterogeneidade do pro-cesso estocástico que gera esses erros. Este termo é o único componente que não é calculadodiretamente das equações de teste estimadas e o aspecto mais complexo das expressões (61),(62) e (63) envolve justamente o seu cômputo. Phillips e Perron se baseiam no fato de que avariância assintótica neste caso é dada por:

σ2Tl = 2π · fu(0) (64)

onde fu(0) é o valor do espectro de potência do erro ut na frequência zero14. Dado este fato,os autores sugerem o uso de procedimentos disponíveis na literatura de análise de sériestemporais para estimação consistente do espetro de potência e recomendam, para os trêscasos, que se use a seguinte expressão:

σ2Tl =

1

T

(T∑t=1

u2t +

l∑s=1

wsl

T∑t=s+1

utut−s

)(65)

Onde ut são os resíduos da regressão correspondente a cada opção. O termo wsl, s = 1, . . . , l,refere-se a um conjunto de pesos que constitui a janela de defasagem (lag window) usada parasuavizar as estimativas do espectro. Phillips e Perron apontam que há vários tipos de janelas(métodos para determinar os pesos) que podem ser usadas, como as janelas triangular (ou deBartlett), de Parzen e de Newey West. Nos softwares computacionais, usualmente são dadasopções ao usuário de escolher a janela de defasagem para estimação do espectro.

Note que cada estatística Z também é uma função da estatística–tau correspondente. Oprocedimento que Phillips e Perron seguiram para obter as estatísticas–Z das expressões (61),(62) e (63) consiste de uma correção não–paramétrica das correspondentes estatísticas–tau eisso nos leva ao segundo aspecto diferente. Como já foi dito, uma vantagem do teste PP é queas estatísticas de teste foram desenvolvidas assumindo–se uma estrutura mais geral para osprocessos com raiz unitária representados no âmbito das equações de teste. Assim, o teste PPadmite que Yt possa seguir uma classe mais ampla de processos estocásticos não estacionáriosincluindo modelos ARIMA apresentando erros autocorrelacionados e distribuídos de formaheterogênea. É por esse motivo (de que as estatísticas–Z já incorporam essas possibilidadesinclusive a autocorrelação dos erros) que a equação de teste pode ser estimada sem os termosdefasados em ∆Yt, o que era necessário antes no caso do teste ADF.

Há, no entanto, um aspecto comum a ambos os testes ADF e PP que é muito vantajoso emtermos práticos. Embora as estatísticas–Z de Phillips e Perron sejam diferentes das correspon-dentes estatísticas–tau de Dickey e Fuller, elas apresentam a mesma distribuição limite sob ahipótese nula de raiz unitária. Assim, o teste PP pode ser aplicado de forma muito similar eaté mesmo mais simples do que o teste ADF. Podem ser seguidos os mesmos passos da seção4.2.5 ???, mas sem a necessidade de se determinar um lag máximo para a equação de teste.Para cada opção do teste, estima-se a equação de teste sem defasagens da variável dependentee simplesmente calcula–se a estatística–Z correspondente, segundo as expressões (61), (62) e(63). No momento de se decidir pela rejeição ou não da hipótese nula de raiz unitária, usa–seos mesmos valores críticos da distribuição de Dickey e Fuller.

A tabela 2 apresenta os resultados da aplicação do teste PP para as mesmas séries simu-ladas dos exemplos 1 e 2. Esta tabela está organizada de modo muito parecido com a tabela1 para facilitar a comparação dos resultados. A única diferença entre ambas é que a tabela2 não inclui a coluna de lag–máximo (pelas razões explicadas no parágrafo acima) e há umacoluna com o título “Est–Z”, contendo os números obtidos para as estatísticas–Z do teste PP,no lugar da coluna com o título “Tau”, contendo as estatísticas–tau do teste ADF, que havia na

14Não cabe neste texto introdutório entramos em maiores detalhes sobre estimação de espectros de potência. Reco-mendamos ao leitor interessado o livro de Chatfeld (1995), onde há uma boa exposição introdutória sobre o assunto.

30

Page 34: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

tabela 1. A tabela 2 também apresenta uma última coluna contendo os valores de prova asso-ciados às estatísticas–Z e que também foram calculados com base no mesmo método descritoem MacKinnon(1996).

Os resultados do teste PP aplicado às séries simuladas são muito similares aos do teste ADFe levam às mesmas decisões no que concerne à rejeitar/não–rejeitar H0. Observe os resultadospara as séries das figuras 2.a) e 2.b), que foram simuladas segundo um processo sem raizunitária. O teste PP rejeita a nula de raiz unitária nos dois casos, mas desde, obviamente,que a opção correta tenha sido escolhida. Assim, quando se usa a opção 2 com constante naequação de teste, o teste PP rejeita a 1% de significância a presença de raiz unitária na sérieda figura 2.a). O mesmo acontece quando se usa a opção 3, com constante mais tendênciadeterminística linear, para a série da figura 2.b). Note que, no caso desta última série, o testePP não rejeita a nula nem mesmo a 10% de significância se usamos a opção 2 (incorreta).

No caso das séries das figuras 3.a), 3.b), 4.a) e 4.b), que foram simuladas segundo processoscom raiz unitária, o teste PP não rejeita a hipótese nula de raiz unitária em todos os casos,nem mesmo a 10% de significância. As estatísticas–Z ficam acima do valor crítico respectivonesses casos, mas, novamente, salientamos que isso acontece porque foram usadas as opçõescorretas do teste. No caso das figuras 3.a) e 4.a), que não possuem tendência determinística,usou–se a opção 2 do teste PP. No caso das séries das figuras 3.b) e 4.b), que embutem umatendência determinística, foi usada a opção 3. Por último, observe que o teste PP rejeita anula para as séries diferenciadas dessas quatro figuras, isto é, que estão plotadas nas figuras4.c) e 4.d), respectivamente. Usando a opção 2 para todas essas séries, a hipótese nula deraiz unitária é rejeitada até mesmo a 1% de significância. Consequentemente, para todasessas séries das figuras 3 e 4, valem as interpretações feitas antes sobre a presença ou não determos de tendência determinística linear e/ou estocástica.

O teste PP também corrobora as conclusões do teste ADF no caso da série real da figura 6.b)e que corresponde ao log neperiano do índice de quantum das exportações brasileiras. O valorda estatística–z, calculada segundo a opção 3 do teste, é de –3,91 e situa–se entre o valor críticode 1% e o de 5% de significância, replicando assim o mesmo resultado do teste ADF. Portanto,também pelo teste PP, podemos decidir pela rejeição da hipótese nula de raiz unitária a 5% designificância, concluindo que a série representativa do quantum das exportações brasileiras(em log) foi gerada por um processo do tipo tendência estacionária.

Tabela 2: Teste Phillips-Perron de raiz unitária para séries simuladasSérie Var. Teste de Phillips-Perron

Opção Est-Z 1% 5% 10% V. Prova

Fig. 2a Yt cte -7,72 -3,46 -2,88 -2,57 0,00Fig. 2b Yt cte -0,34 -3,46 -2,88 -2,57 0,94Fig. 2b Yt cte+tend -7,94 -4,01 -3,43 -3,14 0,00Fig. 3a Yt cte -1,56 -3,46 -2,88 -2,57 0,55Fig. 3b Yt cte+tend -2,06 -4,00 -3,43 -3,14 0,63Fig. 4a Yt cte -1,19 -3,46 -2,88 -2,57 0,67Fig. 4c ∆Yt cte -8,71 -3,46 -2,88 -2,57 0,00Fig. 4b Yt cte+tend -2,00 -4,01 -3,43 -3,14 0,41Fig. 4d ∆Yt cte -8,66 -3,46 -2,88 -2,57 0,00

Fonte: Cálculos feitos a partir de dados simulados pelo autor usando o softwareEviews 7.0. Notas: cte = com constante, tend = com termo de tendência. Est–Z =estatística Z(τµ) ou Z(ττ ), dependendo da opção utilizada (no cálculo dessas esta-tísticas foi usado o método de Bartlett para estimação do espectro de potência comjanela de defasagem de Newey–West). O cálculo dos valores de prova foram feitos porprocedimento descrito em McKinnon(1996).

31

Page 35: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

2.4 Teste DF–GLS

Um importante critério pelo qual estatísticos e econometristas avaliam a qualidade de umprocedimento de teste estatístico de hipótese é o conceito de poder. O poder de um testerefere–se à probabilidade de rejeitar H0 para um dado valor do parâmetro de interesse. Porexemplo, quando testamos H0 : ρ = 1 , o poder do teste refere–se a probabilidade de rejeitar H0

dado que o verdadeiro valor de ρ é um número qualquer ρ∗ ∈ R. Se esse número ρ∗ for diferentede 1, o poder do teste neste caso é a probabilidade de rejeitar H0 : ρ = 1 dado que H0 é falsa.Nem sempre é possível estabelecer com precisão o poder de um teste estatístico, mas quando épossível temos uma base importante de comparação desse teste com outros feitos para testara mesma H0. O teste que apresentar maior poder, sob as mesmas condições, é considerado omelhor, pois nos leva com mais segurança à decidir corretamente pela rejeição de H0 quandoela for falsa. Um problema dos testes ADF e PP é o baixo poder que os mesmos apresentam eem particular quando o processo gerador da série é estacionário (portanto quando H0 é falsa)mas está próximo de apresentar uma raiz unitária. Isso acontece quando o parâmetro ρ émenor do que 1 mas está próximo de 1, ou, de forma equivalente, quando o parâmetro λ émenor do que 0 mas está próximo de 0. Nessa situação, o processo gerador da série é ditoquase–integrado (near integrated) e os testes ADF e PP apresentam baixa probabilidade derejeitar H0.

No trabalho de Elliot et all (1996), os pesquisadores Elliot, Rottemberg e Stock (doravantechamados de ERS) introduzem dois testes de raiz unitária que apresentam vantagens signifi-cativas em termos de poder se comparados aos testes ADF e PP. Ambas as abordagens seguema mesma estrutura do teste ADF, onde se assume a hipótese nula de raiz unitária no âmbito daequação de teste (51) e de acordo com as mesmas três opções. A primeira abordagem de ERS ébaseada no uso das estatísticas de Dickey–Fuller, porém calculadas de um modo diferente queenvolve um procedimento intermediário de estimação por mínimos quadrados generalizados(em inglês generalized least squares – GLS). Por esse motivo, o procedimento desta primeiraabordagem é chamado de teste DF–GLS. A segunda abordagem é baseada na teoria de testesótimos em inferência estatística e sobre ela falaremos mais adiante na seção 4.5 ???.

2.4.1 Processo para Yt

ERS assumem que o processo gerador da série é dado por:

Yt = dt + ut (66)

ut = ρut−1 + vt (67)

onde Yt é a variável de interesse, dt é um termo determinístico, ut é um termo aleatório quesegue um processo AR(1) e vt é um processo I(0) com média nula. ERS assumem na primeiraabordagem que vt é normalmente distribuído e segue uma estrtura AR(p). O termo determinís-tico admite três possibilidades:

Opção 1: dt = 0 (68)

Opção 2: dt = ψ0 (69)

Opção 3: dt = ψ0 + ψ1t (70)

Onde ψ0 e ψ1 são constantes e t é a variável tempo. O objetivo de ERS é testar a hipótesenula H0 : ρ = 1 , correspondente à presença de uma raiz unitária em Yt, contra a alternativaH0 : |ρ| < 1, correspondente a Yt estacionário. Note que embora ρ apareça somente na equação(67) para ut, o modelo para Yt representado pelas equações (66)–(70) é o mesmo que foi usadonos testes ADF e PP e que corresponde à equação (57). Para ver isso, perceba que o processopara Yt descrito nas expressões (66) e (67) é o mesmo usado para caracterizar Yt e Zt nasequações (41) e (42), que deram origem à representação geral da equação (44). Se procedermosde forma análoga agora, isto é, se fizermos algumas manipulações algébricas, como resolvera equação (66) para ut e depois substituir na equação (67), obteremos, para cada opção, as

32

Page 36: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

seguintes representações do processo para Yt:

Opção 1: Yt = ρYt−1 + vt (71)

Opção 2: Yt = ψ0(1− ρ) + ρYt−1 + vt (72)

Opção 3: Yt = ψ0(1− ρ) + ψ1ρ+ ψ1(1− ρ) + ρYt−1 + vt (73)

Ou seja, obtemos em cada opção um caso particular da equação (44) correspondente à repre-sentação geral de processos com raiz unitária para Yt. Fica claro nas expressões (71)–(73) queo processo para Yt apresentará uma raiz unitária se ρ = 1 e nenhuma raiz unitária se |ρ| < 1.Indo um pouco mais além, se subtrairmos Yt−1 de cada uma das expressões, obtemos:

Opção 1: ∆Yt = λYt−1 + vt (74)

Opção 2: ∆Yt = a′ + λYt−1 + vt (75)

Opção 3: ∆Yt = a+ bt+ λYt−1 + vt (76)

Onde λ = ρ − 1, a′ = ψ0(1 − ρ), a = ψ0(1 − ρ) + ψ1ρ e b = ψ1(1 − ρ). Portanto, o objetivo de ERSé equivalente a testar a hipótese nula H0 : λ = 0 contra a alternativa H1 : −2 < λ < 0 nas trêsopções. Isso deixa claro que o teste DF–GLS usa a mesma estrutura do teste ADF, na medidaem que admite que o processo estocástico para Yt descrito em (66)-(67) equivale à expressão(57) de forma que a equação de teste:

• na opção 1, não possua constante nem termo de tendência;

• na opção 2, possua só constante;

• na opção 3, possua constante mais um termo de tendência determinística linear.

Assim, cada opção do teste DF–GLS também permite interpretar as hipóteses nula e alterna-tiva da mesma forma no que concerne à presença/ausência de tendências determinísticas eestocásticas. Veja o quadro 1.

Porém, de forma diferente, o teste DF–GLS considera no lugar da variável uma transforma-ção da mesma que é livre das influências dos termos determinísticos representados pela cons-tante e o termo de tendência. Ao fazerem isso, na prática ERS não alteram o procedimento doteste ADF para a opção 1 (sem constante e sem tendência determinística linear), mas só paraas opções 2 e 3. Assim, é importante observar que é apenas sobre as duas últimas opçõesque incide o procedimento alternativo proposto por ERS segundo o teste DF–GLS. Em ultimainstância, esse procedimento alternativo vai implicar num modo diferente de construção daestatística de teste nessas duas últimas opções.

2.4.2 Estatística do teste DF–GLS

No intuito de construir a variável Yt transformada e obter as estatísticas de testes em cadaopção, ERS seguem um conjunto de passos descritos a seguir. O primeiro passo envolvecomputar por MQG, ao invés de MQO, uma das seguintes regressões para a primeira equaçãodo processo considerado para Yt:

Opção 2: Y ∗t = ψ∗0 + vt (77)

Opção 3: Y ∗t = ψ∗0 + ψ∗1t∗ + vt (78)

onde:

Y ∗t =

{Yt t = 1

Yt − αYt−1 t > 1; t∗ =

{1 t = 1

t− α(t− 1) t > 1e ψ∗0 = ψ(1− α)

O procedimento adotado aqui é do tipo MQG porque regride–se a diferença generalizada deYt, representada pela variável Y ∗t , contra uma constante (opção 2) ou contra uma constantemais a diferença generalizada da variável t (opção 3), representada por t∗. O objetivo de realizaruma das regressões acima consiste em obter estimativas eficientes de ψ0 e ψ1. Na presençade erros autorregressivos de ordem 1, conforme a equação (67), o estimador de MQO deixa

33

Page 37: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

de ser eficiente e neste caso é vantajoso usar o estimador de MQG15. No caso de se usar aopção 1 do teste, em que dt = 0, obviamente não é necessário estimar qualquer parâmetroe portanto não se aplica regredir a primeira equação por MQG. Há um detalhe importante,porém, na estimação por MQG feita em (77) e (78) que é o fato de que algum valor precisa serassumido para ρ, uma vez que é um parâmetro desconhecido. ERS assumem um valor ρ queé determinado segundo a expressão:

ρ = 1− c

T(79)

onde c é uma constante pré-fixada. O valor desta constante é negativo e é escolhido de formaque ρ seja um valor menor mas não muito distante de 1 (daí ERS chamarem o termo ρ de“alternativa local ao ponto”, no caso, ao ponto ρ = 1) e vai ficando cada vez mais próximo de 1quanto maior for o tamanho T da série. ERS mostram que usar os valores c = −7 para a opção2 e c = −13, 5 para a opção 3 promove máxima vantagem em termos de poder do teste. Emsuma, os valores de ρ são determinados de acordo com:

Opção 2: ρ = 1− 7

T(80)

Opção 3: ρ = 1− 13, 5

T(81)

O segundo passo envolve usar os parâmetros ψ0 = ψ∗0/(1 − ρ) e estimados por MQG para“expurgar” de Yt os efeitos do termo determinístico dt. Isso é feito computando–se:

Opção 2: Y dt = Yt − ψ0 (82)

Opção 3: Y dt = Yt − ψ0 − ψ1t (83)

O último passo consiste de substituir Y dt no lugar de Yt na equação de teste, isto é:

∆Y dt = λY dt−1 +

p∑j=1

βj∆Ydt−j + εt (84)

Para então estimá–la por MQO e computar a razão:

Opção 2: tµ = λ/sλ (85)

Opção 3: tτ = λ/sλ (86)

onde λ representa o estimador de MQO para λ e sλ o erro–padrão de λ. Note que não secoloca na equação (84) nem o termo constante e nem o termo de tendência (i.e., tal como essesaparecem no modelo (55). Faz–se assim porque os efeitos desses termos (dada a opção do testeescolhida) já foram removidos pelo procedimento de cômputo de Y dt , como descrito acima.Note também que, em decorrência disso, tµ e tτ possuirão valores diferentes de τµ ou ττ porqueforam construídas por procedimentos diferentes.

ERS apontam que, na opção 2 só com constante, a estatística tµ possui a mesma distribui-ção limite que ττ , isto é, a distribuição de Dickey-Fuller. No entanto, na opção 3 com constantee tendência determinística linear, a distribuição limite é diferente. Os autores usam procedi-mentos de Monte Carlo e tabulam os valores críticos neste caso (ver a tabela 1 do apêndice,reproduzida do artigo de Elliot et al, 1996).

A tabela ??) apresenta os resultados da aplicação do teste DF–GLS nas mesmas sériessimuladas das figuras 2, 3 e 4. Esta tabela está organizada da mesma forma que a tabela 1para o teste ADF, o que permite uma comparação fácil entre os resultados de ambos os testese também com os do teste PP. Nesse sentido, fica fácil perceber que as conclusões obtidasem termos de rejeitar/não rejeitar a hipótese de raiz unitária no caso do teste DF–GLS são asmesmas que as dos testes ADF e PP. Isso era esperado, dado que os procedimentos usam umamesma estrutura de teste com a mesma finalidade (testar a presença de uma raiz unitária) eas séries foram simuladas de forma bem comportada.

15O leitor pode encontrar boas explicações sobre o método de MQG (GLS) , por exemplo, em Johnston e Dinardo(1997).

34

Page 38: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

No entanto, vale tecer algumas observações quanto aos números na tabela ??). O pro-cedimento do teste DF–GLS, assim como o teste ADF, também envolve determinar antes umlag–máximo para a estatística de teste. Os valores de lag–máximo da tabela ??) em geral sãoos mesmos obtidos no teste ADF. Em geral, os valores da estatística–tau são mais próximos dezero se comparados aos correspondentes do teste ADF na tabela 1. Isso também vale para osvalores críticos de 1%, 5% e 10%. Esse aspecto se justifica por razões técnicas que fogem aoescopo deste texto e que decorrem da preocupação de ERS em construir uma opção alternativado teste ADF que apresentasse maior poder. Não são apresentados na tabela ??) os valores deprova, porque o software utilizado para produzir a tabela ??) não os computa. Mesmo assim,mantivemos a coluna de valor de prova nessa tabela para salientar essa diferença em relaçãoaos procedimentos anteriores.

Tabela 3: Teste de raiz unitária DF-GLS para séries simuladasSérie Var. Teste DF-GLS

Opção Lag-Máx Tau 1% 5% 10% V. Prova

Fig. 2a Yt cte 0 -7,62 -2,58 -1,94 -1,62 -Fig. 2b Yt cte 3 -2,71 -2,58 -1,94 -1,62 -Fig. 2b Yt cte+tend 0 -7,96 -3,46 -2,93 -2,64 -Fig. 3a Yt cte 0 -0,98 -2,58 -1,94 -1,62 -Fig. 3b Yt cte+tend 0 -1,28 -3,46 -2,93 -2,64 -Fig. 4a Yt cte 2 -0,26 -2,58 -1,94 -1,62 -Fig. 4c ∆Yt cte 1 -4,74 -2,58 -1,94 -1,62 -Fig. 4b Yt cte+tend 1 -2,23 -3,46 -2,93 -2,64 -Fig. 4d ∆Yt cte 0 -7,50 -2,58 -1,94 -1,62 -

Fonte: Cálculos feitos a partir de dados simulados pelo autor usando o software Eviews7.0. Notas: Var. = variável; cte = com constante; tend = com termo de tendência; Lag–Máx= defasagem máxima da variável dependente na equação de teste. Tau = estatística–τ , τµou ττ , dependendo da versão utilizada.

2.5 Teste Ponto-Ótimo de ERS

No mesmo paper em que apresentam o teste DF–GLS, ERS propõem outro procedimento paratestar a presença de uma raiz unitária. Conhecido como teste ponto–ótimo de ERS, esse outroprocedimento segue usando a estrutura de três opções do teste ADF, como fizeram os outrostestes que vimos até aqui, mas tem a vantagem de apresentar poder ainda maior do queo DF-GLS, inclusive sob circunstâncias em que a serie testada é estacionária mas tem raizpróxima de um. Chamaremos este segundo procedimento de teste ERS–PO e vejamos comoele funciona.

Inicialmente, ERS continuam assumindo que o processo gerador de Yt é dado por (66)–(67)e segundo as três opções para o termo determinístico dt apresentadas em (68)–(70). Assim,o teste ERS–PO vai continuar usando mesma a estrutura do teste ADF, de forma que, emcada opção, as hipóteses nula e alternativa também são interpretadas da mesma forma noque concerne à presença/ausência de tendências determinísticas e estocásticas. Isso torna aaplicação do teste ERS–PO bem fácil, embora como dissemos no caso do teste DF–GLS, aquitambém há aspectos mais complexos, em particular na construção da estatística de teste,cujo desenvolvimento de uma intuição adequada foge ao nível pretendido para este texto. Porisso, nos limitaremos a seguir a apresentar os passos essenciais envolvidos na contrução daestatística do teste ERS–PO. Ao final da seção, um passo-a-passo de implementação do testeserá apresentado.

2.5.1 Estatística do teste ERS-PO

A principal diferença do procedimento de ERS–PO em relação aos anteriores reside na formade computar a estatística de teste. O primeiro passo é o mesmo que no caso do teste DF-GLS,

35

Page 39: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

isto é, envolve computar por MQG uma das seguintes regressões para a primeira equação doprocesso considerado para Yt, como em (66) e (67). No entanto, o objetivo agora é diferente econsiste em obter duas sequências de resíduos , uma sob a hipótese ρ = ρ e outra sob ρ = 1.No caso de se usar a opção 1 do teste, em que dt = 0, obviamente não é necessário estimarqualquer parâmetro e portanto não se aplica regredir a primeira equação por MQG. No entanto,neste caso pode-se computar os resíduos como vρ,t = Yt − ρYt−1 e v1,t = Yt − Yt−1. O valor de ρé determinado previamente ao cômputo das regressões, segundo as expressões (80) e (81):

Num segundo passo, ERS computam a seguinte estatística:

Opção 1: PT =[S(ρ)− ρS(1)]

ω2(87)

Opção 2: Pµ,T =[S(ρ)− ρS(1)]

ω2(88)

Opção 3: Pτ,T =[S(ρ)− ρS(1)]

ω2(89)

onde S(ρ) e S(1) representam a soma dos quadrados dos resíduos vt de acordo com a opçãoescolhida do teste e segundo cada hipótese ρ = ρ e ρ = 1, respectivamente. A fim de facilitara comparação com as estatísticas dos outros testes apresentados anteriormente, pusemos ossubscritos µ e τ nas opções 2 e 3 de PT .

O termo ω2 que aparece no denominador das três estatísticas demanda outro conjuntode procedimentos para ser calculado. Esse termo representa algum estimador consistente davariância de longo prazo de vt, a qual também chamamos anteriormente de “valor do espectrode potência na frequência zero”16, quando estudamos o teste PP. ERS sugerem dois modos dese calcular ω2: o primeiro é adequado quando se tem conhecimento de uma estrutura AR(p)para vt:

ω2AR =

σ2η

1−∑pi=1 ai

(90)

onde σ2η é a variância residual e ai (i = 0, 1, . . . , p) as estimativas de MQO dos parâmetros da

regressão:

∆yt = a0yt−1 + a1∆yt−1 + a2∆yt−2 + · · ·+ ap∆yt−p + ηt. (91)

Na equação (91), ηt é um termo de erro sem correlação serial.O segundo modo de calcular ω2 é adequado para hipóteses mais gerais para a estrutura

de vt (como modelos ARMA(p, q) ou mesmo GARCH) e consiste de uma soma ponderada deautocovariâncias (que ERS chamam simplesmente de “soma de covariâncias” - SC):

ω2SC =

1

T

lT∑m=−lT

K(m/lT )γ(m) (92)

γ(m) =1

T

T−|m|∑t=1

etet+|m| m = −lT , . . . , 0, . . . , lT (93)

onde K(, ) é a janela de defasagem de Parzen (que representa os pesos da soma) e γ(m) é a auto-covariância amostral de lag m dos resíduos et. O termo lT determina a “largura de banda” dasoma, isto é, o número de defasagens incluídas no cômputo de K(, ). Observe, porém, queo cálculo da auto-covariância amostral γ(m) usa resíduos diferentes dos resíduos vt, por issosão definidos com a letra “e” . Os resíduos são obtidos a partir da estimação por MQO de umadas seguintes regressões:

Opção 1: Yt = ρYt−1 + et (94)

Opção 2: Yt = ψ0 + ρYt−1 + et (95)

Opção 3: Yt = ψ0 + ψ1t+ ρYt−1 + et (96)

16Por esse motivo, esses estimadores são também chamados de estimadores espectrais.

36

Page 40: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

Note que essas regressões diferem ligeiramente das que foram usadas para gerar os resíduosvt porque agora coloca-se o termo defasado Yt−1 como mais uma explicativa nas equações eessas são estimadas por MQO ao invés de MQG. Portanto, não se faz uso aqui das hipótesesρ = ρ e ρ = 1, ao invés disso deixa-se o método estimar livremente um valor de ρ através docômputo de ρ.

Isso resume os procedimentos para cômputo da estatística de teste, segundo uma dasopções: PT , Pµ,T ou Pτ,T . Nos três casos, a estatística assume sempre valores positivos e ERSmostram que, sob a condição de ρ fixo e |ρ| < 1 (ou seja, ut estacionário), elas convergemem probabilidade para 0 quando T tende a infinito. Quanto maior o valor, mais evidência afavor da hipótese nula de raiz unitária. Quanto menor, mais evidência a favor da hipótesealternativa de ausência de raiz unitária. A decisão de se rejeitar ou não a hipótese nula de raizunitária é feita pela comparação com o valor crítico pT = pµ,T (δ), no caso das opções 1 e 2, oupT = pτ,T (δ), no caso da opção 3, onde δ é o nível de significância escolhido. Dado o valor de δ,se PT ≤ pT , rejeita-se H0; do contrário, não rejeita-se

2.5.2 Passo a passo do teste ERS

Em termos práticos, o teste de ERS aplica-se de forma bem semelhante aos testes de raizunitária apresentados anteriormente, sendo importante no entanto atentar para seus detalhesespecíficos. Os passos para implementação do teste são descritos a seguir:

1. Análisar o gráfico da série e escolher a opção do teste (o que envolve também determinaro valor de c = −7 ou c = −13, 5);

2. Computar a estatística de teste:

• Executar a regressão correspondente por MQG, segundo (77) ou (78), para obtersequências de resíduos vt sob hipóteses ρ = ρ e α = 1;

• Calcular S(ρ) e S(1);

• Escolher o método para computar ω2:

– Se escolher ω2AR, então determinar um valor de p, estimar por MQO a equação

(91) para computar σ2η e ai (i = 0, 1, . . . , p) e na sequência computar ω2

AR, segundo(90);

– Se escolher ω2SC , regredir por MQO uma das equações (94), (95) ou (96); depois

escolher o lag máximo lT e usar junto com et para computar ω2SC , segundo (92) e

(93);

• Computar a estatística: PT , Pµ,T ou Pτ,T ;

3. Aplicar regra de decisâo: Se PT ≤ pT , rejeita-se H0; do contrário, não rejeita-se.

A tabela 4 apresenta os resultados da aplicação do teste ERS–PO às séries simuladas. Estatabela está organizada como a tabela 2 do teste PP, isto é, sem a coluna de lag–máximo esem a coluna de valor de prova. Todos os resultados para a estatística PT foram calculadosassumindo–se a fórmula (96) de cálculo do denominador pela método das somas de covariân-cias com a janela de Parzen e com a seleção da largura de banda pelo método de Newey–West(1987). Neste caso, o teste ERS–PO, assim como o teste PP, não prescinde do cômputo de umlag–máximo para a equação de teste, que no caso consiste de uma das expressões (74)–(76). Osoftware utilizado não computa os valores de prova para este teste.

Para todas as séries, o teste ERS–PO leva às mesmas conclusões no que concerne à rejeiçãoou aceitação de H0 que os testes anteriores. Esse resultado era naturalmente esperado, dadoque as séries foram simuladas de maneira “bem comportada” segundo padrões desejados.Repare que os valores das estatísticas de teste reportadas são todos positivos, devido às ca-racterísticas específicas da estatística de teste desenvolvida por ERS para o teste ponto–ótimo.Valores muito próximos de zero levaram à rejeição da hipótese de uma raiz unitária e valoresaltos à não rejeição. Foram usadas apenas as opções 2 (constante) e 3 (constante+tendência)do teste, dependendo da característica da séries de parecer não embutir ou embutir uma ten-dência determinística, respectivamente. Os valores críticos reportados de 1%, 5% e 10% são

37

Page 41: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

Tabela 4: Teste ponto–ótimo de Elliot, Rotemberg e StockSérie Var. Teste ponto–ótimo de ERS

Opção PT 1% 5% 10%

Fig. 2a Yt cte 0,50 1,91 3,17 4,33Fig. 2b Yt cte 513,13 1,91 3,17 4,33Fig. 2b Yt cte+tend 1,30 4,05 5,66 6,90Fig. 3a Yt cte 12,25 1,91 3,17 4,33Fig. 3b Yt cte+tend 23,14 4,05 5,66 6,90Fig. 4a Yt cte 48,53 1,91 3,17 4,33Fig. 4c ∆Yt cte 0,51 1,91 3,17 4,33Fig. 4b Yt cte+tend 11,67 4,05 5,66 6,90Fig. 4d ∆Yt cte 0,43 1,91 3,17 4,33

Fonte: Cálculos feitos a partir de dados simulados pelo autorusando o software Eviews 7.0. Notas: cte = com constante, tend= com termo de tendência. PT = estatística de teste utilizada,podendo ser Pµ,T ou Pτ,T , dependendo da opção utilizada. Ométodo de estimação da variância de longo–prazo foi a fórmula doespectro de potência na frequência zero suavizado com a Janelade Parzen. A largura de banda da janela seguiu o método deNewey–West.

próprios para as estatísticas porque a estatística de teste segue uma distribuição diferente dade Dickey–Fuller.

A aplicação do teste ERS–PO à série também nos leva à mesma conclusão que os testesanteriores, isto é, que a mesma apresenta uma raiz unitária acompanhada de uma tendênciadeterminística. O valor obtido para a estatística Pτ,T foi 37,62, situando–se à direita dos valorescríticos 4,22 (1% de sig.), 5,71 (5% de sig.) e 6,77 (10% de sig.).

2.6 Teste ADF com Sazonalidade

Nesta sub-seção, voltamos a falar do teste ADF. Com muita frequência, os dados para nos-sas séries econômicas de interesse estão disponíveis em forma intra-anual, quer dizer, men-sal, bimestral, trimestral, quadrimestral ou semestral. Nesses casos, é natural que as sérieseconômicas apresentem sazonalidade. É preciso então que esse aspecto seja incorporado numprocedimento de teste de raiz unitária para que ele possa detectar adequadamente a presençaou ausência da raiz unitária e o tipo de processo estocástico que está gerando a série. Nocaso do teste ADF, é possível usá-lo de forma bem fácil quando as séries econômicas de inte-resse apresentarem sazonalidade. O procedimento do teste continua basicamente o mesmo,sendo preciso apenas introduzir variáveis dummies sazonais na equação de teste aumentada(57) para modelar o componente de sazonalidade. Dickey e Miller (1986) mostraram que esseprocedimento não afeta a distribuição limite das estatísticas-tau e, consequentemente, elaspodem ser usadas da mesma maneira que antes, assim como as tabelas de valores críticospara as mesmas.

Considere a equação geral de teste aumentada da expressão (57) re-escrita como segue:

∆Yt = a+ bt+

S−1∑s=1

csDst + λYt−1 +

p∑j=1

λj∆Yt−j + ut (97)

Onde Dst representa a dummy sazonal do período s (mês, bimestre, etc.), valendo, portanto,1 nesse período e 0 nos demais. O termo S (em maiúsculas) representa o comprimento dociclo sazonal (12 meses, 6 bimestres, etc.). Todos os demais termos que entram na expressão(97) continuam definidos como antes. Observe que, embora possamos definir um total de Svariáveis dummy, sempre colocamos uma a menos na equação de regressão a ser estimadapara evitar o problema de colinearidade perfeita com a constante da equação.

38

Page 42: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

Alguns autores, como Enders (....) e Johansen (....), recomendam que se use variáveisdummy sazonais centradas no lugar das variáveis dummy usuais. Isso é útil para que, alémdas estatísticas de teste preservarem suas distribuições limite, as estimativas dos demaiscoeficientes da equação (97) - isto é, a, b e λj (j = 1, ..., p) - também não sejam afetadas pelapresença das dummies sazonais. Para isso, devemos redefnir as variáveis dummy da dequação(97) como:

DCst =

{1− 1/S t = s−1/S t 6= s

s = 1, . . . , S (98)

Agora, DCst representa a variável dummy sazonal centrada do período sazonal s. Assim, umavez incorporadas as variáveis dummy sazonais (centradas), podemos seguir os mesmos proce-dimentos descritos antes para implementar o teste ADF. Continuamos tendo três opções parao teste, onde em cada opção continuamos testando H0 : λ = 0 (uma raiz unitária) contra aalternativa H1 : −2 < λ < 0 (sem raiz unitária) e estimando por MQO a equação de teste deacordo com:

Opção 1: ∆Yt =

S−1∑s=1

csDCst + λYt−1 +

p∑j=1

λj∆Yt−j + ut (99)

Opção 2: ∆Yt = a+

S−1∑s=1

csDCst + λYt−1 +

p∑j=1

λj∆Yt−j + ut (100)

Opção 3: ∆Yt = a+ bt+

S−1∑s=1

csDCst + λYt−1 +

p∑j=1

λj∆Yt−j + ut (101)

Nas três opções, continuamos computando a estatística de teste como:

tλ =λ

Exemplo 4. Comércio de Bens de Consumo na Região Metropolitana de São Paulo A figura2.6.a) mostra o gráfico de uma série de dados mensais correspondente ao faturamento realdo comércio de bens de consumo na Região Metropolitana de São Paulo. É nítido pelo gráficoa presença de um padrão sazonal com picos bem salientes nos meses de dezembro de cadaano e vales nos meses de janeiro ou fevereiro. É nítido também um padrão de crescimentopersistente da média da série no longo prazo. Para ajudar a visualizar o comportamento notempo das variações sazonais, a figura 2.6.b) mostra o gráfico da série em primeiras diferenças.É possível perceber nesse segundo gráfico, que as oscilações sazonais se mantém relativamenteestáveis, apresentando apenas um suave aumento de amplitude sazonal nos anos mais parao fim, em particular 2000 e 2001. Diante disso, optamos por trabalhar com a série bruta, semtransformação logarítimica por exemplo. Devido ao padrão crescente exibido pela média dasérie no longo prazo, optamos pela opção 3 do teste ADF e computamos por MQO a equação(101) considerando 11 variáveis dummy (uma para cada mês do ano, começando com janeiro,mas sem a correspondente para o mês de dezembro). Como os dados são mensais, segue queS = 12 e isso nos leva a definir as variáveis dummy sazonais centradas como:

DCst =

{1− 1/12 t = s−1/12 t 6= s

s = 1, . . . , 11. (102)

Os resultados estão apresentados na tabela 5, onde denominamos a variável Yt pela sigla CBC.Antes de computarmos a equação apresentada na tabela 5, tivemos que determinar o lag

máximo dos termos defasados da variável dependente, que no caso foi o lag 2. Esse proce-dimento envolveu estimar a equação algumas vezes, começando sem qualquer lag e aumen-tando progressivamente o número de lags na equação até minimizar o critério de informaçãode Schwarz (SIC na tabela 5). Agora, observe que a variável CBCt−1, correspondente a Yt−1,está destacada em negrito. A razão t calculada para essa variável é de -2,31. Na parte infe-rior da tabela 5, esse valor é copiado no item referente à estatística ADF. Logo abaixo, vêm os

39

Page 43: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

(a) Nível (b) Primeiras Diferenças

Figura 7: Série Mensal de Comércio de Bens de Consumo na Região Metropolitana de SãoPaulo, Janeiro de 1990 a Dezembro de 2013.

Fonte: Federação de Comércio de São Paulo. Dados referem-se ao Índice de Faturamento Real (Basemédia de 1998=100).

Tabela 5: Equação de Teste com variáveis dummy sazonais para o Comércio de Bens de Con-sumo (Variável Dependente: ∆CBCt) da RMSP

Var. Explic. Coef. Erro-padrão Razão-t Valor-pC 5,63 2,44 2,31 0,02t 0,04 0,02 2,18 0,03DC1 -68,04 3,52 -19,35 0,00DC2 -50,99 4,17 -12,24 0,00DC3 -37,63 4,34 -8,67 0,00DC4 -36,98 1,99 -18,60 0,00DC5 -31,94 1,90 -16,80 0,00DC6 -42,44 1,93 -21,95 0,00DC7 -36,61 1,93 -18,98 0,00DC8 -34,36 2,01 -17,05 0,00DC9 -38,20 1,90 -20,15 0,00DC10 -34,60 1,88 -18,45 0,00DC11 -37,16 1,92 -19,33 0,00CBCt−1 -0,10 0,04 -2,31 0,02∆CBCt−1 -0,32 0,08 -3,90 0,00∆CBCt−2 -0,12 0,08 -1,57 0,12R2 0,93R2 − ajustado 0,93SIC 6,43Estaíst. ADF ττ -2,31Valor crítico 1% -4,02Valor crítico 5% -3,44Valor crítico 1% -3,14Fonte: Cálculos feitos a partir de dados simulados pelo autorusando o software Eviews 7.0.

valores críticos associados ao tamanho de amostra usado, de T = 165 observações. O valorde ττ = −2, 31 portanto, situa-se à direita do valor crítico de 10%, correspondente a -3,14.Decidimos, então, pela não rejeição da hipótese nula e admitimos que a série apresenta umaraiz unitária. Como a opção do teste foi a opção 3, concluímos ainda que a série apresentauma tendência estocástica mais uma tendência determinística, quando controlamos para asinfluências do component sazonal.

Neste caso, é interessante verificar se a série apresenta mais alguma raiz unitária, o quepermitirá determinar a ordem de integração da mesma. A tabela 6 apresenta resultados para aaplicação do teste ADF considerando sazonalidade para a primeira diferença da série de fatu-

40

Page 44: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

ramento mensal de bens de consumo na RMSP. Optamos pela opção 2 aqui porque o gráfico dasérie apresentado na figura 2.6.b) sugere a ausência de uma tendência determinística linearna série em primeiras diferenças. Repare também que temos de adaptar a equação de testeem (97) para refletir o fato de que agora estamos examinando a série em primeiras diferenças,escrevendo:

∆2Yt = a+

S−1∑s=1

csDCst + λ∆Yt−1 +

p∑j=1

λj∆2Yt−j + ut (103)

Ou seja, na equação (103) consideramos ∆2Yt como variável dependente no lado esquerdoe ∆Yt−1 como variável explicativa no lado direito. Novamente, apresentamos em negrito arazão-t, no valor de -11,99, para a variável explicativa ∆CBCt−1, correspondente à ∆Yt−1 naexpressão (103). Na parte inferior da tabela 6, este valor é copiado para o lado direito daestatística ADF (tau-mi). Este valor situa-se à esquerda do valor crítico de 1%, o que nos levaa decidir pela rejeição da hipótese nula de raiz unitária. Assim, quando controlamos para apresença de sazonalidade e consoante com o gráfico da figura 2.6.b), concluímos que a sérieem primeiras diferença não apresenta tendência alguma e constitui um processo estacionário;e mais, concluímos também que a série em nível é I(1).

Tabela 6: Equação de teste com variáveis dummy Sazonais para a primeira diferença do Co-mércio de Bens de Consumo (variável dependente ∆2CBCt) da RMSP

Var. Explic. Coef. Erro-padrão Razão-t Valor-pC 0,41 0,39 1,06 0,29DC1 -69,83 3,47 -20,14 0,00DC2 -51,69 4,20 -12,30 0,00DC3 -38,10 4,38 -8,69 0,00DC4 -36,46 2,00 -18,27 0,00DC5 -31,44 1,91 -16,48 0,00DC6 -42,33 1,95 -21,67 0,00DC7 -36,31 1,95 -18,66 0,00DC8 -34,15 2,03 -16,78 0,00DC9 -37,99 1,91 -19,84 0,00DC10 -34,45 1,90 -18,18 0,00DC11 -37,18 1,94 -19,13 0,00∆CBCt−1 -1,53 0,13 -11,99 0,00∆2CBCt−1 0,15 0,08 1,96 0,05R2 0,98R2 − ajustado 0,97SIC 6,40Estatíst. ADF τµ -11,99Valor crítico 1% -3,47Valor crítico 5% -2,88Valor crítico 1% -2,58Fonte: Cálculos feitos a partir de dados simulados pelo autorusando o software Eviews 7.0.

3 Comentários Finais

Este texto foi produzido com o propósito didático de introduzir de forma mais clara e precisa al-guns tópicos que são centrais no entendimento da moderna EST. Esses tópicos dizem respeitoàs noções de processo integrado e de raíz unitária, assim como aos procedimentos de teste deraiz unitária baseados na estrutura de Dickey e Fuller. Trabalhamos numa das abordagensdisponíveis para esse teste, isto é, baseada no uso da razão t (aqui chamada de estatísticaτ . Apresentamos uma formulação em que alguns de seus detalhes são ignorados em outros

41

Page 45: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

textos didáticos, inclusive alguns livros texto. Esses aspectos ignorados podem implicar em in-terpretações e aplicações incorretas do procedimento de Dickey Fuller, como a confusão entretendência determinística e processo de raiz unitária e as consequências nefastas de se ignorara presença de sazonalidade.

Atualmente, há uma variedade de outros testes de raíz unitária disponíveis. Esses outrosprocedimentos de teste são adequados seja como alternativas aos quatro procedimentos deteste que apresentamos aqui, seja como procedimentos para situações específicas apresenta-das pelas séries. No último caso, por exemplo, são muito usados atualmente os testes de raizunitária na presença de quebra estrutural da série. O bom preparo como econometrista espe-cialista em econometria de séries de tempo depende de se investir em aprender esses outrosprocedimentos de teste de raíz unitária. Esperamos que este texto tenha servido como umstart-up.

42

Page 46: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

Apêndices

A Decomposição de Beveridge e Nelson

Os econometristas que estudaram fenômenos como os ciclos econômicos sempre buscaramextrair do comportamento dinâmico de uma série temporal o componente de tendência, paraque, assim, pudessem estudar o componente de ciclo. Para séries que seguem o processotendência estacionária, esta decomposição é trivial e envolve subtrair da série o componentede tendência determinística linear.

No entanto, para séries que apresentam raiz unitária, como a série que segue o processodiferença estacionária, esse procedimento não é suficiente. Elimina-se a tendência determinís-tica linear do comportamento da série mas permanece o componente de tendência estocástica.A idéia da decomposição de Beveridge e Nelson (BN) é modelar uma série não estacionáriacomo a soma de uma tendência estocástica, também chamado componente secular, e umcomponente estacionário, também chamado de componente cíclico.

Este apêndice explica, de forma sucinta, como se procede para decompor um processo deraiz unitária em uma parte que é tendência estocástica e outra que é um componente cíclicoestacionário, ou I(0). Para tanto, partimos da representação de um processo de raiz unitáriacomo:

Zt = Zt−1 + ut (104)

onde Zt representa uma variável de interesse e ut é um termo de erro estacionário, ou I(0), commédia nula. Em particular, vamos assumir que ut segue um processo ARMA(p, q) estacionárioe invertível, que pode ser representado como:

ut = ψ(B)εt (105)

onde εt é um erro aleatório que segue um processo ruído branco e ψ(B) é a razão entre ospolinômiosw média móvel e autorregressivo:

ψ(B) =θ(B)

φ(B). (106)

O polinômio ψ(B) apresenta grau infinito mas corresponde a uma série infinita convergente,devido ao fato que os polinômios finitos de grau p, representado por φ(B), e de grau q, repre-sentado por θ(B), ambos apresentam todas as raízes fora do círculo unitário por hipótese. Emoutras palavras, o polinômio ψ(B) permite representar ut como uma média móvel infinita doserros εt em (A.2). Agora, vamos definir:

ψ∗(B) =[ψ(B)− ψ(1)]

1−B(107)

onde φ(1) representa a soma dos coeficientes da média móvel infinita dos erros εtem (A.2). Estasoma é convergente, isto é, corresponde a um número real finito, em consequência das hipó-teses adotadas até aqui. Dados todos esses elementos, podemos então aplicar a decomposiçãoBN. Primeiro, lembremos que nosso objetivo é re-escrever o processo para Zt em (A.1) como:

Zt = TEt + wt (108)

onde TEt representa uma tendência estocástica, ou um passeio aleatório, e wt representa umcomponente cíclico estacionário, ou I(0). Esses componentes, segundo a decomposição BN,são obtidos como:

TEt = ψ(1)

t∑i=1

εi (109)

wt = ψ∗(B)εt (110)

43

Page 47: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

Note que∑ti=1 εi é um passeio aleatório com média nula multiplicando uma constante finita

dada por ψ(1), daí TEt ser um passeio aleatório também. O termo dado por wt correspondea uma média móvel infinita dos erros εt onde o polinômio média móvel, neste caso dado porψ∗(B), é convergente fazendo com que wt seja estacionário ou I(0).

Portanto, a decomposição BN permite representar duas situações de interesse. O caso emque o processo estocástico para a variável de interesse Yt é de tipo raiz unitária:

Yt = Yt−1 + ut = TEt + wt (111)

Neste caso, Yt não possui tendência determinística, só tendência estocástica. E o caso em queo processo para Yt é de tipo diferença estacionária:

Yt = a+ Yt−1 + ut =

{Yt = TDt + ZtZt = Zt−1 + ut

}= TDt + TEt + wt (112)

onde TDt = ψ0 + ψ1t e a = ψ1.

44

Page 48: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

B Relações Entre Conceitos

Figura 8: Fonte: Elaboração do autor usando conceitos e definições apresentados no texto. As relaçõesforam estabelecidas com base na definição restrita de Engle e Granger (1987) para processo integrado. Ostermos ARMA(p, q) e ARIMA(p, d, q) se referem à representação com constante e condição de invertibilidade.O conceito de processo com d raízes unitárias (na parte AR) não aparece na figura, mas equivale ao deprocesso integrado ou I(d).

45

Page 49: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

Referências

[1] Beveridge, S. e Nelson, C. A new approach to decomposition of economic time series intopermanente and transitory componentes with particular attention to measurement of the‘Business Cycle’. Journal of Monetary Economics 7, 151–174.1981.

[2] Campbell, J. Y. e Perron, P. Pitfalls and opportunities: what macroeconomists should knowabout unit roots. National Bureau of Economic Research Macroeconomics Annual 1991,Volume 6. 141–220. 1991.

[3] Chatfeld, C. The analysis of time series. 5th Edition. Nova York: Chapman & Hall/CRC.1995.

[4] Dickey, D. A., Bell, W. R. e Miller, R. B. Unit roots in time series models: tests and implica-tions. The American Statistician, 40 (1), 12–26. 1986.

[5] Dickey, D.A. e W.A. Fuller. Distribution of the Estimators for Autoregressive Time Serieswith Unit Root. Journal of the American Statistical Association, 74, 427-431. 1979.

[6] Dickey, D. A. e Fuller, W. A. Likelihood ratio statistics for autoregressive time series with aunit root. Econometrica 49, 4, 1057–1072. 1981.

[7] Dickey, D.A. e Pantula, S. Determining the Order of Differencing in Autoregressive Proces-ses. Journal of Business and Economic Statistics, n. 5, 455-461. 1987.

[8] Enders, W. Applied Econometric Time Series. 2nd. Edition. Nova York: Wiley.2003.

[9] Engle, R.F. e C.W.J. Granger. Co-Integration and Error Correction: Representation, Esti-mation and Testing. Econometrica, 55, 251-276. 1987.

[10] Engle, R. F. Introdução a Co-integração. Tradução do primeiro capítulo (Introduction)Long–Run Economic Relationships: Readings in Cointegration. 1990.

[11] Fuller, W.A. Introduction to Statistical Time Series. New York: John Wiley. 1976.

[12] Fuller, W.A. Introduction to Statistical Time Series. 2nd Edition. New York: John Wiley.1995.

[13] Granger, C. e Newbold, P. Spurious regression in econometrics. Journal of Econometrics2, 111-120. 1974.

[14] Hamilton, J. Time series analysis. Princeton: Princeton University Press. 1994.

[15] Harvey, A. Trends and cycles in macroeconomic time series. Journal of Business & Eco-nomic Statistics 3, 3, 216–227. 1985.

[16] Harvey, A, C. Trends, Cycles and Autoregression, The Economic Journal, 107, 192-201.1997.

[17] Hooker, R. H. Correlation of the marriage–rate with trade. Journal of The Royal StatisticalSociety 64, 485–492. 1901.

[18] Johansen, S. Estimation and Hypothesis Testing of Cointegration Vectors in GaussianVector Autoregressive Models. Econometrica, 59, 1551-1580. 1991.

[19] Lütkepohl Autorregreção Vetorial. Tradução de Lütkepohl, H. Vector Autoregressions,Discussion Paper 4, SFB 373, disponibilizado no site do National Research Center /Quantification and Simulation of Economic Processes da Humbolt Universität, Berlim(http://sfb.wiwi.hu-berlin.de/papers). 1999.

[20] MacKinnon, J. G. Numerical Distribution Functions for Unit Root and CointegrationTests. Journal of Applied Econometrics, Vol. 11, No. 6, 601-618. 1996.

46

Page 50: TENDÊNCIAS E R UNITÁRIAS - UFJFsíntese de alguns testes de raíz unitária muito usados em EST. Antes de apresentar os testes, faz–se uma breve discussão sobre a estrutura de

[21] Maddala, G. S. e Kim, In-Mo. Unit roots, cointegration, and structural change. Cambridge,UK: Cambridge University Press. 1999.

[22] Nelson, C. e Plosser, C. Trends and random walks in macroeconomic time series: someevidence and implications. Journal of Monetary Economics 10, 130-162. 1982.

[23] Newey, W. K. e West, K. D. A Simple, Positive Semi-definite, Heteroskedasticity and Auto-correlation Consistent Covariance Matrix. Econometrica. 55 (3), 703–708. 1987.

[24] Ogaki, M. e Park, J.Y. A cointegration approach to estimating preference parameters.Journal of Econometrics 82, 107-134. 1997.

[25] Phillips, P.C.B. Time series regression with a unit root. Econometrica, 55, 277-301. 1987.

[26] Phillips, P. C. B. The mysteries of trend. Macroeconomic Review. 82–89. 2010.

[27] Phillips, P.C.B. e Perron, P. Testing for a unit root in time series regression. Biometrika75,2, 335–346. 1988.

[28] Schimidth, P. e Phillips, P. C. B. LM testes for a unit root in the presence of deterministictrend. Oxford Bulletin of Economics and Statistics. 54,3. 257–287. 1992.

[29] Sims, C.A. Macroeconomics and Reality, Econometrica. 48, 1-48. 1980.

[30] Stock, J. Unit roots, structural breaks, and trends. In Engle, R. e McFadden, D. Handbookof Econometrics, Chapter 46. Nova York: Elsevier. 1994.

[31] Stock, J. e Watson, M. Testing for common trends. Journal of The American StatisticalAssociation 83, 1097-1107. 1988.

47