Download - Analise de Variaveis Canonicas
-
5/21/2018 Analise de Variaveis Canonicas
1/26
Anlise de Variveis CannicasCarlos Alberto Alves Varella
Dimensionalidade das variveis cannicasVetores cannicosPorcentagem de variao das cannicas
Exemplo de aplicao
ANLISE MULTIVARIADA APLICADA AS CINCIAS AGRRIASPS-GRADUAO EM AGRONOMIA CINCIA DO SOLO: CPGA-CS
-
5/21/2018 Analise de Variaveis Canonicas
2/26
Introduo
A anlise de variveis cannicas permite a
reduo da dimensionalidade de dados; semelhante a componentes principais e
correlaes cannicas.
especialmente empregada em anlisesdiscriminantes realizadas a partir de amostrascom observaes repetidas.
-
5/21/2018 Analise de Variaveis Canonicas
3/26
Objetivo da anlise
A anlise procura, com base em um grande
nmero de caractersticas originaiscorrelacionadas, obter combinaes linearesdessas caractersticas denominadas variveis
cannicas de tal forma que a correlao entreessas variveis seja nula (KHATTREE & NAIK,2000).
-
5/21/2018 Analise de Variaveis Canonicas
4/26
Vantagem da tcnica
A utilizao dessa tcnica permite capturar o
efeito simultneo de caractersticas originais; Pode capturar variaes no percebidas
quando do uso de caractersticas originais
isoladamente; A primeira varivel cannica a funo
discriminante linear de Fisher;
So funes discriminantes timas, ou seja,maximizam a variao entre tratamentos emrelao variao residual
-
5/21/2018 Analise de Variaveis Canonicas
5/26
A variao cannica
A variao de tratamentos, nesta anlise,
expressa por uma matriz denominada H,composta pela soma de quadrados e produtosde tratamentos;
A variao residual expressa pela matriz E,composta pela soma de quadrados e produtosdo resduo;
As matrizes He Eso obtidas de uma anlisede varincia multivariada: MANOVA.
-
5/21/2018 Analise de Variaveis Canonicas
6/26
Dimensionalidade das variveis
A dimensionalidade o nmero de variveis
cannicas obtidas na anlise; Pode tambm ser entendida como o nmero de
razes no nulas da Equao1.
(1)
EH
H= matriz de soma de quadrados e produtos detratamentos;
= autovalores da Equao 1;
ne= graus de liberdade do resduo;
=matriz de covarincia.
-
5/21/2018 Analise de Variaveis Canonicas
7/26
Teste de dimensionalidade
Numa anlise de varincia varinica
multivariada com k tratamentos, usualmentetestamos a hiptese:
Esta hiptese equivalente ao teste de queno h diferena entre os vetores de mdias
de tratamentos, isto :
-
5/21/2018 Analise de Variaveis Canonicas
8/26
A importncia da dimensionalidade
Se H0 verdadeira, conclumos que os vetores
so idnticos. Ento H0verdadeira implica emd=0.
Se H0 rejeitada, de importncia se
determinar a real dimensionalidade d; Se d=t no h nenhuma restrio sobre os
vetores de mdias;
Em qualquer caso tem-se que:
-
5/21/2018 Analise de Variaveis Canonicas
9/26
Nmero de variveis cannicas
Em uma anlise de varincia multivariada o
nmero de variveis estudas normalmente maior que nmero de tratamentos;
A regra significa que: o nmero de variveis
cannicas ser no mximo igual ao nmero degraus de liberdade de tratamentos (q).
d= dimenso mxima;
p= nmero de variveis;
q= nmero de graus de liberdade de tratamentos;
k= nmero de tratamentos.
-
5/21/2018 Analise de Variaveis Canonicas
10/26
Porque existe a necessidade do teste
Quando trabalhamos com dados observados,
um autovalor pode ser muito pequeno sempropriamente ser nulo;
Um teste de verificao da dimensionalidade
torna-se necessrio; A aproximao mais adequada, nesse caso,
segundo REGAZZI (2000), aquela proposta
por BARTLETT (1947).
-
5/21/2018 Analise de Variaveis Canonicas
11/26
Teste proposto por BARTLETT (1947)
O teste feito sequencialmente para d=0, d=1, etc,
at que um resultado no significativo aparea; Se at d-1 se obtiver resultados significativos, mas em
d no, infere-se que a dimensionalidade d;
A estatstica proposta por BARTLETT (1947) obtida
atravs da Equao 3.
A estatstca , assintoticamente tem distribuio qui-quadrada 2f com
(3)
-
5/21/2018 Analise de Variaveis Canonicas
12/26
Vetores cannicos
Vetores cannicos so os autovetores j associadosaos autovalores jno nulos da matriz determinante;
L o j-simo vetor cannico obtido na anlise; L normalizado de modo que:
A projeo de um ponto X (observaes) sobre ohiperplano estimado pode ser representada em
termos de coordenadas cannicas d-dimensional:
-
5/21/2018 Analise de Variaveis Canonicas
13/26
Mdias cannicas
As mdias cannicas dos k tratamentos so:
As mdias cannicas representam a projeodo grupo de mdias sobre o hiperplanoestimado e podem ser usadas para estudar asdiferenas entre grupos (tratamentos).
-
5/21/2018 Analise de Variaveis Canonicas
14/26
Varivel cannica
A j-sima varivel cannica representada por:
j-sima varivel cannica; j-simo vetor cannico;
vetor de caractersticas originais.
P t d i
-
5/21/2018 Analise de Variaveis Canonicas
15/26
Porcentagem de variao
A porcentagem de variao entre tratamentos
explicada pelas primeiras d variveis cannicas o resultado da diviso da soma dosautovalores dpela soma dos autovalores p,isto :
d= nmero de variveis cannicas; p= nmero de variveis originais.
P di t CANDISC SAS
-
5/21/2018 Analise de Variaveis Canonicas
16/26
Procedimento CANDISC - SAS O exerccio abaixo exemplifica o uso do procedimento
CANDISC do SAS para anlise de variveis cannicas.dataexemplo;
title'Exemplo de Anlise de Variveis Cannicas DIC';input trat rep X1 X2;
cards;
1 1 4.63 0.95
1 2 4.38 0.89
1 3 4.94 1.01
1 4 4.96 1.23
1 5 4.48 0.94
2 1 6.03 1.08
2 2 5.96 1.19
2 3 6.16 1.08
2 4 6.33 1.19
2 5 6.08 1.08
3 1 4.71 0.96
3 2 4.81 0.93
3 3 4.49 0.87
3 4 4.43 0.82
3 5 4.56 0.91
;
P di t CANDISC SAS
-
5/21/2018 Analise de Variaveis Canonicas
17/26
Procedimento CANDISC - SAS
proccandiscdata=exemplo out=can all;
classtrat;varX1 X2;
run;
procplot;plotcan2*can1 = trat / vpos=20;
run;
P di t G fi
-
5/21/2018 Analise de Variaveis Canonicas
18/26
Procedimento para Grficos
%let plotitop = gopts = gsfmode = replace
gaccess = gsasfile device = gif
hsize = 8.00 vsize = 6.00
cback = white,
cframe = ligr,
color = black,colors = green blue red,
options = noclip expand, post=myplot.gif;
%plo ti t(data=can, plo tvars=Can2 Can1,
labelvar=_blank_, symvar=symbol, typevar=symbol,symsize=1, sym len=4, exttypes=symbo l, ls=100,
tsize=1.0, extend=c lose);
-
5/21/2018 Analise de Variaveis Canonicas
19/26
Interpretao dos resultados do S S
Exemplo de Anlise de Variveis Cannicas DIC 16
21:59 Thursday, March 28, 2007
The CANDISC Procedure O Procedimento CANDISCObservations 15 DF Total 14 GL total
Variables 2 DF Within Classes 12 GL de resduo
Classes (trat) 3 DF Between Classes 2 GL de tratamentos
Class Level Information Probabilidades a priori
Variabletrat Name Frequency Weight Proportion
1 _1 5 5.0000 0.3333332 _2 5 5.0000 0.333333
3 _3 5 5.0000 0.333333
M t i E H A
-
5/21/2018 Analise de Variaveis Canonicas
20/26
Matrizes E, H e AExemplo de Anlise de Variveis Cannicas DIC 18
21:59 Thursday, March 28, 2007
The CANDISC Procedure
Pooled Within-Class SSCP Matrix MatrizE Resduo
Variable X1 X2
X1 0.4579600000 0.1512000000
X2 0.1512000000 0.0975200000
Between-Class SSCP Matrix Matriz HTrat
Variable X1 X2
X1 7.247640000 0.870100000
X2 0.870100000 0.127853333
Total-Sample SSCP Matrix MatrizATotal
Variable X1 X2
X1 7.705600000 1.021300000
X2 1.021300000 0.225373333
M t i d i i
-
5/21/2018 Analise de Variaveis Canonicas
21/26
Matrizes de covarinciasExemplo de Anlise de Variveis Cannicas DIC 19
21:59 Thursday, March 28, 2007
The CANDISC Procedure
Within-Class Covariance Matrices Matrizes Covdentro de trat
trat = 1, DF = 4
Variable X1 X2
X1 0.0696200000 0.0286350000
X2 0.0286350000 0.0177800000--------------------------------------------------------------------
trat = 2, DF = 4
Variable X1 X2
X1 0.0201700000 0.0018150000
X2 0.0018150000 0.0036300000
--------------------------------------------------------------------
trat = 3, DF = 4
Variable X1 X2
X1 0.0247000000 0.0073500000
X2 0.0073500000 0.0029700000
C fi i t d l
-
5/21/2018 Analise de Variaveis Canonicas
22/26
Coeficiente de correlaoExemplo de Anlise de Variveis Cannicas DIC 21
21:59 Thursday, March 28, 2007
The CANDISC Procedure
Within-Class Correlation Coefficients / Pr > |r|trat = 1
Variable X1 X2
X1 1.00000 0.81389 Correlao
0.0936 Significncia
X2 0.81389 1.00000
0.0936
trat = 2
Variable X1 X2
X1 1.00000 0.21211Correlao
0.7320Significncia
X2 0.21211 1.00000
0.7320
trat = 3Variable X1 X2
X1 1.00000 0.85814Correlao
0.0628Significncia
X2 0.85814 1.00000
0.0628
R lt d d MANOVA
-
5/21/2018 Analise de Variaveis Canonicas
23/26
Resultado da MANOVAMultivariate Statistics and F Approximations MANOVA
S=2 M=-0.5 N=4.5
Statistic Value F Value Num DF Den DF Pr > F
Wilks' Lambda 0.03142928 25.52 4 22
-
5/21/2018 Analise de Variaveis Canonicas
24/26
Proporo acumulada de varinciaLikelihood Approximate
Eigenvalue Difference Proportion Cumulative Ratio F Value Num DF Den DF Pr > F
1 22.6963 22.3536 0.9851 0.0314 25.52 4 22
-
5/21/2018 Analise de Variaveis Canonicas
25/26
Vetores cannicos
Raw Canonical Coefficients Vetores cannicos
Variable Can1 Can2
X1 7.16645900 -1.52496137
X2 -8.80246974 13.21432007
Mdias cannicas
-
5/21/2018 Analise de Variaveis Canonicas
26/26
Mdias cannicas
Class Means on Canonical Variables Mdias cannicas
trat Can1 Can2
1 -3.198161274 0.627615714
2 6.022244556 0.026539512
3 -2.824083283 -0.654155226