mestrado profissional em administração -...
TRANSCRIPT
Mestrado Profissional em Administração
Disciplina: Análise Multivariada
Professor: Hedibert Freitas Lopes
1º trimestre de 2015
2
Análise de Correspondência
MANLY, Cap. 10 HAIR et al., Cap. 8 Talbot & Talbot (2005) Correspondence Analysis and Data Coding with Java and R. Greenacre (2007) Correspondence Analysis in Practice, Second Edition.
3
Introdução
É um procedimento gráfico para representar associação em tabelas de contingência.
Obje t i vo : o b te r u m g r á f i c o ( g e r a l m e n te bidimensional) que represente a relação de dependência entre linhas e colunas da tabela.
Exemplo: ! Pesquisa de marketing em que foram entrevistados
1320 consumidores de aparelhos de som, perguntando-se qual a marca adquirida e qual a principal razão para a escolha de tal marca.
4
Exemplo: Marcas de Som
Atributo Qualidade
de som Tecnologia Avançada
Potência do som
Recursos Técnicos Preço
Confiança na Marca
Total
Marca Sony 135 140 95 55 40 60 525 Aiwa 50 115 40 60 5 15 285 Gradiente 90 55 20 35 40 10 250 Philips 60 25 35 10 5 30 165 Sharp 30 20 5 10 10 20 95 Total 365 355 195 170 100 135 1320
• Interesse: estudar associação entre a marca e a razão da escolha dela pelo consumidor.
• Forma de medir o grau de associação entre as variáveis: estatística qui-quadrado de Pearson.
• No exemplo, Χ2 = 179,62 e o p-valor é <0,001.
5
Notação Genericamente,
Seja X = [xij], E=[eij], eij = xi.x.j/x.., i=1,2,...,m e j=1,2,...,n. A análise de correspondência utiliza a distância de qui-quadrado
para obter a melhor representação gráfica (proporcional à distância euclidiana ponderada).
Variável 2 Categ. 1 Categ. 2 ... Categ. j ... Categ. n
Total
Variável 1
Categ. 1 x11 x12 . . . x1j . . . x1n x1.
Categ. 2 x21 x21 . . . x21 . . . x21 x2. : : : : : : Categ. i xi1 xi2 . . . xij . . . xin xi. : : : : : : Categ. m xm1 xm2 . . . xmj . . . xmn xm. Total x.1 x.2 . . . x.j . . . x.m x..
6
Os perfis das linhas definem m pontos no espaço euclidiano n-dimensional.
AtributoQualidade
de somTecnologiaAvançada
Potênciado som
RecursosTécnicos Preço
Confiançana Marca
Total
Marca Sony 25,71 26,67 18,10 10,48 7,62 11,43 100Aiwa 17,54 40,35 14,04 21,05 1,75 5,26 100
Gradiente 36,00 22,00 8,00 14,00 16,00 4,00 100Philips 36,36 15,15 21,21 6,06 3,03 18,18 100Sharp 31,58 21,05 5,26 10,53 10,53 21,05 100Total 27,65 26,89 14,77 12,88 7,58 10,23 100
Interpretação dos Perfis Linha
7
• 27,65% escolhem a marca em função da qualidade do som e 7,58% escolhem por causa do preço.
• Com relação aos consumidores que compraram produto da marca Gradiente, 36% o fizeram devido à qualidade do som e 16% devido ao preço, que são porcentagens um pouco acima de suas respect ivas porcentagens observadas na população em geral.
Interpretação dos Perfis Linha
8
Os perfis das colunas definem n pontos no espaço euclidiano m-dimensional.
Interpretação dos Perfis Coluna
AtributoQualidade
de somTecnologiaAvançada
Potênciado som
RecursosTécnicos Preço
Confiançana Marca
Total
Marca Sony 36,99 39,44 48,72 32,35 40,00 44,44 39,77Aiwa 13,70 32,39 20,51 35,29 5,00 11,11 21,59
Gradiente 24,66 15,49 10,26 20,59 40,00 7,41 18,94Philips 16,44 7,04 17,95 5,88 5,00 22,22 12,50Sharp 8,22 5,63 2,56 5,88 10,00 14,81 7,20Total 100 100 100 100 100 100 100
9
Interpretação dos Perfis Coluna
• 39,77% escolheram a marca Sony e 7,20%, a marca Sharp .
• Com relação aos consumidores preocupados com o atributo tecnologia avançada, 32,39% escolhem a marca Aiwa, que é maior do que 21,59%, que é a porcentagem observada na população total. Dentro de Recursos técnicos, 35,29% escolheram a marca Aiwa. Esta marca parece estar mais associada a estes 2 atributos.
10
Desenvolvimento Algébrico
Na análise de correspondência, o interesse está na análise dos perfis das linhas e das colunas e não nos valores brutos. O perfil de uma linha é dado pela probabilidade condicional de uma observação pertencer à coluna j dado que ela pertence à linha i. De maneira análoga, o perfil de uma coluna é a probabilidade condicional de uma observação pertencer à linha i dado que ela pertence à coluna em questão.
11
Desenvolvimento Algébrico
Perfis das linhas: verificamos como se distribuem os diferentes atributos para cada marca avaliada.
Perfis das colunas: verificamos como se distribuem as diferentes marcas para cada atributo avaliado.
12
A tabela a seguir apresenta os autovalores e as inércias obtidas:
Autovalor Inércia Principal Porcentagem Porcentagemacumulada
0,26781 0,07172 52,71 52,710,22283 0,04965 36,49 89,200,10228 0,01046 7,69 96,880,06511 0,00424 3,12 100,00
Total 0,13608 100 -
Avaliação da Análise
13
Coordenadas dos pontos determinados pelas linhas e dos pontos determinados pelas colunas da tabela:
Dimensão 1 Dimensão 2Pontos Linhas Sony 0,0320 -0,0804
Aiwa -0,4703 -0,0326Gradiente 0,1386 0,4188Philips 0,3286 -0,3301Sharp 0,2989 0,0131
Pontos Colunas Qualidade do som 0,2246 0,0713Tecnologia avançada -0,2924 0,0006Potência do som -0,0002 -0,2773Recurso técnico -0,3368 0,1350Preço 0,3399 0,5320Confiança na marca 0,3342 -0,3578
Construção do Gráfico
14 Dimension 1 (52.7%)
Dim
ensi
on 2
(36.
5%)
-0.6 -0.4 -0.2 0.0 0.2 0.4
-0.2
0.0
0.2
0.4
Sony
Aiwa
Gradient
Philips
Sharp
Qualidade do Som
Tecnologia Avancada
Potencia do Som
Recursos Tecnicos
Preco
Confianca na Marca
15
install.packages("ca") library(ca) data=matrix(c(135,140,95,55,40,60,50,115,40,60,5,15,90,55,20,35, 40,10,60,25,35,10,5,30,30,20,5,10,10,20),ncol=6,byrow=TRUE) data = data.frame(data) names(data) <- c("Qualidade do Som","Tecnologia Avancada", "Potencia do Som","Recursos Tecnicos","Preco","Confianca na Marca") rownames(data) <- c("Sony","Aiwa","Gradient","Philips","Sharp") CA = ca(data) summary(CA) plot(CA)
Leitura complementar Murtagh (2005) Correspondence Analysis and Data Coding with Java and R. Chapman&Hall/CRC. Greenacre (2007) Correspondence Analysis in Practice (2nd Ed). Chapman&Hall/CRC. Greenacre (2007) Constructing maps of data using correspondence analysis.http://statmath.wu.ac.at/courses/CAandRelMeth/greenacreCA.pdf
17
Escalonamento Multidimensional
MANLY, Cap. 11. HAIR et al., Cap. 10. Everitt &Hothorn (2011) An Introduction to Applied Multivariate Analysis with R - Cap. 4. Izenman (2008) Modern Multivariate Statistical Techniques: Regression, Classification,and Manifold Learning, Cap 13.
18
Objetivo A partir de uma matriz de similaridade (ou de
dissimilaridade) entre objetos (marcas, por
exemplo) criar variáveis (dimensões/ fatores)
q u e e x p l i q u e m a s s e m e l h a n ç a s
(dessemelhanças) expressas nessa matriz.
Os objetos são denominados estímulos.
Posicionamento de marcas.
• TABLE 13.1. Some application areas and research topics in MDS.
• Psychology: Study the underlying structure of perceptions of different classes
• of psychological stimuli (e.g., personality traits, gender roles) or physical
• stimuli (e.g., human faces, everyday sounds, fragrances, colors) and create
• a “perceptual map” of those stimuli. Understand the psychological dimensions
• hidden in the data so that we can describe how proximity judgments
• are generated. • Marketing: Derive “product maps” of
consumer choice and product preference • (e.g., automobiles, beer) so that
relationships between products can be discerned.
• Use these maps to position new products appropriately, to modify
• an existing product image to emphasize brand differentiation, or to design
• future experiments to determine what type of consumer can best discriminate
• between similar products and on which dimensions.
• Ecology: Provide “environmental impact maps” of pollution (e.g., oil spills,
• sewage pollution, drilling-mud dispersal) on local communities of animals,
• marine species, and insects. Use such maps to develop a biological taxonomy
• to classify populations using morphometric or genetic data or from
• evolutionary theory. • Molecular Biology: Reconstruct the spatial
structures of molecules (e.g., • amino acids) using biomolecular
conformation (3D structure). Interpret • their interrelations, similarities, and
differences. Construct a 3D “protein • map” as a global view of the protein
structure universe. • Computational Chemistry: Use a measure
of molecular similarity (e.g., interatomic • distance) to characterize the behavior and
function of molecules • derived from large collections of
compounds. • Social Networks: Develop “telephone-call
graphs,” where the vertices are telephone • numbers and the edges correspond to
calls between them. Recognize • instances of credit card fraud and network
intrusion detection. Identify • clusters in large scientific collaboration
networks. • Graph Layout: Design a diagram to
describe a network and the system it represents
• using a graph-theoretic distance (e.g., minimum-path length) between
• pairs of nodes or vertices. Examples include communications networks,
• electrical circuit diagrams, wiring diagrams, and protein-protein interaction
• graphs. Create graphic visualizations of digital image libraries, with
• images as vertices and proximities (e.g., perceptual differences) between
• pairs of images as edge weights. • Music: Use a measure of musical sound
quality (e.g., a set of spectral components • with high resolution at low frequencies to
mimic the human auditory • system) as input to a nonlinear distance
measure to assess the similarities • and differences between a variety of
songs.
20
Um exemplo prático O objetivo de uma pesquisa é avaliar a
semelhança ou não semelhança existente entre seis marcas de automóveis:
PEUGEOT RENAULT CITROËN TOYOTA HONDA FIAT
Podemos fazer isso, por exemplo, baseando na opinião de um grupo de especialistas que ordenam (classificam) os pares de marcas de automóveis dos mais semelhantes até os menos semelhantes.
21
Um exemplo prático
01 TOYOTA HONDA 09 CITROËN TOYOTA
02 RENAULT PEUGEOT 10 CITROËN HONDA
03 HONDA PEUGEOT 11 CITROËN FIAT
04 TOYOTA PEUGEOT 12 CITROËN RENAULT
05 HONDA RENAULT 13 CITROËN PEUGEOT
06 RENAULT TOYOTA 14 FIAT TOYOTA
07 RENAULT FIAT 15 FIAT HONDA
08 PEUGEOT FIAT
Resultado: par mais semelhante (1) até o par menos semelhante (15)
22
Um exemplo prático
saida$points[, 1]
said
a$po
ints
[, 2]
-8 -6 -4 -2 0 2 4 6
-4-2
02
46
8
PeugeotRenault
Citroen
Toyota
HondaFiat
23
Objetivo Representar graficamente (se possível) como objetos
(estímulos) são semelhantes ou dissemelhantes entre si de acordo com as suas posições tomadas nesse gráfico.
A contribuição do EMD é, basicamente, permitir ao pesquisador e ao tomador de decisões a possibilidade de avaliar relativamente, por meio de mapas de percepção, a relação e a interação entre objetos ou estímulos, em função de medidas de distancia (dissimilaridade) ou similaridade entre objetos (Fonte: Fávero et al. 2009).
Some application areas and research topics in MDS Psychology Study the underlying structure of perceptions of different classes of psychological stimuli (e.g., personality traits, gender roles) or physical stimuli (e.g., human faces, everyday sounds, fragrances, colors) and create a “perceptual map” of those stimuli. Understand the psychological dimensions hidden in the data so that we can describe how proximity judgments are generated. Marketing Derive “product maps” of consumer choice and product preference (e.g., automobiles, beer) so that relationships between products can be discerned. Use these maps to position new products appropriately, to modify an existing product image to emphasize brand differentiation, or to design future experiments to determine what type of consumer can best discriminate between similar products and on which dimensions. Ecology Provide “environmental impact maps” of pollution (e.g., oil spills, sewage pollution, drilling-mud dispersal) on local communities of animals, marine species, and insects. Use such maps to develop a biological taxonomy to classify populations using morphometric or genetic data or from evolutionary theory.
Molecular Biology Reconstruct the spatial structures of molecules (e.g.,amino acids) using biomolecular conformation (3D structure). Interpret their interrelations, similarities, and differences. Construct a 3D “protein map” as a global view of the protein structure universe. Computational Chemistry Use a measure of molecular similarity (e.g., interatomic distance) to characterize the behavior and function of molecules derived from large collections of compounds. Social Networks Develop “telephone-call graphs,” where the vertices are telephone numbers and the edges correspond to calls between them. Recognize instances of credit card fraud and network intrusion detection. Identify clusters in large scientific collaboration networks. Music Use a measure of musical sound quality (e.g., a set of spectral components with high resolution at low frequencies to mimic the human auditory system) as input to a nonlinear distance measure to assess the similarities and differences between a variety of songs.
26
Matriz de Dissimilaridades
PEUGEOT RENAULT CITROËN TOYOTA HONDA FIAT
PEUGEOT 00 02 13 04 03 08
RENAULT 02 00 12 06 05 07
CITROËN 13 12 00 09 10 11
TOYOTA 04 06 09 00 01 14
HONDA 03 05 10 01 00 15
FIAT 08 07 11 14 15 00
Dissimilaridades (distâncias) entres capitais brasileiras
27
SP RJ Manaus Natal Poa Bras Salv RB Cuiabá BH São Paulo 0 348 2689 2322 850 875 1455 2704 1326 490 Rio 348 0 2849 2086 1122 934 1210 2982 1576 340 Manaus 2689 2849 0 2765 3131 1932 2606 1149 1452 2556 Natal 2322 2086 2765 0 3172 1775 876 3617 2524 1832 Porto Aleg. 850 1122 3131 3172 0 1619 2302 2814 1679 1340 Brasília 875 934 1932 1775 1619 0 1060 2247 874 625 Salvador 1455 1210 2606 876 2302 1060 0 3206 1915 965 Rio Branco 2704 2982 1149 3617 2814 2247 3206 0 1414 2786 Cuiabá 1326 1576 1452 2524 1679 874 1915 1414 0 1372 Belo Horiz. 490 340 2556 1832 1340 625 965 2786 1372 0
31
Escalonamento multidimensional métrico
As distâncias ou similaridades representam medidas métricas.
Por exemplo: – reproduzir um mapa a partir das distâncias
entre municípios. – distancias euclidianas (dissimilaridade) – correlações (similaridade)
32
Geração de (di) similaridades (1) Escalas gráficas
Coca/Pepsi Indistinguíveis Opostos
Coca/Pepsi
Indistinguíveis Opostos Muito
parecidos Muito
diferentes
Nem muito diferentes, nem muito parecidos
33
Geração de (di) similaridades (2) Escala do tipo Likert - Itemizadas Coca/Pepsi Indistinguíveis 1 2 3 4 5 6 7 Opostos
Coca/Pepsi _____
1: indistinguíveis 2: Muito parecidos 3: Parecidos
4: Nem muito parecidos, nem muito diferentes
5: Diferentes 6: Muito diferentes 7: Opostos
34
Escalonamento multidimensional não métrico
As distâncias ou s imi lar idades não representam medidas métricas.
Por exemplo: – Ordenar pares de estímulos (objetos) segundo
a semelhança ou dissemelhança entre cada par de objetos.
35
T o d o s o s e s t í m u l o s s ã o a p r e s e n t a d o s simultaneamente. O entrevistado deve organizá-los em grupos de estímulos semelhantes. Se um par de estímulos pertencer a um mesmo grupo, ele receberá nota um, caso contrário, nota zero.
A similaridade de um par é obtida somando-se as notas recebidas por todos os entrevistados.
Geração de (dis) similaridades Agrupamento:
36
Exemplo: Apresenta os 5 estímulos ao entrevistado. Na opinião dele,
deve agrupar as cervejas segundo semelhança entre elas. Kaiser, Brahma, Antartica, Skol e Bavária.
Entrevistado 1: Skol/Bavária Kaiser, Brahma, Antartica Grupo 1 Grupo 2
Entrevistado 2: Skol/Bavária Brahma, Antartica Kaiser
Grupo 1 Grupo 2 Grupo 3
Entrevistado 3: Skol Bavária / Antartica Brahma/ Kaiser
Grupo 2 Grupo 3 Grupo 1
Geração de (dis) similaridades
37
1 2 31 Kaiser/Skol 0 0 0 0 32 Kaiser/Brahma 1 0 1 2 1… … … … … … …
10 Bavária/Antartica 0 0 1 1 2
Dissimilar.Pares de estímulos
Entrev. Similar.
Geração de (dis) similaridades Medidas de similaridade ou dissimilaridade:
Nota de cada entrevistado: 1 indica que pertence ao mesmo grupo 0 indica que não pertence ao mesmo grupo
38
Os m pares de estímulos são ordenados segundo sua semelhança. Os pares recebem notas de 1 a m, de tal forma que quanto maior a nota mais diferentes são os estímulos do par (medida de dissimilaridade).
Geração de (dis) similaridades Avaliação por postos ou ordenação:
Se n é o número de estímulos, então m=n(n-1)/2.
39
Geração de (dis) similaridades Exemplo: Apresenta todos os pares de estímulos ao entrevistado. Na
opinião dele, deve ordená-los em ordem crescente de dissemelhança entre os pares.
Pares Dissimil. Brahma Antartica 1
Skol Bavaria 2 Kaiser Bavaria 3 Kaiser Skol 4 Kaiser Brahma 5 Kaiser Antartica 6
Brahma Bavaria 7 Antartica Bavaria 8 Brahma Skol 9
Antartica Skol 10
40
Matriz de Dissimilaridades
Antart. BrahmaKaiser Bavária Skol
Antart. 0Brahma 1 0Kaiser 6 5 0Bavária 8 7 3 0Skol 10 9 4 2 0
Geração de (dis)similaridades
42
Exemplo Distâncias entre 4 objetos num plano d(A, B)= 5 d(B,C)=4 d(A,C)=3 d(A,D)= 4 d(B,D)=3 d(C,D)=5
C
A
B
Construção do mapa
A B
C
D
43
Soluções equivalentes Distâncias entre 4 objetos num plano d(A, B)= 5 d(B,C)=4 d(A,C)=3 d(A,D)= 4 d(B,D)=3 d(C,D)=5
A B
C
D
A B
C D
A B
C
D
44
Comentários
Se o número suposto de dimensões não corresponder a real , o método apresentado não poderá ser utilizado p a r a r e p r o d u z i r f i e l m e n t e o posicionamento dos pontos.
45
Exemplo Dissimilaridades entre 4 objetos em um
espaço bidimensional. d(A, B)= 5 d(B,C)=4 d(A,C)=3 d(A,D)=5 d(B,D)=5 d(C,D)=5
A
B
C
Construção do mapa
A
B
C D ?
47
Descrição da análise
Matriz de (dis) similaridades
Estipular o número de dimensões: k
Para cada estímulo, encontrar um conjunto de k coordenadas de modo que as distâncias entre pares de estímulos, obtidas a partir dessas coordenadas obedeça, o mais fielmente possível, a ordem estabelecida na matriz de (dis)similaridade dos dados.
⇒⇓
48
Exemplo
Comparar os cinco partidos quanto a semelhança (ou dissemelhança): – PFL – PMDB – PPB – PSDB – PTB
49
Geração de uma matriz de Similaridades
Avalie os seguintes pares de partidos políticos: Opostos Indistinguíveis
0 1 2 3 4 5 6 7 8 9 10PDT/PFLPDT/PMDBPDT/PPB
…
PT/PTB
50
Geração de uma matriz de dissimilaridades
Avalie os seguintes pares de partidos políticos: Indistinguíveis Opostos
0 1 2 3 4 5 6 7 8 9 10PDT/PFLPDT/PMDBPDT/PPB
…
PT/PTB
51
Escalonamento Multidimensional
Obter o posicionamento dos seguintes partidos em um espaço de dimensão 2: – PFL – PMDB – PPB – PSDB – PTB
52
Matriz de dissimilaridades (δij)
PFL PMDB PPB PSDB PTBPFL 0PMDB 0,3 0PPB 0,13 0,41 0PSDB 0,22 0,27 0,87 0PTB 0,24 0,4 0,08 0,15 0
δij
53
Passo 1: Propor uma configuração inicial
Partido X YPFL 0 0PMDB 3 3PPB 0,5 0,5PSDB 2,5 2,5PTB 2 2
54
Encontrar a matriz de distâncias euclidianas da configuração: dij
PFL PMDB PPB PSDB PTBPFL 0PMDB 4,24 0PPB 0,71 3,54 0PSDB 3,54 0,71 2,83 0PTB 2,83 1,41 2,12 0,71 0
dij
55
Comparar as distâncias com a matriz de dissimilaridades
δij dijPPB/PTB 0,08 2,12PFL/PPB 0,13 0,71PSDB/PTB 0,15 0,71PFL/PSDB 0,22 3,54PFL/PTB 0,24 2,83PMDB/PSDB 0,27 0,71PFL/PMDB 0,3 4,24PMDB/PTB 0,4 1,41PMDB/PPB 0,41 3,54PPB/PSDB 0,87 2,83
A ordem se mantém?
56
Comparar as distâncias com a matriz de dissimilaridades
δij dijPPB/PTB 0,08 2,12PFL/PPB 0,13 0,71PSDB/PTB 0,15 0,71PFL/PSDB 0,22 3,54PFL/PTB 0,24 2,83PMDB/PSDB 0,27 0,71PFL/PMDB 0,3 4,24PMDB/PTB 0,4 1,41PMDB/PPB 0,41 3,54PPB/PSDB 0,87 2,83
A ordem se mantém?
57
Comparar as distâncias com a matriz de dissimilaridades
δij dijPPB/PTB 0,08 2,12PFL/PPB 0,13 0,71PSDB/PTB 0,15 0,71PFL/PSDB 0,22 3,54PFL/PTB 0,24 2,83PMDB/PSDB 0,27 0,71PFL/PMDB 0,3 4,24PMDB/PTB 0,4 1,41PMDB/PPB 0,41 3,54PPB/PSDB 0,87 2,83
A ordem se mantém?
58
Comparar as distâncias com a matriz de dissimilaridades
δij dijPPB/PTB 0,08 2,12PFL/PPB 0,13 0,71PSDB/PTB 0,15 0,71PFL/PSDB 0,22 3,54PFL/PTB 0,24 2,83PMDB/PSDB 0,27 0,71PFL/PMDB 0,3 4,24PMDB/PTB 0,4 1,41PMDB/PPB 0,41 3,54PPB/PSDB 0,87 2,83
A ordem se mantém?
59
Construção de uma medida de ajuste
S i t u a ç ã o i d e a l : E n c o n t r a r u m a configuração na qual:
dij > dit " dij > dit
Medida de ajuste: Quão distante a solução encontrada está da situação ideal? dij: distância numa situação ideal
^
^
^
60
Determinação de dij
δij dijPPB/PTB 0,08 2,12 1,18PFL/PPB 0,13 0,71 1,18PSDB/PTB 0,15 0,71 1,18PFL/PSDB 0,22 3,54 2,36PFL/PTB 0,24 2,83 2,36PMDB/PSDB 0,27 0,71 2,36PFL/PMDB 0,3 4,24 2,83PMDB/PTB 0,4 1,41 2,83PMDB/PPB 0,41 3,54 3,19PPB/PSDB 0,87 2,83 3,19
^ dij Média das
distâncias dij
Repetir
procedimento para os demais casos
61
Stress de Kruskal Expressa o quanto a situação real se
afasta de uma situação ideal
( )∑
∑
ji,
2ij
ijij
d
d - dj,i
2ˆ
stress =
62
Avaliação do ajuste
Stress Qualidade do ajuste
> 20% Ruim
10% Aceitável
5% Bom
2,5% Excelente
0% Perfeito
Exemplo:
stress = 38,5%
63
Passo 2 Tentar diminuir o stress, encontrando um
novo conjunto de coordenadas, a partir da configuração original.
Problema: qual é a configuração de pontos que minimiza o stress?
Repetir os procedimentos até que se obtenha a convergência do stress.
65
Coordenadas Finais S-plus
Estímulo 1 2PFL 0,09 0,10PMDB -0,21 0,37PPB 0,43 -0,13PSDB -0,33 -0,04PTB 0,02 -1,17
Dimensão
66
Posicionamento em 2 dimensões
Dimensão 1
2,01,51,0,50,0-,5-1,0-1,5
Dim
ensã
o 2
1,5
1,0
,5
0,0
-,5
-1,0
-1,5
ptb
psdb
ppb
pmdb
pfl
67
Mapeamento de marcas de DVD
Uma amostra de consumidores comparou 8 marcas de DVD: CCE, Gradiente, LG, Panasonic, Phillips, Sharp, Sony e Toshiba.
O critério para comparação foi a
qualidade esperada do produto.
68
Matriz de Dissimilaridades
G P S L P T C SGradiente 0,0Panasonic 2,2 0,0Sony 1,9 2,0 0,0LG 6,7 6,0 6,8 0,0
Phillips 4,0 3,7 3,5 4,0 0,0Toshiba 1,0 2,5 2,0 6,0 3,8 0,0CCE 7,0 6,5 6,8 1,2 3,0 6,0 0,0Sharp 4,0 4,5 3,2 5,0 2,4 4,0 6,0 0,0
69
Coordenadas Finais
1 2GRADIENTE 1,27 0,13PANASONIC 0,87 0,59
SONY 1,25 0,07LG -1,99 0,35
PHILLIPS -0,46 -0,66TOSHIBA 0,88 0,41CCE -1,99 0,46SHARP 0,18 -1,35
DimensãoMarca
70
Mapeamento de marcas de
videocassete
Dimensão 1
1,51,0,50,0-,5-1,0-1,5-2,0-2,5
Dim
ensã
o 2
1,0
,5
0,0
-,5
-1,0
-1,5
sharp
cce toshiba
phillips
lg
sony
panasoni
gradient
Stress = 6,0%
Mapeamento de marcas de DVD
71
1 - Antart.-Brahma 6 - Kaiser-Antart. 2 - Skol-Bavária 7 - Bavária-Brahma 3 - Bavária-Kaiser 8 - Bavária-Antart. 4 - Skol-Kaiser 9 - Brahma-Skol 5 - Brahma-Kaiser 10 - Skol-Antart.
Cerveja.sdd Apresenta todos os pares de estímulos ao entrevistado.
Antartica – Brahma – Skol – Bavária – Kaiser
Na opinião dele, deve ordená-los em ordem crescente de dissemelhança entre os pares. Veja resultado:
72
Matriz de Dissimilaridades
Antart. BrahmaKaiser Bavária Skol
Antart. 0Brahma 1 0Kaiser 6 5 0Bavária 8 7 3 0Skol 10 9 4 2 0
73
S-plus Na janela de comandos: library(MASS)
saida<-isoMDS(cerveja,k=2)
plot(saida$points, type="n")
marcas<-c("Antartica", "Brahma", "Kaiser", "Bavaria", "Skol")
text(saida$points,labels=marcas)
saida
74
Posicionamento em duas dimensões
Dimensão 1
2 1 0 -1 -2
Dim
ensã
o 2
,6
,4
,2
0,0
-,2
-,4
skol
bavária
kaiser
brahma
antartica
Stress < 0,1 %
75
S-plus Na janela de comandos: library(MASS)
saida<-isoMDS(cerveja,k=1)
d1<-rep(0,nrow(cerveja))
plot(d1,saida$points, type="n")
marcas<-c("Antartica", "Brahma", "Kaiser", "Bavaria", "Skol")
text(d1,saida$points,labels=marcas)
saida
76
Posicionamento em uma dimensão
,6 ,4 ,2 -,0 -,2 -,4 -,6
Dim
ensã
o 1
1,5
1,0
,5
0,0
-,5
-1,0
-1,5
skol
bavária
kaiser
brahma
antartica
Stress < 0,1 %
77
Mapeamento de marcas de DVD
Uma amostra de consumidores comparou 8 marcas de DVD: CCE, Gradiente, LG, Panasonic, Phillips, Sharp, Sony e Toshiba.
O critério para comparação foi a
qualidade esperada do produto.
78
Matriz de Dissimilaridades G P S L P T C S
Gradiente 0,0Panasonic 2,2 0,0Sony 1,9 2,0 0,0LG 6,7 6,0 6,8 0,0
Phillips 4,0 3,7 3,5 4,0 0,0Toshiba 1,0 2,5 2,0 6,0 3,8 0,0CCE 7,0 6,5 6,8 1,2 3,0 6,0 0,0Sharp 4,0 4,5 3,2 5,0 2,4 4,0 6,0 0,0
Arquivo: DVD.sdd
79
Exercício: Mapeamento de marcas de DVD
Usando o arquivo DVD.sdd, construa um gráfico de duas dimensões usando escalonamento multidimensional.
Qual a qualidade dessa representação gráfica com base na medida Stress. Qual a sua conclusão?
Interprete o gráfico assumindo que os pares de estímulos (aparelhos de DVDs) foram comparados em termos de semelhanças da qualidade esperada do produto.
Calcule a medida Stress para as dimensões k=1 até k=5. Construa um gráfico de Stress versus k. Faça interpretação.
80
S-plus Na janela de comandos: library(MASS)
saida<-isoMDS(DVD,k=1)
plot(saida$points, type="n")
marcas<-c("Gradiente", "Panasonic", "Sony", "LG", "Phillips", "Toshiba", "CCE", "Sharp")
text(saida$points,labels=marcas)
saida
81
Preferência Os es t ímu los podem também ser
comparados segundo a preferência do respondente e não segundo sua semelhança.
Todos os métodos de construção de
matrizes de similaridade se aplicam. Diferenças na interpretação dos mapas.
82
Resposta = Preferência
A partir do ordenamento dos estímulos segundo a preferência (tal como em análise de preferência conjunta), pode-se construir uma matriz de similaridades. A partir dessa matriz, pode-se gerar mapas.
83
Tipos de Análises
• Individual (Desagregada) - um mapa por entrevistado.
• Agregada - um único mapa para um grupo de entrevistados
84
Número de estímulos
Alto grande número de pares de estímulos a serem avaliados.
⇒
Solução: Cada respondente analisa apenas um pequeno número de pares, de tal sorte que vários grupos de respondentes aval iem todos os possíveis pares.
85
Número de dimensões
# Conhecimento a priori da estrutura da população.
# Interpretabilidade do mapa. # Estabelecimento de um nível mínimo de
ajuste. # Variação do stress (critério do cotovelo). # Conveniência de uso.
87
Aplicação aos dados das bebidas não alcoólicas – Bebidasmedias.xls
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10Pepsi 5,17 2,78 3,11 4,89 2,44 5,22 3,22 5,22 2,72 3,33Coca-cola 5,20 2,13 3,73 5,20 2,00 4,80 3,67 5,40 2,13 3,67Gatorade 3,42 5,00 6,25 3,33 4,83 4,67 6,17 3,75 5,00 6,17Allsport 3,57 3,93 5,57 3,21 3,79 4,64 5,79 3,36 4,07 5,71Lipton 6,17 5,44 5,00 5,89 5,56 4,83 4,83 5,78 5,50 4,89Nestea 6,11 5,11 4,83 6,28 5,11 4,78 4,78 6,17 5,22 4,78
Médias por marca de bebida
88
Matriz de distância
Marca Pepsi Coca-cola Gatorade Allsport Lipton NesteaPepsi 0,00
Coca-cola 1,40 0,00Gatorade 7,10 7,26 0,00Allsport 5,69 5,75 2,03 0,00Lipton 5,96 6,40 4,92 5,40 0,00Nestea 5,49 5,86 5,27 5,54 0,86 0,00