anslisis de componentes principales y analisis de...

28
Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 1 Facultad de Psicología y Ciencias Sociales Licenciatura en Sociología ESTADÍSTICA II (Plan 2008) ANÁLISIS DE COMPONENTES PRINCIPALES y ANÁLISIS DE FACTORES COMUNES Prof. Titular Lic. Rubén José Rodríguez 16 de abril de 2012

Upload: lelien

Post on 28-Sep-2018

226 views

Category:

Documents


0 download

TRANSCRIPT

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología1

Facultad de Psicología y Ciencias Sociales Licenciatura en Sociología

ESTADÍSTICA II (Plan 2008)

ANÁLISIS DE COMPONENTES PRINCIPALES y ANÁLISIS DE FACTORES COMUNES

Prof. TitularLic. Rubén José Rodríguez

16 de abril de 2012

INTRODUCCIÓN

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología2

En las siguientes 28 diapositivas se expone sintéticamente la técnica multivariadagenéricamente denominada Análisis Factorial que en realidad engloba dos tipos deprocedimientos diferentes: Análisis de Componentes Principales (ACP) y Análisisde Factores Comunes (AFC), el primero reduce la variabilidad total, el segundola variabilidad común.Se exponen los antecedentes del Análisis Factorial, los objetivos, y los pasos del AF:1° Examen de la Matriz de Correlaciones, 2° Extracción de los Factores o de losComponentes, 3° Rotación de los factores o ejes, 4° Cálculo de laspuntuaciones factoriales, y 5° Denominación e interpretación de los Factores oEjes.Se presenta un primer ejemplo de AF mediante la visualización de un Diagrama deAnálisis Causal, un segundo ejemplo desarrollado de ACP correspondiente auna matriz de correlaciones entre indicadores socio-económico-demográficos de109 países del fichero MUNDO 95, y un tercer ejemplo de una matriz factorialcorrespondiente a 18 indicadores de nacionalismo mediante escalas tipo Likert y sureducción a dimensiones factoriales.Se brindan las definiciones y la ejemplificación (MUNDO 95) de diversos índices deincorrelación e intercorrelación de la matriz de correlaciones.Autor: Lic. Rubén José Rodríguez

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología3

ANTECEDENTES ANÁLISIS FACTORIAL (1)

Charles Spearman (1863-1945): Psicólogo inglés. Fueoficial del ejercito británico en la India y a su vuelta, alos 40 años, influido por la lectura de Francis Galton,decidió realizar su tesis doctoral sobre la mediciónobjetiva de la inteligencia. Propuso el primer modelofactorial, basado en un factor común (factor g), y unfactor específico (factor s) (1901), conocida comoTeoría bifactorialista de la inteligencia. Ocupo laprimera Cátedra de Psicología en la University Collegeen Londres. El Análisis Factorial (AF) engloba dostécnicas: Análisis de Componentes Principales (ACP)y Análisis de Factores Comunes (AFC).

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología4

ANTECEDENTES ANÁLISIS FACTORIAL (2)

Karl Pearson (1857-1936): Científico inglés, discípulo deFrancis Galton. Conocido por sus aplicaciones de laestadística a los problemas biológicos y psicológicos.Cofundador de la revista Biométrika (1902). Fue el quepresentó la propuesta del Análisis de ComponentesPrincipales (1901)(ACP) primer paso para el cálculo delAnálisis Factorial. El ACP es una técnica descriptiva queintenta condensar la matriz de correlaciones entre lasvariables en unos componentes principales lavariabilidad total que presentan los individuos en laspruebas o variables medidas. Harold Hottelling (1885-1993) desarrolló el ACP y el Análisis de CorrelacionesCanónicas.

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología5

OBJETIVOS DEL ANÁLISIS FACTORIAL (1)

El objetivo del AF consiste en identificar un númerode factores o componentes, inferior al número devariables observadas (F<V) mediante los cuales sepueda describir el fenómeno observado en formasimplificada. El AF es un método de reducción de lainformación, identificando los factores que sonconstructos no directamente observables(variables latentes).A partir de la matriz de datos original se calcula lamatriz de correlaciones y el ACP/AFC convierte aésta en una matriz factorial. “El AF es, en fin decuentas, un estudio de los coeficientes de correlación” (Yela,Mariano (1957). La Técnica del Análisis Factorial. Madrid: Biblioteca Nueva,1997, p. 32

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología6

OBJETIVO DEL ANÁLISIS FACTORIAL (2)

El AF al ser un técnica descriptiva o de interdepen-dencia busca resumir, reducir o simplificar la informa-ción contenida en una matriz de datos con Vvariables. Reduce un gran número de variablesempíricas a pocas variables fundamentales dondeaquellas están altamente saturadas en éstas.E identifica un reducido número de factores o

componentes F siendo F < V, de modo queexpliquen un máximo de la variabilidad total (ACP),(Análisis de Componentes Principales) o bien,solamente la variabilidad común (AFC) (AnálisisFactorial Común) (Hair, et al., 1999: 90 y 768). El AFdebe cumplir los Principios de parsimonia einterpretabilidad.

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología7

OBJETIVO DEL ANÁLISIS FACTORIAL (3)

El Análisis Factorial (AF) puede ser exploratorio o con-firmatorio.El Análisis Factorial Exploratorio (AFE) se caracteriza porque no se conocen a priori el número de factores y es en la aplicación empírica donde se de-termina este núme-ro. se usa para tratar de descubrir la estructura interna de un número relativamente grande de variables. La hipóte-sis a priori del investigador es que pueden existir una serie de factores asociados a grupos de variables. Las cargas o pesos (Coeficientes factoriales) de los distin-tos factores -con relación a los ítems donde estos se satu-ran- se utilizan para intuir la relación de éstos con las dis-tintas variables. Es el tipo de análisis factorial más común.

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología8

OBJETIVO DEL ANÁLISIS FACTORIAL (4)

Por el contrario, en el Análisis Factorial Confirmatorio (AFC) los factores están fijados a priori, utilizándose contrastes de hipótesis para su corroboración. trata de determinar si el número de factores obtenidos y sus cargas se corresponden con los que cabría esperar a la luz de una teoría previa acerca de los datos. La hipótesis a priori es que existen unos determi-nados factores preestablecidos y que cada uno de ellos está asociado con un determinado subconjunto de las variable, arroja un nivel de confianza para poder aceptar o rechazar dicha hipótesis. El Análisis Factorial Confirmatorio es un caso particular del Modelo de Ecuaciones Estructurales (MES ó SEM). Éste utiliza los diagramas de flujos causales (Path Analysis). Desde su creación el AF fue de tipo exploratorio pero a partir de la década del 60 Karl Jöreskog y Dag Sörbon desarrollaron el AFC y el SEM y en el 70 el programa LISREL.

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología9

DIAGRAMA DE ANÁLISIS CAUSAL

Índice de industrializaciónPeriódicos semanales por hab.

U$ por Hab de Ventas al DetalleU$ por Hab del Ventas al Por Mayor

% de Mujeres > 14 años que trabajan% de Trabajadoras en agricultura

Índice de Fomento del Nivel de VidaÍndice de Salud

Gastos en Ayudas a los Niños x Hab.Índice de Paro Laboral (Desocup.)Extensión de las Enferm. Mentales

% de Viviendas Construidas reciént.Estabilidad de la Población

Índice de Actividad Migratoria

INDUSRI

PERIODIC

VENTASDE

VENTASMA

EMPLEOMU

AGRICULT

NIVELVID

SALUD

AYUDASNI

PARO

MENTALEN

VIVIENDA

ESTAPOBL

MEGRACIO

F 1

F 2

F 3

VARIABLES ORIGINALES COEFICIENTES FACTORIALES

FACTORESEXTRAIDOS

NOMBRE FACTOR LATENTE

Actividad Económica

Bienestar Social

Estabilidad Social

.913

.866

.840

.834

.082-.657

.888

.791

-.755-.625

-.475

.842

-.822

.777

Bisquerra Alzina, Rafael (1989). Introducción conceptual al Análisis Multivariable. Tomo I. Madrid: PPU-Promociones y Publicaciones Universitarias, 1989, p. 329.

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología10

PASOS DEL ANÁLISIS FACTORIAL(1)

1º Exámen de la Matriz de Correlaciones: El requisitoes que las variables estén intercorrelacionadas. Losindicadores estadísticos para medir la significación delgrado de correlación: Test de Esfericidad de Barlett,Índice de K-M-O de Kaiser, Meyer y Olkin,Coeficiente de Correlación Parcial y Múltiple, yGráfico de Sedimentación.Si de estos indicadores estadísticos surge que lasvariables en la matriz de datos están incorrelaciona-das, por lo tanto no es posible aplicar el ACP o el AFC,pues, no hay variabilidad o variancia (total o común) queexplicar para obtener un componente principal o factorcomún.

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología11

PASOS DEL ANÁLISIS FACTORIAL(2)2º Extracción de los Factores o Componentes:Determinar un número reducido de factores quepuedan representar a las variables originales. Uno delos métodos de extracción es de ComponentesPrincipales (CP), que a su vez es una técnicaestadística del AF: ACP.El método de CP analiza la variancia total y extrae laprimera proporción de máxima varianza (primer CP)que explique los datos. El segundo CP extrae lamayor proporción de la varianza residual, y así sucesivamente. Los CP extraídos deben no estarcorrelacionados entre sí (ortogonales). Losposteriores CP explican cada vez menos de lavariancia residual.

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología12

PASOS DEL ANÁLISIS FACTORIAL(3)

3º Rotación de Factores: Consiste en hacer rotar,girar los ejes factoriales hasta que se aproximen almáximo a las variables. La finalidad es obtener unarepresentación gráfica fácilmente interpretable.4º Cálculo de las Puntuaciones Factoriales: Unavez obtenidos los factores donde las variables tienenalta saturación se pueden calcular las puntuacionesque obtendrían los sujetos en esos factores. A partirde la matriz factorial rotada se calculan las puntua-ciones factoriales que se transforman en puntuacioes estandarizadas Zij y expresan al AF como unaecuación de regresión múltiple:

1 1 2 2 ...ij i i i i i jF FZ F Z FZ

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología13

TEST DE ESFERICIDAD DE BARLETT

El test pone a prueba la H0 mediante X2 que dice quela matriz de correlaciones empírica R es igual a lamatriz identidad I (cuya diagonal principal son unos yel resto de los coeficientes son 0):

H0 : │R│= 1 (Hay incorrelación)H1 : │R│ 1 (Hay correlación)

Si se confirma la H0 significa que las variables noestán intercorrelacionadas, por lo tanto la nube depuntos en el espacio formaría una esfera(esfericidad).

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología14

ÍNDICE KMO de KAISER, MEYER y OLKIN

ijr .ij zr

.ij zrEste índice compara las magnitudes de loscoeficientes de correlación observados rij con loscoeficientes de correlación parcial .El índice KMO varía entre 0,0 a 1,0. Si el índicetiende a 1,0 señala la existencia de intercorrelaciónentre las variables.Valores de KMO inferiores a 0,50 suponen, por el contrario, la no adecuación del AF, al haber pocacorrelación. Su fórmula es:

2

1 1

2 2.

1 1 1 1

N N

iji j

N N N N

ij ij zi j i i

rKMO

r r

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología15

EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 VariablesPérez, César (2004). Técnicas de análisis multivariante de datos con SPSS,

Madrid: Pearson, 2004, pp. 195-203.N

ota:

Cés

ar P

érez

(200

4) e

jem

plifi

ca e

l AF

con

9 in

dica

dore

s, a

dem

ás,

utili

za e

l Mét

odo

de R

otac

ión

Obl

imin

, mie

ntra

que

en

nues

tra

ejem

plifi

caci

ón u

tiliz

amos

el M

étod

o Va

rimax

, por

lo q

ue s

us re

sulta

do

dive

rgen

de

los

mos

trad

os e

n la

pre

sent

ació

n de

la u

nida

d te

mát

ica.

(RJR

)

Estadísticos descriptivos

68831,14 195296,366 59159,869 581,7396 59

49,76 25,186 59

65,83 11,078 59

61,34 9,932 59

69,58 22,326 59

2,214 ,9604 59

57,729 36,9310 59

3107,93 4789,315 59

2588,81 516,132 5912800,08 54071,331 59

31,492 11,1144 59

9,89 4,977 59

34,9374 61,31802 59

3,7760 2,08576 59

4,303 1,8497 59

75,36 19,793 59

62,12 27,017 59

Población x1000Habitantes por Km2Habitantes en ciudades(%)Esperanza de vidafemeninaEsperanza de vidamasculinaAlfabetización (%)Aumento de la población(% anual)Mortalidad infantil(muertes por 1000nacimientos vivos)Producto interior brutoper-capitaIngesta diaria de caloríasCasos de SIDATasa de natalidad (por 1.000 habitantes)Tasa de mortalidad (por1.000 habitantes)Casos de SIDA por 100.000 habitantesTasaNacimientos/Defunciones

Número promedio dehijosHombres alfabetizados(%)Mujeres alfabetizadas (%)

MediaDesviación

típica N del análisis

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología16

EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 VariablesMatriz de Correlaciones

Matriz de correlacionesa

1,000 ,001 -,172 ,008 ,056 ,013 -,210 ,011 -,030 ,018 ,119 -,181 -,081 -,095 -,124 -,195 ,056 -,005,001 1,000 ,181 ,112 ,117 ,074 -,158 -,143 ,295 ,110 -,047 -,179 -,073 -,079 -,094 -,166 ,091 ,077

-,172 ,181 1,000 ,741 ,717 ,614 -,192 -,705 ,558 ,674 ,103 -,566 -,592 -,284 ,261 -,533 ,595 ,634

,008 ,112 ,741 1,000 ,987 ,827 -,392 -,951 ,547 ,716 ,091 -,817 -,845 -,499 ,270 -,790 ,754 ,815

,056 ,117 ,717 ,987 1,000 ,785 -,325 -,931 ,529 ,711 ,075 -,773 -,866 -,521 ,318 -,747 ,727 ,773

,013 ,074 ,614 ,827 ,785 1,000 -,567 -,891 ,469 ,575 ,154 -,822 -,616 -,127 ,043 -,814 ,939 ,963

-,210 -,158 -,192 -,392 -,325 -,567 1,000 ,420 -,422 -,393 -,191 ,776 ,017 ,012 ,692 ,755 -,542 -,580

,011 -,143 -,705 -,951 -,931 -,891 ,420 1,000 -,563 -,701 -,134 ,809 ,764 ,302 -,231 ,784 -,805 -,856

-,030 ,295 ,558 ,547 ,529 ,469 -,422 -,563 1,000 ,703 ,561 -,591 -,218 ,050 -,170 -,495 ,439 ,458

,018 ,110 ,674 ,716 ,711 ,575 -,393 -,701 ,703 1,000 ,256 -,658 -,441 -,229 ,040 -,581 ,576 ,548,119 -,047 ,103 ,091 ,075 ,154 -,191 -,134 ,561 ,256 1,000 -,169 ,064 ,391 -,191 -,135 ,144 ,164

-,181 -,179 -,566 -,817 -,773 -,822 ,776 ,809 -,591 -,658 -,169 1,000 ,543 ,310 ,188 ,968 -,756 -,811

-,081 -,073 -,592 -,845 -,866 -,616 ,017 ,764 -,218 -,441 ,064 ,543 1,000 ,626 -,573 ,566 -,551 -,589

-,095 -,079 -,284 -,499 -,521 -,127 ,012 ,302 ,050 -,229 ,391 ,310 ,626 1,000 -,302 ,322 -,146 -,166

-,124 -,094 ,261 ,270 ,318 ,043 ,692 -,231 -,170 ,040 -,191 ,188 -,573 -,302 1,000 ,152 ,029 ,032

-,195 -,166 -,533 -,790 -,747 -,814 ,755 ,784 -,495 -,581 -,135 ,968 ,566 ,322 ,152 1,000 -,759 -,819

,056 ,091 ,595 ,754 ,727 ,939 -,542 -,805 ,439 ,576 ,144 -,756 -,551 -,146 ,029 -,759 1,000 ,960

-,005 ,077 ,634 ,815 ,773 ,963 -,580 -,856 ,458 ,548 ,164 -,811 -,589 -,166 ,032 -,819 ,960 1,000498 096 475 337 461 055 467 412 447 184 086 271 236 175 070 338 484

Población x1000Habitantes por Km2Habitantes en ciudades(%)Esperanza de vidafemeninaEsperanza de vidamasculinaAlfabetización (%)Aumento de la población(% anual)Mortalidad infantil(muertes por 1000nacimientos vivos)Producto interior brutoper-capitaIngesta diaria de caloríasCasos de SIDATasa de natalidad (por 1.000 habitantes)Tasa de mortalidad (por1.000 habitantes)Casos de SIDA por 100.000 habitantesTasaNacimientos/Defunciones

Número promedio dehijosHombres alfabetizados(%)Mujeres alfabetizadas (%)P bl ió 1000

Correlación

Si (U il t l)

Poblaciónx1000

Habitantespor Km2

Habitantes enciudades (%)

Esperanza devida femenina

Esperanzade vida

masculinaAlfabetización

(%)

Aumento dela población(% anual)

Mortalidadinfantil

(muertes por1000

nacimientosvivos)

Productointerior bruto

per-capitaIngesta diaria

de caloríasCasos de

SIDA

Tasa denatalidad(por 1.000habitantes)

Tasa demortalidad(por 1.000habitantes)

Casos deSIDA por100.000

habitantes

TasaNacimientos/Defunciones

Númeropromediode hijos

Hombresalfabetizados

(%)

Mujeresalfabetizadas

(%)

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología17

EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 VariablesPruebas de ajuste del Análisis Factorial

ÍNDICE KMO: 0,834 Alta intercorrelación entre los indicadores

TEST DE ESFERICIDAD DE BARLETT: X2 = 1545,023 Sig. 0,000

Rechazo de H0 Hay intercorrelación entre las variables

KMO y prueba de Bartlett

,834

1545,023

153

,000

Medida de adecuación muestral deKaiser-Meyer-Olkin.

Chi-cuadradoaproximadogl

Sig.

Prueba de esfericidadde Bartlett

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología18

EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables Comunalidades

Los Componentes extraídos varían entre 0,706 y 0,967 indicando una alta comunalidad(h2). Estas indican la proporción de varianza explicada por todos los factores (resultan-tes de la extracción). La comunalidad de cada variable es igual a la suma de cuadrados de los coeficiente factoriales de cada variable. La comunalidad es la cantidad de varian-za que una variable comparte con las demás variables consideradas

2 2 2 2 21 2 ...k j j kj kjh F F F F

1,000 ,8521,000 ,7321,000 ,7481,000 ,9671,000 ,9561,000 ,9421,000 ,9521,000 ,9271,000 ,8961,000 ,7061,000 ,8431,000 ,9421,000 ,9151,000 ,7831,000 ,8881,000 ,9141,000 ,8611,000 ,939

Población x1000Habitantes por Km2Habitantes en ciudades (%)Esperanza de vida femenina

Esperanza de vida masculinaAlfabetización (%)Aumento de la población (% anual)Mortalidad infantil (muertes por 1000 nacimientos vivos)Producto interior bruto per-capitaIngesta diaria de calorías

Casos de SIDATasa de natalidad (por 1.000 habitantes)Tasa de mortalidad (por 1.000 habitantes)Casos de SIDA por 100.000 habitantesTasa Nacimientos/DefuncionesNúmero promedio de hijosHombres alfabetizados (%)Mujeres alfabetizadas (%)

Inicial Extracción

Método de extracción: Análisis de Componentes principales.

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología19

EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 VariablesVarianza total explicada

Los Autovalores o Eigenvalores (Valores propios: Lmbda) son el cuadrado del Coeficiente Factorial (cargas, pesos o saturaciones factoriales) e indican la proporción de la variancia total de una variable explicada por ese factor. Se convierte en el % explicado por el Factor I, II, etc., dividiendo el Autovalor por el nº de variables y multiplicado por 100, por ejemplo para el FI = [(8,836 / 18) * 100] = 49,091. Se observa que el FI explica el 49,09% de la variancia total, el FII el 13,46% y FIII el 10,06%. Los tres primeros factores explican el 72.62% de la variancia total, pues sus Autovalores son > que 1 (1,811 a 8,836). No se toman en cuenta los FIV y FV que si bien son > que 1 agregan poca variancia explicada residual.

I

p

9,312 51,735 51,735 9,312 51,735 51,735 8,836 49,09 49,0912,681 14,894 66,629 2,681 14,894 66,629 2,424 13,46 62,5561,534 8,520 75,149 1,534 8,520 75,149 1,811 10,06 72,6181,159 6,437 81,586 1,159 6,437 81,586 1,425 7,915 80,5341,077 5,986 87,571 1,077 5,986 87,571 1,267 7,038 87,571

,758 4,211 91,783,442 2,458 94,241,291 1,614 95,855,232 1,288 97,143,167 ,928 98,071,136 ,756 98,827,072 ,402 99,229,040 ,224 99,453,036 ,202 99,656,025 ,140 99,796,018 ,101 99,897,014 ,077 99,974,005 ,026 100,000

Componente1

2

3

4

5

6789101112131415161718

Total% de lavarianza % acumulado Total

% de lavarianza % acumulado Total

% de lavarianza % acumulado

Autovalores inicialesSumas de las saturaciones al cuadrado

de la extracciónSuma de las saturaciones al cuadrado

de la rotación

Método de extracción: Análisis de Componentes principales.

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología20

EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 VariablesGráfico de sedimentación

I

Los Autovalores iniciales mayores a 1 son los 5 primeros componentes (1,077 a 9,312) y que acumulan el 88% de la explicación de la variancia total. El punto de inflexión de la curva indica el número mínimo de factores estadísticamente significativos. Por razones de economía explicativa se toman los 3 primeros factores que explican el 73% de variancia explicada total acumulada.

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología21

EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 VariablesMatriz de componentes sin rotar

,956 -,227 ,015 ,019 ,042

-,949 ,123 -,080 ,060 ,030

,930 -,280 ,015 ,040 ,104

,913 ,086 -,027 -,273 -,162

-,911 -,251 ,215 -,052 -,018

,907 ,091 -,039 -,269 -,186

-,889 -,214 ,280 -,002 -,004

,869 ,099 -,044 -,264 -,155

,758 ,068 ,277 ,179 ,138

,753 -,203 ,325 ,143 -,120

-,737 ,582 ,072 ,006 -,168

,628 ,371 ,495 ,310 ,149

,092 -,879 ,270 -,120 ,138

-,566 -,695 ,369 -,029 ,111

-,362 ,571 ,451 -,328 -,121

,180 ,499 ,574 -,126 ,465

,173 ,112 ,007 ,804 -,210

,064 ,187 -,474 ,015 ,767

Esperanza de vidafemeninaMortalidad infantil(muertes por 1000nacimientos vivos)Esperanza de vidamasculinaAlfabetización (%)

Tasa de natalidad (por 1.000 habitantes)Mujeres alfabetizadas (%)

Número promedio dehijosHombres alfabetizados(%)Ingesta diaria de calorías

Habitantes en ciudades(%)Tasa de mortalidad (por1.000 habitantes)Producto interior brutoper-capitaTasaNacimientos/Defunciones

Aumento de la población(% anual)Casos de SIDA por 100.000 habitantesCasos de SIDA

Habitantes por Km2

Población x1000

1 2 3 4 5Componente

Método de extracción: Análisis de componentes principales.5 componentes extraídosa.

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología22

EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 VariablesMatriz de componentes rotados según el Método VARIMAX

,957 -,090 ,072 -,083 ,073

,955 -,106 ,053 -,077 ,086

-,932 -,177 -,117 -,119 -,006

,922 ,269 ,051 ,182 -,092

,914 -,108 ,062 -,083 ,060

,887 ,333 ,051 ,191 -,141

-,885 ,246 -,075 -,206 ,224

-,881 ,242 -,001 -,150 ,238

-,714 -,578 ,148 -,092 ,201

,694 ,304 ,197 ,303 ,208

,659 ,120 ,398 ,312 -,054

,090 ,919 -,117 -,118 ,090

-,574 ,750 -,057 -,136 ,196

,081 -,101 ,896 -,103 -,114

,481 -,073 ,686 ,432 ,030

-,327 -,409 ,509 -,336 ,371

,039 -,130 -,033 ,842 ,067

,003 -,112 ,071 -,086 -,909

Alfabetización (%)

Mujeres alfabetizadas (%)

Mortalidad infantil(muertes por 1000nacimientos vivos)Esperanza de vidafemeninaHombres alfabetizados(%)Esperanza de vidamasculinaTasa de natalidad (por 1.000 habitantes)Número promedio dehijosTasa de mortalidad (por1.000 habitantes)Habitantes en ciudades(%)Ingesta diaria de calorías

TasaNacimientos/Defunciones

Aumento de la población(% anual)Casos de SIDA

Producto interior brutoper-capitaCasos de SIDA por 100.000 habitantesHabitantes por Km2

Población x1000

1 2 3 4 5

Componente

Método de extracción: Análisis de componentes principales. Método de rotación: Normalización Varimax con Kaiser.

La rotación ha convergido en 9 iteraciones.a.

Obs

érve

se q

ue 1

6 de

los

18 in

dica

dore

s se

sat

uran

en

3 co

mpo

nent

es. E

l FI e

xplic

a 11

indi

cado

res,

el F

II 2,

y e

l FIII

3

indi

cado

r-es

. Los

FIV

y F

V ex

plic

an 1

indi

cado

r cad

a un

o, p

or lo

que

si

gnifi

cativ

idad

la c

orre

-laci

ón ít

em-fa

ctor

es

nula

, de

este

mod

o se

lo

gra

may

or re

ducc

ión

de la

dim

ensi

onal

idad

de

la v

aria

ncia

tota

l.

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología23

EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 218 Variables

Gráfico de Saturaciones con el Método de Rotación Varimax

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología24

EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 VariablesGráfico de componentes en espacio rotado

El Gráfico de saturación visualiza la ubicación en el espacio tridimensional los indicadores que están más saturados (más altos Coeficientes factoriales) en cada uno de los 3 componentes. En la opción de Extracción no se restringió el número de factores a extraer.

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología25

EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables

Gráfico de Saturaciones con el Método de Rotación Varimax

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología26

EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 VariablesGráfico de componentes en espacio rotado

El Gráfico de saturación visualiza la ubicación en el espacio bidimensional los indicado-res que están más saturados (más altos Coeficientes factoriales) en cada uno de los 2 componentes. En la opción de Extracción se restringió a 2 (dos) el número de factores a extraer. La cercanía o proximidad del indicador a uno de los ejes expresa que ese indicador está explicado (está saturado) por el componente más próximo a él.

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología27

ESCALA DE NACIONALISMO - MATRIZ FACTORIAL COEFICIENTES FACTORIALES Fj (Cargas o Saturaciones Factoriales)

F1 F2 F3 F4 F5Me gusta ser peruano 0,800Estoy orgulloso de ser peruano 0,790En general me agradan los peruanos 0,651Prefiero ser peruano más que de cualquier otro país 0,620Los peruanos no debemos mezclarnos con gente de otros países 0,811En el Perú solamente debería vivir la gente que es peruana 0,808Todos los peruanos deberían vivir en el Perú y no irse al extranjero 0,528Se debe cerrar las fronteras a productos de afuera 0,478No hay que confiar mucho en los países vecinos 0,702Las empresas norteamericanas vienen y se llevan la plata 0,671Todos los problemas del Perú surgen con la venida de los españoles durante la conquista 0,653Las inversiones chilenas en el Perú son un peligro para el país 0,625Siento que formo parte de una familia peruana 0,723Siento que comparto un mismo pasado con todos los peruanos 0,682Siento que tengo sangre chola 0,626A pesar de que hay excepciones, está claro que los peruanos somos más capaces que los habitantes de los países vecinos 0,766

Los peruanos son más valientes y patriotas que las personas de los países vecinos. 0,719Los peruanos somos mejores que las personas de otros países 0,519

http://www.waporcolonia.com/presentaciones/chaparro-saravia.pps#792,28,Diapositiva%2028http://www.waporcolonia.com/presentaciones/chaparro-saravia.pps#792,28,Diapositiva%2028

Autor: Prof. Rubén J. RodríguezEstadística II

Licenciatura en Sociología28

ANIMOSIDAD (3.68 de promedio)

ENDOGAMIA (2.89 de promedio)

PERTENENCIA GRUPAL (4.01 de promedio)

ORGULLO (4.24 de promedio)

DENOMINACIÓN DE LAS DIMENSIONES FACTORIALESPromedio en las Escalas Likert

SENTIMIENTO DE SUPERIORIDAD (3.42 de prom)

DIMENSIONES INCLUYENTES

DIMENSIONES DE CONFRONTACION

• De los 66 ítems iniciales se obtiene una escala de 18 ítems• Las dimensiones que mejor explican los cambios en puntuaciones generales son la

Endogamia, la Animosidad y Superioridad. Es ahí donde hay mayor varianza.