SEMINARIO DE POSGRADO
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL Titular: Agustín Salvia MÓDULO 4 B
ANÁLISIS FACTORIAL
ANÁLISIS FACTORIAL EN LA INVESTIGACIÓN SOCIAL SE TRABAJA CON MUCHOS CONCEPTOS COMPLEJOS QUE NO SON DIRECTAMENTE OBSERVABLES
USOS MÁS FRECUENTES
Reducción de información
Identificación de estructuras subyacentes
Creación de variables resumen
ANÁLISIS FACTORIAL El Análisis Factorial es una técnica que consiste en resumir la información contenida en una matriz de datos con V variables. Para ello se identifican un reducido número de factores F, siendo el número de factores menor que el número de variables. Los factores representan a la variables originales, con una pérdida mínima de información. El modelo del Análisis Factorial se expresa como una combinación lineal de factores no
ANÁLISIS FACTORIAL FACTOR PRINCIPAL
El Análisis Factorial (método factor principal) supone que existe un factor común subyacente a las variables. Este método busca factores que expliquen la mayor parte de la varianza común. La varianza común es la parte de la variación de la variable que es compartida con las otras variables. La varianza única es la parte de la variación de la variable que es propia
ANÁLISIS FACTORIAL COMPONENTES PRINCIPALES
El Análisis Factorial (método componentes principales) no supone que existe un factor común subyacente a las variables. El Análisis de Componentes Principales busca hallar combinaciones lineales de las variables originales que expliquen la mayor parte de la variación total. El primer factor o componente sería aquel que explica una mayor parte de la varianza total, el segundo factor sería aquel que explica la mayor parte
ANÁLISIS FACTORIAL Para que el Análisis Factorial tenga sentido deberían cumplirse dos condiciones básicas: Parsimonia e Interpretabilidad Según el principio de parsimonia el número de factores debe ser lo más reducido posible y estos deben ser susceptibles de interpretación sustantiva. Una buena solución factorial es aquella que es sencilla e interpretable.
ANÁLISIS FACTORIAL Se asume que los factores únicos no están correlacionados entre sí ni con los factores comunes. Se puede distinguir entre Análisis Factorial Exploratorio, donde no se conocen los factores "a priori“ sino que se identifican por el análisis factorial y, por otro lado estaría el Análisis Confirmatorio donde se propone "a priori" un modelo, según el cual hay unos factores que representan mejor a las variables originales.
ANÁLISIS FACTORIAL PASOS EN EL ANALISIS FACTORIAL 1- Calcular la matriz de correlaciones entre todas las variables (conocida habitualmente como matriz R). 2- Extracción de los factores necesarios para representar los datos. Análisis de la matriz de cargas. 3- Rotación de los factores con objeto de facilitar la interpretación. Representación gráfica.
ANÁLISIS FACTORIAL REQUISITOS PARA SU UTILIZACIÓN Selección de variables que formen conjuntos correlacionados. Variables deben estar en escala métrica. Un mínimo de 100 casos
ANÁLISIS FACTORIAL EJEMPLO Se intentan conocer los determinantes de los ingresos de la ocupación principal de los asalariados. Dado que se supone que estos están asociados a un conjunto de características de la persona y del puesto. Dado que el conjunto de variables es grande y se sospecha que algunas de ellas están muy relacionadas, por lo que parece conveniente antes del análisis intentar determinar si existen subconjuntos diferenciados de ellas.
ANÁLISIS FACTORIAL EXAMEN DE LA MATRIZ DE CORRELACIONES 1- El primer paso en el Análisis Factorial será calcular la matriz de correlaciones entre todas las variables que entran en el análisis. 2- Una vez que se dispone de esta matriz cabe examinarla para comprobar si sus características son adecuadas para realizar un Análisis Factorial. 3- Uno de los requisitos que deben cumplirse para que el Análisis Factorial tenga sentido es
ANÁLISIS FACTORIAL EJEMPLO EXAMEN DE LA MATRIZ DE CORRELACIONES Correlation Matrix
Correlation
Sig. (1-tailed)
Tamaño del establecimiento Nivel de Instrucción Edad Calificación laboral Tamaño del establecimiento Nivel de Instrucción Edad Calificación laboral
Tamaño del estableci miento
Nivel de Instrucción
1,000
,281
,136
,379
,281 ,136 ,379
1,000 -,101 ,554
-,101 1,000 ,164
,554 ,164 1,000
,000
,000
,000
,000
,000 ,000
,000 ,000 ,000
,000 ,000
Edad
,000
Calificació n laboral
ANÁLISIS FACTORIAL
MATRIZ DE CARGA FACTORIAL El Análisis Factorial extrae una matriz factorial: 1 2
F1 P11 P12
F2 P21 P22
• Cada columna es un factor y cada fila una variable. Los elementos Pij pueden interpretarse como índices de correlación entre el factor i y la variable j. • Estos coeficientes reciben el nombre de pesos o cargas factoriales. Las cargas indican el peso de cada variable en cada factor. Lo ideal es que
ANÁLISIS FACTORIAL
EJEMPLO
Component Matrixa Component 1 Tamaño del establecimiento Nivel de Instrucción Edad Calificación laboral
2 ,680
,202
,775 ,185 ,859
-,412 ,931 1,103E-02
Extraction Method: Principal Component Analysis. a. 2 components extracted.
ANÁLISIS FACTORIAL
EIGENVALUES (VALORES PROPIOS) • El cuadrado de una carga factorial indica la proporción de la varianza explicada por un factor en una variable particular. • La suma de los cuadrados de los pesos de cualquier columna de la matriz factorial es lo que denominamos eigenvalues, indica la cantidad total de varianza que explica ese factor. • Las cargas factoriales pueden tener como valor máximo 1, por tanto el valor máximo que puede alcanzar el valor propio es igual al
ANÁLISIS FACTORIAL
EJEMPLO
EXTRACCIÓN DE MATRIZ FACTORIAL Communalities Initial Tamaño del establecimiento Nivel de Instrucción Edad Calificación laboral
Extraction
1,000
,504
1,000 1,000 1,000
,771 ,900 ,738
Extraction Method: Principal Component Analysis.
Total Variance Explained
Component 1 2 3 4
Initial Eigenvalues % of Cumulativ Total Variance e% 1,836 45,910 45,910 1,077 26,913 72,823 ,702 17,544 90,367 ,385 9,633 100,000
Extraction Method: Principal Component Analysis.
Extraction Sums of Squared Loadings % of Cumulativ Total Variance e% 1,836 45,910 45,910 1,077 26,913 72,823
Rotation Sums of Squared Loadings % of Cumulativ Total Variance e% 1,821 45,531 45,531 1,092 27,292 72,823
ANÁLISIS FACTORIAL
COMUNALIDADES
• Se denomina "comunalidad" a la proporción de la varianza explicada por los factores comunes en una variable. La comunalidad es la suma de los pesos factoriales al cuadrado en cada una de las filas. • El Análisis Factorial comienza sus cálculos a partir de lo que se conoce como matriz reducida compuesta por los coeficientes de correlación entre las variables y con las comunalidades en la diagonal. • Como la comunalidad no se puede saber hasta
ANÁLISIS FACTORIAL
NUMERO DE FACTORES A CONSERVAR La matriz factorial presenta un número de factores superior al necesario para explicar la estructura de los datos. Generalmente hay un conjunto reducido de factores, los primeros, que son los que explican la mayor parte de la variabilidad total. Los otros factores suelen contribuir relativamente poco. Existen diversos criterios para determinar el número de factores a conservar. Uno de los más utilizados es la regla de Kaiser: "conservar aquellos factores cuyos valores propios (eigenvalues) son mayores a
ANÁLISIS FACTORIAL
EJEMPLO
Scree Plot 2,0
1,5
Eigenvalue
1,0
,5
0,0 1
Component Number
2
3
4
ANÁLISIS FACTORIAL
ROTACIONES FACTORIALES La matriz factorial resulta difícil de interpretar pues no queda claro en que factor satura cada variable. Para facilitar la interpretación se realizan lo que se denominan rotaciones factoriales, la cual consiste en hacer girar los ejes de coordenadas, que representan a los factores, hasta conseguir que se aproxime al máximo a las variables en que están saturados. La saturación de factores transforma la matriz factorial inicial en otra denominada matriz factorial rotada, de más fácil interpretación. La matriz factorial rotada es una combinación lineal
ANÁLISIS FACTORIAL
EVALUACIÓN DE LA MATRIZ ROTADA La matriz factorial debe reunir las siguientes características: 1- Cada factor debe tener unos pocos pesos altos y los otros próximos a 0. 2Cada variable no debe estar saturada más que en un factor. 3- Los factores distintos deben presentar distribuciones de cargas altas y bajas distintas. Con la rotación factorial aunque cambie la matriz factorial las comunalidades no se alteran, sin embargo, cambia la varianza explicada por cada factor. Existen varios métodos de rotación: ortogonales para factores independientes
ANÁLISIS FACTORIAL EJEMPLO MATRIZ ROTADA Rotated Component Matrixa
Component Transformation Matrix
Component 1 Tamaño del establecimiento Nivel de Instrucción Edad Calificación laboral
2 ,645
,296
,826 5,196E-02 ,849
-,298 ,947 ,132
Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. a. Rotation converged in 3 iterations.
Component 1 2
1 ,990 -,141
2 ,141 ,990
Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.
ANÁLISIS FACTORIAL EJEMPLO Component Plot in Rotated Space edad
1,0
,5 tamaño del estableci calificación laboral 0,0
Component 2
nivel de instrucción -,5
-1,0 -1,0
Component 1
-,5
0,0
,5
1,0
ANÁLISIS FACTORIAL INTERPRETACIÓN DE RESULTADOS Dos cuestiones pueden ayudar a la interpretación y reconocimiento de los factores: 1) Ordenar la matriz rotada de forma que las variables con saturaciones altas en un factor aparezcan juntas. 2) Eliminar las variables con cargas factoriales bajas (aquellas por debajo de 0,25). Llamaremos variable compleja a aquella que satura altamente en más de un factor y que no debe ser utilizada para identificar los factores. Factores bipolares, son aquellos en los que unas variables cargan positivamente y otras