Tema 3 Aplicación de los modelos matemáticoestadísticos a la investigación social y la medición en las ciencias sociales
EL PROBLEMA DE LA MEDICIÓN EN EL ANÁLISIS SOCIAL Punto de partida: isomorfismo entre la realidad social y los axiomas matemáticos Para medir correctamente un objeto o hecho debe de existir Una igualdad entre las operaciones que se pueden hacer con Los números y las que se pueden realizar con los propios objetos o hechos El problema de múltiples paradigmas teóricos deviene en un problema metodológico. Falta de definiciones conceptuales unívocas que resulten operativas
EL PROCESO DE MEDICIÓN Definición: (Stevens) Procedimiento de asignación de numerales a objetos o acontecimientos de acuerdo con ciertas reglas. Es decir, medir es asignar números a objetos o eventos en modo de significado y de acuerdo a unas reglas, para que presenten sus propiedades y relaciones. Estas son fundamentales porque determinan el tipo de operaciones matemáticas que es posible realizar con cada medición
EL PROBLEMA DE LA MEDICIÓN EN EL ANÁLISIS SOCIAL Esta problemática se refleja en tres aspectos fundamentales: Medir fenómenos no directamente observables, felicidad, opiniones, valores...es necesario localizar las asociaciones o efectos de éstos Medir fenómenos de naturaleza cualitativa, separar las dimensiones y buscar indicadores o medirlos sólo parcialmente Falta de instrumentos de medida generalizados, se hace necesaria una construcción ad hoc y además su validez es transitoria debido a la dinámica intrínseca de los fenómenos sociales
EL PROCESO DE MEDICIÓN ETAPAS BASICAS: Definición del objeto de medición Operacionalización a partir de la definición PASOS TECNICOS: Dar un significado al concepto Identificación de dimensiones Creación y selección de indicadores Especificación de la relación entre indicadores y conceptos Construcción de escalas Aplicación de escalas Obtención de datos Criterios para la definición y operacionalización de conceptos Especificar claramente las definiciones utilizadas Utilizar las definiciones empleadas más frecuentemente Bondad de las definiciones e indicadores: validez y
Proceso de medición y escalas Escala: constructo o esquema relacional para la obtención de datos y que, a su vez, condiciona las operaciones que se Pueden llevar a cabo con los mismos. Los diferentes tipos de escala se configuran en función de los distintos supuestos numéricos que se puedan asumir. En este sentido, los datos obtenidos podrán ser aplicables a un mayor o menor número de análisis, respecto a estos mismos supuestos numéricos
Definición Las escalas se configuran como órdenes o constructos, que permiten atribuir números a fenómenos que observamos, convirtiéndolos en datos que podemos manejar según unas reglas. Son precisamente estas reglas las que constituyen y diferencian cada tipo de escala.
Criterios para la elaboración de escalas 1 Si una variable puede ser medida a partir de distintas escalas deberemos optar por el nivel de medida que posibilite utilizar los test estadísticos más poderosos -potentes, - con este concepto nos referimos a la capacidad o fuerza matemática de una técnica para rechazar la hipótesis nula-. 2 El criterio que debe de guiar la elección de cada escala es conseguir medir el fenómeno con la máxima precisión
Criterios para la elaboración de escalas Ejemplo: asistencia al cine como indicador del Nivel cultural, puede ser medido utilizando diferentes escalas: NOMINAL : Va usted al cine? 1 Si 2 NO ORDINAL : Con qué frecuencia va usted al cine? 1 Todos y casi todos los días 2 Una vez a la semana 3 Varias veces al mes 4 Una vez al mes 5 Casi nunca o nunca
Criterios para la elaboración de escalas Ejemplo: asistencia al cine como indicador del Nivel cultural, puede ser medido utilizando diferentes escalas: INTERVALO : Cuántas veces, al mes, va al cine? RAZÓN : Cuántas veces, al mes, va al cine?
De este modo la calidad y cantidad de información recogida Por cada tipo de escala es diferente INFORMACION DE DE LOS LOS NIVELES DE DE MEDICION
Estrategias para diferenciar tipos de escalas Escala dicotómica Tienen más de dos categorías no si Escala de intervalo o razón Escala ordinal Escala nominal La distancia entre las categorías es la misma si no Pueden ordenarse las categorías según rangos si no
INFORMACION DE LOS DISTINTOS NIVELES DE MEDICIÓN Nivel de medición Clasifica Ordena Unidades iguales Cero absoluto NOMINAL SI NO NO NO ORDINAL SI SI NO NO INTERVAL SI SI SI NO RAZÓN SI SI SI SI
ANÁLISIS ESTADÍSTICO Y NIVEL DE MEDICIÓN Nivel de medición MODA MEDIANA MEDIA NOMINAL SI NO NO ORDINAL SI SI NO INTERVAL SI SI SI RAZÓN SI SI SI
Nivel de medición Propiedades Operaciones Nominal Igualdad o desigualdad entre las unidades de análisis. Equivalencia a=b; Simetría Si a=b, b=a; y Transitividad Si a=b y b=c entonces a=c Equivalencia Ordinal Intervalo Razón Igualdad y desigualdad entre las unidades de análisis, además diferencia en grado. Simetría Si a>b, b<a; y Transitividad Si a>b y b>c entonces a>c Igualdad y desigualdad entre las unidades de análisis, además diferencia en unidades constantes, Pero no cero absoluto. Simetría Si a>b, b<a; y Transitividad Si a>b y b>c entonces a>c Igualdad y desigualdad entre las unidades de análisis, además diferencia en unidades constantes y cero absoluto. Simetría Si a>b, b<a; y Transitividad Si a>b y b>c entonces a>c Op. Rango Suma Resta Suma Resta Multiplicación División
Diferencia entre escalas de intervalo y de razón La diferencia de escalas de intervalo y de razón fue enunciada por Stevens Tipo de escala Intervalo Razón Limite de la escala Sin cero absoluto (arbitrario) Con cero absoluto
Diferencia entre escalas de intervalo y de razón La diferencia de escalas de intervalo y de razón fue enunciada por Stevens Tipo de escala Limite de la escala Intervalo 1 2 3 4 5 6 7 8 9 10 Razón 0 1 2 3 4 5 6 7 8 9
Diferencia entre escalas de intervalo y de razón Supongamos que dos individuos se sitúan en una escala de autoidentificación política ( de 0 a 9) con las puntuaciones de 2 y 4 respectivamente. En este caso, la puntuación del segundo es el doble de la del primero. Si alteramos el cero de la escala y lo situamos al nivel 1, la puntuación 2 se convertirá en 3 y la de 4 en 5. En este caso 5 no es el doble de 3.
Nivel de medición Descripción Estadísticos y gráficos NOMINAL ORDINAL INTERVALO O RAZON Valores no numéricos con ausencia de orden entre ellos Valores no numéricos con presencia de orden entre ellos Cuantitativa discreta: únicamente puede tomar una cantidad finita o numerable de valores numéricos Cuantitativa continua: puede tomar cualquier valor numérico en un intervalo En escala de intervalo: únicamente tiene sentido la diferencia entre sus valores Escala de razón: si, además de la diferencia, tiene sentido la razón entre sus valores Distribución de frecuencias Moda Diagrama de barras Mínimo Máximo Mediana Cuartiles Percentiles Rango intercuartílico Gráfico de Caja con bigotes Media Rango Varianza Desviación típica Coeficiente de variación Coeficiente de asimetría Coeficiente de curtosis Histograma Gráfico de caja con bigotes Gráfico de tallo y hojas
EL PROCESO DE MEDICIÓN El nivel de medición utilizado condiciona los procedimientos estadísticos a utilizar, y en sentido inverso la utilización de diversos procedimientos estadísticos exige determinados niveles de medición para su uso
Introducción al Análisis Multivariable Idoneidad de la aplicación del Análisis Multivariable bajo el principio de Causación Múltiple Sinergia social Principio de parsimonia informativa
Análisis Multivariable: definiciones (September 6, 1907 March 29, 1983) Kendall: Conjunto de técnicas estadísticas que analizan simultáneamente más de dos variables en una muestra de observaciones Cuadras: El Análisis Multivariable es una rama de la estadística y del análisis de datos que estudia interpreta y elabora el material estadístico sobre la base de un conjunto n>1 variables, que pueden ser de tipo cuantitativo, cualitativo o una mezcla de ambos
EL PROBLEMA DE LA MEDICIÓN EN EL ANÁLISIS SOCIAL La base del Análisis Multivariable es el cálculo matricial. Las matrices se estructuran en: Filas: unidades de análisis Columnas: Variables En ellas se recoge la información transformada en datos Numéricos correspondientes a las variables analizadas
Fases en el desarrollo del Análisis Multivariable Elaboración de la matriz de datos
Fases en el desarrollo del Análisis Multivariable Elaboración de la matriz de datos Depuración de datos Análisis univariable: descriptivo y exploratorio Análisis Bivariable Análisis Multivariable
Fases en el desarrollo del Análisis Multivariable
Criterios de clasificación de las Técnicas Multivariables OBJETIVO O FINALIDAD DEL ANÁLISIS : Exploratorias y descriptivas Explicativas y confirmatorias TIPO DE RELACIÓN ENTRE LAS VARIABLES Y NÚMERO DE VARIABLES (dependientes o independientes): Técnicas de dependencia Técnicas de interdependencia NIVEL DE MEDICION DE LAS VARIABLES: Técnicas paramétricas Técnicas no paramétricas La combinación de estos tres niveles y sus respectivas categorías, da lugar a múltiples clasificaciones
Técnicas Multivariables Propósito del Análisis Contrastes Correlación Métodos Descriptivos Ajuste de Modelos Predicción de Pertenencia VD =1 Núm ero de VD VD >1 VD =1 Nº de VD VD >1 Redu cción de la infor maci ón Tipo de descri pción Clasif icació n Sinc róni co Tipo de Ajust e Diac róni co K = 2 N º d e gr u p o s K > 2 K = 2 N º d e gr u p o s K > 2 V I = 1 N º d e VI I > 1 C Ti p o N C T ip o N T de Student Contrastes no paramétricos ANOVA T de Hoteling MANOVA R de Pearson Correlación no paramétrica Regresión Múltiple Correlación Canónica Análisis Discriminante Análisis Factorial Escalas Multi dimensionales Análisis de Correspondenci as Cluster Análisis Modelos Causales Modelos de Series Temporales ARIMA Modelos Log-lineales
Supuestos paramétricos Normalidad multivariable Homocedasticidad Tamaño muestral n>30 Linealidad Nivel de medición continuo
Supuestos paramétricos Normalidad multivariable Un requisito de la mayor parte de los análisis multivariables es la normalidad multivariable, que a su vez incluye como condición la normalidad univariable. Este requisito es una condición necesaria pero no suficiente, ya que el hecho de que todas las variables se ajusten a la ley normal no implica que conjuntamente sigan una distribución normal multivariable. Es necesario, por tanto, que todas las variables se distribuyan normalmente para los valores dados de las otras variables.
Supuestos paramétricos Homocedasticidad Según este supuesto, las varianza de las variables implicadas en el análisis no puede ser significativamente diferente, en caso contrario se habla de heterodasticidad. En resumen, las variables incluidas en un mismo análisis deben presentar una varianza similar. S 2 1 F = S 2 2 Siendo S 2 1>S 2 2
Supuestos paramétricos Linealidad Lleva implícita la aditividad y no multicolinealidad Y = a + b 1 x 1 + b 2 x 2 +...b k x k + e
Supuestos paramétricos Linealidad La no multicolinealidad se refiere a que las variables independientes, no deben estar relacionadas entre sí Y = a + b1x1 + b2x2 +...bkxk + e
Supuestos paramétricos Tamaño muestral n>30 Tamaño a partir del cual los estadísticos son estables
Supuesto paramétricos Nivel de medición continuo Los análisis paramétricos requieren el cálculo de parámetros, como la media, desviación típica, varianza correspondientes únicamente a variables continuas
Construcción de variables Dummy Nivel de desarrollo regional 1 Subindustrial 2 Semi-industrial 3 Industrial 4 Postindustrial Variables dummy o ficticias Z1 Subindustrial (Si =1)(No=0) Z2 Semi-industrial (Si =1)(No=0) Z3 Industrial (Si =1)(No=0)
Construcción de variables Dummy Y = a + b 1 X 1 + b 2 X 2 + c 1 Z 1 + c 2 Z 2 + c 3 Z 3 Y = (a + c 1 ) + b 1 X 1 + b 2 X 2 Subindustrial Y = (a + c 2 ) + b 1 X 1 + b 2 X 2 Semi-industrial Y = (a + c 3 ) + b 1 X 1 + b 2 X 2 + c 3 Industrial Y = a + b 1 X 1 + b 2 X 2 Postindustrial
Construcción de variables Dummy Categoría 1 Persona Casada 2 Persona Soltera 3 Persona Viuda 4 Persona Divorciada Variable Casado Variable Soltero 1 0 0 0 1 0 0 0 1 0 0 0 Variable Viudo
Construcción de variables Dummy Satisfacción = a + b 1 Salud + b 2 casado + b 3 soltero + b 4 viudo Satisfacción = 20 + 3 Salud + 11,5 casado + 5 soltero - 3 viudo Para los casados que tienen asignado el valor 1 en la variable CASADO y 0 en el resto al sustituir estos valores en la ecuación: Satisfacción = 20 + 3 Salud + 11,5 casado = 31,5 + 3 salud Para los solteros: Satisfacción = 20 + 3 Salud + 5 soltero = 25 + 3 salud Para los viudos: Satisfacción = 20 + 3 Salud - 3 viudo = 17 + 3 salud Para los divorciados: Satisfacción = 20 + 3 Salud