Clasificación de los datos por Oliverio Ramírez Una variable es la característica de la muestra o de la población que se desea estudiar. En el ejemplo del candidato que desea saber cuántas personas votarían por él, la variable es el número de votos. Esencialmente existen dos tipos de variables: 1) Variables cuantitativas 2) Variables cualitativas Si a la variable se le puede asignar un valor numérico entonces es una variable cuantitativa; por ejemplo el peso de las canastas de fresa recolectadas. Figura 1. Altura = variable cuantitativa Si a una variable no se le puede asignar un valor numérico entonces es una variable cualitativa; ejemplos de esta clase de variables son el color de piel y el estado civil. 1
Figura 2. Color de la piel =variable cualitativa Otra manera de clasificar las variables, es de acuerdo a los valores que puede tomar. 1) Continua 2) Discreta Si una variable puede tomar valores fraccionarios (1.2, 2.5, 46.8) se dice que es una variable continua. Este tipo de variable se puede obtener mediante un proceso de medición, por ejemplo: temperatura, peso, humedad. Cuál es tu peso?, conoces a alguien que pese exactamente lo mismo que tú?, para representar tu peso requieres números fraccionarios? En cambio, si la variable sólo puede tomar valores enteros se le denomina variable discreta. Se pueden obtener mediante el conteo o enumeración. Por ejemplo el número de asesores de la UVEG, el número de estudiantes inscritos en el curso de estadística, las piezas de pan producidas al día. Qué significado tendría 25.4 alumnos? o, se produjeron 345.2 piezas de pan? Hasta ahora hemos visto dos formas de clasificar las variables: 1) Cuantitativas y cualitativas 2) Continuas y discretas Además de las dos formas anteriores de clasificar las variables, también suelen clasificarse de acuerdo a su escala de medida. 1) Nominales 2) Ordinales 3) De intervalo 4) De razón 2
Las variables en escala nominal se generan cuando se utilizan los nombres o clasificaciones para datos en categorías distintas y separadas. Por ejemplo, en un estudio sobre bancos, las variables pueden ser: Banamex, Bancomer, Banorte y HSBC. Si se habla de los municipios del corredor industrial del estado de Guanajuato, las variables serían: Celaya, Salamanca, Irapuato, Silao y León. Algo que se debe tener en cuenta es que las variables nominales no señalan algún orden de preferencia. En el caso de los municipios del corredor industrial, podríamos ordenarlos por orden alfabético, o de acuerdo con el tamaño de cada municipio, o por la posición en el mapa; cualquiera de estas ordenaciones sería correcta. La siguiente tabla muestra un sistema para identificar el lugar de nacimiento de los estudiantes de la UVEG. Municipio de nacimiento de los estudiantes de la UVEG Número de alumnos Xichú 21 León 34 Irapuato 38 Salamanca 19 Pénjamo 15 Tabla 2. Lugar de nacimiento de los estudiantes de la UVEG. FUENTE: Elaboración propia con datos hipotéticos. A diferencia de la escala nominal, una escala ordinal sí hace un ordenamiento o sucesión de los datos. Por ejemplo, en una encuesta de opinión puede preguntarse a los usuarios sobre el servicio en la plataforma UVEG el cual puede calificarse, como excelente, bueno o regular. Cuando una variable se clasifica de acuerdo a un criterio de ordenación se llama variable ordinal. La siguiente tabla ilustra una escala ordinal. Servicio de la Plataforma UVEG Número de alumnos Excelente 27 Bueno 62 Regular 38 Tabla 3. Escala ordinal. FUENTE: Elaboración propia con datos hipotéticos. 3
Una escala de intervalo lleva intrínsecamente un ordenamiento o rango (al igual que las ordinales) y se miden de forma numérica. En una escala ordinal, la diferencia entre valores no es importante, en una escala por intervalos sí y las operaciones aritméticas son significativas. Un ejemplo típico de una variable que se mide en esta escala, es la temperatura, la cual suele medirse en grados Celsius. Esta escala no es absoluta, sino relativa. Por ejemplo, sabemos que la diferencia entre 20º C y 40º C es la misma que entre 45º C y 65º C; pero si se dice que el agua se encuentra a 0º C, no significa que no tiene temperatura. Resumiendo, existen dos características que distinguen la escala de medida de intervalo: 1) La diferencia entre valores es importante 2) El valor de cero es arbitrario Al respecto del punto 2, no existe alguna razón en particular que haya obligado a establecer la temperatura cero grados, simplemente es un valor de referencia arbitrario. Por último, las variables de razón se basan en un sistema numérico en donde el cero es un valor fijo y la diferencia entre valores es significativo; por ello las operaciones aritméticas multiplicación y división sí tienen una interpretación razonable, variables tales como el número de hijos, longitud, edad, entre otros. Nominal Las unidades de la escala son categorías. Los objetos se miden al determinar la categoría a la cual pertenecen. No existe una relación de magnitud entre las categorías. Ejemplo categoría de tenis: Nike, New Balance, Saucony. Figura 3. Figura 4. Figura 5. Ordinal: Posee la propiedad de magnitud. Se puede ordenar a los objetos según posean más, menos o igual cantidad de la variable medida. Así se puede determinar si A>B, A=B o A<B. No se puede determinar cuán mayor o menor es A que B en el atributo medido. Intervalos o proporciones Intervalos: Posee las propiedades de magnitud e intervalos iguales entre las unidades adyacentes. Se pueden hacer algunas determinaciones como en la escala ordinal y además determinar si A B=C D, A B >C D o A B< C - D. Proporciones: Posee las propiedades de magnitud, intervalos iguales entre las unidades adyacentes y un cero absoluto. Se pueden realizar todas las operaciones matemáticas asociadas por lo general con los números, incluyendo las proporciones. Tabla 4. Escalas de Medición y sus características. (Pagano, 2003, p.26) 4
En la tabla anterior, las escalas de medida se encuentran organizadas en orden de complejidad, siendo la escala nominal la menos compleja. Cada escala de medida ofrece más información sobre la variable que la escala anterior, por lo que para determinar qué escala de medida utilizar se necesita conocer el objetivo del estudio. Referencias Anderson, D., Sweedney, D. & Williams, T. (2004). Estadística para administración y economía. (8ª ed., en español, trad. Francisco Sánchez Fragoso). México: Editorial Thompson. [Versión electrónica]. Recuperado el 3 de agosto de 2011, de http://books.google.com.mx/books?id=rt7wtnm2roqc&pg=pa16&lpg=pa16&dq=la+estad %C3%ADstica+es+el+arte+y+la+ciencia+de+reunir,+analizar,+presentar+e+interpretar+dato s&source=bl&ots=mffql6ml4b&sig=2a_en0osmu0zebbtaddgbfaf1iq&hl=es&ei=zly6tut ZL7HViAKLi6m2Dg&sa=X&oi=book_result&ct=result&resnum=3&ved=0CCgQ6AEwAg#v=o nepage&q=la%20estad%c3%adstica%20es%20el%20arte%20y%20la%20ciencia%20de% 20reunir%2C%20analizar%2C%20presentar%20e%20interpretar%20datos&f=false Berenson, M. & Levine, D. (1996). Estadística básica en administración, conceptos y aplicaciones. (6ª ed., en español, trad. Homero Flores Samaniego). México: Pretince Hall. [Versión electrónica]. Recuperado el 3 de agosto de 2011, de http://books.google.com.mx/books?id=2n09o8- Oe0QC&printsec=frontcover&hl=es#v=onepage&q&f=false Pagano, R. (2003). Estadísticas para las ciencias del comportamiento. (5ta. Ed., en español, trad. Oscar Palmas Velasco). México: Editorial Thompson. 5