El Mapa del Cáncer en España, mediante transformaciones que incrementan la discriminación



Documentos relacionados
DISTRIBUCIÓN DE LA SUPERFICIE DE LA VIVIENDA EN ESPAÑA Félix Alonso Luengo María Gómez Riocerezo

Capital Humano Nº 85. Enero Diferencias territoriales en el aprovechamiento del capital humano.

ÍNDICE. Ayudas a trabajadores afectados por Procesos de Reestructuración de Empresas (APR)

Valores de Tasación de la vivienda a 30 de Septiembre de 2005

Los accidentes leves de tráfico crecen por primera vez en siete años

VIZCAYA GUIPUZCOA ALAVA NAVARRA BURGOS LA RIOJA HUESCA SORIA ZARAGOZA CUENCA CIUDAD REAL ALBACET E ALICANTE CORDOBA JAÉN MURCIA ALMERIA

Trabajamos para ti

En España casi 20 millones de personas tienen un seguro de Decesos

Todas las comarcas 0,10 0,33 0,18 0,35 0,20 0,39 0,22. Todas las comarcas 0,10 0,33 0,18 0,35 0,20 0,39 0,22

El importe medio de las hipotecas constituidas durante el año 2006 aumentó un 13,9% y alcanzó los euros

6. DINAMICA DE LA POBLACION

INFORME SOBRE EL ASOCIACIONISMO Y LA COLEGIACIÓN EN EL SECTOR DE LA MEDIACIÓN DE SEGUROS

El importe medio de las hipotecas constituidas durante el año 2005 aumentó un 13,7% en tasa interanual y alcanzó los euros

Valores de Tasación de la vivienda a 31 de Marzo de 2004

2º TRIMESTRE. Informe Trimestral de ST Sociedad de Tasación Tendencias del Sector Inmobiliario

JOSE-GINES MORA RUIZ ()

Estadísticas de Colegiados y Oficinas de Farmacia Consejo General de Colegios Oficiales de Farmacéuticos

Ayudas a la competición 2015

BASE ESTATAL DE DATOS DE PERSONAS CON DISCAPACIDAD

6. Número de empresas con establecimientos en la Región de Murcia según provincia de la sede central y actividad principal en la Región.

Crece la movilidad de los trabajadores en España

C- Tipo de registro 2

ESTUDIO SOBRE NIVELES DE PRECIOS DE PRODUCTOS

COMPARATIVA POR CAPITALES DE PROVINCIA DE LOS SALARIOS EN LA ADMÓN. DE JUSTICIA

GABINETE DE ESTUDIOS 01/10/2014

Anuncio de licitación Número de Expediente Publicado en la Plataforma de Contratación del Estado el a las 14:13 horas.

BASE ESTATAL DE DATOS DE PERSONAS CON VALORACIÓN DEL GRADO DE DISCAPACIDAD


Capital Humano. Distribución del capital humano en España. núm. Septiembre 2007 INSTITUTO VALENCIANO DE INVESTIGACIONES ECONÓMICAS

PROPUESTA NORMAS DE CONSTITUCIÓN Y DESARROLLO DE LOS COMITÉS DE APLICACIÓN Y SEGUIMIENTO DEL CONVENIO DE COLABORACIÓN ENTRE LA TESORERÍA GENERAL

abril informe mensual de precios de venta

13 de Febrero de 2009

ESTADÍSTICAS MENSUALES RGPD

PROCEDENCIA DE LOS ALUMNOS DE NUEVO INGRESO EN GRADOS POR COMUNIDAD Y DISTRITO 2015/16

ESTADÍSTICAS MENSUALES RGPD

RESUI_TADOS DE ESTUDIOS EN LA ENSEÑANZA OBLIGATORIA CURSO

Solo el 7% de las personas con discapacidad que buscan trabajo han tenido un empleo anteriormente

Pagina Anterior Conectar con la DGT en Internet Sumario Enlace a Tabla Pagina Siguiente

21,4 18,6. Censo 2001

1. Aspectos Epidemiológicos. Una visión global del cáncer en Asturias. 1

ANALISIS DEL OBSERVATORIO TURÍSTICO DE LA COMARCA DE SOMONTANO 2011

Informe Observatorio Inverco: Datos de patrimonio y partícipes de Fondos de Inversión por Comunidades Autónomas y provincias

INSCRIPCIONES VOLUNTARIOS. Registro Oficial de Licitadores y Empresas Clasificadas del Estado DESDE OTROS REGISTROS

Total Residentes Residentes Total Residentes Residentes Estancia en España en el en España en el Media extranjero extranjero (días)

FUNCIONES DE LAS DELEGACIONES COMERCIALES. 2. Configuración de las Delegaciones Comerciales

PRUEBAS REALIZADAS SOBRE EL NÚMERO DE SUSCRIPTORES

PRECIOS DE CARBURANTES Y COMBUSTIBLES

Capitán de fragata ingeniero AGUSTÍN E. GONZÁLEZ MORALES. ÁLGEBRA PARA INGENIEROS (Solucionario)

Tabla de los Mínimos exentos de tributación en el IRPF vigente, según las cargas familiares: tributación conjunta

Prestaciones familiares por hijo a cargo (PRF)

El importe medio de las hipotecas constituidas en enero aumenta un 9,6% en tasa interanual y alcanza los euros

Juventud en Cifras. Población

Pagina Anterior Conectar con la DGT en Internet Sumario Enlace a tabla Pagina Siguiente

ACCIDENTES MORTALES EN CARRETERA VERANO 2008*

El Cáncer en Cifras - España 2013

LINEA: SEGURO RETIRADA Y DESTRU. MODULO: 1. TARIFA: RyD - Cérvidos-Cérvidos RETIRADA Y DESTRUCCION ESPECIE GRUPO RAZAS TIPO ANIMAL

Plan de instalación de puntos fijos de control de velocidad

Los intentos de fraude al Seguro aumentaron un 2,4% en 2013

El importe medio de las hipotecas constituidas en febrero aumenta un 11,2% en tasa interanual y alcanza los euros

DATOS DE LOS REGISTROS DEL SERVICIO PÚBLICO DE EMPLEO ESTATAL DEMANDANTES DE EMPLEO, PARO, CONTRATOS Y PRESTACIONES POR DESEMPLEO OCTUBRE

Voluntariado / Socios / Desarrollo Local

AVDA. DE MIJAS, 14. EDIF. ALEGRÍA, 1. LOCAL. (29640) FUENGIROLA TELF.: / FAX: MBE224@MBE.ES

Servicio Integral de Certificación Energética de Edificios

ESTADÍSTICAS MENSUALES RGPD

ESTADÍSTICAS MENSUALES RGPD

Empresas Inscritas en la Seguridad Social (EMP)

Presentación n General Profesionales Colegiados

BOLETÍN OFICIAL DEL ESTADO

CONSEJO GENERAL DE COLEGIOS OFICIALES DE MÉDICOS MEMORIA DE ACTIVIDADES DEL ÁREA ECONÓMICO-FINANCIERA

MINISTERIO DEL INTERIOR

HIPOTECAS JULIO 2015

HIPOTECAS AGOSTO 2015

Interrupción Voluntaria del Embarazo

2. Demografía INE. Anuario Estadístico de España 2012

HIPOTECAS OCTUBRE 2015

SISTEMA DE CIUDADES EN ESPAÑA

HIPOTECAS NOVIEMBRE 2015

Consideraciones sobre la norma técnica para protección de motoristas en la Comunitat Valenciana

Plan 2000E: Percepción de los conductores Españoles. PLAN 2000E: Percepción de los conductores Españoles

El patrimonio medio en Planes de Pensiones Individuales se situó en 2014 en euros, un 10,8% más que el año anterior

Número de casos por año y sexo. Región de Murcia

ANEXO III: PUESTOS CONVOCADOS

ESTUDIO DEL SEGUIMIENTO DE LA OFERTA DE NUEVA CONSTRUCCIÓN DE VIVIENDAS EN LAS PRINCIPALES CIUDADES DE ESPAÑA. - Informe de Resultados -

LINEA: SEGURO RETIRADA Y DESTRU. MODULO: 1. TARIFA: RyD Bovino Cebo Industrial RETIRADA Y DESTRUCCION ESPECIE GRUPO RAZAS

El importe medio de las hipotecas constituidas durante el año 2007 aumentó un 7,5% y alcanzó los euros

ANEXO III RELACIÓN DE PLAZAS CONVOCADAS

5.2. Los estudiantes extranjeros no universitarios

VECTORES. Módulo, dirección y sentido de un vector fijo En un vector fijo se llama módulo del mismo a la longitud del segmento que lo define.

ESTADÍSTICAS DE PRODUCCIÓN HORMIGÓN PREPARADO III TRIMESTRE DEL AÑO 2.008

/ /

Población. Un millón más de empadronados. Illes Balears, la que más crece. Cifras de población a 1 de enero de 2008

3. Evolución del valor tasado de las viviendas libres.

Informe Panorámica del Sector Financiero en España Enero de 2007

2º trimestre. Informe Trimestral de ST Sociedad de Tasación Tendencias del Sector Inmobiliario

PRECIOS DE RESIDENCIAS GERIÁTRICAS PARA PERSONAS MAYORES, ESTUDIO inforesidencias.com

Adela Cortina UNA NUEVA PROPUESTA PARA EDUCACIÓN EN VALORES PROYECTO MÁSQUECUENTOS

CONSUMO PER CÁPITA POR PROVINCIAS EN EL HOGAR TOTAL AÑO 2012

AYUDAS PARA LA ADAPTACIÓN DE LAS INSTALACIONES DE ANTENA COLECTIVA DE TDT

GABINETE DE ESTUDIOS 01/10/2013

INFORME DE SUPERVISIÓN DEL MERCADO DE GLP CANALIZADO

Transcripción:

El Mapa del Cáncer en España, mediante transformaciones que incrementan la discriminación Francisco Álvarez González (1), Héctor M. Ramos Romero (1), David Almorza Gomar (1), Juan Luis González Caballero (1), Mª Ángeles Bailén García (2) (1) Departamento de Matemáticas. Universidad de Cádiz. (2) Hospital Universitario Puerta del Mar. Cádiz. Palabras clave: Asociaciones; Incremento de variabilidad; Descomposición en Valores Singulares; Inercia relativa. Resumen Estudios biológicos, epidemiológicos, demográficos, medioambientales, etc., utilizan técnicas multivariantes para la detección de patrones de comportamiento, búsqueda de relaciones entre objetos o clasificación de los mismos. Con frecuencia, la variabilidad o inercia asociada a los primeros ejes factoriales es muy baja, de forma que se obtienen grupos difusos de objetos dificultando su estudio. En un amplio número de casos, especialmente los de ámbito geográfico, el interés puede estar en reducir a una variable o un único factor la información contenida en la matriz que representa el modelo estudiado, con el fin de poder representarlo sobre un mapa. En consecuencia, sería de utilidad la determinación de procedimientos que permitan el aumento de la variabilidad explicada por los primeros ejes de representación en subespacios de dimensión reducida, incrementando la capacidad de discriminación entre grupos de objetos que inicialmente pueden agruparse en conjuntos difusos. El presente trabajo tiene como objetivo mostrar un procedimiento simple, basado en la descomposición en valores singulares (DVS), que incrementará la variabilidad explicada por los primeros ejes factoriales de representación, posibilitando una mayor discriminación entre los objetos analizados. Generalmente, la expresión D U..V ( U. a 1 a = θ = θ )(. θ.v ) = X. Y define las coordenadas X e Y para la representación biplot de casos y variables mediante proyecciones en subespacios de dimensión reducida. Denominamos Matriz de Asociaciones Generalizadas de índice α a la matriz Λ α), definida por α ) α Λ = X. θ.y donde X e Y son las matrices que contienen las coordenadas de representación de casos y variables, y θ la matriz diagonal de valores singulares, resultantes de la DVS de la matriz inicial o su transformada ( D = U. θ. V ). Estas matrices verifican la siguiente propiedad fundamental: La matriz de asociaciones generalizadas de índice α, posee los mismos vectores singulares derechos e izquierdos que los de la matriz inicial D, siendo sus valores singulares potencias (α+1)-ésimas de los de D.

Esto producirá una deformación del elipsoide de concentración, dilatando los primeros ejes y comprimiendo los últimos, permitiendo diferenciar grupos que, en condiciones normales, aparecen difusos. Aplicamos el procedimiento para la construcción del Mapa del Cáncer en España, a partir de los datos contenidos en el ATLAS DE MORTALIDAD POR CÁNCER Y OTRAS CAUSAS EN ESPAÑA (1978-1992), publicado en 1996. El Q-Análisis Factorial ha sido, junto al Análisis de Correspondencias, la técnica aplicada en los sucesivos intentos de resolver el problema que nos ocupa. Con el fin de incrementar la variabilidad de los primeros ejes factoriales y poder discriminar grupos de provincias con comportamientos diferenciados, aplicamos un Q-Análisis Factorial a partir de matrices de asociaciones. Los pesos factoriales correspondientes al primer factor permiten la representación del Mapa del Cáncer, observando: En hombres, el mapa muestra comportamientos diferenciados de provincias interiores (excepto Madrid y Zaragoza) con las litorales, ampliando la franja cuanto más al sur (agregación costa-interior). En mujeres, la mortalidad aumenta en sentido interior-costa, con menor dominancia sur que la apreciada para los hombres. Transformación que modifica la variabilidad Realizada (o no) una transformación i de los datos contenidos en la matriz inicial M n p, obtenemos la matriz n p D a la que aplicamos la DVS. Sea D = U. θ. V con: 2 θ = diag( θi ) = diag( λ i ) y θi = λ i = autovalores de D. D o D. D. U = autovectores ortonormales de D. D. V = autovectores ortonormales de D. D. = θ = θ θ = mediante proyecciones en subespacios de dimensión reducida. a 1 a Generalmente, la expresión D U..V ( U. )(..V ) X. Y Definición de Asociación Generalizada de índice α: define las coordenadas X e Y para la representación biplot de casos y variables Denominamos Matriz de Asociaciones Generalizadas de índice α a la matriz Λ α), definida por α) α Λ = X. θ.y donde X e Y son las matrices que contienen las coordenadas de representación de casos y variables, y θ la matriz diagonal de valores singulares, resultantes de la DVS de la matriz inicial o su transformada ( D = U. θ. V ). Denominamos asociaciones ordinarias a las asociaciones generalizadas de índice α = 1. Estas asociaciones permiten, en ciertos casos (Biplot simple, Biplot simétrico, Análisis de Correspondencias), evaluar numéricamente el grado de relación existente entre casos y variables (o categorías fila y

columna en el supuesto de tablas de incidencia), constituyendo un coeficiente de interpretación de la representación en un subespacio de dimensión reducida. Proposición 1: Si, a partir de la matriz inicial de datos (M) o su transformada (D), definimos la matriz de asociaciones de índice α, Λ los mismos vectores singulares que la matriz D y valores singulares iguales a la potencia (α+1)-ésima de los de D. En efecto, siendo 1 1 D = U. θ.v = U. 2. 2.V θ θ = X.Y, la matriz de asociaciones generalizadas de índice α verificará como se establece en la proposición. Incremento de variabilidad: Λ 1 1 α) α 2 α 2 α+ 1 = X. θ.y = U. θ. θ. θ.v = U. θ.v, α ) α = X. θ. Y, dicha matriz tiene Se obtiene así una modificación de la inercia o variabilidad relativa. Por ejemplo, las inercias correspondientes a la representación en el subespacio de dimensión dos serán: λ + λ α+ 1 α+ 1 1 2 λ en la matriz inicial D : = I 1 + λ 2 r en la matriz de asociaciones de índice α : = I r α λ α+ 1 λ i= 1 Al ser λ 1 λ 2 λ 3... 0, deducimos que I α I. Esto producirá una deformación del elipsoide de concentración, dilatando los primeros ejes y comprimiendo los últimos (Figura 1). Con ello podremos diferenciar grupos que, en condiciones normales, aparecen difusos. i i= 1 i Figura 1: Dilatación del elipsoide de concentración

Adaptación a tablas de incidencia: Partiendo de una tabla de incidencia M, totalizamos filas y columnas. Sean: mij M = ( m ) P =, y f = m i j = p n ij p n p 1 m ; c m n 1 m Calculadas las matrices F diag( f ) ; C diag( c) p p = n n =, obtenemos la matriz: D 1 2 ( P f.c ). C 1 2 p n F. = (matriz centrada). La DVS de la matriz centrada D (o de perfiles centrados), permite la obtención de las coordenadas X e Y para la representación de categorías fila y columna. Proposición 2: La matriz de asociaciones generalizadas para la matriz centrada D, Λ de D. En efecto, se verifica que: α ) α = X. θ 1 1 1 1 α) α 2 α 2 2 α+ 2 T Λ = X. θ.y = F.U... C.V. = F.U. θ.v.c 2 θ θ θ, obteniendo así potencias (α+2)-ésimas de los valores singulares iniciales. El Cáncer en España Datos base del estudio m. Y, posee valores singulares iguales a la potencia (α+2)-ésima de los Los datos se han tomado del ATLAS DE MORTALIDAD POR CÁNCER Y OTRAS CAUSAS EN ESPAÑA (1978-1992), de Gonzalo López- Abente Ortega y Marina Pollán Santamaría (Instituto de Salud Carlos III. Madrid), Antonio Escolar Pujolar (Hospital Universitario Puerta del Mar. Cádiz), Manuel Errezola Saizar (Departamento de Sanidad. Vitoria) y Víctor Abraira Santos (Hospital Ramón y Cajal. Madrid), publicado en 1996. Los ficheros de datos contienen los campos siguientes: Número de defunciones, Tasa ajustada por edad (población europea), Tasa ajustada por edad (población mundial), Riesgo acumulado, Tasa truncada ajustada, Edad media de muerte, Número de defunciones por 100.000 habitantes (o tasa cruda, utilizada en el presente estudio), Razón de tasas de cada provincia frente al promedio, Tendencia temporal, Grupo al que pertenece la provincia respecto a la distribución de la tasa ajustada por edad, Proporción de defunciones respecto al total de defunciones por cáncer en esa provincia, Proporción de Años Productivos de Vida Perdidos (APVP) sobre el total de APVP por cáncer en esa provincia. T

29 tipos de cáncer en hombres 30 tipos de cáncer en mujeres 1. Cáncer de Boca y Faringe 16. Cáncer de Peritoneo 1. Cáncer de Boca y Faringe 16. Cáncer de Peritoneo 2. Cáncer de Colon 17. Cáncer de Piel 2. Cáncer de Colon 17. Cáncer de Piel 3. Cáncer de Encéfalo 18. Cáncer de Pleura 3. Cáncer de Encéfalo 18. Cáncer de Pleura 4. Cáncer de Esófago 19. Cáncer de Pulmón 4. Cáncer de Esófago 19. Cáncer de Pulmón 5. Cáncer de Estómago 20. Cáncer de Recto 5. Cáncer de Estómago 20. Cáncer de Recto 6. Cáncer de Hígado 21. Cáncer de Riñón 6. Cáncer de Hígado 21. Cáncer de Riñón 7. Linfoma de Hodgkin 22. Cáncer de Tiroides 7. Linfoma de Hodgkin 22. Cáncer de Tiroides 8. Linfoma No Hodgkin 23. Cáncer de Vejiga 8. Linfoma No Hodgkin 23. Cáncer de Vejiga 9. Cáncer de Huesos 24. Cáncer de Vesícula 9. Cáncer de Huesos 24. Cáncer de Vesícula 10. Cáncer de Intestino Delgado 25. Cáncer de Mama en Hombres 10. Cáncer de Intestino Delgado 25. Cáncer de Mama 11. Cáncer de Laringe 26. Cáncer de Labio 11. Cáncer de Laringe 26. Cáncer de Labio 12. Leucemia 27. Cáncer de Nasofaringe 12. Leucemia 27. Cáncer de Nasofaringe 13. Melanoma Maligno 28. Cáncer de Fosas Nasales 13. Melanoma Maligno 28. Cáncer de Fosas Nasales 14. Mieloma 29. Cáncer de Testículo 14. Mieloma 29. Cáncer de Ovario 15. Cáncer de Páncreas 15. Cáncer de Páncreas 30. Cáncer de Útero Técnicas clásicas aplicadas y nueva metodología Para el análisis de la agregación geográfica, los trabajos publicados sobre este tema han utilizado un método estadístico simple que permite responder a la pregunta de sí una agrupación espacial ha podido ocurrir por azar. El método está basado en la observación de pares de provincias contiguas midiendo sus diferencias en el 'ranking' de las tasas. Para ello se calcula un parámetro D que es la diferencia media en el 'ranking' de todos los K pares de provincias adyacentes. Esto nos da una idea de la agregación espacial, es decir, si la D es muy pequeña las provincias con niveles de riesgo parecido están próximas. Para ello, construimos una variable que representa el orden o posición de cada provincia en el ranking total de las tasas, calculamos D k que es el valor absoluto de la diferencia en el ranking de las provincias que hacen la frontera k y calculamos la media de las diferencias absolutas en el ranking entre provincias adyacentes. La dificultad viene de la determinación de la varianza de la variable D bajo la hipótesis nula. El valor esperado de D es simplemente (N+1)/3, donde N es el número de provincias, y por simulación puede conocerse su distribución generando mapas aleatorios. Se han generado 10 millones de mapas aleatorios para las 47 provincias que tienen otras adyacentes (se excluyeron Ceuta y Melilla). El número de fronteras son 110. El valor medio de D es 15.983, que coincide con el valor esperado, y la varianza es 0.887. Nosotros abordamos la resolución del problema, aplicando técnicas multivariantes. Tratándose la matriz de datos de una tabla de incidencia, abordamos inicialmente el estudio mediante la aplicación de un Análisis de Correspondencias. El Q-Análisis Factorial ha sido, junto al Análisis de Correspondencias, la técnica aplicada en los sucesivos intentos de resolver el problema que nos ocupa. Para este caso, y con el fin de incrementar la variabilidad de los ejes factoriales y poder discriminar grupos de provincias con comportamientos diferenciados, lo aplicaremos a partir de matrices de asociaciones.

Análisis de Correspondencias Aplicado un Análisis de Correspondencias, analizamos la variabilidad explicada por los dos primeros ejes factoriales, lo cuál medirá el grado de bondad de la representación del subespacio factorial bidimensional. Cáncer en hombres 0,3 Análisis de Correspondencias PLEURA Autovalor 0,024 0,020 0,016 0,012 0,008 Autovalores - Análisis de Correspondencias 0,2 0,1 0,0-0,1-0,2 RECTO GranCanaria Guipúzcoa LINFOMA EXOFAGO Tenerife MELANOMA PERITONE MIELOMA Baleares BOCA PANCREAS Vizcaya Tarragona Navarra Alava Lugo Barcelona Gerona Huesca León ENCEFALO VESICULA COLON LaRioja Lérida Orense Cantabria AsturiasMadrid Zaragoza INTESTIN Alicante Pontevedra Teruel NASAL HODGKIN Sevilla Valladolid RINON Burgos Coruña Castellón Palencia Valencia LEUCEMIA Cádiz Murcia HUESOS Zamora VEJIGA Salamanca Soria Córdoba PULMON LARINGE Granada Albacete Málaga HIGADO Guadalajara ESTOMAGO NASOFARI Huelva Almería Toledo Avila Jaén Cáceres Segovia Badajoz CiudadReal TESTICUL PIEL Cuenca Melilla TIROIDES Ceuta LABIO MAMA 0,004 0,000 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30-0,3-0,2-0,1 0,0 0,1 0,2 0,3 Figura 2

Análisis de Correspondencias (Mujeres) Cáncer en mujeres Eje 2º (14,55%) 0,20 0,15 0,10 0,05 0,00-0,05-0,10-0,15-0,20 LINFOMA GranCanaria Guipúzcoa Alava MELANOMA Asturias TIROIDES Tenerife Barcelona Madrid Vizcaya OVARIO Cantabria Burgos MIELOMA Zaragoza Navarra ENCEFALO PANCREAS Lérida Valladolid HODGKIN MAMA Pontevedra PLEURA RECTO Orense León Soria Gerona Lugo Guadalajara Segovia ESTOMAGO Baleares BOCA Coruña Salamanca Tarragona NASOFARI PERITONE Valencia Murcia COLON Palencia Avila PULMON RINON NASAL LEUCEMIA Teruel VEJIGA Sevilla Castellón Zamora Toledo UTEROAlicante VESICULA LaRioja Ceuta HUESOS Cuenca LARINGE Cádiz Huelva Badajoz Córdoba Melilla Huesca EXOFAGO CiudadReal Málaga Almería Granada INTESTIN Cáceres Albacete Jaén HIGADO PIEL A. Correspondencias 1ª coord. (Mujeres) -0,25 LABIO -0,30-0,4-0,3-0,2-0,1 0,0 0,1 0,2 0,3 0,4 Eje 1º (42,17%) Figura 3 De los gráficos pueden deducirse la existencia de grupos de provincias con similares comportamientos, así como la influencia de cierto tipo de cáncer en ellos. Como ejemplo, del análisis de la Figura 2, podemos observar el comportamiento diferencial de Ceuta y Melilla, el de las provincias asociadas a cáncer de Intestino y Estómago (Palencia, Salamanca, Avila, Guadalajara, Teruel, Zamora, Cuenca, Segovia, Burgos y Soria) y el de las provincias asociadas a cáncer de Pulmón y Laringe (Sevilla, Cádiz, Valencia, Murcia, Málaga, Córdoba, Granada, Huelva y Almería). El 50 73% de variabilidad del primer eje puede servir para clasificar y representar las provincias a través de su primera coordenada (Figura 4), diferenciando comportamientos opuestos (coordenadas de distinto signo). Puede ser de utilidad la representación de la contribución a la definición del primer eje (cos²) mediante el correspondiente cartograma (Figura 5). Tales contribuciones deben ser analizadas, de forma especial en lo relativo a columnas (tipos de cáncer), pues las categorías con mayor contribución condicionarán nuestros resultados finales.

Coordenadas eje 1º Cos² (eje 1º) Figura 4: Coordenadas eje 1º (hombres) Figura 5: Contribuciones eje 1º (hombres)

Q-Análisis Factorial desde la matriz de datos Aplicado el procedimiento de las Componentes Principales desde la matriz de correlaciones centradas en el origen (cero) para la extracción de factores, observamos una elevada variabilidad del primer factor. De la observación de los pesos factoriales correspondientes al primer factor (valores próximos a 1) o de la representación bidimensional no se detectan grupos diferenciados, por lo que realizamos una rotación ortogonal (Varimax normalizada) (Figuras 6 y 7), obteniendo una posible clasificación de provincias mediante la representación cartográfica del primer peso factorial (Figuras 8 y 9). Pesos factoriales (F. Loadings Rotados) (Datos) (Q) Pesos factoriales (F. Loadings Rotados) (Datos) (Q) 1,2 1,2 1,0 0,8 0,6 0,4 Burgos Segovia Soria Guadalajara Cuenca Zamora Palencia Teruel Salamanca Huesca Avila León Alava Orense Lérida Lugo Ciudad La Navarra Valladolid Albacete Toledo Rioja Castellón Real Guipúzcoa Pontevedra Cáceres Zaragoza Gerona Coruña Jaén Tarragona Vizcaya Granada Alicante Barcelona Badajoz Valencia Almería Madrid Córdoba Asturias Tenerife Huelva Gran Cantabria Murcia Baleares Málaga Ceuta Cádiz Sevilla Canaria Melilla 1,0 0,8 0,6 0,4 Burgos Guadalajara Segovia Salamanca Soria Zamora Avila Palencia Cáceres Orense Cuenca Ciudad Pontevedra Teruel León Lugo Valladolid Toledo Coruña Real La Alava Huesca Lérida Albacete Badajoz Castellón Granada Jaén Rioja Zaragoza Cantabria Asturias Navarra Vizcaya Almería Huelva Madrid Guipúzcoa Melilla Alicante Barcelona Valencia Córdoba Ceuta Gerona Murcia Tarragona Cádiz Málaga Sevilla Tenerife Baleares Gran Canaria Factor 2º ( 45,92%) 0,2 0,0-0,2-0,4 Factor 2º ( 47,64%) 0,2 0,0-0,2-0,4-0,6-0,6-0,8-0,8-1,0-1,0-1,2-1,2-1,0-0,8-0,6-0,4-0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2-1,2-1,2-1,0-0,8-0,6-0,4-0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2 Factor 1º ( 53,45%) Factor 1º ( 51,08%) Figura 6: Plano factorial (hombres) (DATOS) Figura 7: Plano factorial (mujeres) (DATOS)

Figura 8: Cartograma hombres (peso 1º) (DATOS) Figura 9: Cartograma mujeres (peso 1º) (DATOS)

Q-Análisis Factorial desde la matriz de asociaciones Comprobemos la eficacia del empleo de la matriz de asociaciones para la mayor discriminación de grupos. Para ello, repetimos el proceso anterior desde la matriz de asociaciones correspondientes a la matriz centrada. Las figuras 10 a 13 muestran las representaciones factoriales bidimensionales después de la rotación, así como el cartograma obtenido a partir del primer peso factorial. Pesos factoriales (F. Loadings Rotados) (Asociaciones) (Q) Pesos factoriales (F. Loadings Rotados) (Asociaciones) (Q) 1,2 1,2 Factor 2º ( 31,13%) 1,0 0,8 0,6 0,4 0,2 0,0-0,2-0,4-0,6 Guipúzcoa Tarragona Zaragoza Gerona Navarra Valladolid La Rioja Alava Lugo Huesca Castellón Orense León Lérida Teruel Zamora Palencia Burgos Soria Salamanca Albacete Guadalajara Segovia Avila Cuenca Gran Tenerife Canaria Baleares Vizcaya Barcelona Madrid Alicante Pontevedra Asturias Cantabria Sevilla Valencia Murcia Cádiz Coruña Córdoba Málaga Granada Melilla Huelva Almería Badajoz Ceuta Jaén Factor 2º ( 31,31%) 1,0 0,8 0,6 0,4 0,2 0,0-0,2-0,4-0,6 Albacete Badajoz Jaén Huesca La Rioja Ciudad Real Cáceres Toledo Cuenca Teruel Zamora Guadalajara Palencia Avila Lugo Salamanca Segovia Soria Orense León Burgos Coruña Pontevedra Granada Almería Huelva Córdoba Málaga Castellón Cádiz Alicante Melilla Ceuta Sevilla Tarragona Baleares Murcia Valencia Gerona Gran Tenerife Canaria Alava Barcelona Cantabria Guipúzcoa Vizcaya Madrid Navarra Asturias Zaragoza Lérida -0,8 Toledo Ciudad Real Cáceres -0,8 Valladolid -1,0-1,0-1,2-1,2-1,0-0,8-0,6-0,4-0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2 Factor 1º ( 58,54%) Figura 10: Plano factorial (hombres) (ASOCIACIONES) -1,2-1,2-1,0-0,8-0,6-0,4-0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2 Factor 1º ( 58,77%) Figura 11: Plano factorial (mujeres) (ASOCIACIONES)

Figura 12: Cartograma hombres (peso 1º) (ASOCIACIONES) Figura 13: Cartograma mujeres (peso 1º) (ASOCIACIONES) Conclusiones Cáncer en hombres: Atendiendo a los tipos de cáncer, las mayores contribuciones se deben a: Estómago (0,923102), Pulmón (0,863077), Recto (0,434042), Boca y Faringe (0,424918), Laringe (0,382163) e Intestino Delgado (0,240664). El patrón de distribución de los tumores asociados con el consumo de tabaco y bebidas alcohólicas (cáncer de pulmón, vejiga, laringe y esófago) en los que se detectan dos agrupamientos de áreas de alto riesgo: una en la costa cantábrica y otra en las provincias de Andalucía occidental (Cádiz, Málaga, Huelva y Sevilla). El patrón de distribución del cáncer de estómago "costa-interior".... Las provincias de Castilla-León son las que tienen una mortalidad mayor, presentando Burgos, Palencia, Segovia y Soria las tasas más altas. Cáncer en mujeres: Aplicado un Análisis de Correspondencias, las mayores contribuciones a la definición del primer eje se deben al cáncer de Estómago (0,970550), Útero (0,639398), Mama (0,598759) y Ovario (0,371978). La mortalidad aumenta en sentido interior-costa, con menor dominancia sur que la apreciada para hombres.

Referencias bibliográficas 1. Álvarez, F & González, J.L. (1997): MVWIN1: A Program for Graphic Representation of Correspondence Analysis. IV International Meeting of Multidimensional Data Analysis. Bilbao. 179-180. 2. Álvarez, F, González, J.L., Ramos, H. & Gutiérrez, J.M. (1998): Incremento de variabilidad en la representación de datos, mediante asociaciones entre variables y casos, derivadas de la DVS. Actas del XXIV Congreso Nacional de Estadística e Investigación Operativa. Almería. 255-256. 3. Berkson, J., & Gage, R. R. (1950): The calculation of survival rates for cancer. Proceedings of Staff Meetings, Mayo Clinic, 25, 250. 4. Breslow NCE, Day NE. (1987): Statistical Methods in Cancer Research. Vol II The design and analysis of cohort studies. IARC Scient. Publ. No. 82. Lyon. 5. Errezola M, López-Abente G, Escolar A. (1989): Geographical Patterns of Cancer Mortality in Spain. En: Boyle P, Muir CS, Grundman (Eds). Cancer Mapping. Recent Results in Cancer Research. Springer-Verlag. Berlin. 6. Greenacre, M.J. (1993): Correspondence Analysis in Practice. Academic Press. London. 7. Krzanowski, W.J. (1988): Principles of Multivariate Analysis: A User s Perspective. Oxford U.P. 8. Ramos, H., Álvarez, F. & Almorza, D. (1998): MINDAN procedure and its application in the statistical control of urban pollution. Environmental engineering. UK. 4. 123-131. 9. Smans M, Muir CS, Boyle P. (1992): Atlas of cancer mortality in the European Economic Community. IARC Scient. Publ. No. 107. Lyon. i Centrado o estandarización de variables, centrado global de la matriz de datos, etc. en matrices generales, o matriz de perfiles centrados en tablas de incidencia.