INTELIGENCIA ARTIFICIAL Y ESTADÍSTICA APLICADA: ALGUNAS LÍNEAS MODERNAS DE DESARROLLO



Documentos relacionados
Facultad de Ciencias. Matemática (UCM)

PLAN ESTRATÉGICO DEL DEPORTE DE VALENCIA

IV JORNADAS DE INNOVACIÓN EDUCATIVA Y ENSEÑANZA VIRTUAL EN LA UNIVERSIDAD DE MÁLAGA

Introducción INFORMÁTICA PARA LAS ARTES

SELECCIÓN N Y DISEÑO DEL PRODUCTO Y SERVICIO

PROCEDIMIENTO REALIZACIÓN ESTUDIOS ECONÓMICOS CONTENIDO

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual

Vicerrectorado de Ordenación Académica

Introducción a la estadística y SPSS


PROGRAMA 923N FORMACIÓN DEL PERSONAL DE ECONOMÍA Y HACIENDA

LA INNOVACIÓN EMPRESARIAL

GUÍA TÉCNICA PARA LA DEFINICIÓN DE COMPROMISOS DE CALIDAD Y SUS INDICADORES

PROYECTO DE SEMINARIO INTERNACIONAL LAS RELACIONES SUR-SUR: NECESIDAD DE DESARROLLAR Y FORTALECER LA COOPERACIÓN ÁFRICA AMERICA LATINA

Uso de las tecnologias de la informacion en las PyMES de los municipios de Comalcalco y Cunduacán

Fundación Accenture. Guía de buenas prácticas en formación para el empleo

Las TIC apoyo importante para el docente en educación básica

PROYECTO DE CREACIÓN DE UNA COOPERATIVA DE ENTIDADES SIN ANIMO DE LUCRO, S. Coop. RESUMEN

El elearning paso a paso

Las TIC se constituyen como herramienta esencial para que las empresas aragonesas puedan continuar compitiendo en el mercado

El desarrollo de la mujer en el mundo rural. Área 9

UNIVERSIDAD TECNOLÓGICA DE PEREIRA FACULTAD DE INGENIERÍAS MAESTRÍA EN INGENIERÍA DE SISTEMAS Y COMPUTACIÓN ANÁLISIS MULTIVARIADO

SECRETARÍA DE EDUCACIÓN PÚBLICA SUBSECRETARÍA DE EDUCACIÓN SUPERIOR COORDINACIÓN GENERAL DE UNIVERSIDADES TECNOLÓGICAS

USO DE LOS SGD Y DE LOS SGBDR PARA LA AUTOMATIZACION DE BIBLIOTECAS

La inteligencia empresarial como herramienta fundamental de la internacionalización

Tipos de ensayos y artículos

coie UNIVERSIDAD COMPLUTENSE DE MADRID

Contenidos multimedia para la formación profesional. Autora: Isabel Mª Medina López. Resumen:

Análisis y gestión de riesgo

RECOMENDACIONES DE INVESTIGACIÓN FUTURA.

AMBIENTALIZACION DE LOS PROYECTOS DE ARQUITECTURA

OncoBarómetro, Imagen social de las personas con cáncer. Resumen ejecutivo

VALOR SOCIAL LA GESTIÓN DEL VALOR SOCIAL EN LA ADMINISTRACIÓN PÚBLICA

El proceso unificado en pocas palabras

UNIVERSIDAD CARLOS III DE MADRID

UNA HERRAMIENTA DE GESTION CENTRALIZADA DE INDICADORES DE CALIDAD EN EUSTAT

PLAN DE CHOQUE PARA COMBATIR EL DESEMPLEO DE JÓVENES Y DE PERSONAS EN PARO DE LARGA DURACIÓN

Los estados financieros proporcionan a sus usuarios información útil para la toma de decisiones

UNEDpSI: Un programa didáctico de análisis de datos en Psicología. Área Temática: Universidades virtuales y centros de educación a distancia.

Estudio de la Situación Laboral de las Personas Egresadas de la Diplomatura en Educación Social de la Universidad Pablo de Olavide

ESTUDIO Y OBTENCIÓN DE NUEVOS CONCEPTOS PARA TRAVIESA PARACHOQUES

CITAS SOBRE LA IMPORTANCIA DE LA COMUNICACIÓN EN INGENIERÍA

Licenciatura en Computación

Introducción. Rene Coulomb* y Martha Schteingart*

Respuestas: Consulta para una Estrategia Nacional de Propiedad Industrial

PÓSTER 9. Entrenamiento en habilidades en el mantenimiento de equipos informáticos. Pedro García Fernández

II ENCUENTRO DE UNIDADES Y OFICINAS DE IGUALDAD UNIVERSITARIAS UNIVERSIDAD PABLO DE OLAVIDE. Sevilla, 17 y 18 de Octubre, de 2008

GUÍA DIDÁCTICA DE LA ASIGNATURA Análisis de datos en Psicología 2

Centrados en sus objetivos SERVICIOS Y SOPORTE DE AGILENT RESUMEN DE POSIBILIDADES

MINISTERIO DE CIENCIA, TECNOLOGÍA Y MEDIO AMBIENTE. Programas de Ciencia, Tecnología e Innovación de Interés Nacional

II PLAN LOCAL DE VOLUNTARIADO INTRODUCCIÓN-FUNDAMENTACIÓN

PLAN DE TRANSPARENCIA DE LA UNIVERSIDAD DE MÁLAGA

Red Internacional de Diseño

La participación ciudadana: Indispensable para la correcta operación de la política social y de los programas sociales

III ED PREMIOS EMPRENDEDOR UCM

Orientaciones para documentar experiencias y proyectos innovadores 1

Gestión de proyectos y públicos

HUERTO ESCOLAR JUSTIFICACIÓN DEL PROYECTO

DOCUMENTO del OBSERVATORIO PERMANENTE DE LA INMIGRACIÓN DE LA U.A. ALGUNAS PARTICULARIDADES SOBRE EL EMPLEO DE LOS INMIGRANTES

Programa Prevención y resolución de conflictos: La Negociación como proceso para ejercer influencia Preparado para Prasfarma ALMIRALL PRODESFARMA

MUJER Y MEDIO RURAL: ENVEJECIMIENTO ACTIVO: VOLUNTARIADO INTERGENERACIONAL, DEPENDENCIA, DISCAPACIDAD E IGUALDAD

El Producto: Software

INTrodUCCIÓN El museo Como recurso EdUCATIvo

El alumno conocerá el diseño y la planificación de estrategias corporativa y competitiva, para proyectar a la empresa en una posición de ventaja

En primer lugar quiero concretar algo más ambos términos: sistemas de gestión medioambiental y empresa forestal:

PROYECTO DE CALIDAD TURÍSTICA

DISPOSICIONES GENERALES

CAPITULO III: METODOLOGIA DE ESTUDIO DE CASO

DESARROLLO DE LA I+D Y LA INNOVACIÓN EN EMPRESAS

PROYECTO DISEÑO Y CONSTRUCCIÓN DE LA MAQUETA DE UNA CASA

GESTIÓN INTEGRAL DE PROYECTOS SOCIALES Primera Parte

Batería MC-UB Método de evaluación de riesgos psicosociales

INDICADORES DE ACTIVIDAD EN EL SECTOR SERVICIOS (IASS) EN CASTILLA Y LEÓN

MODIFICACIÓN DE LOS APROVECHAMIENTOS DE AGUAS SUBTERRÁNEAS PRIVADAS Y SU TRANSFORMACIÓN EN CONCESIONES

Módulo III. Aprendizaje permanente Tema 4: Aprendizaje de actividades laborales Entrevista. El papel de las familias como impulsoras del empleo

LOS RETOS DE LA ENSEÑANZA EN LA INGENIERÍA 1

LA ACOGIDA DE LOS CON DISCAPACIDAD VISUAL EN LOS CENTROS EDUCATIVOS

Dictamen del Comité de las Regiones «Año europeo de la creatividad y la innovación 2009» (2008/C 257/09)

Los valores de ONGAWA, Ingeniería para el Desarrollo Humano

1. Introducción. Universidad de Cantabria 1-1

FORMACIÓN EN COMPETENCIAS INFORMACIONALES Y SU GESTIÓN DE CALIDAD EN LA BIBLIOTECA UNIVERSITARIA DE GRANADA: PRIMERAS EXPERIENCIAS

Informe Evaluación Núcleos Problemicos 2012 CURN

CONVOCATORIA DE BECAS ACUDE INTERNACIONALES Campamento saharaui de Awserd

Inteligencia. Primeramente, es necesario que conozca su espacio de exposición y sus implicaciones para que pueda aprovecharlo al máximo:

Experiencia en la IMPLANTACIÓN DE UN SISTEMA DE CALIDAD en la Facultad de Ciencias Agrotecnológicas de la Universidad Autónoma de Chihuahua

Plan de estudios Maestría en Sistemas de Información y Tecnologías de Gestión de Datos

Consolidación de los grados tras la primera promoción

Resumen. La contaminación atmosférica es uno de los principales problemas ambientales que

Informe final de evaluación del seguimiento de la implantación de títulos oficiales

Acción de obligado cumplimiento 2 -Adaptación de PROA a la modalidad semipresencial entre septiembre y diciembre de 2015.

PLAN DE IGUALDAD GRUPO ARNÓ. BENITO ARNÓ E HIJOS, S.A.U Plaça de l Ensenyança, Lleida

1. Introducción al evaluación de proyectos

Convocatoria a Ideas Proyectos Bases y Condiciones

GESTIÓN DEL MEDIO AMBIENTE URBANO. (LIMPIEZA VIARIA, MANTENIMIENTO DE ZONAS VERDES, RESIDUOS URBANOS Y ABASTECIMIENTO DE AGUA)

El sector educativo no se caracteriza por incluir la tecnología como un elemento importante y necesario. Generalmente el profesorado (salvo

Consejo Económico y Social

Programa de trabajo para Escuelas Asociadas

CAPÍTULO I PLANTEAMIENTO DEL PROBLEMA

Marketing aplicado y comunicación

TEMA 2. LA MEDICIÓN EN PSICOLOGÍA

Transcripción:

INTELIGENCIA ARTIFICIAL Y ESTADÍSTICA APLICADA: ALGUNAS LÍNEAS MODERNAS DE DESARROLLO JOSÉ M. 1 CARIDAD Y OCERÍN ACADÉMICO CORRESPONDIENTE Al referirse a una rama de la Matemática, como es la Estadística, es conveniente precisar este concepto, que a menudo es confuso para el profano: La Estadística es la rama de la Ciencia que trata sobre la experimentación, recolección, descripción y análisis de datos. Los métodos estadísticos son herramientas para examinar y analizar datos y para tomar decisiones en ambientes de incertidumbre. Otra cosa son las "estadísticas" o colecciones de datos tomados en una determinada población y que aportan información sobre ésta. En general podemos diferenciar varios aspectos que dan origen a distintos enfoques de la Estadística. Al realizar un proceso de recogida de datos en un colectivo o población, se pueden pretender objetivos diversos; si se trata de describir dicho colectivo, la experimentación debe ser exhaustiva: hay que tomar datos sobre todos los elementos de la población, y los métodos matemáticos que tratan estos problemas se denominan "Análisis de Datos" o "Estadística Descriptiva". Por otra parte, si se ha seleccionado un subconjunto del colectivo, o sea una muestra, se tratará de extrapolar los resultados obtenidos sobre ésta a toda la población; las técnicas empleadas constituyen la "Estadística matemática o inferencia)", las inferencias generales están afectadas de un nivel de incertidumbre que es cuantificado en términos probabilísticos. Así, el Cálculo de Probabilidades, que es una rama del Análisis Matemático, constituye una herramienta imprescindible para la aplicación de los Métodos Estadísticos. Los rápidos desarrollos que ha experimentado el cálculo automático en los últimos veinte años ha cambiado radicalmente la metodología de trabajo del estadístico profesional. Por una parte, los ordenadores han permitido abordar campos antes vetados para la Estadística aplicada: el Análisis Multivariante, la teoría de series Temporales, los métodos multiecuacionales, etc.. Por otra, esta disponibilidad de cálculo ha impulsado nuevas investigaciones teóricas en méto-

214 JOSÉ M.' CARIDAD Y OCERÍN dos conocidos, y ha permitido la aparición de nuevas líneas de desarrollo con la incorporación de nuevas técnicas estadísticas y de análisis de datos que están de nuevo cambiando la forma de abordar los numerosos problemas relacionados con la Estadística que surgen diariamente en las Ciencias Sociales y Experimentales. La evolución histórica de la Ciencia Estadística puede dividirse en cinco bloques claramente definidos: La "prehistoria" que abarca desde el Renacimiento italiano y la aplicación de los métodos estadísticos actuariales, hasta el desarrollo del Cálculo de Probabilidades al que contribuyeron los principales matemáticos europeos de los siglos XVI a XVIII con la formalización teórica de los modelos probabilísticos durante el siglo pasado destacando, entre otras las grandes figuras de Gauss y P.S. de Laplace. Durante la primera mitad del siglo XX se desarrolla la Estadística Clásica con los trabajos de Karl Pearson, W. Gossett, R. Fisher, J. Neyman y otros, así como numerosos métodos estadísticos (modelos lineales, diseño de experimental, control de calidad, fiabilidad de sistemas, etc.); la Econometría surge a partir de la problemática creada por la gran crisis económica de 1929 y por la subsiguiente intervención estatal creciente; la Investigación Operativa es impulsada por las necesidades bélicas en los años cuarenta; el Cálculo de Probabilidades es sistematizado sobre una base axiomática por la escuela rusa de Análisis Matemático mediante la formulación de A.N. Kolmogorov. A partir de los años cincuenta se difunden la Teoría de la Decisión y los Métodos Bayesianos. En los arios sesenta surgen los primeros paquetes de programas estadísticos en ordenadores de propósito general basados en proceso por lotes y en un lenguaje de control de muy alto nivel independiente del sistema operativo utilizado; las bibliotecas de rutinas científicas suponen una facilidad extraordinaria en la programación en Fortran y Algol evitando numerosos problemas de tipo numérico. El disponer de gran capacidad de cálculo potenció nuevas investigaciones teóricas entre las que podemos citar los nuevos desarrollos en Análisis Multivariante, algunos Métodos no Paramétricos como las técnicas booth-trap, modelos de optimización en ambientes probabilísticos, modelos no lineales, procesos estocásticos, análisis de datos cualitativos, etc., que los distintos paquetes han ido incorporando, poniendo a disposición del estadístico profesional, así como del usuario final, nuevas y potentes herramientas de Análisis de Datos. En la última década la situación de los métodos de Estadística Aplicada se caracteriza por la gran abundancia de paquetes estadísticos tanto de tipo interactivo, como para realizar proceso por lotes, muy completos y sofisticados; la gran difusión de micro y mini-ordenadores ha favorecido la aparición de nuevos programas, así como de desarrollo acelerado de métodos gráficos de análisis y representación de datos multivariantes. Actualmente la utilización de métodos estadísticos en ordenadores se encuentra en una situación de cambios muy rápidos que se caracterizan por: la aparición de nuevos trabajos teóricos fundamentalmente en el campo multivariante y temporal;

INTELIGENCIA ARTIFICIAL Y ESTADÍSTICA APLICADA... 215 la incorporación de técnicas renovadas de especificación y contrastación de modelos; la generalización de métodos gráficos, incluyendo, en un futuro próximo, la aplicación de la teoría del color; el desarrollo de interfaces "amables" para el usuario, tanto en la manipulación y tratamiento de bases de datos estadísticos; la sistematización y formulación de estrategias de análisis de datos con el desarrollo de sistemas expertos y utilización de técnicas de Inteligencia Artificial en los paquetes estadísticos. En definitiva, nos encontramos ante la tercera revolución que, en este siglo, ha conmocionado a la ciencia estadística, y a la forma de abordar el análisis de datos. Las aplicaciones de la inteligencia artificial (I.A.) en Estadística persiguen integrar distintos contrastes, estimaciones, transformaciones y modelos para conseguir una aproximación coherente y total en Análisis de Datos, estableciendo estrategias que dirijan el proceso de modelización, de elección de técnicas y transformaciones a aplicar, y de ayuda a la interpretación de los resultados. Es necesario poner a disposición de usuarios de Análisis de Datos, un conjunto de herramientas "inteligentes" que eviten un uso inapropiado, y desgraciadamente muy frecuente, de los paquetes estadísticos, que dirijan su utilización e interpretación, lo que conlleva a la automatización de los procesos de decisión y selección de estrategias de análisis de datos. La elaboración de un Sistema Experto requiere el desarrollo de metodologías de construcción y aplicación de estrategias de Análisis de Datos, hoy día ausentes en los clásicos paquetes BMDP, SPSS, SAS, TSP, Statgraphics, Rats y otros. Las aplicaciones más llamativas de la I.A. en Estadística son, sin duda, en el campo de la Medicina, y en particular en problemas de diagnóstico automático, si bien hoy día existen en el mercado productos operativos para utilización de sistemas Expertos en algunos Métodos Estadísticos; por ejemplo el sistema REX para construir modelos lineales de regresión. Se pueden clasificar estas aplicaciones en dos grandes bloques según sus destinatarios: sistemas de diseños y aplicaciones de estrategias de Análisis de Datos para estadísticos profesionales, y métodos para usuarios finales cuya formación estadística es elemental. En la Universidad de Córdoba, y apoyado con la Comisión Nacional de Ciencia y Tecnología, el Departamento de Estadística está promoviendo la creación de varias ayudas "inteligentes" en el uso de paquetes estadísticos para usuarios no especialistas en Estadística: gestores de bases de datos muestrales, interfaces amables para manejo de datos, generadores de programas en lenguajes propios de paquetes como BMDP y SAS, y diseño de algunas estrategias útiles en el análisis de tablas de contingencia, a las que seguirán en un futuro próximo sistemas más complejos de automatización de estrategias de análisis de datos categorizados, y en particular en la especificación de modelos log-lineales, logit, y de exploración sistemática de bases de datos estadísticos nominales u ordinales que surgen, y en general aplicaciones de tipo biométrico y económico.

216 JOSÉ M.' CARIDAD Y ocern Cabe citar como realidad actual en este campo, el sistema S.E.A.D. recientemente presentado públicamente. En definitiva la I.A. está contribuyendo al desarrollo tecnológico en muchas áreas científicas, entre las cuales se encuentra la Estadística; en correspondencia, entre las pocas disciplinas que pueden influir en la I.A. se encuentra precisamente la Estadística. La I.A. se ha centrado en la representación simbólica del conocimiento/información y de su uso, lo que en última instancia depende de datos experimentales que contienen una componente aleatoria (el error de medida y el muestral) lo que implica la utilización de terminología probabilística y métodos estadísticos. Así, los razonamientos y proposiciones en sistemas de I.A. deben tener en cuenta la incertidumbre inherente en las relaciones empíricas, por ejemplo utili= zando técnicas de Estadística bayesiana. La Estadística puede además contribuir en la teoría del conocimiento y aprendizaje; la formación de conceptos está relacionada con los métodos de "cluster" tanto para datos discretos como para medidas continuas. En el campo de la Educación, desde hace varios años se han producido importantes modificaciones en los programas docentes de la Estadística Aplicada y Métodos Estadísticos. La introducción de paquetes de programas (BMDP, SPSS y otros) es algo habitual, imprescindible para alumnos de Ingeniería, Biología, Química, Medicina, Economía, etc.., o sea para profesionales que utilizarán la Estadística en su actividad académica, científica o técnica. Los sistemas de ayu= da: interfaces amables, gestores de datos y generadores de lenguajes es una realidad cuya utilidad es patente en el aprovechamiento docente. La introducción de sistemas expertos basados en métodos de I.A. debe ser una próxima realidad en alumnos de post=graduado, lo que obligará a replantear los sistemas docentes en beneficio de un mejor, más extenso y preciso uso de la Estadística. En el Departamento de Estadística y Análisis de Datos de la Universidad de Córdoba, además de la actividad docente e investigadora, se realiza una intensa labor de consultoría en la ntilización de técnicas estadísticas en varias áreas (Agronomía, Medicina, Economía, Biología, Control de calidad industrial, etc.) y en su aplicación en ordenador. Esta consultoría se plantea a dos niveles: Para investigadores y profesionales con un nivel estadístico medio o alto, en cuyo caso se proporciona un apoyo en el manejo de paquetes de programas en ordenador, en los procesos de modelización, diseño experimental y muestral, interpretación de resultados, etc. En definitiva, se realiza una cooperación intensiva en las tareas de investigación y desarrollo. Para científicos o técnicos con nivel bajo o medio en Análisis de Datos, estando la asesoría centrada, o bien en el uso de métodos usuales de Estadística y del logicial básico, o en una tarea de integración de un estadístico en el equipo de investigación y desarrollo para llevar a cabo todos los procesos de análisis y de modelización. En ambos casos, la demanda de servicios de consultoría supera claramente a las posibilidades personales de los profesores de un departamento de Estadística, lo que implica la necesidad de contar con herramientas inteligentes de apoyo en estas actividades científicas de consultoría. En el Departamento de Estadística de

INTELIGENCIA ARTIFICIAL Y ESTADÍSTICA APLICADA... 217 la Universidad de Córdoba se está desarrollando, en el ámbito del proyecto de investigación y desarrollo antes citado, un sistema experto para análisis de datos categorizados para optimizar y dirigir los procesos de tratamiento de bases de datos biomédicas y económicas, para las que existe una demanda importante en nuestra ciudad. Bibliografía A. AGRESTI: Categorical Data Analysis. Wiley, 1990. E.B. ANDERSEN: Discrete Statistical Models with Social Science Applications. North Holland, 1980. Y.S. BISHOP: Discrete Multivariate Analysis: Theory and practice. P. FIENBERG: Cambridge. M.I.T. Press, 1975. P. HOLLAND. E. BRENT: Statistical Navigator. Idea Works, 1988. Exys Inc. J.M. CARIDAD: Sistemas expertos en el Análisis de Datos. R. ESPEJO: "Categorizados". I Seminario Internacional de Sistemas. L. MELENDEZ: Expertos en la Agricultura Mediterránea. Córdoba. España. Abril de 1991. J.M. CARIDAD: Estadística Aplicada a las Ciencias Sociales y Biomédicas. S. Publicaciones. Univ. de Córdoba. 1987. J.M. CARIDAD: Análisis de Datos con BMDP. S. Publicaciones. Univ. de Córdoba. 1989. W.J. DIXON Ed' BMDP: Statistical Software Manual. Vol. 1 y 2. University of California Press. 1990. EUROSTAT: Development of Statistical Expert System. Luxemburgo. 1989. S.A. FIENBERG: The analysis of cross-classified data. Cambridge M.T.I. Press. 1980. R.A. FISHER: The Desing of Experiments. Oliver Boyd. 1935. W. GALE: Artificial Intelligence and Statistics. Addison-Wesley, 1986. J.M. MACDONALD: Statistical Computation. Wiley. K. MOMIROVIC, V. MILDNER (Ed): Compstat: proceedings in computational statistics 9 Th Symposium. Dubruvnik. Physica-Verlag Heidelberg. 1990.