MÁ QUINÁ DE ÁPRENDIZÁJE HI BRIDO PÁRÁ EL DIÁGNO STICO TEMPRÁNO DE CÁ NCER DE MÁMÁ

Tamaño: px
Comenzar la demostración a partir de la página:

Download "MÁ QUINÁ DE ÁPRENDIZÁJE HI BRIDO PÁRÁ EL DIÁGNO STICO TEMPRÁNO DE CÁ NCER DE MÁMÁ"

Transcripción

1 MÁ QUINÁ DE ÁPRENDIZÁJE HI BRIDO PÁRÁ EL DIÁGNO STICO TEMPRÁNO DE CÁ NCER DE MÁMÁ CENTENO LEGUÍA, James, CORTEZ VÀSQUEZ, Augusto Parcemón Members Universidad Nacional Mayor de San Marcos - Peru, Abstract Breast cancer is a disease with high number of cases in the country, also is cancer that has a higher rate than people who are cured if detected the disease in early stages of the disease, but is now the third cancer generating more number of deaths in women of Peru. This research is an effort to contribute to a diagnosis of Breast Cancer more effective, building a tool to support the medical diagnosis, which allows a more efficient analysis of mammography, contributing to reduce the error rate in the diagnosis of Breast Cancer. This tool uses the technique of multilevel support vector machine for being the best performance is based on an analysis of several studies that have been conducted, surpassing classical statistical techniques, techniques of neural networks, genetic algorithms.. Keywords: Support Vector Machine, Breast Cancer, Machine Learning, hybrid machine learning E I. INTRODUCCION L cáncer es una enfermedad bastante antigua, pero no reconocida por la baja expectativa de vida. Pero que hoy, los niveles de calidad de vida han aumentado y con ello las posibilidades de que una persona pueda vivir mucho más tiempo, es en este escenario en donde el cáncer se vuelve protagonista puesto que la degeneración celular es un síntoma de la vejez y en una causa muy probable de cáncer, haciendo que hoy en día se encuentre entre las primeras causas de muerte [Who04]. Las máquinas de aprendizaje híbrido han sido implementadas para resolver el problema de diagnóstico de cáncer en diferentes investigaciones, en cada una con diferentes resultados y técnicas utilizadas, consiste básicamente en coger lo bueno de cada técnica que podamos integrar y obtener una mejor técnica. De esta manera se abre un conjunto de posibilidades con relación a las técnicas que se pueden aplicar. 1.1 Antecedentes del problema La tarea de diagnóstico que actualmente se realiza en los hospitales del Perú, requiere del análisis de un conjunto de diversas variables que requiere que el médico tenga que realizar muchos análisis de una muestra en un tiempo corto, por lo que este diagnóstico no garantiza ser completamente eficiente y confiable, en especial en estadios de la enfermedad donde no es muy apreciable su presencia y donde se podría curar con una mayor facilidad. El número de casos de cáncer de mama diagnosticados en un estadio avanzado en el Perú es demasiado alto [MINSA12], esto causado principalmente a que la tarea de diagnóstico de cáncer de mama que realiza el médico no cuenta con una herramienta que garantice un diagnóstico efectivo en las primeras etapas de la enfermedad, donde se puede acceder a tratamientos Fig. 1 Muestra la distribución de muertes por diversas enfermedades que se dieron entre los años 1999 y 2001 [Lopez+01]

2 menos invasivos y que menos secuelas dejan en comparación a los tratamientos para prolongar la vida a las que son sometidos los pacientes de etapas más En el año 2001 se muestra un estudio realizado a toda un población entre los años 1999 y 2001 el cual dio los resultados de la Figura 1. Donde se puede apreciar que el cáncer es una enfermedad que más muertes ha ocasionado considerando los diversos órganos en los que se ha presentado. El año 2004 se realizó un estudio de la mortalidad tal lo muestra la Figura 2, que tienen las enfermedades tanto transmisibles, no transmisibles y otros, en este documento menciona el impacto que tiene el cáncer en estas estadísticas, siendo mencionado recurrentemente por las enfermedades con mayores muertes en diferentes campos y listas. Perú con 130 muertes por personas [WHS12]. En el 2013 en el informe publicado menciona a Perú con 130 personas fallecidas por cada [WHS1]. Estos reportes nos muestran que año tras año el cáncer ha estado afectando a la población peruana dando como resultado la muerte de entre un 0.5% 1% de la población del Perú anualmente, estas estadísticas hacen que desde el año 2012 el Ministerio de Salud apoyado por instituciones como la Liga de Lucha Contra el Cáncer y ONGs, promueva y establezca al Cáncer como problema de Salud Pública, por repercusiones que tiene en la población peruana, desempeñándose principalmente en promover las prácticas saludables y la generación de costumbre de visita médica, de tal manera que se pueda detectar los inicios de Cáncer en Fases tempranas de la enfermedad, donde se tiene un mayor posibilidad de cura y prolongamiento de la vida con una mejor calidad de vida. Aspecto medico II. MARCO TEÓRICO 2.1 Diagnóstico Médico El diagnóstico se basa en el análisis de datos seguros. El razonamiento solo será válido cuando descanse sobre nociones exactas y hechos precisos, pero cuando no se cumplen estos principios los resultados siempre serán erróneos. La validez de una deducción depende de la calidad de las observaciones en que ella se basa, como lo mencionan en [Diaz+06]Teniendo en cuenta estos principios, es indispensable exponer algunas premisas básicas sobre las que se apoya el diagnóstico médico. Fig. 2 Muestra la mortalidad a nivel mundial, registrada en el 2004[Who04]. 1.2 Problema General El problema es la baja precisión del diagnóstico médico a partir de mamografías de Cáncer de Mama. 1.3 Objetivo General Desarrollar una herramienta basada en una máquina de soporte vectorial que sirva de apoyo al diagnóstico médico a partir de mamografías en casos de cáncer de mama. 1.4 Justificación Llegado a este punto, tenemos que analizar el impacto que tuvo el cáncer a los largo de los años en Perú, basándonos en la misma organización que realiza el reporte a nivel mundial. Es importante mencionar que según un estudio estadístico realizado por World Health Stadistic señala que el Perú fallecieron por causas de cáncer 175 personas por cada personas [WHS06]. Esta cifra de 175 personas se mantuvo en el año 2007 según la misma organización [WHS07]. Para el 2008 la cifra continua constante en 175 [WHS08]. En el año 2009 esta cifra cambio descendiendo a 163 personas [WHS09]. Hacia el 2012 el formato volvió y reconoció al 2.2 Mama Las glándulas mamarias caracterizan, entre otros rasgos, a los mamíferos. Aparecen muy precozmente en el embrión, y a lo largo de la vida de la mujer van sufriendo las distintas fases evolutivas que se corresponden con los ciclos biológicos femeninos como lo menciona [Gonzales08] al indicar que están presentes con diferentes funciones en el paso de la vida. Al terminar la actividad sexual de la mujer, en la menopausia, la glándula involuciona y tiende a la atrofia. Aspecto tecnológico 2.3 Inteligencia artificial Definida en 1956 por el informático del MIT John McCarthy como : la ciencia e ingeniería de hacer máquinas inteligentes, especialmente programas de cómputo inteligente. Se puede simplificar diciendo que la inteligencia artificial (IA) [Borrajo09] [AEPIA15] está conformada por las inteligencias no naturales en especímenes no vivos. Dentro del ámbito de la inteligencia artificial podemos distinguir distintos tipos de conocimientos y de sistemas de representación de dichos conocimientos, los cuales pueden ser aprendidos por la máquina o introducidos en su memoria por un agente experto. 2.4 Inteligencia computacional La inteligencia computacional es la rama de la I.A.

3 conocida como subsimbólica-inductiva que implica aprendizaje interactivo basado en datos empíricos. Se centra en el estudio de mecanismos adaptativos que permitan al sistema comportarse de manera inteligente sin emplear algoritmos heurísticos, como hace la inteligencia artificial convencional. Combina elementos de aprendizaje, evolución, adaptación y lógica difusa, sin dejar de lado elementos estadísticos, pero siempre en segundo plano, que aportan un soporte complementario para los programas y algoritmos Máquina de aprendizaje híbrido Es un concepto que resume a las máquinas de aprendizaje automático que hacen uso de más de una técnica convencional y clásica en uno o varios de sus procesos de análisis de datos. Algunas técnicas importantes que se harán revisión en este documento son las siguientes: Máquina de Soporte Vectorial Son un conjunto de algoritmos de aprendizaje supervisado desarrollados por Vladimir Vapnik y su equipo en los laboratorios AT&T. Estos métodos están propiamente relacionados con problemas de clasificación y regresión. Dado un conjunto de ejemplos de entrenamiento (de muestras) podemos etiquetar las clases y entrenar una SVM para construir un modelo que prediga la clase de una nueva muestra. Intuitivamente, una SVM es un modelo que representa a los puntos de muestra en el espacio, separando las clases por un espacio lo más amplio posible. Cuando las nuevas muestras se ponen en correspondencia con dicho modelo, en función de su proximidad pueden ser clasificadas a una u otra clase. Más formalmente, una SVM construye un hiperplano o conjunto de hiperplanos en un espacio de dimensionalidad muy alta (o incluso infinita) que puede ser utilizado en problemas de clasificación o regresión. Una buena separación entre las clases permitirá una clasificación correcta[cortez+2011], [Hernandez+2011] Máquina de Soporte Vectorial Multinivel Los vectores de soporte determinan la información de conocimiento que tiene una muestra. De esta manera se construye una distribución en donde un Vector de Soporte puede guardar la información necesaria para almacenar el conocimiento que la muestra de datos provee. El trabajo de entrenamiento de esta máquina de aprendizaje radica en la modificación de la posición de los vectores de soporte de tal manera que necesariamente se tenga una de las muestras como posible plantilla para poder comparar nuevas muestras que pertenezcan a una misma población con características similares por la técnica de validación de datos que está utilizando. de las cuáles se obtuvo el análisis en razón de métricas de sus mamografías anonimizadas. 3.2 Metodología Methodologies CRISP-DM (CRoss-Industry Standard Process for Data Mining) La metodología CRISP-DM es un estándar es la industria de la minería de datos el cual es bastante utilizado con buenos resultados tal como lo manifiestan en la referencia [Palacios10], Presenta las siguientes actividades: Comprensión del Negocio o Problema. Comprensión de los Datos Preparación de los Datos Modelado de Datos Evaluación del Modelo Despliegue e Implementación 3.3 Herramienta Se utilizó: Lenguaje de Programación: Java (JDK 1.8) Entorno de Desarrollo: Netbeans 8.0 Estas tecnologías sustentadas en que se puedan realizar posteriores estudios con facilidad y puesto que se encuentra extendido en el mercado actual del Perú IV. DESARROLLO DE LA SOLUCIÓN Se utilizó la metodología CRISP-DM es un estándar es la industria de la minería de datos el cual es bastante utilizado con buenos resultados tal como lo manifiestan en la referencia [Palacios10], es por ello que se determina utilizar esta metodología para la presente investigación. 4.1 Comprensión del Negocio o Problema. El negocio en el cuál se va aplicar en el Seguro Social de Salud - ESSALUD, específicamente en la Oficina de Planeamiento e Inteligencia Sanitaria, en donde se realizan los análisis epidemiológicos y se proponen medidas de acción para el tratamiento de las enfermedades. Esta oficina se encuentra en el organigrama de ESSALUD en la gerencia de línea: Prestaciones de Salud, la cual se aprecia mejor en la Figura 3, donde se muestra el organigrama interno de la Gerencia de Central de Prestaciones de Salud. III. METODOLGIA Y HERRAMIENTAS 3.1 Población y muestra La población estuvo conformada por 1250 mujeres, el cual es el promedio mensual de pacientes, a partir de los 35 años, atendidas en el servicio de mamografía del Hospital Nacional Edgardo Rebagliati Martins. Para fines de la presente investigación se consideró una muestra de 487 mujeres a razón del mejor desempeño del algoritmo, Fig. 3 Estructura Orgánica de la Gerencia de

4 Prestaciones de Salud. En la Oficina de Planeamiento e Inteligencia Sanitaria actualmente se tiene una base de datos de muestras de Cáncer de Mama, que se encuentra construida de tal manera que la organización de los datos de la muestra estén organizados de manera semejante a la base de datos pública de la Universidad de Wisconsin. Esto garantiza que sea posible desarrollar un aplicativo que utilice técnicas que se probaron en un escenario distinto pero que por la estructura puedan tener un desempeño superior. 4.2 Comprensión de los Datos Los datos para la investigación proceden de las mamografías anónimas las cuales son proveídas y analizadas por personal de ESSALUD efectuando un informe el cual contenga variables a nivel de datos numéricos que permitan aplicar una técnica de minería de datos sobre los mismos. Las variables estarán codificadas con valores enteros entre 1 y 10 siendo las siguientes: Clump thickness Uniformity of cell size Uniformity of cell shape Marginal adhesion Single epithelial cell size Bare nuclei Bland chromatin Normal nucleoli Mitosis 4.3 Preparación de los Datos La preparación de los datos se encuentra a partir del diagnóstico que emita un médico con ayuda de un software denominado Kateron Pacs (Fig 4)el cuál permite obtener datos con una alta exactitud a partir de las Imágenes Médicas. Fig. 4 Software de análisis de imágenes médicas. Actualmente se realiza un estudio sobre 532 muestras que se han tomado del año 2005 de las cuales se tiene un holgura para la limpieza en caso de imágenes defectuosas de 32 imágenes, teniendo finalmente un conjunto de imágenes de prueba de 500 muestras para estudio. 4.4 Modelado de Datos El modelado de los datos se realiza con validación cruzada que permita mayor precisión de los datos. Utilizando la revisión del estado del arte realizada se procede a seleccionar el modelo utilizado por [Nasser+10] donde se tiene un modelo completo para el abordaje de los diversos tipos de cáncer(fig 5). Fig. 5 Modelo de Análisis de Datos 4.5 Evaluación del Modelo La validación del modelo aplicado según [Nasser+10] es preferible una validación cruzada que estratificado puesto que la precisión de los datos es más confiable para muestras médicas que se utilicen. 4.6 Despliegue e Implementación Luego de la fase de evaluación del modelo se desarrolla el despliegue en donde se tiene planificado un primer programa piloto en el Hospital Rebagliati donde se tiene el mayor índice de pacientes más constantes. Como segunda etapa se procederá a implementar en los hospitales nacionales y nivel IV que cuenten con los profesionales para realizar el levantamiento de la información. En esta etapa se procederá a evaluar la situación del proyecto y definir si se desarrolla para otros tipos de cáncer o en su defecto se despliegue sólo a nivel de cáncer de mama. 4.7 Consideraciones técnicas con relación al desarrollo de los algoritmos. Se utilizó un conjunto de datos de la universidad de Winsconsin Breast Data Set. El conjunto de datos que estamos utilizando contiene los detalles de biopsia tomadas de Wisconsin Hospitales. Se recogió por Wolberg y Mangasarian en la Universidad del Hospital de Wisconsin-Madison en 1990 y está disponible en la UCL repositorio de aprendizaje automático. Hay nueve atributos con uno variable de clase. El resultado se representa como clase 2 para una benigna celular y 4 para la célula maligna. Los valores no son originales como todos los valores se escalan intervalo Hay 478 casos fuera de los cuales 16 casos fueron incompletos. Hemos eliminado las 16 instancias y los casos restantes se distribuyeron de la 315 para casos benignos y 147 para maligna. Los nueve atributos son las siguientes. Clump thickness Uniformity of cell size Uniformity of cell shape Marginal adhesion Single epithelial cell size Bare nuclei Bland chromatin Normal nucleoli Mitosis Class variable Se han realizado diversos estudios en el campo de clasificación de cáncer de mama utilizando estos atributos [18].

5 4.8 Validaciones y pruebas del Sistema. El desarrollo que se realizó fue en base a los requerimientos formulados por profesionales de medicina a los cuales se les consulto sobre los resultados que se deberían poder observar quedando descrito de la siguiente manera: Secciones Desarrolladas del Sistema Sección de presentación de datos. En donde se presentan los datos correspondientes a las 272 muestras que se tienen estudiadas y catalogadas. Actualmente se encuentra compuesto del total de los campos requerido y adicionado por 3 campos de control que se utiliza para realizar un análisis de corrección de las variables y de los cambios que se vean recomendados según la obtención de datos. En esta sección se presentan también un análisis del conjunto total de los datos que se requieren y que posteriormente se analizan, permitiendo brindar una auditoría interna de los datos. Originalmente se presenta esta interface para organizar el conjunto de épocas que se requiere para tener una red entrenada y que permita determinar según un conjunto de parámetros cuales son las conclusiones respecto a un conjunto de datos Sección de leyenda. En donde se presenta la descripción de cada uno de los campos de la presentación, los mismos que se tienen a partir de los atributos de información que se tienen (Fig 6): # Attribute Domain Sample code number id number 2. Clump Thickness Uniformity of Cell Size Uniformity of Cell Shape Marginal Adhesion Single Epithelial Cell Size Bare Nuclei Bland Chromatin Normal Nucleoli Mitoses Class: (2 for benign, 4 for malignant) Fig 6 Tabla de valores de las variables Sección de predicción En donde se realizan los cálculos de los datos y se generan los reportes en Excel para que sean analizados finalmente por médicos. Esta es el área que nos genera y nos reporta la mayor carga de procesamiento en la que se encarga del entrenamiento de la red y que de esta manera se pueda calcular los vectores de soporte Sección de Restricciones Sirve para poder modificar ligeramente los análisis de tal manera que se ajuste a las características específicas de un paciente. La sección de características permite eliminar y/o incluir una variable para el tema de la explotación de la Red Neuronal o Máquina de Soporte Vectorial. Esta es una opción que es agregada a razón de la recomendación de un usuario del sistema que opina que en caso de presentarse una determinada combinación o valor de un valor entonces se tiene una conclusión muchísimo más rápida y probablemente mucho más exacta que lo que puede diagnosticar una sistemas por sí solo. De esta manera se eliminan datos que puedan interferir negativamente con los datos de la entrada y los mismos puedan afectar a las variables sensibles de los algoritmos haciendo que los mismos sean mucho más consistentes. Como criterio propio no se recomienda para las tareas de entrenamiento puesto que hace que el sesgo fruto de esa restricción manipule negativamente la fuente de datos para mostrar un hiperplano que no necesariamente sea el que presente la mayor distancia Validación Cruzada Aleatoria. Consiste en el método derivado de utilizar la validación cruzada pero en esta prueba se necesita que se tengan dos subconjuntos de datos de tal manera que el dimensionamiento que tienen estos mismos sea aleatorio e independiente del total de muestras que se haya realizado en una época anterior de entrenamiento. Fig 7 Explicación gráfica de la validación cruzada. La validación cruzada es una técnica ampliamente usada [Zhong+12] que principalmente se caracteriza por ser mucho más fina con la construcción del modelo de prueba y la obtención de la función de clasificación. Independientemente de cualquier herramienta que se utilice ha probado ser de los mejores métodos de pruebas que se han utilizado y probado en otros estudios anteriormente referenciados y que han demostrado de esta manera que este método es efectivo. Como mayor ventaja que posee es que el afinamiento a la muestra obtenida es la más óptima para el conjunto de entrada puesto que se enfoca en la atención de un solo conjunto de datos y su propia optimización sin esperar posible variaciones en la muestra que se tiene Entre las desventajas que tiene este método es que en caso de no tener una buena muestra de datos, los mismos no pueden ser utilizados porque la función de clasificación que se obtiene es específica para la muestra de entrenamiento no siendo adaptable para otras muestras. 4.9 Pruebas del Sistema. Las pruebas del sistema se realizaran por los siguientes parámetros, siendo estos los que determinen cuál de los algoritmos tiene un mayor desempeño. Especificidad: La especificidad puede ser definida

6 como la relación del número de los verdaderos positivos (El resultado) y el número total de registros, es decir, el número de benigna que ha sido correctamente clasificados / número total de benigna instancias. TP/(TP+FN) Sensibilidad: La sensibilidad puede ser definida como la relación del número de correctos registros malignos clasificados y número total de maligno registros. es decir, TN / (TN + FP) Precisión: Es la relación del número total de benigna clasificado como benigna y maligna clasificado como malignos con el número total de instancias. es decir, (TP + TN) / (TP + TN + FP + FN) Las pruebas al sistema se realizaron en un ambiente determinando los siguientes resultados para los datos de entrada que se tienen siendo la Sensibilidad (capacidad para detectar la ausencia de la enfermedad en sujetos enfermos) y la Especificidad (capacidad de la prueba para detector la ausencia de la enfermedad en sujetos sanos) Esta prueba generó la siguiente curva ROC que básicamente es la intersección de la Especificidad y la Sensibilidad en una curva que registra el conjunto de comportamientos que han tenido según un determinado medio. Finalmente se complete el algoritmo que determina que tan preciso ha sido el sistema determinando los casos positivos y casos negativos. Para el caso del usuario lo que se elige es una prueba muy sensible porque se prefiere obtener falsos positivos en lugar de falsos negativos, es decir que el número de enfermos sin detector sea mínimo. Este es un ejemplo claro para las campañas de epidemiología en donde se busca una mayor sensibilidad. Es importante determinar que se requiere o no un valor alto en especificidad puesto que es variable según la época de entrenamiento. V. RESULTADOS Actualmente se hicieron pruebas con un total de 478 muestra, a través de las cuales se obtuvieron los resultados de la Figura 5.3, donde se puede concluir que se tiene un sistema con una alta tasa de acierto en comparación otros estudios se encuentra altamente posicionado. MLS VM Specifi city Figura 5.1. Sensiti vity Accur acy Resultados obtenidos Especificidad del sistema Es la probabilidad de clasificar correctamente a un individuo sano, es decir es la proporción de verdaderos negativos identificados por la prueba del total de sanos. En relación a la especificidad del sistema, se puede comentar que la capacidad para determinar si una persona sana tiene ausencia de cáncer es bastante alta. Lo cual lo sitúa como una herramienta de descarte de cáncer de mamá muy eficiente y comparable con estudios que se han realizado siendo muy superior a los métodos estadísticos o sometidos al riesgo del diagnóstico humano. Sensibilidad de sistema Sensibilidad (fracción de verdaderos positivos). Es la probabilidad de clasificar correctamente a un caso como enfermo, es decir es la proporción de verdaderos positivos identificados por la prueba del total de enfermos. En relación a la Sensibilidad del sistema es media/baja en comparación de estudios que se han realizado en otras ramas, pero que aún eso es muchísimo más superior que los métodos estadísticos actualmente utilizados y aun siendo mucho mejor que el juicio de expertos a los que se someten las imágenes actualmente. Este porcentaje refleja el número de casos de personas enfermas a las cuales se les diagnostique cáncer, más conocido como los falsos negativos, siendo personas que se encuentran desarrollando la enfermedad pero su diagnóstico fue errado y no se tiene clara la situación que actualmente se tiene. VI. CONCLUSIONES Uno de los problemas que se reviste de real interés es el cáncer de mama dado el alto número de casos registrados en el país así como el que tiene un mayor índice de curación en caso de detectarse la enfermedad en etapas tempranas. En esta investigación se pone de relieve que hemos puesto en la práctica la implementación de la técnica MLSVM (Máquina de Soporte Vectorial Multinivel) caracterizándolo como un máquina de aprendizaje automático, logrando que tenga un porcentaje de acierto 95.75% lo que al ser utilizado por un médico reduciría el número de falsos positivos actualmente. La máquina de aprendizaje híbrido MLSVM, es una técnica que ha demostrado obtener resultados altos, competentes a la de investigaciones de vanguardia que actualmente se utilizan. Para esta investigación se comprueba que la utilización de una técnica proveniente de publicaciones en revistas indexadas que aún no se muestra en su etapa comercial mejora los resultados esperados. Esta investigación ha demostrado que se puede utilizar un origen de datos construidos en similares características con el Breast Cancer Winsconsin Data Set, de manera satisfactoria para su posterior aplicación. La herramienta desarrollada permitió incrementar la precisión del diagnóstico médico a partir de mamografías de Cáncer de Mama. En relación a la especificidad del sistema, es decir la proporción de verdaderos negativos identificados por la prueba del total de sanos, se concluye que la capacidad para determinar si una persona sana tiene ausencia de cáncer es bastante alta. Lo cual lo sitúa como una herramienta de descarte de cáncer de mamá muy eficiente y comparable con estudios que se han realizado siendo muy superior a los métodos estadísticos o sometidos al riesgo del diagnóstico humano. En relación a la sensibilidad de sistema, se concluye que la proporción de verdaderos positivos identificados por la prueba del total de enfermos es media/baja en comparación de estudios que se han

7 realizado en otras ramas, pero que aún eso es muchísimo más superior que los métodos estadísticos actualmente utilizados y aun siendo mucho mejor que el juicio de expertos a los que se someten las imágenes actualmente. Este porcentaje refleja el número de casos de personas enfermas a las cuales se les diagnostique cáncer, más conocido como los falsos negativos. VII. REFERENCIAS [1] [Arroyo+05] jorge arroyo,mahabir prashad, yelkaira vásquez, elena li, gloria tomás c, actividad citotóxica in vitro de la mezcla de annona muricata y krameria lappacea sobre células cancerosas de glándula mamaria, pulmón y sistema nervioso central, rev peru med exp salud publica 22(4), [2] [Austin+13] Peter c. Austin, jack v. t., Jennifer e. h, Daniel Levye, Douglas s. lee, using methods from the data-mining and machinelearning literature for disease classification and prediction: a case study examining classification of heart failure subtypes of the sdjournal of clinical epidemiology 66 (2013) 398e407. [3] [Cortez+11] Áugusto Cortez Maquina de Soporte vectorial Algorithmic 2011 ( 2) 2, [4] [Drier+11] Yotam Drier, do two machine-learning based prognostic signatures for breast cancer capture the same biological processes? of the plos one march 2011 volume 6 issue 3 e [5] [Gonzales08] antonio gonzales martin, estudio descriptivo de la implantación de un programa de detección precoz de cáncer de mama en el distrito sevilla sur, universidad de sevilla tesis doctoral. [6] [Hernandez+2009] Jose Hernández Introducción a la minería de datos Edit Prentice Hall Madrid [7] [Ilhan+13] ilhan ilhan, gülay tezel a genetic algorithm support vector machine method with parameter optimization for selecting the tag snps of the sd-journal of biomedical informatics 46 (2013) [8] [Lopez+01]alan d. lopez, colin d. mathers, majid ezzati, dean t. jamison, and christopher j. l. murray, measuring the global burden of disease and risk factors, who library cataloguing-in-publication data. [9] [Murray00] christopher j.l. murray1y julio frenk, un marco para evaluar el desempen o de los sistemas de salud, bulletin of the world health organization 2000, 78 (6): [10] [Oms_ent10] dr ala alwan,*, global status report on no communicable diseases 2010, library cataloguing-in-publication dataglobal status report on no communicable diseases [11] [Oms_ent10] dr ala alwan,*, global status report on no communicable diseases 2010, library cataloguing-in-publication dataglobal status report on no communicable diseases 2010 [12] [Pan+12] song pan, serdar iplikci, kevin warwick, tipu z. aziz, parkinson s disease tremor classification a comparison between support vector machines and neural networks, of the sd-expert systems with applications 39 (2012) [13]. [Re+11] matteo re y giorgio valentini, cancer module genes ranking using kernelized score functions of the bmc bioinformatics 2012, 13(suppl 14):s3 [see [14] [Santomé01] santomé l, baselga j. actualización en cáncer de mama: aspectos clínicos y terapéuticos. fmc 2001; 8 (9): [Vanneschi+11] leonardo vanneschi, antonella farinaccio, giancarlo mauri, mauro antoniotti1, paolo provero y mario giacobini a comparison of machine learning techniques for survival prediction in breast cancer of the biodata mining 2011, 4:12[see 16. [Weboms05] world health organization, organizacion mundial de la salud 2013, who library cataloguing-in-publication data 17. [Who04] world health organization, the global burden of disease, who library cataloguing-in-publication data,isbn (nlm classification: w 74) 18. [Who04] world health organization, global health risks : the global burden of disease, who, isbn (nlm classification: w 74) 19. [Who08] department of health statistics and informatics who, causes of death 2008: data sources and methods, who library cataloguing-in-publication data world health organization, global health risks : causes of death 2008: data sources and methods, who library cataloguing-in-publication data. 20. [Who09] world health organization, global health risks : mortality and burder of disease attributable to selected major risks, who, isbn ,(classification 105) 21. [Whs06] world health organization, world health statistics 2006, who library cataloguing-in-publication data 22. [Whs07] world health organization, world health statistics 2007, who library cataloguing-in-publication data 23. [Whs08] world health organization, world health statistics 2008, who library cataloguing-in-publication data 24. [Whs09] world health organization, world health statistics 2009, who library cataloguing-in-publication data 25. [Whs10] world health organization, world health statistics 2010, who library cataloguing-in-publication data 26. [Whs11] world health organization, world health statistics 2011, who library cataloguing-in-publication data 27. [Whs12] world health organization, world health statistics 2012, who library cataloguing-in-publication data 28. [Whs13] world health organization, world health statistics 2013, who library cataloguing-in-publication data 29. [Zaharia13] mayer zaharia, cancer as a public health problem in peru, rev peru med exp salud publica-ins 30. [Zhong+12] wei zhong, rick chow, jieyue he, clinical charge profiles prediction for patients diagnosed with chronic diseases using multi-level support vector machine, of the sd-expert systems with applications 39 (2012) [Bibliteca+15] Biblioteca Nacional de Medicina de Estados Unidos [see m] 32. [INC+15] Instituto Nacional del Cancer de Estados Unidos [see 33. [BCW2015] Breast Cancer Wisconsin Data Set [see https://archive.ics.uci.edu/ml/datasets/breast+cancer+wisconsin+(dia gnostic)] 34. [Bennett+92] K. P. Bennett y OL Mangasarian: "robusta Programación Lineal Discriminación de dos conjuntos linealmente Inseparable", Métodos de Optimización y Software 1, 1992, [Diaz+06] José Díaz Novás, Bárbara Gallego Machado, Aracelys León González; El diagnóstico médico: bases y procedimientos; Rev Cubana Med Gen Integr 2006;22(1) 36. [Borrajo09] BORRAJO, Daniel. Apuntes de la asignatura Inteligencia Artificial curso Departamento de informática, Universidad Carlos III 37. [AEPIA15] Asociación española de inteligencia artificial (AEPIA) [Puelles+15] PUELLES, Luis, SÁNCHEZ CÁNOVAS, José, ALBERTOS, Pedro. Inteligencia artificial e inteligencia humana. 39. [IA15] Inteligencia Artificial y temas relacionados. Wikipedia [Sánchez15] SÁNCHEZ G., PÉREZ H., NAKANO M. Growing Cell Neural Network using Simultaneous Perturbation. Inst. Politécnico Nacional, Secc. de Estudios de Posgrado e Investigación, Esc. Superior de Ingeniería Mecánica y y Eléctrica. México D. F. 41. [Sanchez06] SÁNCHEZ-MONTAÑÉS ISLA, Manuel A. Métodos Avanzados en Aprendizaje Artificial. Redes neuronales. Universidad Autónoma de Madrid, [CSULB15] History of the perceptron [Perce15] Perceptrón. Wikipedia 44. [MulPe15] Multilayer perceptrons [PerMu15] Perceptrón multicapa. Wikipedia 46. [JIANGSHENG02] YU JIANGSHENG. Method of k-nearest Neighbors. Institute of Computational Linguistics Peking University, China, [DeLaEscalera+15] DE LA ESCALERA, Arturo, ARMINGOL, José maría. Apuntes de la asignatura Sistemas de percepción (proveniente Del libro Visión por Computador, fundamentos y métodos, Arturo de la Escalera Hueso. Prentice Hall). Departamentos de ingeniería de sistemas y automática, Universidad Carlos III 48. [Fernández+15] FERNÁNDEZ REBOLLO, Fernando, BORRAJO MILLÁN, Daniel, GARCÍA DURÁN, Rocío. Apuntes de la asignatura Aprendizaje automática. Departamento de informática, Universidad Carlos III 49. [HSU15] CHIH-WEI HSU, CHIH-CHUNG CHANG AND CHIH-JEN LIN. A Practical Guide to Support Vector Classification.

Minera de datos aplicada a la detección de Cáncer de Mama

Minera de datos aplicada a la detección de Cáncer de Mama Minera de datos aplicada a la detección de Cáncer de Mama Eugenio Hernández Martínez Universidad Carlos III de Madrid 100039081@alumnos.uc3m.es Rodrigo Lorente Sanjurjo Universidad Carlos III de Madrid

Más detalles

UN MODELO PARA LA PREDICCIÓN DE RECIDIVA DE PACIENTES OPERADOS DE CÁNCER DE MAMA (CMO) BASADO EN REDES NEURONALES

UN MODELO PARA LA PREDICCIÓN DE RECIDIVA DE PACIENTES OPERADOS DE CÁNCER DE MAMA (CMO) BASADO EN REDES NEURONALES UN MODELO PARA LA PREDICCIÓN DE RECIDIVA DE PACIENTES OPERADOS DE CÁNCER DE MAMA (CMO) BASADO EN REDES NEURONALES José Alejandro Chiri Aguirre RESUMEN La predicción de recidiva en pacientes que han sido

Más detalles

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre:

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre: : : lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. 12 6 lemas propios de la. 12 6 lemas propios de la.

Más detalles

Comparación de métodos de clasificación aplicados a textos Científicos y No Científicos

Comparación de métodos de clasificación aplicados a textos Científicos y No Científicos I. Barbona - Comparación de métodos de clasificación aplicados a textos Científicos y No Científicos Comparación de métodos de clasificación aplicados a textos Científicos y No Científicos Comparison among

Más detalles

código Java Solicitudes Reportes AJI resultados API

código Java Solicitudes Reportes AJI resultados API Analizador Java Inteligente López De Luise María Daniela, miembro IT-Lab de la Universidad de Palermo, mlopez74@palermo.edu Agüero Martín Jorge, miembro IT-Lab de la Universidad de Palermo, agüero.martin@gmail.com

Más detalles

Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés

Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés Amaro Camargo Erika, Reyes García Carlos A. Instituto Nacional de Astrofísica, Óptica

Más detalles

MÁQUINA DE VECTORES DE SOPORTE

MÁQUINA DE VECTORES DE SOPORTE MÁQUINA DE VECTORES DE SOPORTE La teoría de las (SVM por su nombre en inglés Support Vector Machine) fue desarrollada por Vapnik basado en la idea de minimización del riesgo estructural (SRM). Algunas

Más detalles

ACTUACIONES RELEVANTES EN LA RED DE POLÍTICAS PÚBLICAS DE I+D+I 2012. IMED: Diagnóstico asistido del cáncer de mama

ACTUACIONES RELEVANTES EN LA RED DE POLÍTICAS PÚBLICAS DE I+D+I 2012. IMED: Diagnóstico asistido del cáncer de mama ACTUACIONES RELEVANTES EN LA RED DE POLÍTICAS PÚBLICAS DE I+D+I 2012 IMED: Diagnóstico asistido del cáncer de mama Edita: Fundación Española para la Ciencia y la Tecnología, FECYT, 2013. Diseño, maquetación

Más detalles

código Java Solicitudes Reportes AJI resultados API

código Java Solicitudes Reportes AJI resultados API Analizador Java Inteligente Agüero Martin Jorge, miembro IT-Lab de la Universidad de Palermo, agüero.marin@gmail.com López De Luise María Daniela, miembro IT-Lab de la Universidad de Palermo, mlopez74@palermo.edu

Más detalles

OPTATIVA I: MINERIA DE DATOS

OPTATIVA I: MINERIA DE DATOS UNIVERSIDAD AUTÓNOMA DE CHIHUAHUA Clave: 08MSU007H Clave: 08USU4053W FACULTAD DE INGENIERÍA PROGRAMA DEL CURSO: OPTATIVA I: MINERIA DE DATOS DES: Programa(s) Educativo(s): Tipo de materia: Clave de la

Más detalles

Propuesta de un modelo de análisis para estimación del tamaño del software y gestión de costos y riesgos a partir de requerimientos funcionales

Propuesta de un modelo de análisis para estimación del tamaño del software y gestión de costos y riesgos a partir de requerimientos funcionales Propuesta de un modelo de análisis para estimación del tamaño del software y gestión de costos y riesgos a partir de requerimientos funcionales S.Forigua, O.Ballesteros Abstract. This paper describes the

Más detalles

EPB 603 Sistemas del Conocimiento!"#$ %& $ %'

EPB 603 Sistemas del Conocimiento!#$ %& $ %' Metodología para el Desarrollo de Proyectos en Minería de Datos CRISP-DM EPB 603 Sistemas del Conocimiento!"#$ %& $ %' Modelos de proceso para proyectos de Data Mining (DM) Son diversos los modelos de

Más detalles

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN)

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) CLASIFICACIÓN NO SUPERVISADA CLUSTERING Y MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) info@clustering.50webs.com Indice INTRODUCCIÓN 3 RESUMEN DEL CONTENIDO 3 APRENDIZAJE

Más detalles

DETECCIÓN DE PATRONES EN IMÁGENES MÉDICAS BASADOS EN TÉCNICAS DE EXPLOTACIÓN DE DATOS Proyecto de Tesis de Magíster en Ingeniería de Software

DETECCIÓN DE PATRONES EN IMÁGENES MÉDICAS BASADOS EN TÉCNICAS DE EXPLOTACIÓN DE DATOS Proyecto de Tesis de Magíster en Ingeniería de Software DETECCIÓN DE PATRONES EN IMÁGENES MÉDICAS BASADOS EN TÉCNICAS DE EXPLOTACIÓN DE DATOS Proyecto de Tesis de Magíster en Ingeniería de Software Tesista: Director propuesto: Ing. Gustavo A. Ferrero M. Ing.

Más detalles

ÍNDICE Capítulo 1: EL CÁNCER DE MAMA (Página 1) Capítulo 2: LA MAMOGRAFÍA (Página 4) Capítulo 3: ASESORAMIENTO GENÉTICO EN ONCOLOGÍA (Página 6)

ÍNDICE Capítulo 1: EL CÁNCER DE MAMA (Página 1) Capítulo 2: LA MAMOGRAFÍA (Página 4) Capítulo 3: ASESORAMIENTO GENÉTICO EN ONCOLOGÍA (Página 6) T R A N S F O R M A M O S H Á B I T O S P O R U N A M E J O R C A L I D A D D E V I D A GUÍA DE CÁNCER DE MAMA Información para pacientes ÍNDICE Capítulo 1: EL CÁNCER DE MAMA (Página 1) Capítulo 2: LA

Más detalles

FILTRADO DE CONTENIDOS WEB EN ESPAÑOL DENTRO DEL PROYECTO POESIA

FILTRADO DE CONTENIDOS WEB EN ESPAÑOL DENTRO DEL PROYECTO POESIA FILTRADO DE CONTENIDOS WEB EN ESPAÑOL DENTRO DEL PROYECTO POESIA Enrique Puertas epuertas@uem.es Francisco Carrero fcarrero@uem.es José María Gómez Hidalgo jmgomez@uem.es Manuel de Buenaga buenga@uem.es

Más detalles

Pablo Martínez-Camblor Subdirección de Salud de Guipuzcoa, Donosti.

Pablo Martínez-Camblor Subdirección de Salud de Guipuzcoa, Donosti. Métodos Estadísticos sticos para Diagnósticos MédicosM Barcelona, uno de marzo de 2008 Pablo Martínez-Camblor Subdirección de Salud de Guipuzcoa, Donosti. MODULO: Diseño de proyectos y análisis estadístico

Más detalles

TÓPICOS AVANZADOS DE BASES DE DATOS

TÓPICOS AVANZADOS DE BASES DE DATOS TÓPICOS AVANZADOS DE BASES DE DATOS 1. DATOS DE LA ASIGNATURA. Nombre de la asignatura: TÓPICOS AVANZADOS DE BASES DE DATOS Carrera: Ingeniería en Sistemas Computacionales Clave de la asignatura: Modulo

Más detalles

Master de Ingeniería Biomédica Sistemas de ayuda al diagnóstico clínico

Master de Ingeniería Biomédica Sistemas de ayuda al diagnóstico clínico Master de Ingeniería Biomédica Sistemas de ayuda al diagnóstico clínico Emilio Soria Olivas! Antonio José Serrano López! Departamento de Ingeniería Electrónica! Escuela Técnica Superior de Ingeniería!

Más detalles

Programa de Detección Precoz de Cáncer de Mama INFORMACIÓN PARA DECIDIR

Programa de Detección Precoz de Cáncer de Mama INFORMACIÓN PARA DECIDIR Programa de Detección Precoz de Cáncer de Mama INFORMACIÓN PARA DECIDIR Programa de Detección Precoz de Cáncer de Mama INFORMACIÓN PARA DECIDIR Esta guía contiene información sobre la prevención del cáncer

Más detalles

Métricas de complejidad para la transformación del problema de detección de cáncer basado en

Métricas de complejidad para la transformación del problema de detección de cáncer basado en Índice para la transformación del problema de detección de cáncer basado en mamografías Alumna: Núria Macià Antoĺınez Asesora: Ester Bernadó Mansilla Núria Macià Antoĺınez PFC: 1/49 Índice 1 Planteamiento

Más detalles

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2.

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. 1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. GENERALIDADES SOBRE LAS TÉCNICAS DE INVESTIGACIÓN SOCIAL Y DE MERCADOS

Más detalles

Resumen. Palabras claves: Clusteres, Crisp-DM, Morosidad, Sigmoidal, Algoritmos, K-medias, UPeU.

Resumen. Palabras claves: Clusteres, Crisp-DM, Morosidad, Sigmoidal, Algoritmos, K-medias, UPeU. Model Clustering Neural Network Monitoring Applications No K-Means Algorithm for the Segmentation of the Peruvian University Students Union Rodolfo Pacco, Palomino; Del Rosario Montero, Wilson Tomas Anquise,

Más detalles

Guía docente de la asignatura

Guía docente de la asignatura Guía docente de la asignatura Asignatura Materia Módulo Titulación TÉCNICAS DE APRENDIZAJE AUTOMÁTICO COMPUTACIÓN TECNOLOGÍAS ESPECÍFICAS GRADO EN INGENIERÍA INFORMÁTICA Plan 545 Código 46932 Periodo de

Más detalles

Capítulo 1. Introducción. 1.1. Antecedentes

Capítulo 1. Introducción. 1.1. Antecedentes Capítulo 1. Introducción En este capítulo se presenta una descripción general del problema a investigar y el enfoque con el que se aborda. Se establece la necesidad de incorporar técnicas de análisis novedosas

Más detalles

Data Mining Técnicas y herramientas

Data Mining Técnicas y herramientas Data Mining Técnicas y herramientas Introducción POR QUÉ? Empresas necesitan aprender de sus datos para crear una relación one-toone con sus clientes. Recogen datos de todos lo procesos. Datos recogidos

Más detalles

GUÍA DOCENTE. Curso Académico 2015/16. Técnicas de Análisis Estadístico basado en Inteligencia

GUÍA DOCENTE. Curso Académico 2015/16. Técnicas de Análisis Estadístico basado en Inteligencia GUÍA DOCENTE Curso Académico 2015/16 1. Técnicas de Análisis Estadístico basado en Inteligencia Artificial 1.1. Datos de la asignatura Tipo de estudios Titulación Nombre de la asignatura Carácter de la

Más detalles

Weka como herramienta de data mining

Weka como herramienta de data mining Weka como herramienta de data mining Lic. Aldave Rojas Isaac Alberto Instituto Tecnológico Superior de Ciudad Serdán Abstract El presente trabajo muestra un ejemplo introductorio a la herramienta de Data

Más detalles

Cómo se usa Data Mining hoy?

Cómo se usa Data Mining hoy? Cómo se usa Data Mining hoy? 1 Conocer a los clientes Detectar segmentos Calcular perfiles Cross-selling Detectar buenos clientes Evitar el churning, attrition Detección de morosidad Mejora de respuesta

Más detalles

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial Universidad del Cauca Facultad de Ingeniería Electrónica y Telecomunicaciones Programas de Maestría y Doctorado en Ingeniería Telemática Seminario de Investigación Evaluación, limpieza y construcción de

Más detalles

SVM: Máquinas de Vectores Soporte. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid

SVM: Máquinas de Vectores Soporte. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid SVM: Máquinas de Vectores Soporte Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Contenido 1. Clasificación lineal con modelos lineales 2. Regresión

Más detalles

Capítulo 1: EL CANCER DE MAMA

Capítulo 1: EL CANCER DE MAMA Capítulo 1: EL CANCER DE MAMA Qué es el cáncer de mama? Es una enfermedad maligna producida por la división y crecimiento descontrolado de las células que conforman algunas de las estructuras de la mama.

Más detalles

Resumen. 1. Introducción. 2. Objetivos

Resumen. 1. Introducción. 2. Objetivos Propuesta para la Asignatura Sistemas Industriales en las Titulaciones de Informática F.A. Pujol, F.J. Ferrández, J.L. Sánchez, J. M. García Chamizo Dept. de Tecnología Informática y Computación Universidad

Más detalles

Capítulo 1. Introducción

Capítulo 1. Introducción Capítulo 1. Introducción El WWW es la mayor fuente de imágenes que día a día se va incrementando. Según una encuesta realizada por el Centro de Bibliotecas de Cómputo en Línea (OCLC) en Enero de 2005,

Más detalles

EL PODER ESTADÍSTICO. DIFERENCIAS OBSERVADAS CUANDO SE CAMBIA EL ALFA ESTABLECIDO EN UN ESTUDIO DE INVESTIGACIÓN

EL PODER ESTADÍSTICO. DIFERENCIAS OBSERVADAS CUANDO SE CAMBIA EL ALFA ESTABLECIDO EN UN ESTUDIO DE INVESTIGACIÓN EL PODER ESTADÍSTICO. DIFERENCIAS OBSERVADAS CUANDO SE CAMBIA EL ALFA ESTABLECIDO EN UN ESTUDIO DE INVESTIGACIÓN Mylord Reyes Tosta, EdD Resumen Se utilizaron dos ejemplos para una prueba de hipótesis

Más detalles

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones

Más detalles

Con el fin de obtener los datos, se procede con las siguientes instrucciones:

Con el fin de obtener los datos, se procede con las siguientes instrucciones: Capitulo 3. La predicción de beneficios del mercado bursátil Este segundo caso de estudio va más allá en el uso de técnicas de minería de datos. El dominio específico utilizado para ilustrar estos problemas

Más detalles

Redes Bayesianas para predecir riesgo de plomo en sangre de puérperas y neonatos

Redes Bayesianas para predecir riesgo de plomo en sangre de puérperas y neonatos Redes Bayesianas para predecir riesgo de plomo en sangre de puérperas y neonatos Autores A.M. Sancho 1,2 ; V. Messina 3 ; M. Cuevas 4 ; I. Sattolo 2 ; R.Dante 1 ; A. Ricca 1, y L. De Oto 2 RESUMEN Las

Más detalles

VivaMéxico sin PRI. Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres. Otoño 2013

VivaMéxico sin PRI. Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres. Otoño 2013 VivaMéxico sin PRI Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres Facultad de Ciencias de la Computación Benemérita Universidad Autónoma de Puebla Otoño 2013 IMAGENESpemexmorena Adquisición

Más detalles

Modelado de relaciones existentes en un equipo de proyecto de software Modeling relationships in a software project team

Modelado de relaciones existentes en un equipo de proyecto de software Modeling relationships in a software project team Modelado de relaciones existentes en un equipo de proyecto de software Modeling relationships in a software project team Rafael Rodríguez-Puente 1, Eliana B. Ril-Valentin 2 1 Departamento de Técnicas de

Más detalles

DETECCIÓN DE PATRONES DE ACCESIBILIDAD EN EL DESARROLLO DE PROYECTOS WEB

DETECCIÓN DE PATRONES DE ACCESIBILIDAD EN EL DESARROLLO DE PROYECTOS WEB DETECCIÓN DE PATRONES DE ACCESIBILIDAD EN EL DESARROLLO DE PROYECTOS WEB Villanueva, J. (p) ; Rodríguez, V.; Ortega, F.; Mijares, A. Abstract The use of accessibility requirements in the development of

Más detalles

CAPÍTULO 1. LA SITUACIÓN DEL CANCER DE MAMA EN MÉXICO

CAPÍTULO 1. LA SITUACIÓN DEL CANCER DE MAMA EN MÉXICO CAPÍTULO 1. LA SITUACIÓN DEL CANCER DE MAMA EN MÉXICO De acuerdo con la Organización Mundial de la Salud (OMS), el cáncer más frecuente entre las mujeres es el de mama, que a nivel mundial representa el

Más detalles

Investigación clínica en Centros Privados Visión del gerente y el investigador

Investigación clínica en Centros Privados Visión del gerente y el investigador Investigación clínica en Centros Privados Visión del gerente y el investigador Proyecto LIFE: Investigación clínica contra el cáncer de mama José Manuel santabárbara R&D Project Manager ERESA Grupo Médico

Más detalles

Programa de Doctorado en Tecnologías para la Salud y el Bienestar. Doctorando: Carlos Sáez Silvestre

Programa de Doctorado en Tecnologías para la Salud y el Bienestar. Doctorando: Carlos Sáez Silvestre Métodos espacio-temporales probabilísticos para el control de calidad de datos biomédicos, aplicación al Registro de Mortalidad de la Comunitat Valenciana Programa de Doctorado en Tecnologías para la Salud

Más detalles

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Francisco J. Martín Mateos Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Qué es la (KE)? Definición de Wikipedia: La es una disciplina cuyo objetivo es integrar conocimiento

Más detalles

1. DATOS DE LA ASIGNATURA

1. DATOS DE LA ASIGNATURA 1. DATOS DE LA ASIGNATURA Nombre de la asignatura: Curso Avanzado de Estadística Titulación: Máster en Matemáticas y aplicaciones Código Breve Descripción: El curso está centrado en dos temas relativamente

Más detalles

PROYECTO IMED. CETA-CIEMAT, Trujillo, España Día Virtual de e-salud RedClara, 12 de Septiembre de 2012

PROYECTO IMED. CETA-CIEMAT, Trujillo, España Día Virtual de e-salud RedClara, 12 de Septiembre de 2012 PROYECTO IMED La experiencia del CETA-CIEMAT en: INVESTIGACIÓN EN MÉTODOS DE AYUDA AL DIAGNÓSTICO EN CÁNCER DE MAMA CETA-CIEMAT, Trujillo, España Día Virtual de e-salud RedClara, 12 de Septiembre de 2012

Más detalles

1.9. Requisitos mínimos de asistencia a las sesiones presenciales / Minimum attendance requirement

1.9. Requisitos mínimos de asistencia a las sesiones presenciales / Minimum attendance requirement ASIGNATURA / COURSE TITLE ANÁLISIS DE DATOS 1.1. Código / Course number 16307 1.2. Materia / Content area Módulo instrumental 1.3. Tipo / Course type Obligatoria 1.4. Nivel / Course level Grado 1.5. Curso

Más detalles

Parte I: Introducción

Parte I: Introducción Parte I: Introducción Introducción al Data Mining: su Aplicación a la Empresa Cursada 2007 POR QUÉ? Las empresas de todos los tamaños necesitan aprender de sus datos para crear una relación one-to-one

Más detalles

Enfermedades Crónico - Degenerativas. Padecimientos Población Adulta

Enfermedades Crónico - Degenerativas. Padecimientos Población Adulta México: Enfermedades Crónico - Degenerativas = Padecimientos Población Adulta Constituyen: Principales Causas Mortalidad Diabetes Mellitus Dislipidemias Trastornos Cardiovasculares Destacan: Prevalencia

Más detalles

LA MINERÍA DE DATOS EN LA EXTRACCIÓN DE CONOCIMIENTOS APLICADOS A PROBLEMAS RELACIONADOS CON LA EDUCACIÓN

LA MINERÍA DE DATOS EN LA EXTRACCIÓN DE CONOCIMIENTOS APLICADOS A PROBLEMAS RELACIONADOS CON LA EDUCACIÓN LA MINERÍA DE DATOS EN LA EXTRACCIÓN DE CONOCIMIENTOS APLICADOS A PROBLEMAS RELACIONADOS CON LA EDUCACIÓN Blanca Maricela Ibarra Murrieta, Ricardo Blanco Vega y María Angélica García Fierro Departamento

Más detalles

Comparación de modelos de curvas ROC para la evaluación de procedimientos estadísticos de predicción en investigación de mercados.

Comparación de modelos de curvas ROC para la evaluación de procedimientos estadísticos de predicción en investigación de mercados. Comparación de modelos de curvas ROC para la evaluación de procedimientos estadísticos de predicción en investigación de mercados. Pedro Concejero Cerezo Tesis Doctoral dirigida por Rosario Martínez Arias

Más detalles

MINERIA DE DATOS Y Descubrimiento del Conocimiento

MINERIA DE DATOS Y Descubrimiento del Conocimiento MINERIA DE DATOS Y Descubrimiento del Conocimiento UNA APLICACIÓN EN DATOS AGROPECUARIOS INTA EEA Corrientes Maximiliano Silva La información Herramienta estratégica para el desarrollo de: Sociedad de

Más detalles

Los requisitos, un factor crítico en el éxito de los proyectos

Los requisitos, un factor crítico en el éxito de los proyectos Los requisitos, un factor crítico en el éxito de los proyectos La importancia de los modelos José Luis Fernández Sánchez Profesor titular ETSI Industriales- Universidad Politécnica de Madrid jlfdez@etsii.upm.es

Más detalles

Productividad en Empresas de Construcción: Conocimiento adquirido de las bases de datos

Productividad en Empresas de Construcción: Conocimiento adquirido de las bases de datos Productividad en Empresas de Construcción: Conocimiento adquirido de las bases de datos Productivity in Construction Companies: Knowledge acquired from the databases Hernando Camargo Mila, Rogelio Flórez

Más detalles

AUTOR: GILBERT CERVANTES JURO ESTUDIANTE DE LA ESCUELA PROFESIONAL DE INGENIERÍA DE SISTEMAS

AUTOR: GILBERT CERVANTES JURO ESTUDIANTE DE LA ESCUELA PROFESIONAL DE INGENIERÍA DE SISTEMAS PERFIL DEL NIVEL DE GESTIÓN DEL DOMINIO PLANEAR Y ORGANIZAR DE LAS TECNOLOGÍAS DE LA INFORMACIÓN Y COMUNICACIONES (TIC) EN HOSPITAL NIVEL II JORGE REÁTEGUI DELGADO - ESSALUD, PIURA 2014. PROFILE MANAGEMENT

Más detalles

Evaluación de modelos para la predicción de la Bolsa

Evaluación de modelos para la predicción de la Bolsa Evaluación de modelos para la predicción de la Bolsa Humberto Hernandez Ansorena Departamento de Ingeniería Telemática Universidad Carlos III de Madrid Madrid, España 10003975@alumnos.uc3m.es Rico Hario

Más detalles

El cáncer de mama. se puede curar si se detecta a tiempo

El cáncer de mama. se puede curar si se detecta a tiempo El cáncer de mama se puede curar si se detecta a tiempo Qué es el cáncer de mama? Es una enfermedad que afecta la glándula mamaria y que, como todos los cánceres se produce cuando proliferan excesivamente

Más detalles

Decidir cuándo autenticar en dispositivos móviles a partir de modelos de machine learning 1

Decidir cuándo autenticar en dispositivos móviles a partir de modelos de machine learning 1 Decidir cuándo autenticar en dispositivos móviles a partir de modelos de machine learning 1 En los dispositivos móviles como tablets o teléfonos celulares se tiene la opción de implementar o no un sistemas

Más detalles

2. CLASIFICACIÓN DE LA ACTIVIDAD CURRICULAR, FORMACIÓN PRÁCTICA Y CARGA HORARIA

2. CLASIFICACIÓN DE LA ACTIVIDAD CURRICULAR, FORMACIÓN PRÁCTICA Y CARGA HORARIA CÓDIGO ASIGNATURA 1131-3 DEPARTAMENTO: Ingeniería e Investigaciones Tecnológicas ASIGNATURA: DATA MINING y DATA WAREHOUSE Plan 2009 Ingeniería en Informática Año: 5 (Electiva - Ingeniería de Software)

Más detalles

Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico

Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico Verónica Escobar González, Claudio Barrientos Ochoa, Sergio Barrientos Ochoa, Dirección de Modelamiento Geometalúrgico

Más detalles

DOCTORADO EN CIENCIAS COMPUTACIONALES

DOCTORADO EN CIENCIAS COMPUTACIONALES DOCTORADO EN CIENCIAS COMPUTACIONALES Objetivos El programa de Doctorado en Ciencias Computacionales, tiene el propósito esencial de formar profesionales con las siguientes características: Amplio dominio

Más detalles

Herramienta para la Administración y Estimación Ágil de Desarrollo de Software

Herramienta para la Administración y Estimación Ágil de Desarrollo de Software Herramienta para la Administración y Estimación Ágil de Desarrollo de Software Mario R. MORENO SABIDO Depto. de Sistemas y Computación, Instituto Tecnológico de Mérida Mérida, Yucatán 97118, México y Jorge

Más detalles

Información a usuarias sobre el cribado de cáncer de mama

Información a usuarias sobre el cribado de cáncer de mama Información a usuarias sobre el cribado de cáncer de mama Evaluación de la situación actual y establecimiento de estándares de información basada en la evidencia Teresa Queiro Verdes XIII Reunión Anual

Más detalles

Introducción a la Minería de Datos

Introducción a la Minería de Datos Introducción a la Minería de Datos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Índice 1 Minería de

Más detalles

Información socioeconómica de los estudiantes de la UPS analizada desde un sistema de información geográfica

Información socioeconómica de los estudiantes de la UPS analizada desde un sistema de información geográfica 63 Información socioeconómica de los estudiantes de la UPS analizada desde un sistema de información geográfica Bertha Tacuri Capelo*, Álvaro Mejía Pesántez**, Germán Parra González*** email: btacuri@ups.edu.ec

Más detalles

Análisis de los determinantes del riesgo de crédito. Aplicación de técnicas emergentes en el marco de los acuerdos de Basilea II y Solvencia II

Análisis de los determinantes del riesgo de crédito. Aplicación de técnicas emergentes en el marco de los acuerdos de Basilea II y Solvencia II REVISTA ESPAÑOLA DE FINANCIACIÓN Y CONTABILIDAD Vol. XXXVI, n.º 135 julio-septiembre 2007 pp. 649-653 649 Análisis de los determinantes del riesgo de crédito. Aplicación de técnicas emergentes en el marco

Más detalles

LA GESTIÓN DEL CONOCIMIENTO

LA GESTIÓN DEL CONOCIMIENTO Plan de Formación 2006 ESTRATEGIAS Y HABILIDADES DE GESTIÓN DIRECTIVA MÓDULO 9: 9 LA ADMINISTRACIÓN ELECTRÓNICA EN LA SOCIEDAD DE LA INFORMACIÓN LA GESTIÓN DEL CONOCIMIENTO José Ramón Pereda Negrete Jefe

Más detalles

Mónica López Ratón BIOSTATECH, Advice, Training & Innovation in Biostatistics, S.L. Abril 2013. monica.lopez.raton@usc.es

Mónica López Ratón BIOSTATECH, Advice, Training & Innovation in Biostatistics, S.L. Abril 2013. monica.lopez.raton@usc.es Mónica López Ratón BIOSTATECH, Advice, Training & Innovation in Biostatistics, S.L. Abril 2013 monica.lopez.raton@usc.es Selección de puntos de corte óptimos en los tests diagnósticos Índice 1. Motivación

Más detalles

CURSO ESTADÍSTICA APLICADA CON R

CURSO ESTADÍSTICA APLICADA CON R CURSO ESTADÍSTICA APLICADA CON R Organizado por: Instituto IMDEA Alimentación Facultad de Ciencias de la Universidad Autónoma de Madrid MADRID, de Septiembre a Diciembre de 2015 Estadística Aplicada con

Más detalles

PROGRAMA DE ASIGNATURA

PROGRAMA DE ASIGNATURA PROGRAMA DE ASIGNATURA 01. Carrera Lic. En Administración de Negocios Internacionales Lic. En Dirección del Factor Humano Lic. En Comercialización x Lic. En Tecnología Informática Lic. En Administración

Más detalles

INFORME DE PATOLOGIA ONCOLOGICA EN DOCENTES EN LA PROVINCIA DE MISIONES. AÑO 2011.

INFORME DE PATOLOGIA ONCOLOGICA EN DOCENTES EN LA PROVINCIA DE MISIONES. AÑO 2011. INFORME DE PATOLOGIA ONCOLOGICA EN DOCENTES EN LA PROVINCIA DE MISIONES. AÑO 2011. FUNDAMENTOS Y OBJETIVOS: La Patología Oncológica es actualmente la principal causa de muerte en el mundo por enfermedad.

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 2 - Juan Alfonso Lara Torralbo 1 Índice de contenidos (I) Introducción a Data Mining Actividad. Tipos

Más detalles

Un presente y futuro de RR.HH. basado en datos: Aplicaciones de Data Mining en la Gestión de Personas. Prof. Lic. Juan M. Bodenheimer jb@instare.

Un presente y futuro de RR.HH. basado en datos: Aplicaciones de Data Mining en la Gestión de Personas. Prof. Lic. Juan M. Bodenheimer jb@instare. Un presente y futuro de RR.HH. basado en datos: Aplicaciones de Data Mining en la Gestión de Personas Congreso de RR.HH. De Costa Rica 30/10/2012 Prof. Lic. Juan M. Bodenheimer jb@instare.com Nuestra Agenda

Más detalles

Desarrollo de un sistema capaz de optimizar rutas de entrega utilizando algoritmos genéticos

Desarrollo de un sistema capaz de optimizar rutas de entrega utilizando algoritmos genéticos MT 6 Desarrollo de un sistema capaz de optimizar rutas de entrega utilizando algoritmos genéticos Rosario Baltazar 1 Judith Esquivel Vázquez 2 Andrea Rada 3 Claudia Díaz 4 Resumen Durante los últimos 15

Más detalles

Línea de trabajo: Control de los Procesos de Manufactura Optimización de los Procesos de Manufactura 48 20 100 168-6

Línea de trabajo: Control de los Procesos de Manufactura Optimización de los Procesos de Manufactura 48 20 100 168-6 Nombre de la asignatura: ESTADISTICA MULTIVARIADA Línea de trabajo: Control de los Procesos de Manufactura Optimización de los Procesos de Manufactura 48 20 100 168-6 DOC: Docencia; TIS: Trabajo Independiente

Más detalles

Diseño e Implementación de un Sistema para la Segmentación de Clientes de una Operadora Celular

Diseño e Implementación de un Sistema para la Segmentación de Clientes de una Operadora Celular Diseño e Implementación de un Sistema para la Segmentación de Clientes de una Operadora Celular AUTORES: Fabián Cabrera Cuenca 1, Sergio Jonathan León García 2, Ilse Lorena Ycaza Díaz 3, Juan Aurelio Alvarado

Más detalles

CLASIFICADOR LINGÜÍSTICO DE TEXTOS EN JAVA

CLASIFICADOR LINGÜÍSTICO DE TEXTOS EN JAVA CLASIFICADOR LINGÜÍSTICO DE TEXTOS EN JAVA Óscar Alberto García Pérez Universidad Carlos III de Madrid 100039016@alumnos.uc3m.es Ignacio Martínez Fernández Universidad Carlos III de Madrid 100039048@alumnos.uc3m.es

Más detalles

Clasificación de Áreas y Subáreas para las inscripciones al Doctorado en Ciencias Informáticas

Clasificación de Áreas y Subáreas para las inscripciones al Doctorado en Ciencias Informáticas Área Algoritmos y Estructuras de Datos Arquitectura de computadoras Subárea - Algoritmos - Análisis de algoritmos - Estructuras de Datos - Verificación y certificación de programas - Lógicas para el desarrollo

Más detalles

Programación Orientada a Objetos Inteligencia Artificial Programación Lógica Lógica Matemática Tecnicas para el derrallo de sistemas artificiales

Programación Orientada a Objetos Inteligencia Artificial Programación Lógica Lógica Matemática Tecnicas para el derrallo de sistemas artificiales ANEXO D. INSTITUCION: PLANES DE ESTUDIOS DE OTRAS IES INSTITUTO POLITECNICO NACIONAL CIENCIAS DE LA COMPUTACIÓN Inteligencia artificial Programación Orientada a Objetos Inteligencia Artificial Programación

Más detalles

EVALUACIÓN N DE LA VALIDEZ DE PRUEBAS DIAGNÓSTICAS

EVALUACIÓN N DE LA VALIDEZ DE PRUEBAS DIAGNÓSTICAS EVALUACIÓN N DE LA VALIDEZ DE PRUEBAS DIAGNÓSTICAS César Gutiérrez Villafuerte Sección n de Epidemiología a y Estadística stica Facultad de Medicina UNMSM Lima, marzo de 2006 Tuberculosis pulmonar Cáncer

Más detalles

Localización y clínica asociada al cáncer de colon. Hospital Nacional Arzobispo Loayza: 2009 2013

Localización y clínica asociada al cáncer de colon. Hospital Nacional Arzobispo Loayza: 2009 2013 Localización y clínica asociada al cáncer de colon. Hospital Nacional Arzobispo Loayza: 2009 2013 1 2a 2, Abraham André 2 2 2, Mónica Fisher Alvarez 2, 2 RESUMEN Material y Métodos: Palabras clave: ABSTRACT

Más detalles

PREVENCIÓN DE CÁNCER DE MAMA

PREVENCIÓN DE CÁNCER DE MAMA PREVENCIÓN DE CÁNCER DE MAMA DR. JAIME PONCE LA TORRE MASTÓLOGO CMP 18352 RNE 9037-2034 INDICE 1. Epidemiologia 2. Detección precoz 3. Procedimientos diagnósticos 4. Tratamiento quirúrgico El cáncer más

Más detalles

SCREENING DEL CARCINOMA DE MAMA

SCREENING DEL CARCINOMA DE MAMA SCREENING DEL CARCINOMA DE MAMA CS Illes Columbretes Página 1 Algunas personas visitan al médico únicamente cuando sienten dolor o cuando notan cambios, como por ejemplo, una masa o nódulo en el seno.

Más detalles

Ejemplo de aplicación de la Dimensión Fractal en Medicina

Ejemplo de aplicación de la Dimensión Fractal en Medicina Ejemplo de aplicación de la Dimensión Fractal en Medicina El cáncer de mama es la enfermedad de las mujeres más común en el mundo moderno. Las estadísticas muestran que el riesgo de la mujer de desarrollar

Más detalles

Sistema de Consultas en Lenguaje Natural para Bases de Datos

Sistema de Consultas en Lenguaje Natural para Bases de Datos Sistema de Consultas en Lenguaje Natural para Bases de Datos José Manuel Soto Corzo, David Díaz Portillo, José Antonio Cruz Zamora Instituto Tecnológico de Apizaco Av. Instituto Tecnológico de Apizaco

Más detalles

CONCEPTOS BÁSICOS DE DISEÑO DE ESTUDIOS EPIDEMIOLÓGICOS

CONCEPTOS BÁSICOS DE DISEÑO DE ESTUDIOS EPIDEMIOLÓGICOS CONCEPTOS BÁSICOS DE DISEÑO DE ESTUDIOS EPIDEMIOLÓGICOS 1. Objetivo: Conocer los principales diseños epidemiológicos. 2. Términos Claves: Estudios epidemiológicos; estrategias de diseño; validez; objetivos.

Más detalles

Generación de números aleatorios

Generación de números aleatorios Generación de números aleatorios Marcos García González (h[e]rtz) Verano 2004 Documento facilitado por la realización de la asignatura Métodos informáticos de la física de segundo curso en la universidad

Más detalles

Síntesis Ejecutiva. Trato Adecuado en México: Respuesta a las Expectativas no Médicas de los Usuarios de Servicios de Salud

Síntesis Ejecutiva. Trato Adecuado en México: Respuesta a las Expectativas no Médicas de los Usuarios de Servicios de Salud Síntesis Ejecutiva Trato Adecuado en México: Respuesta a las Expectativas no Médicas de los Usuarios de Servicios de Salud El Índice de trato adecuado en México en 2001 alcanzó una calificación de 5.7,

Más detalles

Dispositivos Lab-on-a-chip y ópticos para mediciones distribuidas con aplicaciones en biomedicina.

Dispositivos Lab-on-a-chip y ópticos para mediciones distribuidas con aplicaciones en biomedicina. UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE CIENCIAS Sección de Posgrado y Segunda Especialización Profesional Dispositivos Lab-on-a-chip y ópticos para mediciones distribuidas con aplicaciones en biomedicina.

Más detalles

SET (Software Engineering Tutor). Una herramienta para la construcción guiada de modelos de dominio

SET (Software Engineering Tutor). Una herramienta para la construcción guiada de modelos de dominio SET (Software Engineering Tutor). Una herramienta para la construcción guiada de modelos de dominio Arturo Cepeda Pérez, Sergio Bravo Martín, Francisco José García Peñalvo Universidad de Salamanca, Facultad

Más detalles

Guía docente de la asignatura

Guía docente de la asignatura Guía docente de la asignatura Asignatura Materia Minería de Datos Complementos de Computación Módulo Titulación Grado en Ingeniería Informática Plan 463 45220 Periodo de impartición 1 er Cuatrimestre Tipo/Carácter

Más detalles

Enfermedades Quirúrgicas de la Mama. Módulo 5.2 Prevención secundaria del Cáncer de Mama

Enfermedades Quirúrgicas de la Mama. Módulo 5.2 Prevención secundaria del Cáncer de Mama Módulo 5.2 Prevención secundaria del Cáncer de Mama El cáncer de mama es tumor más frecuente en las mujeres de Cantabria Incidencia: 76 casos/100.000 mujeres. Registro de Tumores. Dirección General de

Más detalles

INSTITUTO MATEMÁTICO Y ACTUARIAL MEXICANO DIPLOMADO EN MINERÍA DE DATOS

INSTITUTO MATEMÁTICO Y ACTUARIAL MEXICANO DIPLOMADO EN MINERÍA DE DATOS INSTITUTO MATEMÁTICO Y ACTUARIAL MEXICANO DIPLOMADO EN MINERÍA DE DATOS Por qué es importante la Minería de Datos? 2 La Minería de Datos es un proceso que permite obtener conocimiento a partir de los datos

Más detalles

Base de datos II Facultad de Ingeniería. Escuela de computación.

Base de datos II Facultad de Ingeniería. Escuela de computación. Base de datos II Facultad de Ingeniería. Escuela de computación. Introducción Este manual ha sido elaborado para orientar al estudiante de Bases de datos II en el desarrollo de sus prácticas de laboratorios,

Más detalles

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Introducción a selección de atributos usando WEKA Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Contenido 1 Introducción a WEKA El origen Interfaces

Más detalles

<TITULO DEL PROYECTO DE DESARROLLO DE SW > Diana Milena Pérez Riveros 1 Diana Milena Pérez Riveros Pagina de

Más detalles

Extracción de reglas borrosas en problemas de clasificación multiatributo. El enfoque NEFCLASS

Extracción de reglas borrosas en problemas de clasificación multiatributo. El enfoque NEFCLASS VIII Congreso de Ingeniería de Organización Leganés, 9 y 10 de septiembre de 2004 Extracción de reglas borrosas en problemas de clasificación multiatributo. El enfoque NEFCLASS Javier Puente 1, David de

Más detalles

Competencias generales vinculadas a los distintos módulos Módulo de Formación Básica

Competencias generales vinculadas a los distintos módulos Módulo de Formación Básica Competencias generales vinculadas a los distintos módulos Módulo de Formación Básica C1. Capacidad para la resolución de los problemas matemáticos que puedan plantearse en la ingeniería. Aptitud para aplicar

Más detalles

SISTEMAS INTELIGENTES

SISTEMAS INTELIGENTES SISTEMAS INTELIGENTES T11: Métodos Kernel: Máquinas de vectores soporte {jdiez, juanjo} @ aic.uniovi.es Índice Funciones y métodos kernel Concepto: representación de datos Características y ventajas Funciones

Más detalles