UNIVERSIDAD TECNOLÓGICA ISRAEL TRABAJO DE TITULACIÓN

Tamaño: px
Comenzar la demostración a partir de la página:

Download "UNIVERSIDAD TECNOLÓGICA ISRAEL TRABAJO DE TITULACIÓN"

Transcripción

1 Responsabilidad con pensamiento positivo UNIVERSIDAD TECNOLÓGICA ISRAEL TRABAJO DE TITULACIÓN CARRERA: INGENIERIA EN SISTEMAS INFORMÁTICOS TEMA: Caracterización y modelación de la red de comercialización de combustible automotriz utilizando técnicas de inteligencia artificial. AUTORA: ROSA MAGDALENA CHICAIZA ACOSTA TUTOR: MG. JOSÉ RAÚL BARRERAS AÑO 2013

2 i DEDICATORIA Dedico este trabajo con todo mi amor y cariño: A Dios, por la inteligencia, sabiduría y fortaleza que me ha brindado para alcanzar un logro más en mi vida. A mis hijos, por el amor y la comprensión que me han brindado por dejarlos solos para alcanzar mi meta. A mi madre por su valioso apoyo, por todas las oraciones que hizo en mi nombre para que concluyera mi carrera. A Byron por estar a mi lado en todo momento entregándome su apoyo incondicional en todas las etapas de mi carrera. Magdalena.

3 ii AGRADECIMIENTO Agradezco a las autoridades y profesores de la Universidad Tecnológica Israel por los conocimientos impartidos durante mi formación académica. Un agradecimiento especial al Mg. José Raúl Barreras quien con sus conocimientos, orientación y dedicación, aportó valiosamente para el desempeño del presente trabajo investigativo. La Autora.

4 iii UNIVERSIDAD TECNOLÓGICA ISRAEL AUTORÍA DE TESIS La abajo firmante, en calidad de estudiante de la Carrera de Sistemas Informáticos, declaro que los contenidos de este Trabajo de Titulación, requisito previo para la obtención del Grado de Ingeniera en Sistemas Informáticos, son absolutamente originales, auténticos y de exclusiva responsabilidad legal y académica de la autora. Quito, diciembre del Magdalena Chicaiza Acosta C.C

5 iv UNIVERSIDAD TECNOLÓGICA ISRAEL APROBACIÓN DEL TUTOR En mi calidad de Tutor de Trabajo de Graduación certifico: Que el Trabajo de Titulación CARACTERIZACIÓN Y MODELACIÓN DE LA RED DE COMERCIALIZACIÓN DE COMBUSTIBLE AUTOMOTRIZ UTILIZANDO TÉCNICAS DE INTELIGENCIA ARTIFICIAL., presentado por Rosa Magdalena Chicaiza Acosta, estudiante de la carrera de Sistemas Informáticos, reúne los requisitos y meritos suficientes para ser sometido a la evaluación del Tribunal de de Grado, que se designe, para su correspondiente estudio y calificación. Quito, diciembre del TUTOR.. Mg. José Raúl Barreras

6 v UNIVERSIDAD TECNOLÓGICA ISRAEL APROBACIÓN DEL TRIBUNAL Los miembros del tribunal de grado, aprueban el Trabajo de Titulación de acuerdo con las disposiciones reglamentarias emitidas por la Universidad Tecnológica Israel para títulos de pregrado. Quito, diciembre del Para constancia firman: TRIBUNAL DE GRADO.. PRESIDENTE.... MIEMBREO 1 MIEMBRO 2

7 vi Resumen En este trabajo se propone una metodología dirigida al descubrimiento del conocimiento oculto en información que aparentemente no aporta valor; el objetivo es determinar en la red de comercialización de combustible automotriz consumos anómalos que puedan derivar en posibles delitos hidrocarburíferos. La metodología incluye la utilización de técnicas de inteligencia artificial. La técnica seleccionada es la de minería de datos porque a través de esta se puede encontrar correlaciones útiles para algún proceso, esto permite que una persona con poca experiencia adquiera la comprensión sobre un tema específico de manera fácil y rápida. El presente documento contiene los siguientes capítulos: En el capítulo I se describen los fundamentos teóricos sobre los cuales se basa la investigación. En el capítulo II se detalla las técnicas de investigación aplicadas para el cumplimiento de los objetivos. En el capítulo III se especifica la metodología propuesta para categorizar y modelar la red de comercialización de combustible automotriz utilizando técnicas de inteligencia artificial.

8 vii Abstract This thesis proposes a methodology oriented to discover the hidden knowledge in information which apparently does not summit any value, the objective is to establish in the automobile fuel commercialization scheme any inappropriate consuming activities that may derive in possible fuel felonies. The methodology includes the use of artificial intelligence techniques. The chosen technique is data mining because through this you can find useful correlations for some process, which allows people with not much experience to gain understanding about specific subjects in an easy and fast way. This document contains the following chapters: Chapter I describes theoretical basis on which this research is sustained. Chapter II explains the investigation techniques that were used to fulfill its aims. Chapter III specifies the proposed methodology to categorize and model the automobile fuel commercialization scheme using artificial intelligence techniques.

9 viii Índice General INTRODUCCIÓN... I Introducción General... I Antecedentes...II Descripción del problema a resolver...ii Objeto de Estudio...II Campo de la Investigación...II Objetivos...II Objetivo General...II Objetivos específicos...iii Idea a defender en el proceso investigativo...iii CAPÍTULO I MARCO TEÓRICO Antecedentes investigativos Fundamentación Científico Técnica...1 CAPÍTULO II METODOLOGÍA Y DIAGNÓSTICO DE LA INVESTIGACIÓN Fuentes de información Metodología de la investigación Técnicas e instrumentos de recolección de datos Análisis e interpretación de resultados Problemas y especificación de requerimientos Estudio de Factibilidad (Operativa, Tecnológica y Económica)....8 CAPÍTULO III PROPUESTA Antecedentes de la propuesta Justificación Objetivos de la propuesta General Específicos Desarrollo de la Propuesta...15 CONCLUSIONES RECOMENDACIONES BIBLIOGRAFÍA DE CONSULTA...31

10 ix Índice de Tablas Tabla 1.- Análisis comparativo de Sistemas de libre distribución....3 Tabla 2.- Despacho de combustible automotriz por producto Tabla 3.- Despacho de combustible automotriz por provincia Tabla 4.- Número de habitantes por provincia Tabla 5.- Relación Despachos/Población Tabla 6.- Pareto (Relación Despachos/Población) Tabla 7.- Relación Despachos/Número de vehículos Tabla 8.- Pareto (Relación Despachos/Vehículos) Tabla 9.- Descripción de los códigos de la condición del cliente Tabla 10.- Resumen de los clústeres y centroides resultantes Tabla 11.- Comparativo entre análisis previos y los obtenidos con WEKA Tabla 12.- Comportamiento de despachos de combustible a las gasolineras analizadas en el tiempo....27

11 x Índice de figuras Figura 1.- Una visión general de los pasos que componen el proceso de KDD....6 Figura 2.- Archivo.arff...17 Figura 3.- Mapa Político del Ecuador...20

12 xi Índice de Pantallas Pantalla 2.- Modulo Explorer...18 Pantalla 3.- Primeros resultados con 9 atributos...18 Pantalla 4.- Selección de los algoritmos de clusterización y filtro...21 Pantalla 5.- Selección de atributos a ignorar...22 Pantalla 6.- Resultados numéricos de la clusterización...22 Pantalla 7.- Visualización de la relación Nombre de Estación vs Volumen Entregado luego de la clusterización...23 Pantalla 8.- Visualización de la relación ubicación vs Volumen Entregado luego de la clusterización Pantalla 9.- Visualización de la relación Condición Cliente vs Volumen Entregado luego de la clusterización Pantalla 10.- Visualización de la relación Nombre de provincia vs Volumen Entregado luego de la clusterización Pantalla 11.- Visualización de la relación Nombre de mes vs Volumen Entregado luego de la clusterización Pantalla 12.- Visualización de la relación Nombre de mes vs Volumen Entregado luego de la clusterización....25

13 I INTRODUCCIÓN Introducción General En el año 1995, se crea las siglas KDD (Knowledge Discovery in Databases), es el proceso no trivial de identificación válida, novedosa, potencialmente útil y entendible de patrones comprensibles que se encuentran ocultos en los datos.(fayyad, 1996) En las organizaciones existe un gran crecimiento del almacén de datos, en esta gran masa de datos se esconde información valiosa que con la aplicación de técnicas de descubrimiento del conocimiento se la puede obtener para darle una utilidad. La minería de datos es una técnica de inteligencia artificial que permite determinar patrones y correlaciones en los datos. Con el desarrollo de herramientas y paquetes de minería de datos, como, por ejemplo, Clementine de SPSS, Intelligent Miner de IBM, Mine Set de Silicon Graphics, Enterprise Miner de SAS, DM Suite (Darwin) de Oracle, WEKA (de libre distribución), Knowledge Seeker, etc. (Hernandez & y, 2005), se facilita el uso de técnicas de minería de datos a no especialistas. Ente las técnicas de minería de datos están las de clasificación no supervisada, los algoritmos más conocidos son K-medias y mapas auto-organizados, estos algoritmos identifican clústeres en los datos mediante funciones de distancia que encuentran similitudes entre los datos. Con la ayuda de estas técnicas se logrará el procesamiento de grandes cantidades de datos a través de procesos automatizados, se identificarán patrones principales para la predicción de tendencias o comportamientos. Para la presente investigación la utilización de la técnica de inteligencia artificial basada en data mining brindará su apoyo en la toma de decisiones, pues, con la base de datos los despachos de combustible automotriz a las gasolineras existentes en el Ecuador, sometida a un proceso de extracción de conocimiento y con la ayuda del algoritmo de aprendizaje no supervisado K-medias se conseguirá contar con información valiosa para la investigación especializada de delitos hidrocarburíferos que afectan la economía de nuestro país.

14 II Antecedentes El Gobierno Nacional, con la finalidad de controlar el uso, distribución y comercialización de precursores químicos, combatir el tráfico ilegal, el almacenamiento, transportación y comercialización sin la debida autorización de hidrocarburos y sus derivados, ha venido expidiendo Decretos Ejecutivos que facilitan la gestión de las empresas públicas para el cumplimiento de este objetivo. En tal razón, el Decreto Ejecutivo No faculta a las Fuerzas Armadas (FFAA), Policía Nacional y Agencia de Regulación y Control Hidrocarburífero (ARCH), a realizar operativos de control en carreteras y fronteras ecuatorianas limitándose su trabajo a patrullajes a distintas horas del día lo que ha permitido identificar a pequeños y medianos infractores, sin embargo no se ha contado con una solución informática que permita identificar comportamientos anómalos en el consumo de las estaciones de servicio a nivel nacional, que sirvan de guía para la detección de posible ilícitos en este segmento de mercado. Descripción del problema a resolver La inexistencia del apoyo informático para la detección de posibles delitos hidrocarburíferos, ha derivado que las entidades de control actúen en base a denuncias formuladas por fuentes humanas o en base a programas de patrullajes, realizando esfuerzos cuyos resultados son de pequeña y mediana incidencia. Objeto de Estudio Aplicación de recursos tecnológicos basados en inteligencia artificial para el análisis masivo de información. Campo de la Investigación Técnicas y herramientas de inteligencia artificial aplicada a la extracción del conocimiento de las Bases de datos. Objetivos Objetivo General Efectuar la investigación sobre metodologías y soluciones informáticas tendientes a extraer el conocimiento de las bases de datos utilizando técnicas de inteligencia artificial para identificar posibles ilícitos hidrocarburíferos.

15 III Objetivos específicos 1. Realizar la investigación bibliográfica referente a las metodologías y técnicas de inteligencia artificial que permitan el desarrollo de la investigación mediante el método de investigación histórico-lógico. 2. Diagnosticar la problemática a resolver para analizar las posibles soluciones utilizando la opinión de expertos y herramientas computacionales. 3. Realizar el análisis de la red de comercialización de combustible automotriz utilizando técnicas de inteligencia artificial para identificar posibles ilícitos hidrocarburíferos. 4. Presentar los resultados obtenidos para su posterior validación en campo por expertos en casos de delitos hidrocarburíferos. Idea a defender en el proceso investigativo Caracterizando, modelando y presentando una metodología de análisis de la red de comercialización de combustible automotriz que permita identificar gasolineras con un anómalo consumo que podría derivar en la existencia de un posible ilícito.

16 1 CAPÍTULO I 1. MARCO TEÓRICO 1.1. Antecedentes investigativos En la actualidad, la Inteligencia artificial se está aplicando a numerosas actividades realizadas por los seres humanos como por ejemplo: la robótica, la visión artificial, técnicas de aprendizaje y la gestión del conocimiento. Estas dos últimas aplicaciones de la inteligencia artificial son las que más se ajustan para el cumplimiento de los objetivos del presente trabajo de investigación, debido a que existe la necesidad de contribuir con una solución informática para incorporar el conocimiento sobre la identificación de posibles ilícitos que permitan a las autoridades competentes tomar acciones eficientes y oportunas frente al cometimiento de delitos hidrocarburíferos. Las técnicas de inteligencia artificial toman la información cualitativa y a partir de ella se diseñan e implementan modelos estadísticos y computacionales que permiten realizar la resolución de diversos problemas empresariales. Entre las técnicas más destacadas de inteligencia artificial están los sistemas expertos, las redes neuronales, los algoritmos genéticos, la lógica difusa y minería de datos, estas técnicas pueden combinarse para obtener una solución más adecuada al problema de estudio Fundamentación Científico Técnica Los sistemas expertos tienen dos componentes principales: el primero es el conocimiento y las experiencias de los expertos en un determinado dominio representado por medio de símbolos y el segundo es el mecanismo que obtienen las conclusiones de la base de conocimiento mediante procesos de búsqueda. Las redes neuronales es sólo una colección de unidades conectadas entre sí; las propiedades de la red se determina por su topología y las propiedades de las neuronas. Un modelo matemático simple para una neurona está dado por donde ai es la activación de la salida de la unidad i y wi,j es el peso en el enlace de la unidad i en la unidad (Rusell, 2010).

17 2 Ésta se convierte en una herramienta tecnológica potente para el procesamiento de la información cuyos resultados pueden permitir la toma decisiones eficientes y oportunas. Los algoritmos genéricos simulan la mecánica de la selección natural y de la genética utilizando la información histórica para encontrar nuevos puntos de búsqueda de una solución óptima, permitiendo obtener soluciones a un problema que por su complejidad no tiene ningún método de solución de forma precisa. La lógica difusa permite representar el ser miembro de un conjunto como una distribución de posibilidades(knight, 1994), esto permite el trabajo con información de difícil especificación. La minería de datos es una fase de la metodología de KDD en la que se aplican técnicas de inteligencia artificial, estadística y aprendizaje automático con la finalidad de extraer el conocimiento de una base de datos y someterla a un proceso de transformación para su comprensión y uso posterior. Para el desarrollo del presente trabajo se utiliza la técnica de Minería de Datos, para ello se evaluó las características de 2 sistemas de distribución libre, ver tabla 1.

18 3 Tabla 1.- Análisis comparativo de Sistemas de libre distribución. Plataforma Tipos de Algoritmos sobre la archivos cual trabaja soportados. Nombre del Sistema Orange Contiene técnicas de clasificación y evaluación automatizadas como por ejemplo: Clasificación Select atributes Asociación Clúster. Requiere como base Phyton para su funcionamie nto. Funciona con varias tipos de archivos: *.tab, *.txt, *.data, *.dat, *.rda, *.rdo. Cuenta con una gran librería de técnicas de aprendizaje automático Funciona con Esta tanto supervisadas como no varias tipos de desarrollado supervisadas, como por ejemplo: archivos: completame WEKA Regresión *.arff, nte en java Algoritmos a priori *.names, por lo que *.data, K-medias basta tener *.csv, *.dat, Kohonen una JVM *.bsi, *.xrff, Filtered disponible. *.libsvm Clusterer Fuente: Páginas oficiales de Orange y Weka. Elaborado por la autora. Del análisis se decide la utilización del software WEKA por ser más fácil de implementar tanto en Windows como en Linux. Descripción del software WEKA WEKA es una herramienta de aprendizaje automático y data mining desarrollado en Java por la Universidad de Waikato de Nueva Zelanda, que tiene una amplia gama de algoritmos de clasificación, regresión, clustering, asociación, adicionalmente cuenta con un modulo de visualización para una mejor interpretación de resultados. WEKA es una herramienta de libre distribución y por estar desarrollada en Java no depende de una arquitectura especial, funciona en cualquier plataforma que cuente con un JVM (Java Virtual Machine) disponible. Los instaladores de la herramienta están disponibles en la página oficial de la Universidad de Waikato (WEKA, The University of Waikato). La JVM de Sun asigna un valor de 100 megas de memoria para realizar las operaciones en Weka, valor que para el desarrollo de este estudio resulta insuficiente. Para dar solución a la insuficiente asignación de memoria asignamos 1GB de memoria para el análisis de los datos mediante el siguiente comando:

19 4 javaw -Xmx1024m -classpath "C:\Archivos de Programa\Weka-3-6\weka.jar" weka.gui.main Dentro del ambiente gráfico de WEKA se encuentra el módulo exploración de datos (WEKA Knowledge Explorer) el cual permite pre procesar, clasificar, asociar y visualizar datos de una manera fácil e intuitiva. WEKA cuenta con seis entornos de ejecución: Preprocess.- permite seleccionar la fuente de datos y su preparación. Classification.- permite aplicar esquemas de clasificación y regresión, entrenar modelos y evaluar su precisión. Cluster.- Integra varios métodos de agrupamiento. Associate.- Incluye algunas técnicas de reglas de asociación. Select Attributes.- permite aplicar técnicas para la reducción del número de atributos. Visualice.- permite estudiar el comportamiento de los datos mediante técnicas de visualización. Descripción de los archivos.arff con los que WEKA trabaja. Nativamente WEKA trabaja con un formato denominado ARFF, acrónimo de Attribute- Relation File Format, es un archivo de texto ASCII que describe una lista de instancias que comparten un conjunto de atributos. Un archivo con este formato contiene meta-información, es decir, contiene el nombre y tipo de cada atributo y una descripción textual del origen de los datos. Está conformado por tres secciones: a. Cabecera.- Se define el nombre de la relación bajo el siguiente <Nombre de la relación> b. Declaraciones de los atributos.- se declaran todos los atributos contenidos en el archivo en forma secuencial de la siguiente <Nombre del atributo> <Tipo> El tipo de dato puede ser de cuatro clases: numérico, especificación nominal, string y date. c. Sección Datos.- al iniciar esta sección se escribe la y a continuación se declara los datos separándolos entre comas los atributos y con saltos de línea las relaciones.

20 5 Descripción del método K-medias utilizado. El método de las K-medias, permite asignar a cada observación el clúster que se encuentra más próximo en términos del centroide (media), la distancia empleada es la euclídea El Clustering o agrupamiento, es un procedimiento que se aplica para encontrar grupos y estructuras en los datos con características similares. Pasos: 1. Se toman al azar k clústeres iniciales, para el caso de estudio Para el conjunto de observaciones, se vuelve a calcular las distancias a los centroides de los clústeres y se reasignan a los que estén más próximos. Se vuelven a recalcular los centroides de los k clústeres después de las reasignaciones de los elementos. 3. Se repiten los dos pasos anteriores hasta que no se produzca ninguna reasignación, es decir, hasta que los elementos se estabilicen en algún grupo. Usualmente, se especifican k centroides iniciales y se procede al paso (2) y, en la práctica, se observan la mayor parte de reasignaciones en las primeras iteraciones.(uc3m) La finalidad de formar clústeres es que los centroides estén lo más separado posible entre sí, además es importante la selección del número de clústeres puesto que se pueden presentar algunos problemas: Si dos centroides iniciales caen por casualidad en un único clúster natural, entonces los clústeres que resultan están poco diferenciados entre sí. Si aparecen outliers (valores atípicos), se obtiene por lo menos un clúster con sus objetos muy dispersos. Si se imponen previamente k clústeres puede dar lugar a grupos artificiales o bien a juntar grupos distintos.(uc3m) Para enfrentar estos problemas se consideró varias posibilidades del número de clústeres y realizando una comparación de sus resultados.

21 6 CAPÍTULO II 2. METODOLOGÍA Y DIAGNÓSTICO DE LA INVESTIGACIÓN 2.1. Fuentes de información Para el desarrollo del presente trabajo se toma como fuente de información los despachos efectuados por EPPETROECUADOR hacia las diferentes gasolineras del país, dicha información reside en la base de datos del Sistema de Comercialización de la Empresa Metodología de la investigación. Para el desarrollo del trabajo se utiliza los métodos de investigación: Inductivo-deductivo, para la elaboración de los objetivos general y específicos. Histórico-lógico, en la realización del fundamentación teórica. Analítico-sistémico, en el desarrollo de la propuesta. Y, la metodología técnica propuesta por Usama Fayyad, Knowledge Discovery in Databases (KDD): Figura 1.- Una visión general de los pasos que componen el proceso de KDD. Fuente: From Data Mining to Knowledge Discovery in Databases, Usama Fayyad

22 7 Como se puede apreciar, para aplicar el KDD se requiere la realización de una serie de actividades previas dirigidas a la preparación de los datos de entrada puesto que pueden proceder de fuentes heterogéneas, no cuentan con un formato apropiado o compatible con el sistema a utilizar. Por esta razón se toma como base los pasos propuestos por Fayyad y se añade uno previo que tiene que ver con la determinación de objetivos, puesto que, sin conocer que es lo que se quiere conseguir no será útil iniciar un proceso de KDD. Los pasos a seguir son: 1. Determinación de objetivos. 2. Preparación de Datos que involucra: Selección de las fuentes de información externas e internas. Preprocesamiento de la información que implica el análisis de la calidad de los datos y determinación de las técnicas de KDD a aplicar. 3. Transformación de los datos.- donde se obtiene una evolución de los datos en un modelo adecuado para el análisis. 4. Minería de datos.- donde se aplica las técnicas automatizadas para explotar los datos seleccionando una combinación apropiada de algoritmos. 5. Análisis de Resultados.- interpretación de los resultados obtenidos en la etapa anterior, generalmente con la ayuda de una técnica de visualización. 6. Asimilación del conocimiento.- utilizar el conocimiento obtenido en función de los objetivos planteados. Cabe indicar que la metodología propuesta es totalmente iterativa, es decir de no obtener resultados con una primera selección de datos y algoritmos a utilizar se puede regresar al paso inicial Técnicas e instrumentos de recolección de datos. La información se obtendrá del Sistema de Comercialización de EPPETROECUADOR a través de la herramienta Business Objetcs que la empresa mantiene para análisis y extracción de información Análisis e interpretación de resultados. Para el análisis e interpretación de los resultados obtenidos luego de aplicar la metodología de trabajo se toma como muestra dos o tres elementos que permitan determinar en primera instancia si se consiguió los objetivos planteados, para ello se

23 8 utiliza el internet como medio de consulta para obtener información de las gasolineras que se agruparan dentro del marco de estudio, las paginas a consultar son: la del Servicio de Rentas Internas y la Superintendencia de Compañías Problemas y especificación de requerimientos. Los problemas que se presentaron en el proceso de investigación fue el número de registros extraídos de la base de datos que al inicio superaban los 2 millones y medio de registros ya que se realizó una extracción diaria de despachos por gasolinera entre los años 2008 y Luego de analizados y procesados los datos se determinó la no necesidad de contar con un dato tan especifico como despacho diario, reduciendo a mensual la temporalidad de los despachos. Adicionalmente de detecta la necesidad de contar con atributos que describan de manera general a cada registro obtenido, como fue el caso de la creación del atributo ubicación que permitió clasificar a las gasolineras como fronterizas y no fronterizas Estudio de Factibilidad (Operativa, Tecnológica y Económica). El presente trabajo, propone una nueva metodología para realizar análisis de información, esto involucrará la participación de un analista que ponga en práctica los pasos descritos en la propuesta. Las herramientas tecnológicas a utilizar son: Business Object con licencia pagada con la que cuenta la empresa y WEKA software de libre distribución que funciona en cualquier plataforma; la persona a cargo de la ejecución deberá contar con conocimientos en el manejo de la herramienta Business Object y en la información almacenada en el sistema de comercialización. Los costos requeridos para la ejecución del proyecto se reducen al costo de renovación de licencias de Business Objects y el costo hora/trabajada de un analista que corresponde a $8.38 USD.

24 9 CAPÍTULO III 3. PROPUESTA 3.1. Antecedentes de la propuesta En la actualidad los entes de control FFAA, Policía Nacional y ARCH realizan operativos de control en base a programas de patrullaje o denuncias. De ahí nace la necesidad de la utilizar herramientas computacionales que permitan extraer información útil de datos aparentemente sin valor. La Empresa Pública PETROECUADOR (EPPETROECUADOR) mantiene una base de información referente a los despachos efectuados diariamente a las gasolineras existentes a nivel nacional, información a la que se aplicarán herramientas del campo de estudio denominado Knowledge Discovery in Databases, KDD (Extracción de Conocimiento en Base de Datos). Con la Extracción de Conocimiento en Base de Datos se pretende encontrar patrones útiles de datos que permitan identificar posibles delitos hidrocarburíferos con mayor asertividad y de mayor incidencia. Para mostrar un panorama macro del consumo inequitativo de combustible automotriz en el Ecuador se toma las siguientes variables para el análisis preliminar: Despachos de combustible automotriz a nivel nacional por producto. Despachos de combustible automotriz a nivel nacional por provincia. Número de habitantes por provincia. Número de vehículos por provincia. Tomando como base los despachos de combustible automotriz a nivel nacional por producto desde el año 2008 hasta el año 2012, se identificó que el Diesel es el combustible más utilizado a nivel nacional y su consumo se encuentra en constante crecimiento.

25 Título del eje 10 Tabla 2.- Despacho de combustible automotriz por producto. DESPACHOS DE COMBUSTIBLE AUTOMOTRIZ POR PRODUCTO DIESEL PREMIUM GAS. EXTRA SUPER S.P Fuente: Sistema de Comercialización de EPPETROECUADOR Con los despachos de combustible automotriz a nivel nacional por provincia del año 2010 se analizará la relación con el número de habitantes y vehículos por provincia. Es importante indicar que se toma el año 2010 como referencia para el análisis porque que es el año en el cual el INEC publicó las cifras oficiales del CENSO de población y vivienda. Tabla 3.- Despacho de combustible automotriz por provincia CONSUMO POR PROVINCIA AÑO 2010 DIESEL PREMIUM GAS. EXTRA SUPER S.P. Fuente: Sistema de Comercialización de EPPETROECUADOR

26 GALAPAGOS PASTAZA ZAMORA CHINCHIPE NAPO ORELLANA MORONA SANTIAGO CARCHI SUCUMBIOS BOLIVAR CAÑAR SANTA ELENA SANTO DOMINGO IMBABURA COTOPAXI LOJA CHIMBORAZO TUNGURAHUA ESMERALDAS EL ORO AZUAY LOS RIOS MANABI PICHINCHA GUAYAS 11 Con los resultados de la tabla 3 se concluye que las provincias de mayor consumo son las que más habitantes tienen, lo que aparentemente se vería como un comportamiento normal de consumo de los combustibles, sin embargo, a continuación se presenta un análisis más detallado en el cual se toma los datos poblacionales por provincia Tabla 4.- Número de habitantes por provincia. NÚMERO DE HABITANTES POR PROVINCIA CENSO 2010 Fuente: Censo de población y vivienda año 2010 INEC Con los datos poblacionales de la tabla 4 y los despachos de combustible automotriz por provincia de la tabla 3, se puede obtener una aproximación del consumo de combustible automotriz por habitante y por provincia, para lo cual se plantea la siguiente relación: Despachos por Provincia / Número de habitantes por provincia Aplicando esta relación, se determina que las tres provincias de mayor consumo por habitante son: Carchi, El Oro y Santo Domingo de los T-Sáchalas, aspecto que en parte concuerda con los controles a las provincias de frontera y de donde se obtiene el mayor número de operativos de control e incautaciones, no obstante la provincia de Santo Domingo no ha sido identificada como un problema mayor en la que se deba intensificar los controles.

27 MORONA SANTIAGO GALAPAGOS BOLIVAR MANABI SANTA ELENA ESMERALDAS GUAYAS LOS RIOS LOJA ORELLANA SUCUMBIOS CHIMBORAZO NAPO ZAMORA CHINCHIPE COTOPAXI IMBABURA PASTAZA CA.AR PICHINCHA TUNGURAHUA AZUAY STO. DGO. TSACHILAS EL ORO CARCHI 12 Tabla 5.- Relación Despachos/Población. 200,00 180,00 160,00 140,00 120,00 100,00 80,00 60,00 40,00 20,00 0,00 RELACIÓN DESPACHOS/POBLACIÓN año 2010 Fuente: Sistema de Comercialización de EPPETROECUADOR y Censo de población y vivienda año 2010 INEC De acuerdo con los resultados obtenidos y mostrados en la tabla 5 se hace necesario realizar un análisis global de la información para esto se aplica la técnica de Pareto.1 Con la ayuda de la Ley de Pareto, se clasifican a las provincias, enmarcando los pocos vitales como las provincias de menor consumo y los muchos triviales como las provincias de mayor consumo, como se muestra en la tabla 6, enfocando el análisis a las 17 provincias del Ecuador consumen el 80% del combustible distribuido para el segmento automotriz, debiéndose considerar como prioridad al problema planteado. 1 El diagrama de Pareto, nace con un estudio realizado por el Economista italiano Vilfredo Pareto, quien realizó un estudio de cómo estaba distribuida la riqueza en Italia obteniendo como resultado que el 80% de las riquezas estaban en manos de solo el 20% de la población italiana, pero el Doctor Joseph Juran observó que la ley de Pareto era aplicable a problemas de calidad creando así su regla del 80/20 donde el 80% de los problemas representan los muchos triviales y el 20% los pocos vitales. Por lo que es mejor resolver los pocos vitales (Delgado, 2008).

28 NAPO ZAMORA CHINCHIPE SANTA ELENA ESMERALDAS PASTAZA ORELLANA CARCHI EL ORO SUCUMBIOS STO. DGO. TSACHILAS CHIMBORAZO LOJA BOLIVAR IMBABURA MANABI LOS RIOS PICHINCHA COTOPAXI GALAPAGOS AZUAY TUNGURAHUA GUAYAS CA.AR MORONA SANTIAGO CARCHI EL ORO AZUAY TUNGURAHUA PICHINCHA CA.AR PASTAZA IMBABURA COTOPAXI NAPO CHIMBORAZO SUCUMBIOS ORELLANA LOJA LOS RIOS GUAYAS ESMERALDAS SANTA ELENA MANABI BOLIVAR GALAPAGOS 13 Tabla 6.- Pareto (Relación Despachos/Población). 100,00% 90,00% 80,00% 70,00% 60,00% 50,00% 40,00% 30,00% 20,00% 10,00% 0,00% PARETO (RELACIÓN POBLACIÓN / CONSUMO) año 2010 Por último, con la base de datos de los vehículos matriculados y los despachos de combustible automotriz por provincia, se puede obtener una aproximación del consumo de combustible automotriz por vehículo y por provincia, para lo cual se plantea la siguiente relación: Despachos por Provincia / Número de vehículos matriculados De la relación se obtienen los resultados de la tabla 7: Tabla 7.- Relación Despachos/Número de vehículos. RELACIÓN DESPACHOS/NÚMERO DE VEHÍCULOS año 2010 Fuente: Sistema de Comercialización de EPPETROECUADOR y Número de vehículos motorizados matriculados, por uso, según provincias año 2010 INEC

29 NAPO ZAMORA CHINCHIPE SANTA ELENA ESMERALDAS PASTAZA ORELLANA CARCHI EL ORO SUCUMBIOS STO. DGO. TSACHILAS CHIMBORAZO LOJA BOLIVAR IMBABURA MANABI LOS RIOS PICHINCHA COTOPAXI GALAPAGOS AZUAY TUNGURAHUA GUAYAS CA.AR MORONA SANTIAGO 14 Aplicando la técnica de Pareto a esta información se encuentra que de las 24 provincias del Ecuador 16 tiene un elevado consumo respecto de sus vehículos. Tabla 8.- Pareto (Relación Despachos/Vehículos). 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% PARETO (RELACIÓN CONSUMO/NÚMERO DE VEHÍCULOS) año 2010 Comparando los resultados mostrados en la tabla 8, con los obtenidos en la Relación tabla 6 se puede identificar que las provincias que se repiten en los dos análisis son: CARCHI, CHIMBORAZO, EL ORO, IMBABURA, LOJA, LOS RIOS, NAPO, ORELLANA, PASTAZA, STO. DGO. TSÁCHILAS, SUCUMBIOS y ZAMORA CHINCHIPE. De las 12 mencionadas provincias 7 son fronterizas (CARCHI, EL ORO, LOJA, ORELLANA, PASTAZA, SUCUMBIOS y ZAMORA CHINCHIPE), 1 es considerada como fronteriza por la cercanía a límite con Colombia (IMBABURA), 2 pertenecen a lo se conoce como sierra central (CHIMBORAZO, STO. DGO. TSÁCHILAS), 1 corresponde al oriente ecuatoriano (NAPO) y la última LOS RIOS que pertenece a la Costa Ecuatoriana. La información y análisis presentados muestran por qué las autoridades de control han aplicado su mayor esfuerzo en las provincias de frontera pero no se toma en cuenta a las provincias centrales porque al parecer no existen incentivos para el robo o desvío del combustible, por esta razón se justifica la necesidad de contar con la extracción de conocimiento de la Base de Datos de Despachos que mantiene EPPETROECUADOR y colaborar con las entidades de control en su labor de erradicar los delitos hidrocarburíferos de los que adolece el Ecuador desde hace muchos años.

30 Justificación Sobre la base de los antecedentes de la propuesta, se advierte viable la solución, puesto que, se determina por medio de otras herramientas como el Excel y otras fuentes de información como el número de vehículos y número de habitantes obtenido del INEC, la existencia de comportamiento anómalos en la comercialicen de combustible automotriz, hecho que deberá comprobarse al aplicar la metodología propuesta sin la necesidad de depender de las fuentes externas de información Objetivos de la propuesta General Realizar el análisis de la red de comercialización de combustible automotriz utilizando técnicas de inteligencia artificial para identificar posibles ilícitos hidrocarburíferos Específicos Determinar los objetivos del análisis para delimitar el alcance utilizando el método de investigación inductivo-deductivo. Realizar la preparación de los datos seleccionando las fuentes de información y revisando la calidad de datos con herramientas de extracción y análisis de datos. Generar la transformación de los datos que permita obtener un modelo analítico con el sistema WEKA. Aplicar los algoritmos de agrupamiento para obtener el conocimiento oculto en los datos utilizando los recursos y técnicas del sistema WEKA. Analizar e interpretar los resultados visualizando los datos y comparándolos con deducciones previamente realizadas. Aplicar el conocimiento adquirido tomando muestras aleatorias y verificando a detalle la información de consumos, tributación, administración y ubicación Desarrollo de la Propuesta De acuerdo con la metodología propuesta para el desarrollo del presente trabajo se realizaron los siguientes pasos: Paso 1: Determinación de Objetivos Objetivo General: Realizar la caracterización y modelación de la red de comercialización de combustible automotriz utilizando técnicas de inteligencia artificial para identificar posibles ilícitos hidrocarburíferos.

31 16 Objetivos específicos: Categorizar automáticamente los datos de despachos a gasolineras. Clasificar gasolineras de acuerdo a su situación geográfica y volumen de consumo. Detectar consumos anómalos que podrían derivar en posibles delitos hidrocarburíferos. Paso 2: Preparación de los datos Identificación de las fuentes de información. Por tratarse de un caso de estudio sobre la comercialización de combustible automotriz en el Ecuador se obtiene la información del Sistema de Comercialización de la Empresa Pública de Hidrocarburos del Ecuador sobre los Despachos de combustible automotriz realizados a las gasolineras a nivel nacional desde enero del 2008 hasta agosto del Los datos obtenidos para el análisis son: código de la estación de servicio, condición de la estación de servicio, nombre de la estación de servicio, ubicación geográfica de la estación de servicio (provincia y cantón), código del producto despachado, nombre del producto despachado, año/mes de despacho y volumen despachado. Análisis de la calidad de los datos y determinación de los algoritmos de minería que se pueden utilizar. Dentro del periodo de análisis de debió considerar una de las políticas gubernamentales que ejecuto EPPETROECUADOR en el año 2012 en lo referente al mejoramiento de los combustibles, lo que requirió transformar el código de producto despachado de 2 a 21 y nombre de producto despachado de DIESEL 2 A DIESEL PREMIUM, que en teoría se habla del mismo producto solo que con un mayor octanaje, índice que no es parte del caso de estudio pero si necesario para la uniformidad de los datos a analizar. En el campo nombre del estación de servicio se determinó la presencia de caracteres especiales como las comillas ( ) y vocales tildadas, mismas que fueron reemplazadas por espacios en blanco y vocales no tildadas respectivamente. En lo referente a los algoritmos de minería se consideró la utilización del algoritmo de APRENDIZAJE NO SUPERVISADO, puesto que se requiere identificar consumos anómalos que a priori se desconocen.

32 17 Paso 3: Transformación de los datos.- conversión de los datos a un modelo analítico. Para el caso de estudio se ha determinado que la utilización del software WEKA, esta herramienta trabaja con un tipo de archivo.arff el mismo que tiene la siguiente estructura: Figura 2.- Archivo.arff De acuerdo con los tipos de datos soportados por WEKA, se modificó el archivo Excel para que la información sea receptada y procesada; una vez obtenido el archivo.csv con la información proporcionada por EPPETROECUADOR, se sometió a la carga dentro del software WEKA el mismo que transformo la información a un archivo tipo.arff mediante los siguientes pasos: a) Abrir el entorno WEKA Pantalla 1.- Entorno WEKA

33 18 b) Con un clic en la pestaña Explorer, se abre el archivo.csv y lo convierte en.arff con la opción Save. Pantalla 2.- Modulo Explorer Paso 4: Minería de datos.- aplicar los algoritmos seleccionados. Una vez creado el archivo.arff, se lo abre desde WEKA para visualizar la información de cada atributo, por ejemplo para el caso del campo nombre de producto se visualiza un histograma con relación al volumen despachado, es decir, se obtiene una estadística de cada atributo. En la parte izquierda nos da información sobre el número de datos, número de atributos y el nombre de los atributos. En la parte superior derecha aparece información estadística sobre los atributos (media, desviación típica, valores máximo y mínimo, Unique se refiere al número de valores que sólo aparecen una vez en ese atributo y Distinct al número de valores distintos. Pantalla 3.- Primeros resultados con 9 atributos

34 19 De lo observado como primer resultado se pueden establecer características ya conocidas desde el inicio de la investigación. Con el atributo nombre de provincia se puede determinar a simple vista que las provincias de más alto consumo de combustibles en orden descendente son Pichincha, Guayas, Manabí, Tungurahua, Los Ríos, Chimborazo, El Oro, Cotopaxi, Azuay y Santo Domingo de los Tsáchilas. Así mismo, con el atributo Nombre de Deposito se corrobora que los terminales de EPPETROECUADOR más grandes son el Terminal Pascuales y El Beaterio, siguiéndoles el Terminal Santo Domingo y el Terminal Ambato. Con el atributo Año/Mes, se observa un comportamiento casi uniforme de consumo por año, salvo unos picos presentado en agosto, septiembre y diciembre del 2008, agosto y diciembre del 2009, marzo, abril, mayo, agosto del 2010, diciembre del 2011 y diciembre del 2012, resultados que nos podrían suponer que el ingreso a clases en la región sierra y las fiestas de fin de año en todos los casos son de más alto consumo del combustible automotriz, no así en los meses de marzo, abril y mayo del Con el atributo año se indica un ordenamiento mayor a menor en términos de despacho de la siguiente manera: 2010, 2009, 2011,2012 y 2008 siendo el año 2010 el de mayor consumo, así mismo los meses de mayor consumo en el periodo de estudio son los meses de agosto y diciembre. Con el atributo Nombre del Producto se identifica que el combustible de mayor consumo es el diesel, seguido de la gasolina extra y en porcentaje menor la gasolina súper. Continuando con el análisis, se requiere elegir los algoritmos de filtro y agrupamiento que permita identificar los consumos anómalos. Inicialmente se realizó pruebas con diversas técnicas de clusterización con los 9 atributos del archivo Despachos Diesel 6 ATRIBUTOS.arff, pero los resultados fueron muy dispersos y requirió de un análisis adicional de la información con la finalidad de contar con un modelo mejor ajustado.

35 20 En este punto se regresa al Paso 3 Transformación de los datos, con la finalidad de obtener atributos cualitativos que permitan la aplicación de las técnicas de agrupamiento, tomando en cuenta las siguientes consideraciones: Sobre la base de que el mayor consumo por tipo de combustible es el DIESEL, se redujo la muestra a los despachos exclusivamente de este producto, así mismo de las estaciones de servicio a nivel nacional se sabe que tienen un tratamiento especial las cercanas a las fronteras por lo que se creó el atributo Ubicación en el cual se asigna a cada estación la condición de fronteriza y no fronteriza, ésta distribución se la realizó con ayuda del mapa político compilado por el Instituto Geográfico Militar, en el cual se marca sobre cada provincia el límite internacional con el signo convencional:. Figura 3.- Mapa Político del Ecuador El atributo condición cliente tiene datos numéricos que tienen un significado, es por ello que se optó por incluir el dato descriptivo de la condición, es así que: Tabla 9.- Descripción de los códigos de la condición del cliente. Condición Descripción Cliente 1 ACTIVO 2 SUSPENDIDO 3 CESANTE SUSPENDIDO POR NO RECIBIR 4 DESPACHOS EN 3 MESES Fuente: Sistema de Comercialización de EPPETROECUADOR

36 21 El atributo año/mes se lo separo en año y mes con la finalidad de tomar el número de mes y transformarlo a nombre del mes, así entonces se trabajo con el campo NomMes al cual se le asigno las primeras tres letras de los nombres de cada mes, así por ejemplo en el mes de enero estará ENE. Con estas transformaciones, se trabajó con los atributos Condición del cliente, nombre de la estación de servicio, nombre la de provincia, ubicación, nombre del mes y volumen entregado aplicándoles otras técnicas de filtro y clusterización pero esta vez se utilizó la opción de FilteredClusterer de la pestaña Clúster en el módulo Explorer de WEKA. En este punto se retoma el paso 4 que tiene que ver con la aplicación del algoritmo seleccionado. Con la opción de FilteredClusterer de WEKA se realiza la aplicación de filtros inmediatamente después de haberse aplicado la clusterización, evitando la aplicación manual de filtros y obteniendo resultados de filtros y clúster en un solo paso. Los mejores resultados se los obtuvo con la siguiente configuración: Pantalla 4.- Selección de los algoritmos de clusterización y filtro Para el caso de la clusterización se aplicó el algoritmo SimpleKMeans y para el filtro la opción AllFilter como se muestra en la figura. Adicionalmente se excluyó los atributos de Nombre Estación, Nombre Provincia y NomMes para el procesamiento de la información, como se muestra a continuación.

37 22 Pantalla 5.- Selección de atributos a ignorar WEKA entrega un reporte de resultados luego del procesamiento del algoritmo. Pantalla 6.- Resultados numéricos de la clusterización WEKA permite la visualización de los resultados obtenidos mediante diagramas como se muestra a continuación:

38 23 Pantalla 7.- Visualización de la relación Nombre de Estación vs Volumen Entregado luego de la clusterización Pantalla 8.- Visualización de la relación ubicación vs Volumen Entregado luego de la clusterización.

39 24 Pantalla 9.- Visualización de la relación Condición Cliente vs Volumen Entregado luego de la clusterización. Pantalla 10.- Visualización de la relación Nombre de provincia vs Volumen Entregado luego de la clusterización.

Directorio de Empresas y Establecimientos 2012

Directorio de Empresas y Establecimientos 2012 Directorio de Empresas y Establecimientos 2012 Contenido Generalidades Antecedentes Qué es el Directorio de Empresas? Ficha metodológica Definiciones Resultados Cobertura y empresas Indicadores económicos

Más detalles

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda Inteligencia en Redes de Comunicaciones Tema 7 Minería de Datos Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda {jvillena, rcrespo, rueda}@it.uc3m.es Índice Definición y conceptos

Más detalles

MINERIA DE DATOS Y Descubrimiento del Conocimiento

MINERIA DE DATOS Y Descubrimiento del Conocimiento MINERIA DE DATOS Y Descubrimiento del Conocimiento UNA APLICACIÓN EN DATOS AGROPECUARIOS INTA EEA Corrientes Maximiliano Silva La información Herramienta estratégica para el desarrollo de: Sociedad de

Más detalles

Directorio de Empresas y Establecimientos 2013

Directorio de Empresas y Establecimientos 2013 Directorio de Empresas y Establecimientos 2013 Contenido Qué es el Directorio de Empresas y Establecimientos (DIEE)? Ficha metodológica Principales definiciones Cobertura de empresas según sección de resultados

Más detalles

SINIESTRALIDAD VIAL EN EL ECUADOR

SINIESTRALIDAD VIAL EN EL ECUADOR SINIESTRALIDAD VIAL EN EL ECUADOR Sabía Ud. qué...? en el Ecuador, en el año 2012 cada 24 horas se produjeron 65 accidentes de tránsito, que generaron 6 muertos y 50 heridos cada día...? Sensibilizados

Más detalles

Informe de Coyuntura Económica N o 3. Economía y Educación 18/02/2011

Informe de Coyuntura Económica N o 3. Economía y Educación 18/02/2011 2011 Informe de Coyuntura Económica N o 3 Economía y Educación 18/02/2011 Introducción Los planteamientos teóricos de la economía siempre han destacado la importancia de la educación y cualificación de

Más detalles

Trabajo final de Ingeniería

Trabajo final de Ingeniería UNIVERSIDAD ABIERTA INTERAMERICANA Trabajo final de Ingeniería Weka Data Mining Jofré Nicolás 12/10/2011 WEKA (Data Mining) Concepto de Data Mining La minería de datos (Data Mining) consiste en la extracción

Más detalles

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN.

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. SISTEMA EDUCATIVO inmoley.com DE FORMACIÓN CONTINUA PARA PROFESIONALES INMOBILIARIOS. CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. Business Intelligence. Data Mining. PARTE PRIMERA Qué es

Más detalles

RESULTADOS DE LA PRUEBAS CENSALES 3 RESULTADOS DE LAS PRUEBAS CENSALES

RESULTADOS DE LA PRUEBAS CENSALES 3 RESULTADOS DE LAS PRUEBAS CENSALES RESULTADOS DE LA PRUEBAS CENSALES 3 RESULTADOS DE LAS PRUEBAS CENSALES SER ECUADOR 2008 4 PRUEBAS SER ECUADOR 2008 Importante El uso de lenguaje que discrimine y reproduzca esquemas discriminatorios entre

Más detalles

Censo de Información Ambiental Económica en Gobiernos Autónomos Descentralizados Provinciales 2013

Censo de Información Ambiental Económica en Gobiernos Autónomos Descentralizados Provinciales 2013 Censo de Información Ambiental Económica en Gobiernos Autónomos Descentralizados Provinciales 2013 Contenido 1. Objetivo 2. Cronología 3. Definiciones 4. Metodología 5. Ficha Técnica 6. Resultados Objetivo

Más detalles

Cómo crecerá la población en Ecuador?

Cómo crecerá la población en Ecuador? Cómo crecerá la población en Ecuador? Contenido 1. Qué es una proyección? 2. Usos fundamentales de las proyecciones 3. Técnica demográfica 4. Tendencias: Fecundidad, mortalidad y migración 5. Omisión censal

Más detalles

SECRETARÍA NACIONAL DE GESTIÓN DE RIESGOS

SECRETARÍA NACIONAL DE GESTIÓN DE RIESGOS SECRETARÍA NACIONAL DE GESTIÓN DE RIESGOS 1. DATOS GENERALES 1.1. Nombre del proyecto: MONTAJE Y OPERATIVIZACIÓN DEL SISTEMA NACIONAL DE SALAS DE SITUACIÓN PARA VIGILANCIA, MONITOREO Y EVALUACIÓN DE EVENTOS

Más detalles

GUÍA DE RETENCIONES JUDICIALES PARA INSTITUCIONES PÚBLICAS QUE OPERAN CON LA HERRAMIENTA INFORMÁTICA E-SIGEF DEL MINISTERIO DE FINANZAS

GUÍA DE RETENCIONES JUDICIALES PARA INSTITUCIONES PÚBLICAS QUE OPERAN CON LA HERRAMIENTA INFORMÁTICA E-SIGEF DEL MINISTERIO DE FINANZAS GUÍA DE RETENCIONES JUDICIALES PARA INSTITUCIONES PÚBLICAS QUE OPERAN CON LA HERRAMIENTA INFORMÁTICA E-SIGEF DEL MINISTERIO DE FINANZAS A. PROCESO DE REGISTRO O ACTUALIZACIÓN DE DATOS DE INSTITUCIONES

Más detalles

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre:

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre: : : lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. 12 6 lemas propios de la. 12 6 lemas propios de la.

Más detalles

OBJETIVOS. Unificar el discurso de nuestros voceros y voceras principales y secundarios- con fines de afirmación efectiva del mensaje.

OBJETIVOS. Unificar el discurso de nuestros voceros y voceras principales y secundarios- con fines de afirmación efectiva del mensaje. OBJETIVOS Posicionar en todo el territorio nacional los aspectos más relevantes y positivos del primer Examen de Exoneración para la Educación Superior (EXONERA). Posicionar ante la opinión pública la

Más detalles

Encuesta de Superficie y Producción Agropecuaria Continua 2012

Encuesta de Superficie y Producción Agropecuaria Continua 2012 Encuesta de Superficie y Producción Agropecuaria Continua 2012 Dirección responsable de la información estadística y contenidos: DIRECCIÓN DE ESTADÍSTICAS ECONÓMICAS Ing. Lorena Naranjo Directora de Estadísticas

Más detalles

INSTRUCTIVO ANEXO PARA SOLICITUD DE RECURSOS MODALIDAD DE REEMBOLSO

INSTRUCTIVO ANEXO PARA SOLICITUD DE RECURSOS MODALIDAD DE REEMBOLSO INSTRUCTIVO ANEXO PARA SOLICITUD DE RECURSOS MODALIDAD DE REEMBOLSO REEMBOLSO.- Bajo esta figura, la Corporación Nacional de Finanzas Populares y Solidarias reembolsa a la operadora el capital colocado

Más detalles

UNIVERSIDAD ECOTEC FACULTAD DE TURISMO Y HOTELERÍA SYLLABUS. GEOGRAFÍA TURÍSTICA CODIGO TUR 116 CREDITOS 4 PERIODO LECTIVO Trimestre I- 2010

UNIVERSIDAD ECOTEC FACULTAD DE TURISMO Y HOTELERÍA SYLLABUS. GEOGRAFÍA TURÍSTICA CODIGO TUR 116 CREDITOS 4 PERIODO LECTIVO Trimestre I- 2010 UNIVERSIDAD ECOTEC FACULTAD DE TURISMO Y HOTELERÍA SYLLABUS MATERIA GEOGRAFÍA TURÍSTICA CODIGO TUR 116 CREDITOS 4 PERIODO LECTIVO Trimestre I- 2010 HORAS PRESENCIALES HORAS NO PRESENCIALES Clases Conferencia

Más detalles

Edición Julio 2015. inversiones.quito.com.ec

Edición Julio 2015. inversiones.quito.com.ec Edición Julio 2015 inversiones.quito.com.ec INVERTIR EN QUITO El Municipio de Quito ha declarado al turismo como la vocación productiva de la ciudad, considerando el desarrollo que ha tenido en los últimos

Más detalles

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2.

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. 1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. GENERALIDADES SOBRE LAS TÉCNICAS DE INVESTIGACIÓN SOCIAL Y DE MERCADOS

Más detalles

Visión global del KDD

Visión global del KDD Visión global del KDD Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Introducción Desarrollo tecnológico Almacenamiento masivo de información Aprovechamiento

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Vallejos, Sofia Contenido Introducción: Inteligencia de negocios (Business Intelligence). Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica.

Más detalles

1. INVERSIONES NO PRIVATIVAS 2. INVERSIONES PRIVATIVAS**

1. INVERSIONES NO PRIVATIVAS 2. INVERSIONES PRIVATIVAS** El Instituto Ecuatoriano de Seguridad Social pone en conocimiento de la población afiliada las inversiones no privativasy privativas realizadas. 1. INVERSIONES NO PRIVATIVAS 2. INVERSIONES PRIVATIVAS**

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Contenido Introducción: Inteligencia de negocios (Business Intelligence). Componentes Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica. Fases

Más detalles

Informativo Telconet Mintel

Informativo Telconet Mintel Informativo Telconet Mintel Radio Enlace Los tres gráficos que se observan son respectivamente los siguientes dispositivos: Antena: Dispositivo que sirve para irradiar las señales generadas por el equipo

Más detalles

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003 MINERÍA DE DATOS Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE Octubre - 2003 CONTENIDO Qué es Data Warehousing Data Warehouse Objetivos del Data Warehouse

Más detalles

CONSTRUCCION DE INDICADORES SOCIALES A PARTIR DE LOS DATOS DE UN CENSO DE POBLACION Y VIVIENDA

CONSTRUCCION DE INDICADORES SOCIALES A PARTIR DE LOS DATOS DE UN CENSO DE POBLACION Y VIVIENDA CONSTRUCCION DE INDICADORES SOCIALES A PARTIR DE LOS DATOS DE UN CENSO DE POBLACION Y VIVIENDA Por Verónica Ibarra G. Mat. John Ramírez F. Lo que se quiere lograr a lo largo de la investigación es construir

Más detalles

EVOLUCIÓN DEL VOLUMEN DE CRÉDITO Y TASAS DE INTERÉS. Diciembre de 2013

EVOLUCIÓN DEL VOLUMEN DE CRÉDITO Y TASAS DE INTERÉS. Diciembre de 2013 EVOLUCIÓN DEL VOLUMEN DE CRÉDITO Y TASAS DE INTERÉS Diciembre de 2013 Análisis del Sistema Financiero Público y Privado del Ecuador Diciembre 2013 SOL Cultura La Tolita, de 400 ac. a 600 dc. En su representación

Más detalles

de población y vivienda en el Ecuador FASCÍCULO NACIONAL Características generales de la población

de población y vivienda en el Ecuador FASCÍCULO NACIONAL Características generales de la población Resultados del Censo2010 de población y vivienda en el Ecuador FASCÍCULO NACIONAL Estructura Cuántos somos y cuánto crecimos? Qué edades tenemos los ecuatorianos? 4 de la educación Cuál es el analfabetismo

Más detalles

Productividad en Empresas de Construcción: Conocimiento adquirido de las bases de datos

Productividad en Empresas de Construcción: Conocimiento adquirido de las bases de datos Productividad en Empresas de Construcción: Conocimiento adquirido de las bases de datos Productivity in Construction Companies: Knowledge acquired from the databases Hernando Camargo Mila, Rogelio Flórez

Más detalles

Anexo 2. GUÍA DE REQUISITOS

Anexo 2. GUÍA DE REQUISITOS Anexo 2. GUÍA DE REQUISITOS Para la obtención del permiso de transporte para alimentos procesados y materias primas para la elaboración de alimentos. Versión [2.0] Dici embre, 2014 CONTENIDO 1. OBJETIVO

Más detalles

Pontificia Universidad Católica del Ecuador

Pontificia Universidad Católica del Ecuador DATOS INFORMATIVOS: MATERIA O MÓDULO: APLICACIONES DIFUSAS CÓDIGO: IS -10344 CARRERA: NIVEL: INGENIERIA DE SISTEMAS OCTAVO No. CRÉDITOS: 4 CRÉDITOS TEORÍA: 2 CRÉDITOS PRÁCTICA: 2 SEMESTRE / AÑO ACADÉMICO:

Más detalles

INFORME SITUACIÓN DE INUNDACIONES EN ECUADOR

INFORME SITUACIÓN DE INUNDACIONES EN ECUADOR INFORME SITUACIÓN DE INUNDACIONES EN ECUADOR Fecha: 8 de marzo de 2012. Fuente: Punto Focal Desastres de DPS El Oro Fuente: Informe marzo CIFEN Las fuertes lluvias registradas en las provincias de Manabí,

Más detalles

GUÍA DE RETENCIONES JUDICIALES PARA EMPRESAS PRIVADAS

GUÍA DE RETENCIONES JUDICIALES PARA EMPRESAS PRIVADAS GUÍA DE RETENCIONES JUDICIALES PARA EMPRESAS PRIVADAS A. PROCESO DE ACTUALIZACIÓN DE DATOS DE EMPRESAS PRIVADAS QUE CONTABAN CON USUARIO Y CLAVE DEL SISTEMA ANTERIOR. i) PROCEDIMIENTO Si su institución

Más detalles

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Introducción a selección de atributos usando WEKA Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Contenido 1 Introducción a WEKA El origen Interfaces

Más detalles

Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico

Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico Verónica Escobar González, Claudio Barrientos Ochoa, Sergio Barrientos Ochoa, Dirección de Modelamiento Geometalúrgico

Más detalles

Weka como herramienta de data mining

Weka como herramienta de data mining Weka como herramienta de data mining Lic. Aldave Rojas Isaac Alberto Instituto Tecnológico Superior de Ciudad Serdán Abstract El presente trabajo muestra un ejemplo introductorio a la herramienta de Data

Más detalles

DOSSIER DEL EVENTO PRIMER ENCUENTRO EMPRESARIAL DE TURISMO INTERNO ECUADOR 2012 MUNDOS ANDES Y AMAZONÍA EN LA COSTA.

DOSSIER DEL EVENTO PRIMER ENCUENTRO EMPRESARIAL DE TURISMO INTERNO ECUADOR 2012 MUNDOS ANDES Y AMAZONÍA EN LA COSTA. 202 Mundos Andes y Amazonía en la Costa Ferias y Eventos Nacionales 202 de Primer Encuentro Empresarial de Turismo Interno Ecuador 202 DOSSIER DEL EVENTO PRIMER ENCUENTRO DE TURISMO INTERNO ECUADOR 202

Más detalles

ESCUELA POLITÉCNICA NACIONAL

ESCUELA POLITÉCNICA NACIONAL ESCUELA POLITÉCNICA NACIONAL FACULTAD DE INGENIERÍA DE SISTEMAS ELABORACIÓN DE UNA ESTRATEGIA PARA LA IMPLEMENTACIÓN DE ITIL V3.0, EN LAS PYMES ECUADOR PROYECTO PREVIO A LA OBTENCIÓN DEL TÍTULO DE INGENIERO

Más detalles

UNIVERSIDAD DE COSTA RICA SISTEMA DE ESTUDIOS DE POSGRADO POSGRADO EN COMPUTACION E INFORMATICA JUSTIFICACIÓN OBJETIVO GENERAL OBJETIVOS ESPECÍFICOS

UNIVERSIDAD DE COSTA RICA SISTEMA DE ESTUDIOS DE POSGRADO POSGRADO EN COMPUTACION E INFORMATICA JUSTIFICACIÓN OBJETIVO GENERAL OBJETIVOS ESPECÍFICOS UNIVERSIDAD DE COSTA RICA SISTEMA DE ESTUDIOS DE POSGRADO POSGRADO EN COMPUTACION E INFORMATICA PF-3808 Minería de Datos II Semestre del 2009 Profesor: Dr. Francisco J. Mata (correo: fmatach@racsa.co.cr;

Más detalles

OPTATIVA I: MINERIA DE DATOS

OPTATIVA I: MINERIA DE DATOS UNIVERSIDAD AUTÓNOMA DE CHIHUAHUA Clave: 08MSU007H Clave: 08USU4053W FACULTAD DE INGENIERÍA PROGRAMA DEL CURSO: OPTATIVA I: MINERIA DE DATOS DES: Programa(s) Educativo(s): Tipo de materia: Clave de la

Más detalles

Aspectos Metodológicos

Aspectos Metodológicos Aspectos Metodológicos Encuesta Nacional sobre Relaciones Familiares y Violencia de Género contra las Mujeres. 1. Objetivo General Generar datos y producir información estadística sobre la y magnitud de

Más detalles

Proyecto técnico MINERÍA DE DATOS. Febrero 2014. www.osona-respon.net info@osona-respon.net

Proyecto técnico MINERÍA DE DATOS. Febrero 2014. www.osona-respon.net info@osona-respon.net Proyecto técnico MINERÍA DE DATOS Febrero 2014 www.osona-respon.net info@osona-respon.net 0. Índice 0. ÍNDICE 1. INTRODUCCIÓN... 2 2. LOS DATOS OCULTOS... 3 2.1. Origen de la información... 3 2.2. Data

Más detalles

Artículos de Minería de Datos de Dataprix Introducción a la minería de datos

Artículos de Minería de Datos de Dataprix Introducción a la minería de datos Published on Dataprix (http://www.dataprix.com) Principal > Artículos de Minería de Datos de Dataprix By Dataprix Created 26/12/2009-17:13 Artículos de Minería de Datos de Dataprix Introducción a la minería

Más detalles

CURSO MINERÍA DE DATOS AVANZADO

CURSO MINERÍA DE DATOS AVANZADO CURSO MINERÍA DE DATOS AVANZADO La minería de datos (en inglés, Data Mining) se define como la extracción de información implícita, previamente desconocida y potencialmente útil, a partir de datos. En

Más detalles

EPB 603 Sistemas del Conocimiento!"#$ %& $ %'

EPB 603 Sistemas del Conocimiento!#$ %& $ %' Metodología para el Desarrollo de Proyectos en Minería de Datos CRISP-DM EPB 603 Sistemas del Conocimiento!"#$ %& $ %' Modelos de proceso para proyectos de Data Mining (DM) Son diversos los modelos de

Más detalles

Nro. Taller. Nro. Aula. Sede. Fecha. No. Instit. Nombre de Institución No. EOD Nombre de EOD. Nro. Participantes x EOD. Nro. Total Participantes

Nro. Taller. Nro. Aula. Sede. Fecha. No. Instit. Nombre de Institución No. EOD Nombre de EOD. Nro. Participantes x EOD. Nro. Total Participantes x 360 MINISTERIO DE AGRICULTURA GANADERIA ACUACULTURA Y PESCA. 0001 DIRECCION PROVINCIAL AGROPECUARIA DEL AZUAY 0002 DIRECCION PROVINCIAL AGROPECUARIA DE BOLIVAR 0003 DIRECCION PROVINCIAL AGROPECUARIA

Más detalles

Introducción a la Minería de Datos (Data Mining)

Introducción a la Minería de Datos (Data Mining) a la Minería de Datos (Data Mining) IT-Nova Facultad de Ingeniería Informática y Telecomunicaciones Iván Amón Uribe, MSc Minería de Datos Diapositivas basadas parcialmente en material de Inteligencia Analítica

Más detalles

Avances del Censo Nacional Económico y Mecanismos de Difusión. nio 2011 Jun

Avances del Censo Nacional Económico y Mecanismos de Difusión. nio 2011 Jun Avances del Censo Nacional Económico y Mecanismos de Difusión nio 2011 Jun Agenda 1. Ficha técnica 2. Conclusiones importantes 3. Datos interesantes 4. Mecanismos de difusión y lanzamientos Ficha técnica

Más detalles

MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY)

MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY) MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY) Autor: Lic. Manuel Ernesto Acosta Aguilera Entidad: Facultad de Economía, Universidad de La Habana Dirección: Edificio

Más detalles

Introducción a la Minería de Datos

Introducción a la Minería de Datos Introducción a la Minería de Datos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Índice 1 Minería de

Más detalles

LINEAMIENTOS PARA LA FORMACIÓN DE AUXILIARES DE ENFERMERÍA DEL NIVEL NO PROFESIONAL

LINEAMIENTOS PARA LA FORMACIÓN DE AUXILIARES DE ENFERMERÍA DEL NIVEL NO PROFESIONAL LINEAMIENTOS PARA LA FORMACIÓN DE AUXILIARES DE ENFERMERÍA DEL NIVEL NO PROFESIONAL APROBADOS EN ASAMBLEA ORDINARIA DEL 27 DE JULIO DE 2007 INTRODUCCIÓN La directiva de ASEDEFE, en atención a la Política

Más detalles

1 * LOS HOSPITALES DE NIVEL III, LLEVARÁN A CABO TODO EL PROCESO DE CONCURSOS PÚBLICOS DE MERECIMIENTOS Y OPOSICIÓN.

1 * LOS HOSPITALES DE NIVEL III, LLEVARÁN A CABO TODO EL PROCESO DE CONCURSOS PÚBLICOS DE MERECIMIENTOS Y OPOSICIÓN. 45727 531 CT2 1 CENTRO ATENCION AMBULATORIO CENTRAL AUXILIAR DE FARMACIA 45729 531 CT2 1 CUENCA OPERADOR DE EQUIPO MEDICO 45730 531 CT2 4 * 45779 531 CT2 37 AZUAY BOLIVAR CAÑAR CARCHI CHIMBORAZO COTOPAXI

Más detalles

Darwin Japón PRESIDENTE FEPTCE

Darwin Japón PRESIDENTE FEPTCE Darwin Japón PRESIDENTE FEPTCE www.feptce.org info@feptce.org La Paz-Bolivia, 7 de octubre de 2014 HISTORIA TC ECUADOR Finales de los 80 Comunidades pioneras: Capirona, Agua Blanca Patrimonio Cultural

Más detalles

Trabajo Practico N 12

Trabajo Practico N 12 Trabajo Practico N 12 Minería de Datos CATEDRA: Actualidad Informática Ingeniería del Software III Titular: Mgter. Horacio Kuna JTP: Lic. Sergio Caballero Auxiliar: Yachesen Facundo CARRERAS: Analista

Más detalles

Estrategia Comunicacional Rendición de Cuentas 2014

Estrategia Comunicacional Rendición de Cuentas 2014 Estrategia Comunicacional Rendición de Cuentas 2014 ESTRATEGIA COMUNICACIONAL Se plantea que se realice un evento de rendición de cuentas por Dirección Provincial y Coordinaciones Zonales. En las provincias

Más detalles

Formulario para la Presentación de Proyectos de Investigación Bilaterales 2014

Formulario para la Presentación de Proyectos de Investigación Bilaterales 2014 Formulario para la Presentación de Proyectos de Investigación Bilaterales 2014 Instrucciones: El siguiente formulario deberá ser llenado empleando letra tipo Times de 10 puntos, a espacio sencillo, en

Más detalles

SEMINARIO INTERNACIONAL SECTOR FINANCIERO Y DE SEGUROS. EL CONTROL Y SUPERVISIÓN DE LAS COACs

SEMINARIO INTERNACIONAL SECTOR FINANCIERO Y DE SEGUROS. EL CONTROL Y SUPERVISIÓN DE LAS COACs 1 SEMINARIO INTERNACIONAL SECTOR FINANCIERO Y DE SEGUROS EL CONTROL Y SUPERVISIÓN DE LAS COACs Luis Rosero M. Intendente Zonal 5 Superintendencia de Economía Popular y Solidaria SEPS JULIO 2014 2 Contenido

Más detalles

DIRECCIÓN DEL SEGURO GENERAL INDIVIDUAL Y FAMILIAR SUBDIRECCIÓN DE REGULACIÓN 2.2.1.1 SUBDIRECCIÓN DE REGULACIÓN DEL SEGURO DE SALUD

DIRECCIÓN DEL SEGURO GENERAL INDIVIDUAL Y FAMILIAR SUBDIRECCIÓN DE REGULACIÓN 2.2.1.1 SUBDIRECCIÓN DE REGULACIÓN DEL SEGURO DE SALUD 2.2.1.1 DEL SEGURO DE SALUD La Subdirección de Regulación del Seguro de Salud dependerá de la Dirección del Seguro General de Salud Individual y Familiar, estará a cargo del Subdirector de Regulación del

Más detalles

Guía docente de la asignatura

Guía docente de la asignatura Guía docente de la asignatura Asignatura Materia Minería de Datos Complementos de Computación Módulo Titulación Grado en Ingeniería Informática Plan 463 45220 Periodo de impartición 1 er Cuatrimestre Tipo/Carácter

Más detalles

Diseño e Implementación de un Sistema para la Segmentación de Clientes de una Operadora Celular

Diseño e Implementación de un Sistema para la Segmentación de Clientes de una Operadora Celular Diseño e Implementación de un Sistema para la Segmentación de Clientes de una Operadora Celular AUTORES: Fabián Cabrera Cuenca 1, Sergio Jonathan León García 2, Ilse Lorena Ycaza Díaz 3, Juan Aurelio Alvarado

Más detalles

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones

Más detalles

REGLAMENTO DE RONDA CONCURSABLE PROYECTO COACHING PARA LA EXPORTACIÓN.

REGLAMENTO DE RONDA CONCURSABLE PROYECTO COACHING PARA LA EXPORTACIÓN. REGLAMENTO DE RONDA CONCURSABLE PROYECTO COACHING PARA LA EXPORTACIÓN. Artículo 1.- Objetivo del cofinanciamiento En cumplimiento de las competencias de PRO ECUADOR de promover la inserción estratégica

Más detalles

LA MINERÍA DE DATOS EN LA EXTRACCIÓN DE CONOCIMIENTOS APLICADOS A PROBLEMAS RELACIONADOS CON LA EDUCACIÓN

LA MINERÍA DE DATOS EN LA EXTRACCIÓN DE CONOCIMIENTOS APLICADOS A PROBLEMAS RELACIONADOS CON LA EDUCACIÓN LA MINERÍA DE DATOS EN LA EXTRACCIÓN DE CONOCIMIENTOS APLICADOS A PROBLEMAS RELACIONADOS CON LA EDUCACIÓN Blanca Maricela Ibarra Murrieta, Ricardo Blanco Vega y María Angélica García Fierro Departamento

Más detalles

Aplicación de mapas autoorganizados (SOM) a la visualización de datos. Modelos Computacionales Fernando José Serrano García

Aplicación de mapas autoorganizados (SOM) a la visualización de datos. Modelos Computacionales Fernando José Serrano García Aplicación de mapas autoorganizados (SOM) a la visualización de datos Modelos Computacionales Fernando José Serrano García 2 Contenido Introducción... 3 Estructura... 3 Entrenamiento... 3 Aplicación de

Más detalles

MATERIAL DE APOYO CASO PRÁCTICO SISTEMA INTEGRAL PARA LA PROYECCION Y DETECCION DE LA PREVENCION DEL DELITO, MEDIANTE MINERIA DE DATOS.

MATERIAL DE APOYO CASO PRÁCTICO SISTEMA INTEGRAL PARA LA PROYECCION Y DETECCION DE LA PREVENCION DEL DELITO, MEDIANTE MINERIA DE DATOS. MATERIAL DE APOYO CASO PRÁCTICO SISTEMA INTEGRAL PARA LA PROYECCION Y DETECCION DE LA PREVENCION DEL DELITO, MEDIANTE MINERIA DE DATOS. PRESENTA MTIE. Erik Guerrero Bravo. Tula de Allende Hidalgo Septiembre

Más detalles

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Francisco J. Martín Mateos Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Qué es la (KE)? Definición de Wikipedia: La es una disciplina cuyo objetivo es integrar conocimiento

Más detalles

v.1.0 Clase 5 Docente: Gustavo Valencia Zapata

v.1.0 Clase 5 Docente: Gustavo Valencia Zapata v.1.0 Clase 5 Docente: Gustavo Valencia Zapata Temas Clase 5: Conceptos de Minería de Datos Herramientas de DM Referencias Minería de datos Proceso de DM www.gustavovalencia.com Minería de datos La minería

Más detalles

CARTOGRAFIADO DE TEXTOS Métodos Iconográficos de Observación, Exploración y Comunicación Aplicados a la Minería de Textos

CARTOGRAFIADO DE TEXTOS Métodos Iconográficos de Observación, Exploración y Comunicación Aplicados a la Minería de Textos CARTOGRAFIADO DE TEXTOS Métodos Iconográficos de Observación, Exploración y Comunicación Aplicados a la Minería de Textos Anteproyecto de Tesis de Magíster en Ingeniería del Software Tesista: Lic. Matilde

Más detalles

ACCIDENTES DE TRÁNSITO EN LA COMUNIDAD ANDINA

ACCIDENTES DE TRÁNSITO EN LA COMUNIDAD ANDINA 19/11/2013 ACCIDENTES DE TRÁNSITO EN LA COMUNIDAD ANDINA ÍNDICE Pág. INTRODUCCIÓN... i ACCIDENTES DE TRÁNSITO EN LA COMUNIDAD ANDINA... 1 Capítulo I. Estadísticas de accidentes de tránsito en la Comunidad

Más detalles

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN)

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) CLASIFICACIÓN NO SUPERVISADA CLUSTERING Y MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) info@clustering.50webs.com Indice INTRODUCCIÓN 3 RESUMEN DEL CONTENIDO 3 APRENDIZAJE

Más detalles

INSTITUTO MATEMÁTICO Y ACTUARIAL MEXICANO DIPLOMADO EN MINERÍA DE DATOS

INSTITUTO MATEMÁTICO Y ACTUARIAL MEXICANO DIPLOMADO EN MINERÍA DE DATOS INSTITUTO MATEMÁTICO Y ACTUARIAL MEXICANO DIPLOMADO EN MINERÍA DE DATOS Por qué es importante la Minería de Datos? 2 La Minería de Datos es un proceso que permite obtener conocimiento a partir de los datos

Más detalles

ANALISIS ESTADÍSTICO DESCRIPTIVO

ANALISIS ESTADÍSTICO DESCRIPTIVO ESCUELA SUPERIOR POLITÉCNICA DE CHIMBORAZO VICERRECTORADO DE INVESTIGACION Y DESARROLLO DEPARTAMENTO DE BIENESTAR POLITECNICO UNIDAD DE PROMOCION SOCIAL ANALISIS ESTADÍSTICO DESCRIPTIVO ANÁLISIS SOCIO-ECONÓMICO

Más detalles

Id % 05 oct '14 D. 4 100% Memorando para informes Direcciones 2 días mié 07/01/15 jue 08/01/15

Id % 05 oct '14 D. 4 100% Memorando para informes Direcciones 2 días mié 07/01/15 jue 08/01/15 Id % Nombre de tarea Duración Comienzo Fin Predecesoras Responsable completado 1 23% Rendición de Cuentas 2014 126 días mié 05/11/14 mié 29/04/15 2 100% Revisión de Cronograma con las Autoridades 1 día

Más detalles

POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA

POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA M.ª del Pilar Cantero Blanco Jefa de Servicio de Sistemas Informáticos. Subdirección General de Planificación

Más detalles

FORMULARIO PARA PRESENTACIÓN DE PROYECTOS DE I+D

FORMULARIO PARA PRESENTACIÓN DE PROYECTOS DE I+D Formulario para la Presentación de Proyectos de Investigación Científica y Desarrollo Tecnológico Instrucciones: El siguiente formulario deberá ser llenado empleando letra tipo Times de 10 puntos, a espacio

Más detalles

Boletín epidemiológico No. 11 de la situación de Dengue en el Ecuador 2013

Boletín epidemiológico No. 11 de la situación de Dengue en el Ecuador 2013 Boletín epidemiológico No. 11 de la situación de Dengue en el Ecuador 2013 Quito, 19 de Marzo de 2013-10h43 Tiempo de lectura 6'14'' No. de palabras:8162 183 visitas Imprimir Enviar Introducción En el

Más detalles

TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA

TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA MSC ZOILA RUIZ VERA Empresa Cubana de Aeropuertos y Servicios Aeronáuticos Abril 2010 ANTECEDENTES El proyecto Seguridad es una

Más detalles

INDICE OCUPACIONAL DE PUESTOS

INDICE OCUPACIONAL DE PUESTOS PLANTA CENTRAL PROCESOS GOBERNANTES GERENCIA GENERAL 00.01.00.00.01 Gerente General NIVEL JERÁRQUICO SUPERIOR 8 6122 Libre Remoción Gerencial 00.01.00.00.02 Asesor 1 NIVEL JERÁRQUICO SUPERIOR 5 4174 Libre

Más detalles

Capítulo 1. Introducción. 1.1. Antecedentes

Capítulo 1. Introducción. 1.1. Antecedentes Capítulo 1. Introducción En este capítulo se presenta una descripción general del problema a investigar y el enfoque con el que se aborda. Se establece la necesidad de incorporar técnicas de análisis novedosas

Más detalles

UNIVERSIDAD TECNOLÓGICA DE QUERÉTARO. Nombre del Proyecto: Empresa: Memoria que como parte de los requisitos para obtener el título de:

UNIVERSIDAD TECNOLÓGICA DE QUERÉTARO. Nombre del Proyecto: Empresa: Memoria que como parte de los requisitos para obtener el título de: UNIVERSIDAD TECNOLÓGICA DE QUERÉTARO Nombre del Proyecto: Modulo semiautomático para alta de empresas en red social Empresa: HIGH TECHNOLOGY & SUPPORT S.A. DE C.V. Memoria que como parte de los requisitos

Más detalles

UNIVERSIDAD TÉCNICA DE AMBATO CENTRO DE VINCULACIÓN CON LA COLECTIVIDAD CEVIC

UNIVERSIDAD TÉCNICA DE AMBATO CENTRO DE VINCULACIÓN CON LA COLECTIVIDAD CEVIC UNIVERSIDAD TÉCNICA DE AMBATO CENTRO DE VINCULACIÓN CON LA COLECTIVIDAD CEVIC FACULTAD DE: INGENIERÍA EN SISTEMAS, ELECTRÓNICA E INDUSTRIAL PROGRAMA: Unidad de Vinculación con la Colectividad de la Facultad

Más detalles

SISTEMA NACIONAL DE PRODUCCION ORGANICA. Tumbaco, 12 de mayo de 2014

SISTEMA NACIONAL DE PRODUCCION ORGANICA. Tumbaco, 12 de mayo de 2014 SISTEMA NACIONAL DE PRODUCCION ORGANICA Tumbaco, 12 de mayo de 2014 PRODUCCIÓN ORGÁNICA EN EL ECUADOR AGROCALIDAD Control de la certificación de productos orgánicos MINISTERIO DE AGRICULTURA, GANADERÍA,

Más detalles

ETL: Extractor de datos georreferenciados

ETL: Extractor de datos georreferenciados ETL: Extractor de datos georreferenciados Dr. Juan Pablo Díaz Ezcurdia Doctor Honoris Causa Suma Cum Laude Master en Telecomunicaciones Master en Gestión Educativa Coordinador de la comisión de CSIRT de

Más detalles

Folleto Informativo. Proceso de desconcentración del Ejecutivo en los niveles administrativos de planificación

Folleto Informativo. Proceso de desconcentración del Ejecutivo en los niveles administrativos de planificación Folleto Informativo Proceso de desconcentración del Ejecutivo en los niveles administrativos de planificación 1 SENPLADES Proceso de desconcentración del Ejecutivo en los niveles administrativos de planificación

Más detalles

Creación y Funcionamiento del Sistema Nacional Descentralizado de Gestión de Riesgos María del Pilar Cornejo R. de Grunauer

Creación y Funcionamiento del Sistema Nacional Descentralizado de Gestión de Riesgos María del Pilar Cornejo R. de Grunauer Creación y Funcionamiento del Sistema Nacional Descentralizado de Gestión de Riesgos María del Pilar Cornejo R. de Grunauer Quito, 18 y 19 de febrero de 2015 1 Reseña histórica ConsCtución, 2008 Crea el

Más detalles

Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler

Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler Álvaro J. Méndez Services Engagement Manager IBM SPSS / Profesor Econometría UAM Jecas, 22 Oct 2010 Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler Business Analytics software Agenda Minería

Más detalles

Data Mining Técnicas y herramientas

Data Mining Técnicas y herramientas Data Mining Técnicas y herramientas Introducción POR QUÉ? Empresas necesitan aprender de sus datos para crear una relación one-toone con sus clientes. Recogen datos de todos lo procesos. Datos recogidos

Más detalles

w w w. l o c a t i o n - w o r l d. c o m

w w w. l o c a t i o n - w o r l d. c o m 1 En la actualidad el 80% de la información de una empresa está relacionada a un lugar. La variable de ubicación está presente en todas las áreas críticas de un negocio. Sin embargo, las organizaciones

Más detalles

PLAN DE TRABAJO DOCENTE 2013

PLAN DE TRABAJO DOCENTE 2013 PLAN DE TRABAJO DOCENTE 2013 1. DATOS DE LA ASIGNATURA Nombre: Procesamiento Analítico de Datos Código: Nivel: Grado Carácter: Optativo Área curricular a la que pertenece: Administración Carrera: Contador

Más detalles

HADES: Hidrocarburos Análisis de Datos de Estaciones de Servicio

HADES: Hidrocarburos Análisis de Datos de Estaciones de Servicio Hidrocarburos: Análisis de Pablo Burgos Casado (Jefe de Área Desarrollo (SGTIC - MITYC)) María Teresa Simino Rueda Rubén Pérez Gómez Israel Santos Montero María Ángeles Rodelgo Sanchez 1. INTRODUCCIÓN

Más detalles

SISTEMA DE INFORMACION GERENCIAL. Lic.Patricia Palacios Zuleta

SISTEMA DE INFORMACION GERENCIAL. Lic.Patricia Palacios Zuleta SISTEMA DE INFORMACION GERENCIAL Lic.Patricia Palacios Zuleta Pentaho Open BI Suite La suite Pentaho cubre principalmente las siguientes áreas: integración de datos, reportes, análisis, alertas y dashboards,

Más detalles

Esta solución de fácil uso está orientada a cualquier industria, ya sea una empresa del sector privado o del sector público.

Esta solución de fácil uso está orientada a cualquier industria, ya sea una empresa del sector privado o del sector público. 1 En la actualidad el 80% de la información de una empresa está relacionada a un lugar. La variable de ubicación está presente en todas las áreas críticas de un negocio. Sin embargo, las organizaciones

Más detalles

Inteligencia Artificial y Seguridad Informática. en plataformas Open Source

Inteligencia Artificial y Seguridad Informática. en plataformas Open Source Inteligencia Artificial y Seguridad Informática en plataformas Open Source Jornadas de Software Libre y Seguridad Informática Santa Rosa La Pampa 4 y 5 de Diciembre de 2009 AGENDA Primera Parte Definiciones

Más detalles

Evaluación de modelos para la predicción de la Bolsa

Evaluación de modelos para la predicción de la Bolsa Evaluación de modelos para la predicción de la Bolsa Humberto Hernandez Ansorena Departamento de Ingeniería Telemática Universidad Carlos III de Madrid Madrid, España 10003975@alumnos.uc3m.es Rico Hario

Más detalles

Antiguo número de abonado. interurban os

Antiguo número de abonado. interurban os (indicativo de país +593) Comunicación de 16.VII.2001: El Consejo Nacional de Telecomunicaciones del (CONATEL), Quito, anuncia que a partir del 2 de septiembre de 2001 a las 0000 horas, hora local, (0500

Más detalles

INFORME FINAL 15 de junio 16 de diciembre 2015

INFORME FINAL 15 de junio 16 de diciembre 2015 INFORME FINAL 15 de junio 16 de diciembre 2015 CON QUIÉN DIALOGAMOS Moradores de barrios y comunidades, Organizaciones Sociales, Estudiantes, Transportistas, Comités de Salud, Trabajadores, Obreros, Pueblos

Más detalles

La experiencia turística en el Ecuador CIFRAS ESENCIALES DE TURISMO INTERNO Y RECEPTORR

La experiencia turística en el Ecuador CIFRAS ESENCIALES DE TURISMO INTERNO Y RECEPTORR 1 La experiencia turística en el Ecuador CIFRAS ESENCIALES DE TURISMO INTERNO Y RECEPTORR 2 3 Índice Presentación... 5 Capítulo 1: Información general... 6 Capítulo 2: Servicios turísticos... 14 Capítulo

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 2 - Juan Alfonso Lara Torralbo 1 Índice de contenidos (I) Introducción a Data Mining Actividad. Tipos

Más detalles

Minería de Datos. Abstract. Existencia de herramientas automáticas que no hacen necesario el ser un experto en estadística Potencia de computo

Minería de Datos. Abstract. Existencia de herramientas automáticas que no hacen necesario el ser un experto en estadística Potencia de computo Minería de Datos Óscar Palomo Miñambres Universidad Carlos III de Madrid Avda. De la Universidad, 30 28911, Leganés (Madrid-España) 100049074@alumnos.uc3m.es Abstract En este artículo analizaremos las

Más detalles