PLAN PLURIANUAL DE ACTIVIDADES ( )

Tamaño: px
Comenzar la demostración a partir de la página:

Download "PLAN PLURIANUAL DE ACTIVIDADES (2013-2015)"

Transcripción

1 PLAN PLURIANUAL DE ACTIVIDADES ( ) Para el Centro de Estudios en Tecnologías de la Información y la Comunicación

2

3 Objetivo Una vez logrado la creación del Centro de Estudios Avanzados en TIC (CEATIC) cuya Acta de Fundación, fue aprobada el 18 de junio de 2012 por el Consejo de Gobierno y, posteriormente, el 27 de junio de 2012, por el Consejo Social de esta universidad. Uno de los objetivos de mayor importancia tal y como se indicaba en la memoria de actividad del Centro en Noviembre de 2012 es la definición y planificación de las actividades de Investigación del CEATIC en los próximos años. Estas actividades son claves para que así el Centro pueda encauzar iniciativas de sus investigadores apoyando la investigación de excelencia y la transferencia de conocimiento en el ámbito de las Tecnologías de la Información y Comunicación (TIC), impulsándolas y promoviéndolas para establecer las bases de colaboración científica e investigadora que definan modelos multidisciplinares de investigación y transferencia; tal y como se indica en el artículo 1 de su carta fundacional. Para apoyar la consecución de los fines investigadores y de transferencia anteriormente citados, la Universidad de Jaén ha dotado al CEATIC de unos fondos de investigación del Presupuesto para 2013 de la Universidad de Jaén, Capítulo VI, subconcepto 640. Por lo que, el presente plan plurianual de actividades de investigación definirá las distintas acciones que el CEATIC pretende realizar y financiar en el ámbito de investigación. Tipos de Actividades y Líneas de Investigación De la amalgama posible de actividades que el Centro puede abordar para alcanzar sus objetivos científicos de investigación, en este Plan Plurianual de actividades, se acordó por todos los grupos de investigación del CEATIC financiar los siguientes tipos de actividades: 1. Proyectos de I+D 2. Internacionalización de la investigación TIC en la UJA 3. Participación en proyectos de Transferencia de Resultados de Investigación 4. Seminarios y Foros de Investigación. 5. Servicios de apoyo a la Investigación De acuerdo a las prioridades temáticas y científico-técnicas expuestas en el Plan Estatal De Investigación Científico y Técnica De Innovación Este Plan recoge las siguientes líneas de investigación para el desarrollo de las actividades de investigación del CEATIC:

4 a) Desarrollo, innovación y adopción de SOLUCIONES Y TECNOLOGÍAS ligadas a: (i) «cloud computing»; (ii) Open/Linked/Big Data b) APLICACIONES Y SOLUCIONES TIC (i) gestión medioambiental; (ii) materia de eficiencia y la gestión energética; (iii) sistemas inteligentes de transporte; (iv) en medicina, (v) sensores y procesamiento para vigilancia y reconocimiento, etc. c) CIUDADES INTELIGENTES: desarrollo tecnológico, modelos de sostenibilidad y prestación avanzada de servicios, comunicaciones y otras aplicaciones. Sistemas y dispositivos basados en inteligencia ambiental. Modelización inteligente de entornos urbanos. d) CIBERSEGURIDAD Y CONFIANZA DIGITAL: (i) desarrollo de entornos seguros ligados a los derechos de los ciudadanos (ii) protección colectivos especialmente vulnerables, (iii) tecnologías ligadas a redes, sistemas y software e) REDES SOCIALES como vehículos de prestación de servicios y potencial desarrollo empresarial. f) SISTEMAS, PLATAFORMAS, SERVICIOS Y PROCESOS ORIENTADOS a: (i) contenidos digitales; (ii) difusión audiovisual Ambito de Aplicación A las distintas actividades de este plan podrán participar aquellos investigadores pertenecientes a grupos de investigación pertenecientes al CEATIC según su carta fundacional: 1. TIC144: Informática Gráfica y Geomática de Jaén. 2. TIC188: Tratamiento de Señales en Sistemas de Telecomunicación. 3. TIC206: Sistemas Inteligentes Basados en Análisis de Decisión Difuso. 4. TIC207: Sistemas Inteligentes y Minería de Datos. 5. TIC209: Sistemas Inteligentes de Acceso a la Información 6. TIC220: Ingeniería de Sistemas Telemáticos

5 ACTIVIDADES 1. Ayudas para la realización de proyectos de investigación Los investigadores responsables de los grupos de investigación del CEATIC definieron que las solicitudes para estas ayudas deben cumplir los siguientes requisitos: 1. La solicitud debe ser presentada por el Investigador Principal (IP) que será doctor del Personal Docente e Investigador a tiempo completo de los grupos pertenecientes al CEATIC (enumerados anteriormente) de la Universidad de Jaén. 2. Los investigadores beneficiarios de un Programa de Incorporación de Doctores (Ramón y Cajal / Juan de la Cierva) pertenecientes a un grupo TIC de la UJA, podrán participar siempre y cuando estén adscritos a la Universidad de Jaén. 3. Los investigadores doctores a tiempo completo que estén inscritos como personal de Investigación de grupos TIC de la UJA siempre que su contrato finalice con posterioridad a la fecha de finalización de la ayuda. 4. Los equipos estarán formados por al menos 5 investigadores de la Universidad de Jaén, incluido el responsable que será doctor. 5. Como máximo se concederá un proyecto a cada grupo del CEATIC en esta convocatoria. 6. Los investigadores tanto principal como miembros del equipo podrán participar en una única petición de proyecto de esta convocatoria. La evaluación y asignación de ayudas a los proyectos de investigación serán realizadas por una Comisión Gestora del CEATIC, creada ad hoc para realizar esta tarea hasta que se apruebe su Reglamento de Régimen Interno del Centro que regulará este proceso. Esta comisión estará formada por investigadores del CEATIC que sean los Catedráticos más antiguos de las áreas de Lenguajes y Sistemas Informáticos, Teoría de la Señal y Comunicaciones y Ciencias de la Computación e Inteligencia Artificial. En su defecto aquel TU con acreditación a Catedrático más antiguo. La Resolución emitida por dicha comisión será adjunta a este Plan en el Anexo correspondiente una vez obtenida. Este Plan hace una reserva de fondos para esta actividad de un máximo de

6 2. Internacionalización de la investigación TIC en la UJA En el área de Internacionalización se hará una reserva de los fondos disponibles en el CEATIC (indicados en el Objetivo de este Plan) de una cantidad de 2500 para incrementar e incentivar la Internacionalización de las actividades de los investigadores del CEATIC tales como: Fomentar el establecimiento de nuevas relaciones y el inicio de colaboración entre equipos de investigación del CEATIC e investigadores de otros países, ayudando a establecer consorcios internacionales fuertemente competitivos, orientados a presentar propuestas de investigación en convocatorias internacionales. Promoción de proyectos de cooperación de dimensión internacional en especial en redes. Otras actividades similares no recogidas inicialmente. 3. Participación en proyectos de Transferencia de Resultados de Investigación En cuanto a Transferencia se hará una reserva de los fondos disponibles en el CEATIC de 4000 para actividades propias del centro para aumentar su presencia en la transferencia de resultados de investigación. Actuaciones tales como: Participación en la creación de empresas de Base Tecnológica, mediante recursos propios, humanos o los demandados según cada actividad. Promoción de proyectos de solicitud de proyectos de Transferencia de Resultados de Investigación en colaboración con empresas. Otras actividades similares no recogidas inicialmente. 4. Seminarios y Foros de Investigación En el ámbito de seminarios y foros de investigación se hará una reserva de los fondos disponibles en el CEATIC de 1500 para actividades tales como: Organización de Seminarios de investigación en las líneas de investigación descritas Asistencia a foros relacionados con el desarrollo de Centros de Investigación Otras actividades similares no recogidas inicialmente.

7 5. Servicios Apoyo a la Investigación Finalmente el CEATIC hará una reserva de sus fondos de 4750 para actividades tales como: Recursos humanos para la gestión técnica de distintos servicios propios del Centro Material para facilitar la labor técnica e investigadora en caso de ser necesaria Otras actividades similares no recogidas inicialmente. Plazo de Ejecución de Plan Plurianual El plazo de ejecución de las actividades incluidas en este plan plurianual 2013 se extenderá hasta el 30 de junio de 2015, aunque algunas de ellas podrán ser extendidas si en años posteriores el CEATIC dispone de fondos para dilatar su duración siempre y cuando sigan siendo de interés para el Centro. Resumen Económico del Plan Plurianual Centro de Gastos Actividades de Investigación 38250,00 Proyectos de Investigación (max. 6) Becas y Contratos de apoyo a la investigación 2500 Internacionalización 4000 Participación en Proyectos Transferencia 1500 Servicios Apoyo a la Investigación 4750 Total Las cuantías asignadas a cada actividad, podrán ser redistribuidas por el CEATIC según las necesidades de desarrollo de las mismas. Luis Martínez López Comisionado TIC de la Universidad de Jaén

8 Anexos Anexo I: Informe de la comisión gestora del CEATIC y Resolución de Proyectos de Investigación Anexo II: Memorias de Proyectos.

9 Anexo I

10

11 Una vez recibidos las propuestas de proyectos para la actividad de Proyectos de I+D por parte del Comisionado del CEATIC, se creó la Comisión Gestora encargada de su evaluación que estuvo compuesta por: Dr. Francisco R. Feito Higueruela, Catedrático de Lenguajes y Sistemas Informáticos Dr. Nicolás Ruiz Reyes, Catedrático de Teoría de la Señal y Comunicaciones Dr. M. José del Jesus Diaz. Prof. TU acreditada a Catedrática del área de Ciencias de la Computación e Inteligencia Artificial. Esta comisión emitió una propuesta provisional de aceptación de proyectos el día 25 de Septiembre de 2013 (Ver Anexo II), a partir de la cual se realizó la siguiente resolución por parte del comisionado TIC: 1. Título: Gestión de Subsuelo Urbano mediante SIG 3D a. Investigador Principal: Lidia Ortega Alvarado b. Presupuesto: 4250 para gastos de personal y ejecución. c. Periodo de ejecución: 15 de Octubre de Mayo Título: Selección inteligente de estrategias basadas en el conocimiento para scheduling in computación grid/clould a. Investigador Principal: Sebastián García Galán b. Presupuesto: 4250 para gastos de personal y ejecución. c. Periodo de ejecución: 15 de Octubre de Mayo Título: Toma de decisiones estratégicas bajo incertidumbre en green computing a. Investigador Principal: Macarena Espinilla Estévez b. Presupuesto: 4250 para gastos de personal y ejecución. c. Periodo de ejecución: 15 de Octubre de Mayo Título: Implantación y explotación de un entorno Big Data para problemas de minería de datos a. Investigador Principal: Pedro González García b. Presupuesto: 4250 para gastos de personal y ejecución. c. Periodo de ejecución: 15 de Octubre de Mayo Título: Captura y procesamiento de grades volúmenes de datos provenientes de varias fuentes de micro-blogging a. Investigador Principal: Manuel C. Díaz Galiano b. Presupuesto: 4250 para gastos de personal y ejecución. c. Periodo de ejecución: 15 de Octubre de Mayo Título: Red experimental de sensores inalámbricos adaptada para la monitorización del ruido acústico en tiempo real en entornos urbanos a. Investigador Principal: Jose A. Fernández Prieto b. Presupuesto: 4250 para gastos de personal y ejecución. c. Periodo de ejecución: 15 de Octubre de Mayo 2015

12 25 de Septiembre de 2013 La Comisión Gestora del CEATIC compuesta por: Dr. Francisco R. Feito Higueruela Dr. Nicolás Ruiz Reyes Dr. M. José del Jesus Diaz. Se ha reunido para evaluar las memorias de proyectos de investigación sometidas dentro del Plan Plurianual del Centro de Estudios Avanzados en Tecnologías de la Información y Comunicación Tras revisar las distintas memorias de investigación se emite el informe siguiente indicando la adecuación de la propuesta a las líneas indicadas en el Plan, así como una recomendación de aprobación para su aceptación a ser financiada por el CEATIC. Finalmente en caso de ser necesario se indican las modificaciones que han de llevarse a cabo antes de su aceptación final.

13 TITULO DEL PROYECTO: Implantación y explotación de un entorno de Big Data para problemas de minería de datos IP PROYECTO: Pedro González García (TIC-207) ADECUACIÓN A LA CONVOCATORIA: El proyecto se adecua a la línea de investigación "Desarrollo, innovación y adopción de soluciones y tecnologías ligadas a: (i) cloud computing; (ii) Openjlink/big data" APROBACIÓN: SI 1 MODIFICACIONES: TITULO DEL PROYECTO: Captura y procesamiento de grandes volúmenes de datos provenientes de varias fuentes de micro-blogging IP PROYECTO: Manuel Carlos Díaz Galiana (TIC-209) ADECUACIÓN A LA CONVOCATORIA: El proyecto se adecua a la línea de investigación "Desarrollo, innovación y adopción de soluciones y tecnologías ligadas a: (i) cloud computing; (ii) Openjlink/big data" APROBACIÓN: SI MODIFICACIONES: Se debe aportar cronograma de actividades/tareas a desarrollar durante el período de realización del proyecto. TITULO DEL PROYECTO: Red experimental de sensores inalámbricos adaptada para la monitorización del ruido acústico en tiempo real en entornos ur banos IP PROYECTO: José Ángel Fernández Prieto (TIC-220) ADECUACIÓN A LA CONVOCATORIA: El proyecto se adecua a la línea de investigación "Ciudades inteligentes y aplicaciones y soluciones TIC" APROBACIÓN: SI MODIFICACIONES: Se debe aportar cronograma de actividades/tareas a desarrollar durante el período de realización del proyecto.

14 TITULO DEL PROYECTO: Gestión del subsuelo urbano mediante SI G 3D IP PROYECTO: Lidia Ortega Alvarado (TIC-144) ADECUACIÓN A LA CONVOCATORIA: El proyecto se adecua a la línea de investigación "Ciudades inteligentes y aplicaciones y soluciones TIC" APROBACIÓN: SI MODIFICACIONES: TITULO DEL PROYECTO: Selección inteligente de estrategias basadas en conocimiento para scheduling en computación grid/gloud. IP PROYECTO: Sebastián García Galán (TIC-188) ADECUACIÓN A LA CONVOCATORIA: El proyecto se adecua a la línea de investigación "Desarrollo, innovación y adopción de soluciones y tecnologías ligadas a: (i) cloud computing; (ii) Openjlink/big data" APROBACIÓN: SI MODIFICACIONES: TITULO DEL PROYECTO: Toma de decisiones estratégicas bajo incertidumbre en grid computing IP PROYECTO: Macarena Espinilla Estévez (TIC-206) ADECUACIÓN A LA CONVOCATORIA: El proyecto se adecua a la línea de investigación "Aplicaciones y soluciones TIC". APROBACIÓN: SI MODIFICACIONES:

15 Anexo II

16

17

18 Memoria Científico-Técnica Gestión del subsuelo urbano mediante SIG 3D. Líneas: Modelización inteligente de entornos urbanos. Soluciones TIC Resumen La gestión eficiente del subsuelo de las ciudades puede considerarse un problema aún no resuelto y que compite tanto a empresas de mantenimiento e instalación como a las propias administraciones públicas. El subsuelo tiene una serie de características que lo hacen particular a nivel de gestión: se mantienen en un mismo espacio una serie de instalaciones de muy diversa naturaleza y no visibles a simple vista. Cualquier incursión en el terreno para realizar tareas de mantenimiento puede dar lugar a numerosos problemas. En este proyecto se plantea avanzar en algoritmos y estructuras de datos que potencien los SIG 3D para la gestión eficiente de las instalaciones subterráneas. Los SIG 3D no sólo ofrecen modelos tridimensionales de las instalaciones subterráneas, sino que también ofrecen el manejo eficiente de la información asociada y además permiten realizar operaciones de análisis. 1.- Antecedentes y estado actual del tema, incluyendo la bibliografía más relevante comentada. Uno de los problemas relativos a la gestión urbana y del territorio es la del manejo del subsuelo. Al contrario que ocurre con la información catastral, centralizada por la Dirección General del Catastro, no existen organismos concretos que gestionen de las infraestructuras subterráneas. En general, se puede afirmar que las IDE (Infraestructura de Datos Espaciales) están presentes en la gestión urbana a nivel de superficie. Sin embargo, no se puede decir lo mismo para las infraestructuras en el subsuelo. La gestión de la información del subsuelo es fundamental porque soporta gran parte de los servicios suministrados a los ciudadanos: electricidad doméstica y para alumbrado público, telefonía, gas, agua, saneamientos, transporte, etc.. Normalmente en las cuidades este tipo de infraestructuras se realizan mediante redes de conductos o túneles que se encuentran debajo del pavimento de las calles o de los propios edificios.

19 Para los ciudadanos esta información no suele trascender, pero los ayuntamientos y las empresas que llevan la gestión y el mantenimiento de dichas redes de distribución demandan cada vez más el desarrollo herramientas eficaces para la gestión de estos sistemas, y que superen en versatilidad a los tradicionales planos en papel. Dependiendo del caso, estas instituciones o compañías encargadas de la gestión no manejan herramientas normalizadas. Si bien los grandes ayuntamientos o empresas suelen emplear software específico de carácter espacial como son los Sistemas de Información Geográficos (SIG), este tipo de herramientas no son habituales en municipios de mediano o pequeño tamaño. Lo que sí está extendido en la actualidad es el uso de herramientas CAD para el diseño de planos. El resto de fases como la implantación o el mantenimiento de estas instalaciones se realiza con estos planos en papel. Los problemas principales que subyacen en este modus operandi son muy diversos, sobre todo porque en el subsuelo pueden coexistir numerosas incursiones a lo largo de la historia, que pueden tener nula o escasa documentación [1] Se precisa entonces de una herramienta capaz de seguir todo el ciclo de vida de una conducción subterránea y su interrelación con el resto de infraestructuras del subsuelo. Aunque los aspectos referentes al modelado, tanto de elementos arquitectónicos como de conducción subterránea pueden estar resueltos, no ocurre lo mismo con respecto a la integración de modelos tridimensionales y su información temática asociada. Existe una fuerte componente espacial asociada a cualquier elemento urbano, lo que implica el manejo de bases de datos espaciales. Por esta razón las herramientas más adecuadas para su manejo son los SIG, capaces de trascender a los planos, permitiendo realizar la adquisición de datos, su manipulación y análisis espacial. En la actualidad los SIG son ya una realidad para numerosas empresas y administraciones encargadas de desarrollar los proyectos que poseen elevado carácter espacial. Sin embargo, raras veces este software se emplea durante todo el ciclo de vida de las instalaciones. Su uso suele reservarse a la oficina técnica. En realidad, se convierte en una herramienta adicional que no sustituye a los planos en papel de las instalaciones. Los ingenieros y operarios utilizan la documentación del proyecto en un formato fácilmente legible, transportable como el papel. La problemática del trabajo con planos sobre el papel es en parte el elevado nivel de abstracción propio de la representación bidimensional, en la que se superponen capas de información interpretadas sólo por personal especializado. Pero las características del subsuelo hacen que este tipo de herramienta lleve a errores de cálculo o precisión en la lectura. La información de los planos suele ser parcial o no mantener correlación con el resto de infraestructuras que coexisten bajo tierra. Además, puede estar obsoleta si las sucesivas incursiones en el terreno no se han reflejado en los planos de construcción, etc. En este marco de trabajo, la herramienta capaz de proporcionar la funcionalidad deseable para la gestión del subsuelo debe trascender en cierto modo las capacidades propias de los SIG, con el objeto de reducir este

20 nivel de abstracción entre la realidad y el formato en el que ésta se plasma. La incursión de modelos tridimensionales del terreno y de los elementos del subsuelo junto con el resto de la información es el siguiente paso para conseguir un avance sustancial en el campo de la gestión suburbana, y son propios de los denominados SIG 3D [2], si bien actualmente sólo algunas grandes ciudades cuentan con sistemas que compartan estas características para el manejo del subsuelo [3]. Un futuro deseable para que las nuevas tecnologías lleguen a todos los ámbitos de la ingeniería civil, también a los pequeños municipios, implicaría realizar un proceso de reingeniería que permitiera: La estandarización de herramientas de software libre para creación y uso extensivo de las IDE. El empleo de SIG 3D para manejo, visualización y análisis de la información tridimensional. Crear un modelo de integración de datos de diversa naturaleza, vectorial y raster para análisis conjunto de dicha información. La inclusión de la variable temporal. Un SIG 3D no es una simple extensión de los SIG 2D. Existen numerosos aspectos no solucionados con respecto al modelado automático a partir de diversas fuentes de datos y la estructuración de la información. La visualización de modelos complejos requiere el uso de estructuras de datos avanzadas que soporten las técnicas de aceleración en el rendering. La falta de topología que normalmente afecta a las capas de geometría 2D debe ser evitada en los SIG 3D. La topología, que describe las relaciones de los objetos con su entorno, permite la aceleración de las consultas espaciales, tanto a nivel geométrico como en la propia base de datos. Aunque existen algunas propuestas para el manejo de modelos del terreno, no existen estudios concretos para los sistemas urbanos, ya que la mayoría de las soluciones se presentan únicamente a nivel de visualización de modelos en 3D [4]. El diseño de bases de datos, el análisis y consulta espacial en 3D, así como la estandarización de los procesos y modelos están aun en proceso de investigación [5]. El proceso de estandarización, necesario para compatibilizarlo con el resto de herramientas de carácter geoespacial, está liderado por el Open Geospatial Consortim (OGC), que pretende establecer los modelos topológicos para la representación de objetos en 3D y para su integración en bases de datos espaciales [6]. En la actualidad, el modelo de información urbana denomiando CityGML, que siguen el estándar de OGC, añade desde 2012 el proyecto denominado CityGML Tunnel ADE, para el manejo de túneles, lo que pone de manifiesto el interés que suscita el subsuelo en la comunidad científica. Los sistemas de información geográficos que manejan datos tridimensionales suelen centrarse exclusivamente en el modelo vectorial [7]. Sin embargo, se hace necesario también manejar modelos basados en voxeles, que se pueden obtener directamente de la fuente de datos y que resultan más propicios para representar áreas. Estos modelos, aunque suelen ser sencillos de manejar, tienen el inconveniente de ser bastente

21 más pesados. El manejo conjunto de ambas formas de representación es objeto de estudio en algunos trabajos recientes de investigación, aunque se orientan fundamentalmente a imágenes de satélite con geometría 2D [8] [9]. Algunos autores recientemente están empezando a considerar el concepto de modelos híbridos de integración, para el manejo conjunto de información ráster y vectorial [10]. Un sistema híbrido no debe modificar o cambiar la naturaleza de cada dato sino más bien integrar ambas representaciones bajo un modelo capaz de gestionar ambos al mismo tiempo y proporcionando resultados independientemente de su naturaleza. Este tipo de modelos no se han trabajado de forma genérica, sino que se centran exclusivamente en tipos de escenarios muy concretos, como la gestión de emergencias en entornos urbanos [11]. En el análisis del subsuelo mediante integración de diferentes fuentes de datos y formatos encontramos el trabajo de Xu Lei et al., [12] pero centrado exclusivamente en la integración de distintos tipos de datos de entrada para análisis de las capas del terreno, más que para un uso genérico. A pesar de los intentos de estandarización de OGC, existen aún aspectos que debe considerarse a nivel de investigación, y que permitan la verdadera integración de modelos basados en la representación de fronteras con aquellos basados en volúmenes. Este proceso permitiría que las relaciones topológicas, la representación gráfica y el análisis conjunto de estos datos sea el adecuado. De igual modo, otro de los objetivos a cubrir sería la inclusión de la variable temporal en el sistema, que permita reflejar feacientemente las posibles modificaciones llevadas a cabo a lo largo del tiempo. En la superficie estas transformaciones se han podido documentar de diversas formas, por ejemplo mediante fotografías. Sin embargo, el manejo de sistemas dinámicos a nivel de intervención en su subsuelo es más compleja. Manejar la evolución temporal en este tipo de sistemas ayudaría a trabajar en entornos de naturaleza cambiante para permitir la localización de infraestructuras obsoletas, analizar las posibles ampliaciones en el diseño de futuras instalaciones, etc. El proceso de manejar eficientemente la variable temporal es más complicado que el simple hecho de añadir datos de tipo fecha a los sistemas de gestión [13]. Uno de los objetivos al trabajar con este tipo de variables consiste en mantener actualizada la información espacial y además hacerlo de forma eficiente. Las fotografías o los datos LIDAR no son los formatos más adecuados para mantener la información actualizada. Su datación está totalmente ligada al momento en que se realizó la toma de datos. La actualización de dicha información, implicaría repetir por completo el proceso de toma de datos. Los modelos que se necesitan para trabajar la variable temporal deben permitir la actualización de una forma mucho más simple, y permitiendo volver a estados anteriores en el tiempo. Bibliografía comentada: [1]Curiel-Esparza, J. Canto-Perello. Selecting utilities placement techniques in urban underground engineering. Archives of Civil and Mechanical Engineering, Volume 13, Issue 2, June 2013, Pages

22 [2]Alias Abdul-Rahman, Sisi Zlatanova Volker Coors, Innovations in 3D Geo Information Systems (Lecture Notes in Geoinformation and Cartography), 2006, Springer-Verlag New York. [3]Francesca de Rienzo, Pierpaolo Oreste, Sebastiano Pelizza. 3D GIS Supporting Underground Urbanisation in the City of Turin (Italy). Geotechnical and Geological Engineering, 27(4), , [4]Guoqing Zhou, Zhenyu Tan, Penggen Cheng, Weirong Chen. Modeling and visualizing 3d urban environment via internet for urban planning and monitoring. International archives of photogrammetry remote sensing and spatial information sciences, 35(2), , [5]Trung T. Pham, Marjorie Musy, Daniel Siret, Jacques Teller. Methodology for Integrating and Analyzing Environmental and Urban Data in 3D GIS. Proceeding of 10th AGILE International Conference on Geographic Information Science, [6]Marian De Vries, Sisi Zlatanova. Interoperability on the Web: The Case of 3D Geo-Data. In Proc. IADIS International Conference e-society, [7]Wang Yanbing, 3D GIS Spatial Modeling for City Surface and Subsurface Integration. IGARSS'06, [8]Heiner Hild and Dieter Fritsch. Integration Of Vector Data And Satellite Imagery For Geocoding. IAPRS, [9]NM Mattikalli, Integration of remotely-sensed raster data with a vector-based Geographical Information System for land-use change detection. International Journal of Remote Sensing, 16(15), , [10] S. Becker, V Walter, D. Fritsch. Integrated management of heterogeneous geodata with a hybrid 3D geoinformation system. ISPRS Annals of Photogrammetry, Remote Sensing and Spatial Information Sciences. I-2, 87-92, [11] J. Lee, S. Zlatanova. A 3D data model and topological analyses for emergency response in urban areas. Geospatial information technology for emergency response (ISPRS book series). Taylor & Francis Group, London, [12] Xu Lei, Wu Lixin, Chen Xuexi, Che Defu, Jiang Yun. A conceptual model for 3D subsurface spatial data integration: the integrated information voxel. Geoscience and Remote Sensing. Symposium IGARSS '05. Proceedings [13] Gidon Eshel, Spatiotemporal Data Analysis, Princeton University Press, Hipótesis y planteamiento de la investigación El Grupo de Gráficos y Geomática de Jaén (Gggj) fue el encargado de llevar a cabo el proyecto de investigación de la Junta de Andalucía con título

23 Gestión de Información Urbana Tridimensional: P07-TIC-02773, liderado por el Dr. Francisco R. Feito. Este proyecto, concluído en 2012, trabajó extensamente sobre geometría urbana, bases de datos espaciales, web 3D y SIG 3D, entre otros. Gran parte de las bases del proyecto que se presenta en esta convocatoria parten de resultados ya existentes a nivel de superficie. Sin embargo, la gestión del subsuelo plantea nuevos retos, como son la integración de información de diferentes fuentes y bajo diferentes modelos de representación. En este proyecto colaborarán todos los miembros del grupo TIC 144 que son profesores de la UJA con contrato indefinido En este aspecto, consideramos que la siguiente propuesta representa un campo abierto para la investigación. Los contactos llevados a cabo con la empresa SOMASAJA, Sociedad Mixta del Agua Jaén, S.A. nos han llevado a comprender la problemática actual existente en la gestión de las infraestructuras subterráneas. Esta empresa mixta de ámbito provincial está constituida por la Excma. Diputación Provincial de Jaén y la empresa Acciona Agua, S.A., y gestiona actualmente los servicios Públicos de Abastecimiento, Suministro de Agua Potable, Alcantarillado y Depuración de los municipios de la provincia de Jaén. Su colaboración en el proyecto nos permite conocer de primera mano el ámbito del problema, y además nos permite comprobar los avances que se realicen a lo largo de su ejecucion. Los aspectos más importantes que deben tratarse en el proyecto son los siguientes: Metodologías para la adquisición de información: los datos de entrada al sistema pueden provenir de muy diversas fuentes: datos 2D procedentes de herramientas CAD, planos en papel, datos de geo-rádares, etc. para su transformación en modelos 3D. Modelos híbridos: definir modelos de integración de datos volumétricos y geométricos. Estudiar los modelos formales, las estructuras de datos y operaciones sobre dichos modelos. Utilizar para ello las especificaciones estándares de la OGC. El equipo investigador de este proyecto tiene experiencia contrastada en los siguientes ámbitos: Ha trabajado en la generación de entornos 3D a partir de información bidimensional. En concreto con información catastral para generar entornos urbanos y con datos de Auto CAD para generación automática de interiores. Tiene experiencia en el diseño de bases de datos espaciales para mantener modelos 3D con información topológica en escenarios urbanos. Ha trabajado en el desarrollo de aplicaciones web en 3D. Conoce los lenguajes de programación y las técnicas de visualización para estos entornos que establecen una serie de restricciones para alcanzar una interacción en tiempo real. Tiene experiencia tanto trabajando con modelos voxelizados como modelos vectoriales. Los aspectos geométricos y topológicos de los modelos han sido gran parte de la investigación de los

24 componentes de este equipo. Todos estos elementos anteriores fundamentan en gran parte a los SIG 3D. En los últimos años se han obtenido resultados en este ámbito relacionados con los modelos urbanos. La experiencia a nivel de superficie sobre entornos arquitectónicos permite al equipo integrante acometer las tareas propuestas para el desarrollo de este proyecto. Sin embargo, existen numerosos retos que afrontar relativos al proceso de captación de la información, de la integración de los datos o de la visualización, a parte de los retos que supone trabajar en el ámbito de los SIG 3D. Como fundamento adicional para este modelo que planteamos está la utilización, en la medida de lo posible, de herramientas software de libre distribución y de los estándares establecidos. Esto conlleva ciertas ventajas de cara a la posible estandarización del método y difusión del trabajo final, al no tener que depender del coste adicional del software utilizado. Sin embargo, plantea nuevos retos para unificar todas estas herramientas que por lo general proceden de muy diversas fuentes. 3.- Euipo Investigador: IP: Lidia Ortega Alvarado Miembros: Juan José Jiménez Antonio Rueda Francisco R. Feito Higueruela Angel L. García Rafael J. Segura Juan Ruiz de Miras Carlos Ogayar Roberto Jimenez Angel Aguilera García Jose L. de la Cruz 3.- Objetivos previstos A partir de la definición del proyecto se plantean los siguientes objetivos fundamentales. 1. Estudiar los diversos formatos de los datos de entrada. Establecer mecanismos de adquisición y conversión de la información. 2. Definición del modelo híbrido de integración de los modelos tipo voxel y vectorial. 3. Desarrollar algoritmos para el análisis de los datos asociados al modelo híbrido.

25 4.- Material y métodos Los métodos para cada una de las tareas desglosadas de este proyecto están de algún modo estudiadas, sin embargo, se aplican a datos de naturaleza diferente y no siguen el estándar de la OGC (Open Geospatial Consortium). La implementación y diseño de la aplicación seguirá el modelo de datos abierto definido por CityGML, que sigue el estándar de OGC y la norma ISO TC211. El objetivo es desarrollar los algoritmos utilizando CityGML ( definición común de las entidades, atributos y relaciones de los modelos 3D. Al tratarse de un estándar y de unos algoritmos novedosos se orientaría a la constitución de un posible estándar en la gestión del subsuelo. A su vez, la incorporación del módulo CityGML Tunnel ADE permitirá trabajar sobre una especificación estandarizada. 5.- Plan de trabajo, cronograma orientativo y reparto de tareas La metodología de trabajo se concreta en las siguientes tareas que se derivan de los objetivos marcados: 1. Tarea 00: Dirección, seguimiento, coordinación y evaluación del proyecto. Relaciones externas. Hitos a alcanzar: Control del seguimiento del proyecto. Evaluación periódica de resultados y coordinación entre los componentes de todas las tareas. Ampliación de la web ya existente para la difusión del proyecto ( ). Memoria final del proyecto Responsables: F. Feito, Lidia Ortega, Antonio Rueda y Becario (a partir de su incorporación). Resultados esperados: Desarrollo adecuado del proyecto y Memoria final. Duración: 12 meses. 2. Tarea 01: Análisis de las fuentes de adquisición de información del subsuelo Hitos a alcanzar: Identificar las diversas fuentes de información que pueden nutrir una IDE del subsuelo (planos, datos existentes en CAD, datos procedentes de geo-rádares, datos LIDAR, imágenes, etc.) y definir indicadores de calidad. Estudiar los procesos de parametrización de los datos de entrada y estudiar las técnicas de extracción de información geométrica. Desarrollar métodos de conversión de diferentes fuentes de datos para conseguir obtener coherencia espacial. Estudiar la naturaleza de los datos de entrada para determinar el tipo de modelado 3D más adecuado Responsables: Francisco Feito, Lidia Ortega, Antonio J. Rueda, Angel L. García, Jose L. de la Cruz. Resultados esperados: Datos de entrada homogeneizados en formatos voxelizados o vectorial y manteniendo coherencia espacial. Duración: 4 meses

26 3. Tarea 02: Integración de datos volumétricos y geométricos en SIG 3D Hitos a alcanzar: Estudiar las características del modelo vectorial y recopilar algoritmos geométricos para el tratamiento de estos datos. Estudiar las características de los modelos basados en voxeles, recopilar algoritmos para su manejo, así como librerías para su optimización en espacio y tiempo de cómputo. Estudiar y definir formalmente el modelo de representación híbrida de modelos volumétricos y geométricos para mantener la coherencia espacial y las relaciones topológicas. Estudiar la metodología para la generación automática de modelos híbridos a partir de los datos de entrada ya preprocesados. Se evaluará posibles soluciones basadas tanto en SIG comerciales como en SIG Open Acces. Resultados esperados: Definición del modelo híbrido de integración de datos volumétricos y geométricos. Responsables: Antonio J. Rueda, Rafael J. Segura, Juan R. de Miras, Juan J. Jimenez, Carlos Ogayar, Angel Aguilera, Roberto Jimenez Duración: 6 meses 4. Tarea 03: Desarrollo de algoritmos y estructuras de datos para manejo de modelos híbridos. Hitos a alcanzar: Definición de las estructuras de datos para mantener y manejar eficientemente el modelo híbrido de integración. Algoritmos de análisis espacial propios de un SIG como: contigüidad, coincidencia, conectividad, enrutamiento, alcance, pendientes, etc. sobre el modelo híbrido. Estudio de la componente temporal en los modelos híbridos. Algoritmos para el análisis temporal de los datos espaciales: consulta temporal, evolución temporal, etc. Diseño de la base de datos espacio-temporal para albergar el modelo híbrido y sus relaciones topológicas. Resultados esperados: Implementación e integración del modelo híbrido de integración de datos volumétricos y geométricos en el prototipo. Responsables: Coordina: Francisco Feito, Ejecutan: Todos los investigadores y el Becario. Duración: 10 meses 5. Tarea 04: Documentación y difusión del proyecto Hitos a alcanzar: Documentación de los algoritmos, modelos y el prototipo desarrollado. Desarrollo de informes técnicos y artículos para revistas y congresos Resultados esperados: Memoria del proyecto y artículos científicos. Responsables: Todos. Duración: 12 meses.

27 La cronología del trabajo se representa en el siguiente esquema: Tarea 00: Tarea 01: Meses 1 al 12 Meses 1 al 4 Tarea 02: Meses 2 al 10 Tarea 03: Tarea 04: Meses 2 al 11 Meses 1 al Medios disponibles y requeridos para la ejecución del proyecto El departamento de Informática, a través del grupo de investigación TIC-144 denominado Informática Gráfica y Geomática al que pertenecen gran parte de los integrantes del equipo investigador de este proyecto, cuenta con la mayoría de los recursos necesario para llevar a cabo las tareas propuestas. Los miembros externos al departamento pertenecen a su vez a grupos de investigación con medios propios. Los medios materiales disponibles son los siguientes: Gran parte del software utilizado es de libre distribución. También se cuenta con parte del software comercial necesario. Ordenadores personales de todo el equipo investigador Bibliografía y acceso a bases de datos de artículos científicos. Los datos de entrada necesarios para realizar este proceso de investigación serán proporcionados por la empresa SOMASAJA S.A.: Sin embargo consideramos la necesidad de: La contratación de un becario para realizar la tarea de desarrollo de los algoritmos Dispositivo cliente (pda, tablet pc o similar) para poder determinar la conectividad y adecuar la interfaz según el caso. Propuesta económica de acuerdo con las especificaciones anteriores: 1. Becario de apoyo (Ingeniero en Informática o Técnico si no es posible lo anterior) durante 10 meses (800 /mes (25 horas semana)+seguro 80 ): (máximo en caso de I.I.) Material inventariable: dispositivo móvil para cliente Material no inventarialble: Viajes y dietas (asistencia a congreso y dietas) TOTAL Solicitado: euros

28 El becario de apoyo se encargaría principalmente del proceso de implementación de los algoritmos asesorado por el resto del equipo. El departamento puede proporcionarle ubicación para trabajar y conexión a Internet, pero sería necesaria la adquisición de un ordenador para que realizara las tareas adjudicadas. Los resultados del proyecto se esperan difundir al menos en un congreso nacional y otro internacional. En caso de que este presupuesto no fuera suficiente, el proyecto podría contar con ayuda de otros proyectos adjudicados a este grupo de investigación. Se espera que la gran parte de la bibliografía esté disponible en el departamento, a través del acceso a bases de datos de artículos científicos, así como manuales disponibles a través de Internet. 7.- Plan de difusión de resultados Se espera que la difusión de los resultados alcance los siguientes objetivos: 1. Comunicación en un congreso nacional del ámbito de la Informática Gráfica 2. Comunicación en un congreso internacional del ámbito de los Sistemas de Información geográficos 3. Difusión a través de la O.T.R.I. de la Universidad de Jaén para otros centros de investigación y empresas del sector público y privado. 4. En caso de obtener los resultados de calidad esperados en cualquiera de los ámbitos SIG o Informática Gráfica, se presentarán igualmente los resultados en revistas científicas de carácter internacional. 8.- Adecuación del equipo de investigación El equipo solicitante forma parte de un grupo más amplio: el grupo TIC-144 del Plan Andaluz de Investigación ( que dispone de espacios y la infraestructura adecuada. Todos los integrantes de este equipo realizan actualmente trabajos de investigación en temas relacionados con SIG y con el modelado de entornos urbanos y arquitectónicos.

29 Título del proyecto, contrato o ayuda Relación (1) Estado (2) Investigador Principal Subvención ( ) Entidad financiadora y referencia Periodo de vigencia Nuevas Tecnologías para Museos Ibéricos virtuales y reales (1) C Francisco R. Feito Diputación Provincial de Jaén Herramientas avanzadas para el modelado paramétrico en CAD Uso de GPU Programable. Aplicaciones Aplicación de Herramientas CAD en Realidad Virtual: Representaciones Formales y Algoritmos Geométricos. Gestión de Información Urbana Tridimensional Estudio de estructuras de datos y algoritmos que permitan la obtención de secciones transversales correctas de modelos tridimensionales de túneles Simulación Virtual Avanzada del Resultado de Tratamientos Dentales (2) (3) (1) (0) (1) (3) C C C C C C Francisco R. Feito Rafael J. Segura Francisco R. Feito Francisco R. Feito Rafael J. Segura Juan J. Jimenez ,49 MCYT/FEDER: TIN C03-03 Proyectos de Excelencia Junta de Andalucía - Código P06- TIC MCYT/FEDER: TIN C03-03 Proyectos de Excelencia Junta de Andalucía: Código: P07-TIC-02773) Contrato Empresa: SACYR VALLEHERMOSO,S.A. Contrato Empresa: VIRTUAL DENTAL SOLUTIONS (1) Relación con la solicitud, escríbase 0, 1, 2 ó 3 según la siguiente clave: 0 = es el mismo tema; 1 = está muy relacionado; 2 = está algo relacionado; 3 = sin relación (2) Escríbase de acuerdo con el artículo 79 de la convocatoria, una C o una S según se trate de una concesión o de una solicitud de otra ayuda para la misma acción

30 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA CONVOCATORIA DE PROYECTOS DE INVESTIGACION CENTRO DE ESTUDIOS AVANZADOS TIC DE LA UNIVERSIDAD DE JAEN SOLICITUD LÍNEA DE INVESTIGACION (de la convocatoria): Desarrollo, innovación y adopción de SOLUCIONES Y TECNOLOGÍAS ligadas a: (i) «cloud computing»; (ii) Open/Linked/Big Data Título del proyecto: SELECCIÓN INTELIGENTE DE ESTRATEGIAS BASADAS EN CONOCIMIENTO PARA SCHEDULING EN COMPUTACIÓN GRID/CLOUD Objetivos y Resumen del proyecto: Cloud Computing es un nuevo paradigma de computación distribuida que proporciona a sus usuarios servicios tales como la ejecución de aplicaciones de forma on-line, plataformas para el desarrollo de aplicaciones y/o una infraestructura de una elevada capacidad de cómputo y almacenamiento. El objetivo final de estos servicios consiste en la mejora de la productividad que las empresas pueden conseguir al externalizar sus necesidades informáticas y contratar los servicios Cloud. Por otra parte, un Grid computacional es una colección de recursos computacionales autónomos, heterogéneos y geográficamente distribuidos que cooperan y comparten capacidades para lograr un objetivo común. Por lo tanto, una mejora en las prestaciones de un sistema Grid representa una mejora en las prestaciones del sistema Cloud que lo utilice como infraestructura. Uno de los problemas más críticos que aparecen cuando se implementa un Grid computacional es la planificación para la gestión eficiente de los recursos del sistema, conocida comúnmente como Grid scheduling. Recientes trabajos sugieren la utilización de sistemas expertos que trabajen como schedulers. Estos sistemas expertos basan su funcionamiento en la descripción borrosa del estado del Grid y la aplicación de reglas borrosas para inferir la mejor selección de recursos. La obtención de estas reglas borrosas está sujeta a un proceso de aprendizaje u optimización considerando los objetivos perseguidos por el Grid scheduling. Concretamente, en Grid scheduling se pueden consideran diversos objetivos de optimización tales como makespan, flowtime, tardiness, average weighted response time, resources usage, slowdown, etc. Además, los criterios de optimización pueden presentar conflictos de intereses en el sentido de que mejorar uno implica empeorar otro. La idea general del proyecto consiste en realizar una optimización multi-objetivo y una posterior selección inteligente de las soluciones que se obtienen como resultado. Resulta especialmente interesante la obtención de soluciones no dominadas, de forma que se tengan soluciones igualmente eficientes en sentidos diversos que puedan ser empleadas en cada momento dependiendo del estado del Grid. Grupo TIC solicitante: TIC-188 Componentes del grupo Nombre y apellidos Departamento Grupo TIC Firma Inv. Principal: Sebastián García Galán Ing. Telecomunicación TIC-188 Componentes: 1. José Enrique Muñoz-Expósito 2. Rocío Pérez de Prado 3. Nicolás Ruiz Reyes 4. Pedro Vera Candeas 5. Raul Mata Campos 6. Damian Martínez Muñoz 7. Francisco Jesús Cañadas Quesada 8. Francisco Rodriguez Serrano 9. Pablo Cabañas Molero Dirección de la coordinación Nombre: Sebastián García Galán Dirección postal: Alfonso X el Sabio, 28. EPS de Linares Teléfono: FAX: (imprescindible): sgalan@ujaen. es

31 SELECCIÓN INTELIGENTE DE ESTRATEGIAS BASADAS EN CONOCIMIENTO PARA SCHEDULING EN COMPUTACIÓN GRID/CLOUD MEMORIA Este proyecto de investigación se presenta al amparo de la convocatoria del plan plurianual de actividades de del Centro de Estudios Avanzados en TIC de la Universidad de Jaén. Se trata de un proyecto de investigación enmarcado en la línea de investigación: Desarrollo, innovación y adopción de soluciones y tecnologías ligadas a Cloud Computing. 1.- INTRODUCCIÓN 1.1. Justificación. Con el rápido desarrollo y utilización de las TICs surge un nuevo paradigma de computación: el Cloud Computing. Dicho paradigma representa un mecanismo de computación distribuida que ofrece a los usuarios distintos servicios tales como software como servicio (SaaS), plataforma como servicio (PaaS) e infraestructura como servicio (IaaS). Así, un usuario podrá ejecutar aplicaciones on-line, desarrollar sus propias aplicaciones y disponer de una elevada capacidad de cómputo y de almacenamiento. Igualmente, Grid computing está emergiendo como una infraestructura distribuida y heterogénea capaz de proporcionar elevadas capacidades de cómputo. Resulta evidente, por lo tanto, que una mejora en las prestaciones de un sistema Grid conlleva inherentemente una mejora en las prestaciones de un sistema Cloud (reducción de costes a las empresas, optimización de los recursos aplicados a cada usuario, en definitiva, un aumento en la productividad de las empresas). Existen mecanismos para mejorar la eficiencia de los sistemas Grid, pero posiblemente el más crítico es la planificación Grid o Grid scheduling, y consiste en la asignación de tareas a ejecutar a los diferentes recursos disponibles en el sistema. Si bien en los últimos años se ha habido un avance significativo en la línea citada, los actuales planificadores presentan comportamientos manifiestamente mejorables y por lo tanto aún se precisa realizar esfuerzos encaminados a mejorar su comportamiento Contexto, Experiencias previas y Fuentes Bibliográficas. Grid Computing se posiciona cada vez más como una prometedora plataforma de computación distribuida a gran escala capaz de dar solución a los complejos problemas que se presentan actualmente en la ciencia, la ingeniería y la tecnología y que difícilmente pueden resolverse con las capacidades actuales de procesamiento de los sistemas considerados éstos como entes aislados. Un factor clave para poder aprovechar el alto potencial de estas redes de computación distribuida es realizar una gestión eficiente de los recursos y, en concreto, un reto importante es diseñar estrategias de planificación que realicen una asignación conveniente de carga-recursos en un entorno altamente dinámico Scheduling en Grid Computing con técnicas borrosas La planificación en Grid computing se basa en el reparto eficiente de trabajos y la coordinación y cooperación de recursos para conseguirlo. Los recursos del Grid pueden pertenecer a múltiples dominios administrativos considerando sus propias políticas de acceso y restricciones de seguridad que pueden cambiar dinámicamente. Además, los recursos del Grid son heterogéneos y pueden agregarse o dejar el sistema de forma no predecible en función de dichas políticas de acceso o reserva. Los planificadores se pueden clasificar en dos grandes grupos: Meta-schedulers y Local Schedulers. Los Meta-schedulers se usan para reservar y asignar los recursos en el Grid mientras que los Local schedulers son planificadores dedicados a la asignación de tareas dentro del mismo dominio de recursos. Una de las mayores dificultades de las estrategias de planificación viene dada la dificultad para conocer el estado real en un determinado momento. Sin embargo, el conocimiento de dicho estado resulta imprescindible para conseguir garantizar niveles adecuados de funcionamiento del Grid. De aquí puede entenderse que el desarrollo de técnicas de planificación capaces de reaccionar a cambios en el entorno 2

32 SELECCIÓN INTELIGENTE DE ESTRATEGIAS BASADAS EN CONOCIMIENTO PARA SCHEDULING EN COMPUTACIÓN GRID/CLOUD e imprecisiones es muy conveniente. En este sentido, hay que destacar el uso de los sistemas borrosos basados en reglas. Los sistemas borrosos basados en reglas representan una extensión de los sistemas tradicionales basados en reglas que intentan integrar la precisión de las técnicas de ingeniería clásicas y la interpretabilidad y flexibilidad de las técnicas de inteligencia artificial. Estos sistemas han están atrayendo cada vez más la atención de los investigadores para su aplicación a planificación en sistemas de computación distribuida de gran escala Criterios de optimización en Grid Computing En la planificación Grid se pueden considerar muchos criterios que caracterizan el funcionamiento y la calidad de la planificación. En general, se distingue entre criterios de funcionamiento y criterios de optimización del Grid, aunque es el conjunto de ambos el que proporciona una visión genérica sobre el funcionamiento general de éste. Los criterios de optimización del Grid incluyen makespan, flowtime, tardiness, etc. Una cuestión fundamental a la hora de diseñar una estrategia de planificación eficiente es la elección de los diferentes objetivos a optimizar. La optimización de varios objetivos puede ser deseable en un sistema Grid, aunque la conveniencia de su uso puede depender de muchas variables como por ejemplo el nivel de planificación que consideremos (ej., meta-scheduler, local-scheduler, etc), el tipo de Grid, servicios principales ofrecidos o las preferencias de los usuarios o grupos de usuarios. Así, puede ser necesario recurrir a estrategias que nos permitan decidir cuándo es conveniente la utilización de los criterios de optimización Scheduling multi-objetivo en Grid Computing La planificación Grid se describe como un problema multi-objetivo en su formulación general- Además, estos objetivos suelen presentar conflictos de intereses e interdependencias. Así, es importante que la estrategia de planificación sea capaz de ofrecer compensaciones adecuadas entre los diferentes criterios. En Grid scheduling es deseable conseguir soluciones que proporcionen buenas compensaciones entre los criterios contradictorios. Por ello, se debe tener en cuenta un número reducido de criterios al mismo tiempo. Fuentes bibliográficas Foster, I., Kesselman, C., The Grid 2: Blueprint for a New Computing Infrastructure, Morgan Kaufmann Publishers Inc., San Francisco, CA, USA, Kalantari, M., Akbari, M. K., A parallel solution for scheduling of real time applications on grid environments. Future Gener. Comput. Syst. 25 (7), Xhafa, F., Abraham, A., Computational models and heuristic methods for grid scheduling problems. Future Generation Computer Systems 26 (4), Xhafa, F., Abraham, A., Meta-heuristics for grid scheduling problems. Metaheuristics for Scheduling: Distributed Computing Environments, Studies in Computational Intelligence, Springer Verlag, Germany, ISBN, Liu, H., Abraham, A., Hassanien, A.E Scheduling jobs on computational grids using a fuzzy particle swarm optimization algorithm. Future Gener. Comput. Syst. 26, 8 (October 2010), Farzi, S., Efficient job scheduling in grid computing with modified artificial fish swarm algorithm, International Journal of Computer Theory and Engineering 1,

33 SELECCIÓN INTELIGENTE DE ESTRATEGIAS BASADAS EN CONOCIMIENTO PARA SCHEDULING EN COMPUTACIÓN GRID/CLOUD 2. OBJETIVOS El siguiente proyecto persigue 4 objetivos generales: OBJETIVO 1. Estudio y caracterización de los diferentes criterios de optimización que pueden ser utilizados por los schedulers de diferente nivel para la mejora del funcionamiento del Grid. En la actualidad los schedulers utilizan algoritmos de planificación que pretenden mejorar ciertos parámetros del comportamiento del sistema grid, sin embargo no existen estudios que diferencien dichos objetivos de optimización en función del nivel del planificador. OBJETIVO 2. Análisis de las interdependencias existentes entre objetivos de optimización del Grid. No se encuentra en la literatura ningún estudio de la interdependencia que de hecho existe entre los diferentes objetivos de optimización del grid. OBJETIVO 3. Selección de objetivos representativos de carácter contradictorio o conflictivo para los diferentes niveles de planificación Grid y posterior optimización multi-objetivo de los mismos. Hasta el momento no sólo no se ha realizado una selección de dichos objetivos, sino que tampoco se ha realizado desde una perspectiva multi-objetivo que consiga la optimización simultánea sin necesidad del establecimiento de prioridades o factores de escala entre los diferentes objetivos. OBJETIVO 4. Selección inteligente de la solución no dominada según la teoría de Pareto para la planificación. Las soluciones no dominadas deben utilizarse en función de las condiciones del Grid de forma que se obtenga una mejora en las prestaciones de la red. Para ello se debe desarrollar un sistema inteligente que seleccione en base al estado de Grid la solución no dominada más adecuada en cada momento para emplearse en la planificación. 4

34 SELECCIÓN INTELIGENTE DE ESTRATEGIAS BASADAS EN CONOCIMIENTO PARA SCHEDULING EN COMPUTACIÓN GRID/CLOUD 3. DESCRIPCIÓN DE LA EXPERIENCIA A DESARROLLAR Uno de los problemas más críticos que aparecen cuando se implementa un Grid computacional es la planificación para la gestión eficiente de los recursos del sistema, conocida comúnmente como Grid scheduling. Recientes trabajos sugieren la utilización de sistemas expertos que trabajen como schedulers. Estos sistemas expertos basan su funcionamiento en la descripción borrosa del estado del Grid y la aplicación de reglas borrosas para inferir la mejor selección de recursos. La obtención de estas reglas borrosas está sujeta a un proceso de aprendizaje u optimización considerando los objetivos perseguidos por el Grid scheduling. Concretamente, se pueden consideran diversos objetivos de optimización tales como makespan, flowtime, etc. Además, los criterios de optimización pueden presentar conflictos de intereses en el sentido de que mejorar uno implica empeorar otro. La idea general del proyecto consiste en realizar una optimización multi-objetivo y una posterior selección inteligente de las soluciones que se obtienen como resultado. Resulta especialmente interesante la obtención de soluciones no dominadas, de forma que se tengan soluciones igualmente eficientes en sentidos diversos que puedan ser empleadas en cada momento dependiendo del estado del Grid. Para conseguir los objetivos del proyecto se propone una estructura basada en grupos de trabajo que se encargarán de realizar las tareas asignadas a cada una de las actividades que conducen a la consecución de los objetivos planteados en el presente proyecto de investigación. Los grupos son los siguientes: Grupo 1: Responsable: Dr. Sebastián García Galán Participantes: Dr. Nicolás Ruiz Reyes, Dr. Raul Mata Campos, Ingeniero contratar. Grupo 2: Responsable: Dr. José Enrique Muñoz Expósito Participantes: Dr. Pedro Vera Candeas, Dr. Damian Martinez Muñoz, Francisco Rodríguez Serrano. Grupo 3: Responsable: Dr. Rocío Pérez de Prado Participantes: Dr. Francisco Jesús Cañadas Quesada, Pablo Cabañas Molero Existirá una coordinación general llevada a cabo por el investigador principal. 5

35 SELECCIÓN INTELIGENTE DE ESTRATEGIAS BASADAS EN CONOCIMIENTO PARA SCHEDULING EN COMPUTACIÓN GRID/CLOUD 4.- ALCANCE DEL PROYECTO Para cada uno de los objetivos planteados se presentan unos objetivos específicos que en su globalidad constituyen el alcance del proyecto. OBJETIVO 1. Estudio y caracterización de los diferentes criterios de optimización que pueden ser utilizados por los schedulers de diferente nivel para la mejora del funcionamiento del Grid. Objetivo 1.1: Analizar los objetivos de planificación para un planificador local. Los objetivos de planificación a considerar por un planificador local tienen que definirse en función a los criterios de eficiencia y políticas de compartición asociados a su dominio administrativo correspondiente. Objetivo 1.2: Analizar los objetivos de planificación para un meta-planificador. La metaplanificación en un sistema grid debe considerar objetivos que conlleven una mejora global de la planificación en el sistema considerando todos los dominios que forman el sistema grid de forma simultánea. OBJETIVO 2. Análisis de las interdependencias existentes entre objetivos de optimización del Grid. Objetivo 2.1: Analizar la interdependencia de los distintos objetivos de optimización. La optimización de un sistema de planificación grid puede necesitar la consideración simultánea de múltiples objetivos de naturaleza muy diversa e incluso contradictoria. Objetivo 2.2: Obtener criterios para la selección de objetivos de optimización. Deben definirse cuáles son estas variables o condiciones del sistema grid para las cuales es favorable emplear unos objetivos en concreto de forma que se realice una optimización de la planificación adecuada en las condiciones actuales. OBJETIVO 3. Selección de objetivos representativos de carácter contradictorio o conflictivo para los diferentes niveles de planificación Grid y posterior optimización multi-objetivo de los mismos. Objetivo 3.1: Seleccionar los objetivos de optimización más representativos. Una vez conocidos los objetivos que resultan relevantes para ser optimizados, se debe realizar una agrupación adecuada de éstos para conseguir una optimización simultánea eficiente. Objetivo 3.2: Realizar una optimización multi-objetivo. Teniendo definidos los objetivos a ser optimizados, se debe proceder a la optimización conjunta. OBJETIVO 4. Selección inteligente de la solución no dominada según la teoría de Pareto para la planificación. Objetivo 4.1: Diseñar sistemas para la selección de soluciones (estrategias basadas en conocimiento). Objetivo 4.2: Seleccionar soluciones en los distintos ámbitos de la planificación. La selección inteligente debe aplicarse considerando cada nivel de planificación. 6

36 SELECCIÓN INTELIGENTE DE ESTRATEGIAS BASADAS EN CONOCIMIENTO PARA SCHEDULING EN COMPUTACIÓN GRID/CLOUD 5.- MATERIAL Y MÉTODOS Equipo investigador Investigador Principal Sebastián García Galán Dr. Ingeniero de Telecomunicación Investigadores José Enrique Muñoz Expósito Dr. Ingeniero de Telecomunicación Rocío Pérez de Prado Nicolás Ruiz Reyes Pedro Vera Candeas Raul Mata Campos Damian Martinez Muñoz Francisco Jesús Cañadas Quesada Francisco Rodríguez Serrano Ingeniero de Telecomunicación Pablo Cabañas Molero Medios disponibles y requeridos Para la realización del presente proyecto de investigación se contará con los recursos materiales del grupo de investigación TIC

37 SELECCIÓN INTELIGENTE DE ESTRATEGIAS BASADAS EN CONOCIMIENTO PARA SCHEDULING EN COMPUTACIÓN GRID/CLOUD METODOLOGÍA Y PLAN DE TRABAJO Para conseguir los objetivos planteados se han definido unas actividades, cada una de las cuales integra varias tareas concretas. A continuación, se describen las actividades y tareas sobre las que se articula el plan de trabajo. Actividad 1: Revisión bibliográfica y actualización de software Tarea 1.1: Revisión y actualización de referencias bibliográficas. Se pretende realizar un repaso exhaustivo de las últimas publicaciones -en especial las del último año- relacionadas con la temática del proyecto, prestando especial atención a los trabajos publicados en revistas y congresos de prestigio internacional. Tarea 2.1: Búsqueda y evaluación de herramientas software. Se considera esencial la tarea inicial de compilación de herramientas software, principalmente las disponibles en la web, directamente relacionadas con las líneas propuestas en el proyecto. Actividad 2. Identificación de la relevancia de objetivos de optimización en función del nivel de planificación Tarea 2.1. Identificación de objetivos relevantes para la planificación local. Se realizarán estudios dentro del ámbito local de la planificación con el objetivo de identificar aquellos que mejores prestaciones ofrecen. Tarea 2.2. Identificación de objetivos relevantes para el meta-planificador. En esta ocasión los estudios se realizarán dentro de un ámbito global con el objetivo de identificar aquellos objetivos que resulten más interesantes de utilizar por un meta-planificador. Actividad 3. Identificación de interdependencias entre los objetivos de optimización Tarea 3.1. Identificación de interdependencias entre los diferentes objetivos de optimización. Se realizará un análisis de las correlaciones existentes entre los objetivos de planificación para identificar objetivos con conflictos de intereses u objetivos cuya optimización conlleva al menos un empeoramiento de otros objetivos y objetivos de carácter complementario cuya optimización conlleva la mejora de otros objetivos. Tarea 3.2. Análisis de las posibles agrupaciones de criterios de optimización. Esta tarea consiste en determinar posibles combinaciones de criterios cuya optimización simultánea puede resultar conveniente, ya sea por la posibilidad de paralelismo en su optimización o por la relevancia de consideración conjunta para obtener una planificación eficiente global. Actividad 4. Optimización multi-objetivo para los diferentes niveles de planificación Tarea 5.1. Selección de criterios para los diferentes niveles de planificación. Esta tarea consiste en la selección de los objetivos, dentro de los objetivos indicados como propicios por el modelo de decisión y el análisis de interdependencias, que deben ser optimizados de forma simultánea. Esta selección debe realizarse para todos los niveles de planificación. Tarea 5.2. Optimización multi-objetivo en el ámbito local de la planificación. Se realiza una optimización multi-objetivo basada en la teoría de Pareto empleando los objetivos obtenidos en la actividad anterior para los planificadores locales. Se obtiene como resultado un conjunto de soluciones o bases de reglas no dominadas para planificadores locales expertos. Tarea 5.3. Optimización multi-objetivo en el ámbito global de la planificación. Se lleva a cabo una planificación multi-objetivo basada en la teoría de Pareto con los objetivos indicados en la actividad 5.1 para meta-planificación. Se obtiene como resultado un conjunto de soluciones o bases de reglas no dominadas para meta-planificadores expertos. 8

38 SELECCIÓN INTELIGENTE DE ESTRATEGIAS BASADAS EN CONOCIMIENTO PARA SCHEDULING EN COMPUTACIÓN GRID/CLOUD Actividad 5. Selección inteligente de estrategias basadas en conocimiento Tarea 6.1. Selección inteligente en el ámbito local de la planificación. Se determina mediante un sistema inteligente la solución o base de reglas no dominada obtenida en el proceso multiobjetivo de los planificadores locales anterior que resulta eficiente en las condiciones locales actuales. Tarea 6.2. Selección inteligente en el ámbito global de la planificación. Se determina mediante un sistema inteligente la solución o base de reglas no dominada obtenida en el proceso multi-objetivo de la meta-planificadores anterior que resulta eficiente en las condiciones globales actuales. Actividad 6. Gestión del proyecto y difusión de resultados Tarea 7.1. Coordinación y gestión de actividades técnicas. La coordinación del proyecto se llevará a cabo mediante reuniones periódicas semanales del investigador principal con los responsables de cada una de las tareas. Tarea 7.2. Difusión y explotación de los resultados. Los resultados obtenidos se divulgarán mediante su publicación en revistas y congresos de reconocido prestigio, siempre que se considere que son suficientemente relevantes y aportan nuevo conocimiento a la comunidad científica especializada en la materia. 9

39 SELECCIÓN INTELIGENTE DE ESTRATEGIAS BASADAS EN CONOCIMIENTO PARA SCHEDULING EN COMPUTACIÓN GRID/CLOUD 6.- RESULTADOS EXPERADOS Científicos y tecnológicos Además de contribuciones científicas, en forma de artículos, en revistas de impacto y congresos de prestigio internacional, se considera que los resultados esperables de la investigación a realizar son susceptibles de transferencia tecnológica, existiendo posibilidades de explotación comercial de los mismos. En este sentido distintas empresas internacionales y nacionales con presencia internacional han manifestado su interés por los resultados que se puedan obtener del presente proyecto de investigación. Las empresas que han manifestado este interés son: Compañía especializada en el área de los semiconductores, servidores empresariales, telecomunicaciones, servicios y soluciones de redes a empresas. Comercializa la plataforma dinámica Fujitsu Global Cloud, que ofrece a empresas y proveedores de software independientes un portal de servicios en la nube. Es una compañía española, referente internacional en el desarrollo y despliegue de infraestructuras de servicios de red y plataformas para empresas, organizaciones e individuos, facilitando la comunicación de las aplicaciones, datos e información. Ofrece soluciones de e-business a través de cloud y sistemas operativos a través de red. Empresa especializada en tecnologías de la información con proyección multinacional. Junto con la compañía japonesa NEC desarrollan y comercializan soluciones Cloud en el área de Utility Computing. Es importante destacar que ya se tiene firmado un acuerdo de intenciones de contratación con la empresa Telvent para trabajar en temas relacionados con cloud computing en el marco de la propuesta Scalare-Andalucía presentada a la Corporación Tecnológica de Andalucía en Julio de Formativos Hasta la fecha se ha avanzado bastante en el comportamiento de los sistema Grid/Cloud, sin embargo queda un amplio horizonte por explorar. En este sentido, parece evidente que la investigación propuesta permite formar nuevos doctores. El equipo investigador está constituido Para llevar a cabo la dirección de estas potenciales tesis, se dispone 8 doctores del total de los 11 integrantes del equipo, teniendo experiencia en dirección de tesis 4 de ellos. 10

40 SELECCIÓN INTELIGENTE DE ESTRATEGIAS BASADAS EN CONOCIMIENTO PARA SCHEDULING EN COMPUTACIÓN GRID/CLOUD Obligaciones de los participantes En la siguiente tabla se presentan las obligaciones de los participantes mediante un reparto de rareas para cada uno de los grupos de trabajo anteriormente descritos. ACTIVIDADES/TAREAS G-1 G-2 G-3 Act. 1: Revisión bibliográfica y actualización de software T.1.1: Revisión y actualización de referencias bibliográficas X X X T.1.2: Búsqueda y evaluación de herramientas software X X X Act. 2: Identificación de la relevancia de objetivos de optimización en función del nivel de planificación T.2.1: En ámbito local de la planificación X X T.2.2: En ámbito global de la planificación X X Act.3: Identificación de interdependencias T.3.1: Identificación de interdependencias X X T.3.2: Análisis de las posibles agrupaciones de criterios X X Act. 4.: Optimización multi-objetivo T.4.1: Selección de criterios X X T.4.2: Optimización multi-objetivo en ámbito local X X T.4.3: Optimización multi-objetivo en ámbito global X X Act.5: Selección inteligente de estrategias de planificación T.5.1: En ámbito local de la planificación X X T.5.2: En ámbito global de la planificación X X Act. 6: Gestión del proyecto y difusión de resultados T.6.1: Coordinación y gestión de actividades técnicas X T.6.2: Difusión y explotación de resultados X X X Tabla 6.1: Reparto de tareas. 11

41 SELECCIÓN INTELIGENTE DE ESTRATEGIAS BASADAS EN CONOCIMIENTO PARA SCHEDULING EN COMPUTACIÓN GRID/CLOUD 7.- EXPERIMENTACIÓN PREVISTA Una vez descritas, en el apartado 5, las actividades y tareas que se incluyen en el proyecto de investigación para la consecución de los objetivos fijados, en la tabla 7.1 se presenta una propuesta de cronograma de actividades/tareas, supuesto que la duración del proyecto de investigación es de 18 meses. EXPERIMENTACIÓN PREVISTA Act. 1: Revisión bibliográfica y actualización de software T.1.1: Revisión y actualización de referencias bibliográficas X X X T.1.2: Búsqueda y evaluación de herramientas software X X X Act. 2: Identificación de la relevancia de objetivos de optimización en función del nivel de planificación T.2.1: En ámbito local de la planificación T.2.2: En ámbito global de la planificación Act.3: Identificación de interdependencias T.3.1: Identificación de interdependencias T.3.2: Análisis de las posibles agrupaciones de criterios Act. 4.: Optimización multi-objetivo T.4.1: Selección de criterios T.4.2: Optimización multi-objetivo en ámbito local T.4.3: Optimización multi-objetivo en ámbito global Act.5: Selección inteligente de estrategias de planificación T.5.1: En ámbito local de la planificación T.5.2: En ámbito global de la planificación Act. 6: Gestión del proyecto y difusión de resultados T.6.1: Coordinación y gestión de actividades técnicas T.6.2: Difusión y explotación de resultados X X X X X X Tabla 7.1: Cronograma de la experimentación prevista. MESES X X X X X X X X X X X X X X X x X X X x X x x x x X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X 12

42 SELECCIÓN INTELIGENTE DE ESTRATEGIAS BASADAS EN CONOCIMIENTO PARA SCHEDULING EN COMPUTACIÓN GRID/CLOUD 8.- PRESUPUESTO En la propuesta económica se considera la contratación a tiempo parcial de un titulado superior en Ingeniería, durante 5 meses. 1. GASTOS DE PERSONAL i) Ingeniero a Contratar GASTOS DE EJECUCIÓN i) Material inventariable 0 2.ii) Material fungible 0 2.iii) Material bibliográfico 0 2.iv) Viajes, dietas e inscripciones a congresos v) Otros gastos complementarios 0 13

43 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA CONVOCATORIA DE PROYECTOS DE INVESTIGACION CENTRO DE ESTUDIOS AVANZADOS TIC DE LA UNIVERSIDAD DE JAEN SOLICITUD LÍNEA DE INVESTIGACIÓN: Aplicaciones y Soluciones TIC. Título del proyecto: Toma de decisiones estratégicas bajo incertidumbre en Green Computing Objetivos y Resumen del proyecto: El término de Green Computing representa las estrategias en el uso y desarrollo de las tecnologías de la información y comunicación que buscan la utilización eficiente de los recursos para minimizar el impacto ambiental que está sufriendo el planeta debido a su creciente uso y desarrollo. Este proyecto de investigación se centra en la toma de decisiones estratégicas en el ámbito de Green Computing donde es necesario determinar el impacto que determinado uso o desarrollo de las tecnologías de la información y comunicación causaría sobre determinados indicadores ambientales. El conjunto de indicadores pueden tener naturaleza cuantitativa y cualitativa, estando estos últimos habitualmente asociados a incertidumbre, dado que las valoraciones de dichos indicadores presentan vaguedad e imprecisión. Nuestra propuesta de investigación tiene como propósito la definición de nuevos modelos y metodologías para el tratamiento cualitativo de la incertidumbre en la toma de decisiones estratégicas en Green Computing. Para ello, se propone el uso de técnicas Soft Computing que permitan mejorar la precisión de las evaluaciones y obtener resultados comprensibles para los evaluadores y decisores involucrados. Además, se propone la implementación y el desarrollo de los nuevos modelos y metodologías en un prototipo de Sistema de Soporte a la Decisión que ayude a tomar decisiones estratégicas en el ámbito de Green Computing. Grupo TIC solicitante: Sistemas Inteligentes Basados en el Análisis de Decisión Difuso. Sinbad2 Componentes del grupo Nombre y apellidos Departamento Grupo TIC Firma Inv. Principal: Dra. Macarena Espinilla Estévez. Dep. Informática. TIC 206 Componentes: 1. Dr. Luis Martínez López 2. Dr. Pedro J. Sánchez Sánchez 3. Dr. Manuel Barranco García 4. Dr. Rosa María Rodríguez Domínguez 5. Iván Palomares Carrascosa 6. Francisco Javier Estrella Liébana 7. Jorge Castro Gallardo Dirección de la coordinación Nombre: Macarena Espinilla Estévez Dirección postal: Campus Las Lagunillas s/n. Jaén. C.P Teléfono: FAX: (imprescindible): mestevez@ujaen.es

44 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA MEMORIA (máximo 3000 palabras) 1. Introducción El avance de la sociedad en las últimas décadas ha estado ligado al auge de las Tecnologías de la Información y de la Comunicación (TIC). Las TIC brindan numerosas e importantes ventajas, pero también implican ciertos inconvenientes como son un aumento del consumo energético y un daño considerable al medio ambiente. Por este motivo, recientemente se está tomando conciencia del uso y desarrollo de las TIC. En este contexto, nace el término Green Computing (GC) [1-3], el cual representa las estrategias en el uso y desarrollo de TIC que busquen la utilización eficiente de los recursos para minimizar el impacto ambiental. Ejemplos de algunas TIC verdes son Cloud Computing [4,5], Virtualización [5-7], Computación en clúster [8,9] o Centros de Datos eficientes energéticamente [10]. El término de GC nace en 1992 en EEUU, después de que la Agencia de Protección Ambiental (EPA) desarrollase el programa estrella de energía (Energy Star), diseñado para promover la eficiencia energética de diversas tecnologías como computadoras, monitores y aires acondicionados. Numerosas y reconocidas compañías se han sumando al desarrollo de TIC bajo GC, destacando dos titanes en el sector como Facebook 1 que tiene ubicado un centro de datos en Suecia con el objetivo de abastecer su suministro eléctrico mediante energía hidroeléctrica o Google 2 que tiene ubicados centros de datos en Finlandia para aprovechar el frío y refrigerar sus instalaciones. Actualmente, en las organizaciones y administraciones públicas se está recapacitando sobre la urgencia de abordar decisiones estratégicos en el ámbito de GC [11-12]. En dichas decisiones se determina el impacto que el uso o desarrollo de determinada TIC implicaría en un conjunto de indicadores medioambientales. Dichos indicadores tienen tanto naturaleza cualitativa como cuantitativa y son determinados a través de las opiniones vertidas de un grupo de individuos con diferentes conocimientos y, en ocasiones, con conflictos de intereses. Las evaluaciones sobre los indicadores medioambientales deben ser agregadas para valorar las diferentes estrategias y realizar la toma de decisión. En el caso de indicadores cuantitativos dicha agregación puede realizarse con modelos numéricos [15-17]. Sin embargo, los indicadores cualitativos habitualmente están asociados a la incertidumbre o vaguedad y es aquí es donde se encuentra el reto de las situaciones de decisión estratégicas en el ámbito de GC, es decir, en el tratamiento de la incertidumbre involucrada para intentar mejorar la precisión de las evaluaciones y obtener resultados que sean comprensibles. Dicho tratamiento abarca el modelado de los indicadores de acuerdo a la incertidumbre, su agregación y la interpretación de los resultados de dicha agregación, ya que en la Toma de Decisiones (TD) estratégicas la interpretación de los resultados de forma comprensible es de gran importancia [18]. La Teoría Clásica de la Decisión y en ella el análisis de decisión multicriterio [15] ha desarrollado un marco metodológico para la TD donde proporcionan modelos determinísticos y probabilísticos, los cuales no son adecuados en la TD estratégica bajo incertidumbre. Esto se debe a que los primeros ignoran la existencia de incertidumbre y los segundos sólo pueden manejar aquella de naturaleza probabilística. Dado que la incertidumbre en la TD estratégicas se debe a la ignorancia acerca de la información y la vaguedad de la misma, no puede modelarse habitualmente con distribuciones de probabilidad. Para tratar dicha incertidumbre se han desarrollado distintos enfoques y herramientas de Soft Computing como son la Lógica Difusa [19], el Enfoque Lingüístico Difuso [20] y diferentes extensiones [21-23] de las mismas que hace más fiables, inteligibles y flexibles los modelos de decisión en contextos de incertidumbre [24]. 1 Visitado Visitado

45 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA El uso de información lingüística implica operar con palabras. La computación con palabras [25] (Computing with Words, CWW 3 ) es una metodología ampliamente utilizada en TD bajo incertidumbre [26-29], cuyo esquema se muestra en la Ilustración 1 y donde se realiza una fase de retranslación que tiene como objetivo expresar lingüísticamente los resultados para proporcionar una mejor interpretación. La CWW ha sido la base para la definición de diferentes modelos lingüísticos computacionales [21,30-32]. Ilustración 1 - Esquema de CWW Sin embargo, se observa que en ámbito de GC no ha sido propuesto ningún modelo ni metodología para la toma de decisiones estratégicas que proporcione un tratamiento adecuado a la incertidumbre envuelta en este ámbito y que proporciona resultados fácilmente entendibles. Así, el propósito de este proyecto es investigar el ámbito de GC para establecer nuevos modelos y metodologías para el tratamiento cualitativo de la incertidumbre a través del uso de términos lingüísticos, modelados y tratados mediante técnicas de Soft Computing. Para alcanzar el propósito de este proyecto, el equipo de trabajo del presente proyecto posee un importante know-how que ha sido adquirido en el desarrollo de proyectos competitivos, tanto del plan nacional (TIN y TIN ), como de la comunidad regional (TIC-3548). En dichos proyectos, se han desarrollado algunas de las herramientas que servirán como base para alcanzar el propósito de este proyecto y, además, se han obtenido resultados satisfactorios en problemas muy relacionados con el ámbito de GC. Así, en [33,34] se encuentran modelos de evaluación de políticas de energía sostenibles y en [37] un modelo de evaluación de riesgo nuclear. La gran mayoría de los modelos y metodologías desarrolladas en dichos proyectos se encentran bajo la TD bajo incertidumbre y son resueltos con técnicas de Soft Computing, estando las publicaciones asociadas disponibles en la página web del grupo de trabajo 4. Bibliografía [1] Barroso, L.A., Hölzle, U. The case for energy-proportional computing (2007) Computer, 40 (12), pp [2] Mukherjee, T., Banerjee, A., Varsamopoulos, G., Gupta, S.K.S., Rungta, S. Spatio-temporal thermal-aware job scheduling to minimize energy consumption in virtualized heterogeneous data centers (2009) Computer Networks, 53 (17), pp [3] Guo, B., Shen, Y., Shao, Z.-L. The redefinition and some discussion of green computing (2009) Jisuanji Xuebao/Chinese Journal of Computers, 32 (12), pp [4] Armbrust, M., Fox, A., Griffith, R., Joseph, A.D., Katz, R., Konwinski, A., Lee, G., Patterson, D., Rabkin, A., Stoica, I., Zaharia, M. A view of cloud computing (2010) Communications of the ACM, 53 (4), pp [5] Buyya, R., Yeo, C.S., Venugopal, S., Broberg, J., Brandic, I. Cloud computing and emerging IT platforms: Vision, hype, and reality for delivering computing as the 5th utility (2009) Future Generation Computer Systems, 25 (6), pp [6] Rosenblum, M., Garfinkel, T. Virtual machine monitors: Current technology and future trends (2005) Computer, 38 (5), pp [7] Chowdhury, N.M.M.K., Boutaba, R. A survey of network virtualization (2010) Computer Networks, 54 (5), pp [8] Murphy, R., Sterling, T., Dekate, C. Advanced architectures and execution models to support green computing (2010) Computing in Science and Engineering, 12 (6), art. no , pp [9] Xu, R., Wunsch II, D. Survey of clustering algorithms (2005) IEEE Transactions on Neural Networks, 16 (3), pp [10] ITΙntel (2006) Energy-Efficient Performance for the Data Center. [11] Murugesan, S. Harnessing green IT: Principles and practices (2008) IT Professional, 10 (1), pp [12] Murugesan, S. From the editors: Making IT green (2010) IT Professional, 12 (2), art. no , pp [13] Rivoire, S., Shah, M.A., Ranganathan, P., Kozyrakis, C., Meza, J. Models and metrics to enable energy-efficiency optimizations (2007) Computer, 40 (12), pp [14] Wang, L., Khan, S.U. Review of performance metrics for green data centers: a taxonomy study (2011) Journal of Supercomputing, pp Article in Press. [15] Lu, J., et al., Multi-Objective Group Decision Making. Methods, Software and Applications with Fuzzy Set Techniques [16] Triantaphyllou, E., Multi-criteria decision making methods: a comparative study Introducida por Zadeh para operar con palabras del lenguaje natural e inspirada en la capacidad de razonamiento o de tomar decisiones de los humanos sin utilizar medidas precisas. 4

46 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA [17] Beliakov, G., T. Calvo, and A. Pradera, Aggregation Functions: A Guide for Practitioners [18] Sarkis, J. and R.P. Sundarraj, Evaluation of enterprise information technologies: A decision model for high-level consideration of strategic and operational issues. IEEE Transactions on Systems, Man and Cybernetics Part C, (2): p [19] Zadeh, L., Fuzzy sets. Information and Control, : p [20] Zadeh, L., The concept of a linguistic variable and its applications to approximate reasoning. Information Sciences, Part I, II, III, 1975 (8,9): p , , [21] Herrera, F. and L. Martínez, A 2-tuple Fuzzy Linguistic Representation Model for Computing with Words. IEEE Transactions on Fuzzy Systems, (6): p [22] Lawry, J., A methodology for computing with words. International Journal of Approximate Reasoning, : p [23] Torra, V., Hesitant Fuzzy sets. International Journal of Intelligent Systems, (6): p [24] Martinez, L., et al., Linguistic decision making: Tools and applications Preface Information Sciences, (14): p. 2. [25] Zadeh, L., Fuzzy Logic = Computing with Words. IEEE Transactions on Fuzzy Systems, (2): p [26] Kacprzyk, J. and S. Zadrozny, Computing with Words in Decision Making: Through Individual and Collective Linguistic Choice Rules. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, (4): p [27] Martínez, L., D. Ruan, and F. Herrera, Computing with Words in Decision support Systems: An overview on Models and Applications. International Journal of Computational Intelligence Systems, (4): p [28] Mendel, J.M., Computing with Words: Zadeh, Turing, Popper and Occam. IEEE Computational Intelligence Magazine, (4): p [29] Mendel, J.M., et al., What computing with words means to me. IEEE Computational Intelligence Magazine, (1): p [30] Lawry, J., A framework for linguistic modelling. Artificial Intelligence, (1-2): p [31] Wang, J.H. and J. Hao, A new version of 2-tuple fuzzy linguistic representation model for computing with words. IEEE Transactions on Fuzzy Systems, (3): p [32] Xu, Z.S., A method based on linguistic aggregation operators for group decision making with linguistic preference relations. Information Sciences, (1-4): p [33] Espinilla, M., Palomares, I., MartÍnez, L., Ruan, D. A comparative study of heterogeneous decision analysis approaches applied to sustainable energy evaluation (2012) International Journal of Uncertainty, Fuzziness and Knowlege-Based Systems, 20 (SUPPL. 1), pp [34] Espinilla, M., Ruan, D., Liu, J., Martínez, L. A heterogeneous evaluation model for assessing sustainable energy: A Belgian case study (2010) 2010 IEEE World Congress on Computational Intelligence, WCCI 2010, art. no [35] Rodríguez, R.M., Martínez, L., Ruan, D., Liu, J. Using collaborative filtering for dealing with missing values in nuclear safeguards evaluation (2010) International Journal of Uncertainty, Fuzziness and Knowlege-Based Systems, 18 (4), pp Objetivos Los objetivos propuestos a alcanzar son los siguientes: - Objetivo 1. Investigar situaciones reales de TD estratégicas en el ámbito de GC. - Objetivo 2. Desarrollar nuevos modelos y metodologías para el tratamiento cualitativo de incertidumbre en el ámbito de GC, los cuales impliquen el modelado de los indicadores cualitativos, la agregación de las evaluaciones de los indicadores y la obtención de resultados lingüísticos interpretables. - Objetivo 3. Implementar y desarrollar los modelos y metodologías en un prototipo de Sistema de Soporte a la Decisión (SDD) para la TD estratégicas en el ámbito de GC. 3. Descripción de la experiencia a desarrollar Las fases necesarias para llevarlo a cabo el proyecto y su organización en un plazo temporal de un año y nueve meses son las siguientes: Fase 1. Recopilación y estudio bibliográfico - Participantes: Todo el equipo. - Entrada de Recursos: Material bibliográfico sobre GC, TD estratégicas y técnicas Soft Computing. - Objetivo Desarrollado: [Objetivo 1]. - Resultado previsible: Puesta al día en GC y técnicas de Soft Computing, homogeneización de conocimientos de todos los miembros del equipo. - Duración: 4 meses.

47 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA Fase 2. Desarrollo de nuevos modelos y metodologías para el tratamiento cualitativo de incertidumbre en el ámbito de GC. - Participantes: Todo el equipo. - Entrada de Recursos: Material bibliográfico adicional y feedback recibido en las contribuciones de congresos en la fase 4. - Conocimientos Necesarios: Los adquiridos en la fase 1. - Objetivo Desarrollado: [Objetivo 2]. - Resultado previsible: Diferentes modelos y metodologías para la TD estratégicas en GC que puedan manejar indicadores cualitativos a través de técnicas de Soft Computing. - Duración: 9 meses. Fase 3. Implementación y desarrollo de un prototipo de SSD con los nuevos modelos y metodología para la TD estratégicas en el ámbito de GC. - Participantes: Dr. Manuel Barranco, Dr. P.J. Sánchez, I. Palomares, J. Castro, F.J. Estrella, Personal a incorporar al proyecto (PIP). - Entrada de Recursos: Material bibliográfico adicional, resultado previsible de fase 2 y feedback recibido en las contribuciones de congresos en la fase 4. - Conocimientos Necesarios: Conocimientos de programación y los adquiridos en la fase 2. - Objetivo Desarrollado: [Objetivo 3]. - Resultado previsible: Prototipo de SSD para la TD estratégicas en GC que implementa los modelos y metodologías propuestos. - Duración 8 meses. Fase 4. Difusión de los resultados - Participantes: Dra. Macarena Espinilla, Dr. Luis López, Dra. Rosa Mª Rodríguez, Iván Palomares. - Entrada de Recursos: Resultados que se vayan alcanzando y material bibliográfico adicional. - Conocimientos Necesarios: Conocimientos de la fase 1, 2 y 3. - Resultado previsible: Diversas publicaciones en congresos y revistas de reconocido prestigio. - Duración 8 meses. Fase 5. Gestión del proyecto - Participantes: Todo el equipo - Duración: Todo el proyecto. - Entrada de Recursos: Resultados que se vayan alcanzando. - Resultados Previsibles: Coordinación entre los miembros del equipo a través de reuniones periódicas. 4. Alcance del proyecto La investigación a realizar se basa en utilizar las ventajas que proporcionan las teorías, modelos y metodologías basadas en técnicas de Soft Computing para el tratamiento incertidumbre. Así, nuestra propuesta tiene como propósito principal la definición de nuevos modelos y metodologías para el tratamiento cualitativo de la incertidumbre en TD estratégicas en GC con el fin de: - Modelar correctamente la incertidumbre presente en situaciones de decisión en GC. - Agregar adecuadamente la información proporcionada. - Proporcionar resultados lingüísticamente interpretables.

48 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA De este modo, se pretende mejorar las soluciones de los modelos actuales. Por tanto, el alcance del presente proyecto alberga: - El estudio del modelado adecuado de los indicadores cualitativos y cuantitativos que se encuentran presentes en el ámbito de GC. - El estudio de los procesos de agregación de las evaluaciones de dichos indicadores. - El proceso de retranslación para expresar lingüísticamente los resultados. Además, un fruto previsible de este proyecto es la implementación y desarrollo de los nuevos modelos y metodologías en un prototipo de SSD que ayude a tomar decisiones estratégicas en el ámbito de GC. El alcance de este proyecto es proporcionar tan solo un prototipo que proporcione la funcionalidad básica, no estando dentro del alcance el desarrollo de un SSD profesional. Finalmente, dentro del alcance del proyecto se encuentra la publicación de los resultados que se vayan logrando. 5. Material y métodos El presente proyecto de investigación comprende la obtención de resultados teóricos y procesos de implementación software, por lo que se utilizarán dos métodos de investigación. En la línea teórica se seguirá la metodología científica habitual: Formulación de hipótesis. El uso de técnicas de Soft Computing para el tratamiento de la incertidumbre presente en los indicadores cualitativos de la TD estratégicas en el ámbito de GC proporcionará nuevos modelos y metodologías adecuadas al tipo de incertidumbre presente en dicho ámbito, lo cual implicará una mejora en la TD, ya que los resultados obtenidos serán más fiables e interpretables. Recogida de observaciones. Una vez propuestos los nuevos modelos y metodologías, estos serán aplicados a situaciones reales de TD estratégicas en el ámbito de GC. Contraste de hipótesis con las observaciones. En líneas generales, evaluaremos las técnicas de Soft Computing implementadas en los modelos y metodologías con el objetivo de evaluar su calidad, en concreto, se analizarán el modelado de los indicadores cualitativos, los operadores de agregación utilizados y las funciones de retranslación usadas para obtener los resultados lingüísticos. Readaptación de hipótesis inicial. Modificación y refinamiento de las técnicas de Soft Computing utilizadas como consecuencia de su aplicación a situaciones reales, de su evaluación y de la experiencia acumulada. El material que se utilizará en la línea teórica es material bibliográfico. En la línea de desarrollo software, se implementará un prototipo de SSD para la TD estratégicas en el ámbito de GC que incluya los modelos y metodologías implementados en la línea teórica. Para implementar dicho prototipo se seguirá la metodología de desarrollo software Incremental donde para cada parte o bloque del SSD se definen los requerimientos funcionales y no funcionales que se demandan de él, se realiza el análisis y diseño y, finalmente, se implementado el bloque para alcanzar su propósito y objetivos. Para la línea de desarrollo software el conjunto de recursos son: - Software de desarrollo: Netbeans java y Bases de datos: Postgress y mysql. - Recursos humanos: Una Persona a Incorporar al Proyecto (PIP) por la siguiente modalidad y perfil: Modalidad: o Ingeniería en Informática o 8 meses, (20 horas semanales)

49 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA Perfil o Conocimientos de análisis, diseño y programación en Java: IDE de desarrollo Netbeans. o Conocimientos en bases de datos: Postgress y mysql. o Conocimientos básicos en Soft Computing: Lógica difusa, modelado de la información y el enfoque lingüístico difuso. 6. Resultados esperados Respecto a los resultados esperados destacan el desarrollo de nuevos modelos y metodologías para el tratamiento cualitativo de incertidumbre en el ámbito de GC y su implementación en un prototipo de SSD. Dichos resultados se adaptan a las actividades que el CEATIC propone en el PLAN PLURIANUAL DE ACTIVIDADES en la línea de APLICACIONES Y SOLUCIONES TIC en el ámbito de gestión medioambiental, el papel que juega cada participante del proyecto ha sido detallado en el apartado 3 de esta memoria científica. Los resultados esperados pretenden ser difundidos por el equipo y se confía en mantener la línea de difusión del grupo en los últimos años, publicando en revistas internacionales indexadas en la base de datos del ISI. Por otro lado, para conocer la validez y calidad del trabajo científico desarrollado, divulgaremos las ideas iniciales en congresos para ver posibles mejoras indicadas por el colectivo participante en los mismos y así integrar dichas mejoras en los trabajos que serán remitidos posteriormente a revistas. 7. Experimentación prevista La experimentación a realizar es la aplicación de los nuevos modelos y metodologías propuestos a situaciones reales de TD estratégicas en el ámbito de GC con el objetivo de evaluar las técnicas de Soft Computing implementadas, en concreto se analizarán el modelado de los indicadores cualitativos, los operadores de agregación utilizados y las funciones de retranslación usadas para obtener los resultados lingüísticos. 8. Presupuesto solicitado y su distribución 1 - GASTOS DE PERSONAL Coste PERSONAL A INCORPORAR EN EL PROYECTO (PIP) 2 - GASTOS DE EJECUCIÓN VIAJES, DIETAS E INSCRIPCIONES A CONGRESOS 6 meses 500 /mes , ,00 BIBLIOGRAFÍA RECIENTE 150,00 COSTE DEL PROYECTO 5.000,00

50 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA CONVOCATORIA DE PROYECTOS DE INVESTIGACION CENTRO DE ESTUDIOS AVANZADOS TIC DE LA UNIVERSIDAD DE JAEN SOLICITUD LÍNEA DE INVESTIGACION (de la convocatoria): Desarrollo, innovación y adopción de soluciones y tecnologías ligadas a Big Data Título del proyecto: Implantación y explotación de un entorno de Big Data para problemas de Minería de Datos Objetivos y Resumen del proyecto: La cantidad cada vez mayor de datos que generan empresas, usuarios y dispositivos, requiere la aplicación de nuevas técnicas de extracción de información, puesto que las herramientas analíticas convencionales no están preparadas para gestionar estos grandes volúmenes de datos, que llegan a una gran velocidad y que es necesario analizar en tiempo real. Este proyecto pretende la implantación y explotación de un entorno para afrontar problemas de Big Data que incorpore algoritmos de minería de datos. En primer lugar, se analizarán las alternativas de herramientas disponibles, para seleccionar la más adecuada. Entonces, se realizarán las experimentaciones, tanto de conjuntos de datos tradicionales como de problemas de Big Data, y se analizarán y compararán sus resultados. Además, se probará el entorno implantado con problemas reales de alta dimensionalidad, dentro de las líneas de interés de la convocatoria, en el campo de la Medicina y genética (Bioinformática y biomedicina) como clasificación y descripción de secuencias de ADN y proteínas para enfermedades del tipo de gripe A y variantes, con problemas de alta dimensionalidad relacionados con enfermedades psiquiátricas, o en el campo de las energías renovables con flujos continuos de datos de alta dimensionalidad. Los resultados obtenidos en el proyecto, tanto en la implantación de la solución de Big Data como en las experimentaciones realizadas, se pondrán a disposición de la comunidad científica a través de su publicación en revistas y/o congresos científicos.

51

52 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA MEMORIA (máximo 3000 palabras) 1. Introducción (justificación del proyecto, contexto, experiencias previas, bibliografía ) La Minería de Datos (MD) [Fay96] juega un papel fundamental en la investigación científica para analizar datos, verificar hipótesis y extraer conocimiento, permitiendo a una organización optimizar el negocio y tomar decisiones. Así, la transferencia de la MD en medicina, finanzas, análisis de información web, o comercio-e, entre otros, está en continuo crecimiento. De forma paralela al avance en la obtención y almacenamiento de los datos, las técnicas de MD se enfrentan a nuevos retos. Quizá el de más actualidad hoy día sea la gestión de la ingente marea de información digital, en continuo crecimiento, que requiere de una capacidad de almacenamiento y procesado de magnitudes hasta ahora nunca vistas. El problema de la escalabilidad, o capacidad de un algoritmo para mantener el nivel de eficacia a un coste computacional razonable a medida que se incrementa la dimensionalidad del problema a resolver, es un reto para los algoritmos de MD. La escalabilidad se ha tratado desde diferentes perspectivas. Una de ellas se basa en la adaptación de algoritmos de MD para mejorar su rendimiento ante bases de datos de elevada dimensionalidad [Pro99, Ber10]. Una segunda vía de trabajo se centra en la reducción previa de la dimensionalidad de los datos a través de procesos de selección de características, selección de instancias o prototipos [Can05, Gar08] o distribución de ejemplos [Har09]. Una tercera línea de desarrollo se centra en el desarrollo de propuestas distribuidas [Rob09]. A pesar de estos esfuerzos, los conjuntos de datos crecen tan rápidamente que no pueden ser manipulados por las herramientas tradicionales. Cada vez que hacemos una búsqueda en Internet, enviamos un correo electrónico, usamos el teléfono móvil o hacemos una compra online dejamos tras nosotros una gran cantidad de datos, huellas digitales y registros que ofrecen una información muy valiosa para los analistas. Y las empresas han comenzado a darse cuenta de que la manera de obtener ventaja es tener la capacidad de procesar uno de sus principales activos: la información que la propia empresa genera. Esta enorme cantidad de datos que generan empresas, usuarios y dispositivos, ha experimentado un crecimiento explosivo que requiere la aplicación de nuevas técnicas para la extracción de información, ya que las herramientas analíticas convencionales, como sistemas de gestión de bases de datos o data warehouse no están preparados para gestionar estos grandes volúmenes de datos, que llegan a una gran velocidad y que es necesario analizar en tiempo real. Para definir este fenómeno se ha acuñado el término Big Data [Agr11] que se refiere a conjuntos de datos que crecen tan rápidamente que no pueden ser manipulados por las herramientas de gestión de bases de datos tradicionales. Sin embargo, el tamaño no es el único problema, puesto que además de almacenar esta información es necesario capturar, consultar, gestionar y analizar toda esta información. En el campo de análisis de datos, el paradigma MapReduce [Dea04] ha sido ampliamente adoptado tanto en la industria como en el entorno académico. Su versión de código abierto Apache Hadoop [Had09] es una plataforma de software libre que conforma hoy día la columna

53 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA vertebral de la mayor parte de los proyectos de Big Data, que permite el procesamiento en paralelo de grandes cantidades de datos (estructurados y desestructurados) a través de clusters de servidores. Hadoop, además, ofrece la posibilidad de crecer de manera escalable y llegar a trabajar con miles de nodos y un volumen de datos del orden de petabytes. Pero hay otros proyectos software de código abierto que están apareciendo para ayudar al desarrollo del Big Data: Spark [Spa12] es un sistema de computación en clúster extremadamente rápido desarrollado en la Universidad de Berkeley que mantiene los datos en la memoria del clúster; Apache Drill [Dri12] es un sistema distribuido para el análisis interactivo de conjuntos de datos de gran escala; D3.js [D3.12] es una librería JavaScript que permite manipular documentos de gran tamaño; HCatalog [HCa13] es un entorno de gestión de tablas y metadados. En el campo de la MD y el Machine Learning, Mahout es una librería Java optimizada para funcionar sobre Hadoop, cuya ventaja es que dispone de gran número de algoritmos implementados para trabajar sobre distintos aspectos de MD y Machine Learning, como el agrupamiento, las reglas de asociación, la clasificación o los sistemas de recomendación. En este proyecto se pretende la implantación y explotación de un entorno que incorpore algoritmos de minería de datos para resolver problemas de Big Data. El equipo de investigación posee una amplia experiencia en el desarrollo y aplicación de técnicas de MD y Machine Learning, como se puede observar por los siguientes proyectos desarrollados en este área: Nuevas tendencias en el diseño evolutivo de sistemas difusos y redes neuronales de función de base radial: desarrollo de algoritmos y aplicaciones a medicina, e-learning y marketing. Proyecto de excelencia de la Junta de Andalucía. P08-TIC Duración: 04/2009 a 04/2013. KEEL-CTNC: Descubrimiento de subgrupos evolutivo. RBFNs evolutivas. Sistemas Difusos genéticos. Aprendizaje basado en programación Genética para problemas de alta dimensionalidad. Proyecto del Plan Nacional de I+D del Ministerio de Ciencia y Tecnología. TIN C Duración: 01/2009 a 12/2011. Minería de datos aplicada al estudio de pacientes con tentativas suicidas. Caso de estudio: servicio de urgencias psiquiátricas del Hospital Doce de Octubre de Madrid. Plan propio de la Universidad de Jaén. UJA_07_16_07. Duración: 06/2008 a 06/2010. KEEL II: desarrollo de modelos evolutivos de extracción de reglas descriptivas e interpretables. Selección evolutiva de instancias y características. Redes neuronales evolutivas de función de base radial. Proyecto del Plan Nacional de I+D del Ministerio de Ciencia y Tecnología. TIN C Duración: 12/2005 a 12/2008. Desarrollo de modelos de selección de características y multiclasificadores evolutivos en el entorno KEEL. Proyecto del Plan Nacional de I+D del Ministerio de Ciencia y Tecnología. TIC C Duración: 12/2002 a 12/2005.

54 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA El equipo de investigación también tiene experiencia en la aplicación a problemas reales como los que se pretenden abordar en el proyecto, como lo demuestran algunos trabajos ya publicados: C. J Carmona, C. Chrysostomou, H. Seker, M.J. del Jesus. Fuzzy rules for describing subgroups form Influenza A virus using a multi-objective evolutionary algorithm. Applied Soft Computing 13 (2013) A.J. Rivera, B. García-Domingo, M.J. Del Jesus, J. Aguilera. Characterization of concentrating photovoltaic modules by cooperative competitive radial basis function networks. Expert Systems with applications 40(5) (2013) Bibliografía: [Agr11] D. Agrawal, S. Das and A. El Abbadi. Big Data and Cloud Computing: Current State and Future Opportunities. In Proceedings of the 14th International Conference on Extending Database Technology (EDBT/ICDT '11), pages , 2011 [Ber10] F. Berlanga, A. Rivera, M.J. Del Jesus, F. Herrera. GP-COACH: Genetic programming-based learning of compact and accurate fuzzy rulee-based classification systems for high dimensional problems. Information Sciences 180(8): , [Can05] J.R. Cano, F. Herrera, M. Lozano, Stratification for scaling up evolutionary prototype selection. Pattern Recognition Letters, 26(7): , [D3.12] [Dea04] J. Dean and S. Ghemawat. MapReduce: simplified data processing on large clusters. In OSDI, pages , [Dri12] [Fay96] U. Fayyad, G. Piatetsky-Shapiro, P. Smyth. From Data Mining to Knowledge Discovery in Databases. AI Magazine 17(3): 37 54, [Gar08] S. García, J.R. Cano, F. Herrera, A memetic algorithm for evolutionary prototype selection: A scaling up approach. Pattern Recognition 41(8): , [Had09] The Apache Hadoop Project [Har09] A. de Haro-García, N. García-Pedrajas, A divide-and conquer recursive approach for scaling up instance selection algorithms. Data Mining and Knowledge Discovery, 18(3) , [HCa13] [Pro99] F.J. Provost, V. Kolluri, A survey of methods for scaling up inductive algorithms. Data Mining and Knowledge Discovery, 3(2): , [Rob09] I. Robles, R. Alcalá, J.M. Benítez, F. Herrera. Evolutionary Parallel and Gradually Distributed Lateral Tuning of Fuzzy Rule-Based Systems. Evolutionary Intelligence 2: 5-19, 2009 [Spa12]

55 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA 2. Objetivos (concretar qué se pretende con el proyecto) El objetivo de este proyecto es la implantación de un entorno que permita afrontar problemas de MD en un entorno de Big Data. Este objetivo principal se estructura en los siguientes objetivos específicos: En primer lugar será necesario realizar una revisión sobre herramientas disponibles que se puedan utilizar para el objetivo del proyecto. Hoy por hoy, la herramienta más completa y que aporta más algoritmos de minería de datos es Apache Mahout, pero no se descarta que del resultado de este análisis se opte por otra u otras de las herramientas estudiadas. Después del análisis y la decisión de la herramienta a utilizar, se realizará la implementación de la herramienta sobre el clúster del grupo de investigación. Una vez implantado el entorno, en una primera fase se aplicará para la resolución de problemas de MD a problemas de Medicina, Marketing, Bioinformática, etc. sobre conjuntos de datos no correspondientes a la categoría de Big Data, para evaluar su rendimiento y efectividad. La segunda fase de la experimentación abordará problemas de Big Data, sobre conjuntos de datos reales, para tareas de minería de datos tanto descriptiva como predictiva. Se aplicarán a problemas reales de Medicina y genética o en el campo de las energías renovables. 3. Descripción de la experiencia a desarrollar (exponer de forma concisa el proyecto que se pretende desarrollar y la organización interna que se va a adoptar) De acuerdo con la descripción de los objetivos, el proyecto se afrontará a través de distintas fases, que se describen a continuación: Estudio de distintas alternativas de entornos que permitan la aplicación de técnicas de minería de datos para resolución de problemas de Big Data. Implantación del sistema de MD sobre Big Data,. Para esta fase, será necesaria la contratación de un técnico, con formación de titulado superior en Informática. Aplicación del entorno a problemas de MD sobre conjuntos de datos tradicionales que no pertenecen a la categoría de Big Data. En esta fase, el equipo de investigación aplicará las soluciones de MD disponibles en el entorno implementado a problemas ya abordados con otras técnicas MD, para evaluar el funcionamiento y efectividad del entorno, y comparar sus resultados.

56 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA Aplicación del entorno implantado a problemas de MD sobre Big Data. En esta fase se afrontarán nuevos problemas de Big Data que no se podrían tratar con las técnicas tradicionales. Se aplicará a problemas reales de alta dimensionalidad, dentro de las líneas de interés de la convocatoria, en el campo de la Medicina y genética (Bioinformática y biomedicina) como clasificación y descripción de secuencias de ADN y proteínas para enfermedades del tipo de gripe A y variantes, con problemas de alta dimensionalidad relacionados con enfermedades psiquiátricas, o en el campo de las energías renovables con flujos continuos de datos de alta dimensionalidad cuyo objetivo es caracterizar y predecir el rendimiento en módulos de energía solar fotovoltaica de concentración. Para la realización de estos trabajos, el equipo del proyecto se organizará en los siguientes grupos de trabajo: a) Tarea 1: Análisis de entornos de Big Data. a. Responsable: Pedro González b. Miembros: Resto del equipo b) Tarea 2: Implantación a. Responsable: Pedro González b. Miembros: Personal Técnico Contratado Resto del equipo c) Tarea 3: Experimentación Minería de Datos a. Responsable: Salvador García b. Miembros: José Joaquín Aguilera María José Gacto María José del Jesus Francisco Martínez Elisabet Parras d) Tarea 4: Experimentación Big Data a. Responsable: Alberto Fernández b. Miembros: Francisco Charte Pedro González María Dolores Pérez Antonio Jesús Rivera

57 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA 4. Alcance del proyecto (indicar el alcance del proyecto ) De acuerdo con lo anterior, el proyecto se abordará mediante el siguiente conjunto de tareas: Tarea 1: Estudio y análisis de alternativas de herramientas de Big Data Duración: 1 mes Subtareas: 1.1. Estudio y revisión bibliográfica sobre Big Data Recopilación de información sobre entornos disponibles para abordar problemas de Big Data Análisis comparativo de las características y requerimientos de los distintos entornos para Big Data Elección del entorno a implantar. Tarea 2: Implantación del sistema de MD sobre Big Data. Duración: 5 meses Subtareas: 2.1. Análisis de requerimientos técnicos para la implantación del entorno sobre el clúster del grupo de investigación Implantación del entorno Prueba y depuración del entorno. Tarea 3: Aplicación del entorno a problemas de MD ya resueltos con otras técnicas y comparación de los resultados. Duración: 4 meses Subtareas: 3.1. Selección de problemas a resolver Realización de la experimentación Comparación de resultados y obtención de conclusiones. Tarea 4: Aplicación del entorno a problemas de MD sobre Big Data con conjuntos de datos disponibles y sobre problemas reales. Duración: 5 meses Subtareas: 4.1. Selección de los problemas a resolver Realización de la experimentación Recopilación de resultados y obtención de conclusiones.

58 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA Estas tareas se desarrollarán de acuerdo con el siguiente cronograma: Tarea 1 Tarea 2 Tarea 3 Tarea 4 5. Material y métodos (describir la metodología que se va a seguir) Para el desarrollo del proyecto, será necesario en primer lugar la contratación de un técnico con titulación superior en Informática, que realizará la implantación sobre del entorno seleccionado. La contratación será por una duración de 5 meses, de acuerdo con la duración estimada de la tarea correspondiente. El entorno será implantado sobre el clúster del que dispone el grupo de investigación, compuesto por un total de 19 máquinas de altas prestaciones, con 2 y 4 procesadores. La metodología propuesta tiene una doble perspectiva, teórica y práctica. En la vertiente práctica, se analizarán los problemas, técnicas y algoritmos de MD para su utilización en el entorno de Big Data implantado. En el aspecto teórico, el método de estudio a seguir es el habitual método científico: Formulación de hipótesis, que en nuestro caso implica la aplicación de algoritmos de MD a problemas tanto tradicionales como de Big Data. Recogida de observaciones, que en nuestro contexto supone recopilar los resultados obtenidos en las distintas experimentaciones. Contraste de hipótesis con las observaciones, es decir, comparación de los resultados obtenidos por las distintas técnicas empleadas en la experimentación. Y finalmente, readaptación de las hipótesis iniciales a la luz de los resultados obtenidos, que implicará el refinamiento del procedimiento empleado a la luz de las pruebas realizadas y la experiencia acumulada.

59 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA 6. Resultados esperados (comentar los resultados que se esperan obtener, en especial como se adaptarán los mismos al objeto de la convocatoria y las obligaciones de los participantes) Como primer resultado del proyecto, se dispondrá de una instalación de un entorno para aplicar a problemas de MD sobre Big Data, que estará disponible en el clúster del grupo de investigación. Este entorno permitirá además afrontar futuros problemas en el entorno de la MD sobre problemas de Big Data. Todos los miembros del equipo de investigación colaborarán en la consecución de este resultado. Un segundo grupo de resultados vendría de la aplicación a problemas reales de alta dimensionalidad, que están dentro de las líneas de interés de la convocatoria, como problemas reales del campo de la Medicina y la Genética (Bioinformática, Biomedicina), como clasificación y descripción de secuencias de ADN y proteínas para enfermedades del tipo de gripe A y variantes, con problemas de alta dimensionalidad relacionados con enfermedades psiquiátricas, o en el campo de las energías renovables con flujos continuos de datos de alta dimensionalidad. Además, como resultado de las experimentaciones realizadas sobre problemas de minería de datos tradicionales y de Big Data, los miembros de los subequipos responsables de cada tarea colaborarán para la publicación de los resultados obtenidos en revistas y/o congresos científicos. Estos trabajos muestran además la capacidad de transferencia de conocimiento del grupo y las posibilidades futuras que podría tener el entorno Big Data implantado. 7. Experimentación prevista (describir la experimentación que se propone realizar) La experimentación que se propone realizar en este proyecto consistirá en la aplicación de las técnicas de MD disponibles en el entorno de Big Data implementado a conjuntos de datos, tanto disponibles públicamente (conjuntos de datos UCI, conjuntos de datos disponibles en el proyecto Keel a través de la web u otros) como conjuntos de datos de alta dimensionalidad de los que dispone el grupo de investigación en el campo Bioinformática y Biomedicina (como clasificación y descripción de secuencias de ADN y proteínas para enfermedades del tipo de gripe A y variantes), en el campo de la Medicina (con problemas de alta dimensionalidad relacionados con enfermedades psiquiátricas), o en el campo de las energías renovables con flujos continuos de datos de alta dimensionalidad cuyo objetivo es caracterizar y predecir el rendimiento en módulos de energía solar fotovoltaica de concentración.

60 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA 8. Presupuesto solicitado y su distribución (indicar el presupuesto solicitado, desglosado en sus capítulos de gastos) El presupuesto global del proyecto asciende a 5144,90 euros, que se dedicará a la contratación de un Titulado Superior en Informática durante 5 meses, para la realización de la tarea de implementación del entorno de MD para problemas de Big Data. De esta forma, el presupuesto se desglosa de la siguiente forma: Contratación de Titulado Superior en Informática, durante 5 meses, a tiempo parcial (19 horas por semana): o Sueldo bruto por jornada a tiempo parcial (19 horas semanales) 1.525,84 / 37,5 horas * 19 horas = 773,09 /mes o Seguros sociales (33,10% del sueldo bruto, por jornada a tiempo parcial) 773,09 * 33,1 / 100 = 255,89 /mes o Importe total (5 meses de sueldo bruto más seguros sociales) 5 * (773, ,89 ) = 5114,90 9. Observaciones y comentarios (comentar aspectos no incluidos en los demás apartados)

61 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA CONVOCATORIA DE PROYECTOS DE INVESTIGACION CENTRO DE ESTUDIOS AVANZADOS TIC DE LA UNIVERSIDAD DE JAEN SOLICITUD LÍNEA DE INVESTIGACION (de la convocatoria): Desarrollo, innovación y adopción de SOLUCIONES Y TECNOLOGÍAS ligadas a (ii): Open/Linked/Big Data Título del proyecto: Captura y procesamiento de grandes volúmenes de datos provenientes de varias fuentes de micro-blogging Objetivos y Resumen del proyecto: El objetivo principal de la presente propuesta es el estudio y desarrollo de métodos y procesos para la extracción y el procesamiento de grandes volúmenes de datos con orientación semántica y facilitar de esta forma el análisis de textos provenientes de flujos de texto de la red social, incorporando al grupo de una infraestructura adecuada. Además, posibilitaría la adecuación de nuestras técnicas y métodos al tratamiento de datos masivos (Big Data) y la generación de nuevo conocimiento para ser incorporado en la gran red de datos enlazados abiertos (Open Linked Data). Grupo TIC solicitante: SINAI (TIC 209) Componentes del grupo Nombre y apellidos Departamento Grupo TIC Firma Inv. Principal: Manuel Carlos Díaz Galiano Informática SINAI Componentes: 1. L. Alfonso Ureña López Informática SINAI 2. María Teresa Martín Valdivia Informática SINAI 3. Manuel García Vega Informática SINAI 4. Arturo Montejo Ráez Informática SINAI 5. Fernando Martínez Santiago Informática SINAI 6. Miguel Ángel García Cumbreras Informática SINAI 7. Eugenio Martínez Cámara Informática SINAI

62 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA Dirección de la coordinación Nombre: Manuel Carlos Díaz Galiano Dirección postal: Despacho A Universidad de Jaén. Campus Las Lagunillas Jaén (Spain) Teléfono: FAX: (imprescindible):

63 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA MEMORIA (máximo 3000 palabras) 1. Introducción (justificación del proyecto, contexto, experiencias previas, bibliografía ) La información producida en este año en el mundo es superior a toda la registrada por toda la humanidad desde sus albores. Cuando en 2004 finalizó el proyecto europeo DataGRID [1], se estimaba que el volumen de información generado por el Gran Colisionador de Hadrones (siglas LHC en inglés) sería el experimento que mayor volumen de datos generaría en la historia, preparando tecnologías para poder albergar los miles de petabytes derivados de cada colisión de partículas para posterior filtrado, distribución y, por supuesto, análisis. Gracias a estas tecnologías hemos podido descubrir nuevas partículas, como el bosón de Higgs. Pero cuatro años después empezamos a ser conscientes de que en la gran red de redes, Internet, es donde crecen los datos de forma masiva a medida que los usuarios pasan de ser meros consumidores a activos productores de información, los dispositivos se conectan para permitir acceder a sus datos, las corporaciones y organizaciones ponen a disposición del gran público sus bases de datos o que los distintos sensores (GPS, cámaras, etc.) acceden a la red mediante aplicaciones que, periódicamente, diseminan por el mundo sus estados. De esta forma, hemos llegado a alcanzar la creación de 2,5 trillones de bytes diarios en 2012 [2], y vamos doblando la información almacenada cada poco más de tres años [3]. Iniciativas como Open Linked Data [4] buscan crear una nueva dimensión sobre la web actual para, mediante los protocolos y estándares que consensúa el consorcio de la WWW, establecer una red semántica de datos que nos lleve a un modelo de conocimiento global. Este proyecto se ha convertido en fuente de información para multitud de proyectos científicos y aplicaciones actuales, suponiendo un recurso valioso en evolución y constante crecimiento. Otros servicios, como Twitter, han ido más allá de un uso directo, sirviendo de plataforma de datos de probada solvencia en tareas de predicción como la expansión de la gripe A [5], la recaudación de taquilla para estrenos en salas de cine [6] o los movimientos en bolsa [7]. Este último trabajo va más allá de los modelos de regresión y predicción estadísticos, realizando un análisis semántico profundo de los mensajes para extraer información de tipo emocional que permitan establecer la orientación polar (positividad o negatividad) de los micro-textos. En este sentido, nuestro grupo de investigación SINAI (Sistemas Inteligentes de Acceso a la Información) lleva trabajando en los últimos años en el Análisis de Opiniones y Emociones [8], con Twitter como plataforma principal [9]. Mediante la captura y filtrado de tweets podemos generar nuevos recursos, en distintos idiomas, que permitan el análisis emocional de textos, así como el seguimiento de entidades (empresas, políticos, productos ) revelando la evolución de la opinión que sobre las mismas tiene la población en general o determinados sectores. Esto ha llevado a incrementar las necesidades de recursos por parte de nuestro grupo de investigación, siendo el presente proyecto la forma de adaptar nuestras infraestructuras a las necesidades tecnológicas que el grupo demanda en función a las líneas de investigación en marcha. Lograríamos así poder llevar nuestros métodos y técnicas a un entorno propicio para el procesamiento de lo que se ha dado a conocer como Big Data, sobre todo desde fuentes como Twitter [10].

64 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA Es importante remarcar que la mayoría de la comunidad investigadora en Tecnologías del Lenguaje Humano ha comenzado a migrar hacia este tipo de infraestructuras, por lo que la Universidad de Jaén no puede quedarse atrás en este nuevo camino que la realidad de la red ha marcado. Referencias. 1. Lamanna, M. (2004). The LHC computing grid project at CERN. Nuclear Instruments and Methods in Physics Research Section A: Accelerators, Spectrometers, Detectors and Associated Equipment, 534(1), Lohr, S. (2012). The age of big data. New York Times, M. Hilbert, P. López. The World s Technological Capacity to Store, Communicate, and Compute Information. Science 1 April 2011: 332 (6025), Heath, T., & Bizer, C. (2011). Linked data: Evolving the web into a global data space. Synthesis lectures on the semantic web: theory and technology, 1(1), Ritterman, J., Osborne, M., & Klein, E. (2009, November). Using prediction markets and Twitter to predict a swine flu pandemic. In 1st international workshop on mining social media. 6. Asur, S., & Huberman, B. A. (2010, August). Predicting the future with social media. In Web Intelligence and Intelligent Agent Technology (WI-IAT), 2010 IEEE/WIC/ACM International Conference on (Vol. 1, pp ). IEEE. 7. Bollen, J., Mao, H., & Zeng, X. (2011). Twitter mood predicts the stock market.journal of Computational Science, 2(1), M Rushdi Saleh, MT Martín-Valdivia, A Montejo-Ráez, LA Ureña-López (2011). Experiments with SVM to classify opinions in different domains. Expert Systems with Applications 38 (12), E. Martínez-Cámara, M.T. Martín-Valdivia, L.A. Ureña-López, A. Montejo-Ráez (2013). Sentiment analysis in Twitter. Natural Language Engineering 1 (1), Kumar, Shamanth, Morstatter, Fred, and Huan Liu. Twitter Data Analytics. Springer, Objetivos (concretar qué se pretende con el proyecto) El objetivo principal de la presente propuesta es el estudio y desarrollo de métodos y procesos para la extracción y el procesamiento de grandes volúmenes de datos con orientación semántica y facilitar de esta forma el análisis de textos provenientes de flujos de texto de la red social, incorporando al grupo de una infraestructura adecuada. Además, posibilitaría la adecuación de nuestras técnicas y métodos al tratamiento de datos masivos (Big Data) y la generación de nuevo conocimiento para ser incorporado en la gran red de datos enlazados abiertos (Open Linked Data). Este gran objetivo se desglosa en los siguientes sub-objetivos: 1. Formación y capacitación del personal investigador, mediante a la asistencia a congresos y simposios relacionados con el Big Data y el Open Linked Data 2. Instalación y configuración de equipos de almacenamiento y procesamiento escalables y de gran capacidad (estaciones NAS). 3. Adecuación de nuestras tecnologías a plataformas de datos masivos como Hadoop 1 1

65 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA 4. Adaptación de nuestros algoritmos y bibliotecas a operaciones de tipo Map/Reduce para el acceso y procesamiento de grandes volúmenes de información 5. Implementación de filtros de captura y extracción de información desde la web social 6. Implementación de una plataforma de acceso a los datos para su uso por parte de los investigadores del grupo en las distintas tareas de Procesamiento de Lenguaje Natural en marcha, principalmente para Análisis de Emociones y Minería de Opiniones. 3. Descripción de la experiencia a desarrollar (exponer de forma concisa el proyecto que se pretende desarrollar y la organización interna que se va a adoptar) Con el presente proyecto pretendemos capturar y procesar grandes volúmenes de datos provenientes de varias fuentes de micro-blogging en la red social, haciendo uso de la infraestructura adecuada. Para ello se establecen tres fases bien diferenciadas: capacitación, creación de infraestructuras y adecuación de tecnologías. Capacitación. Gracias a la configuración virtual de nuestros servidores, podemos añadir sistemas de almacenamiento en red (Networked Attached Storage) y servidores especializados en el procesamiento escalable de grandes volúmenes de información. Para ello es necesario que miembros del grupo se formen en la instalación y configuración de estas tecnologías. Es muy conveniente también participar en los foros especializados que sobre almacenamiento para datos abiertos y enlazados tienen lugar, así como aquellos que proponen tareas específicas de PLN en este paradigma, como los workshops MABSDA 2 (Multidisciplinary Approaches to Big Social Data Analysis), RAMSS 3 (Real-Time Analysis and Mining of Social Streams) o WASSA 4 (Computational Approaches to Subjectivity and Sentiment Analysis). Infraestructuras. Es necesario, por tanto, disponer de dichos servidores NAS, así como instalar y configurar paquetes software basados en Hadoop y derivados: sistemas de bases de datos NoSQL 5 como CouchDB 6, que permitan un acceso eficiente a los datos. La instalación y configuración de estas tecnologías correrá a cargo de un reducido número de investigadores del grupo (de dos a tres miembros). Adecuación y explotación. Toda vez que el grupo disponga de estos servicios en operación, será posible desarrollar nuevo software y adaptar el software desarrollado en el seno del mismo para el aprovechamiento de estas tecnologías. Se permitirá de esta manera dar acceso a todo el grupo para pasar de trabajar sobre colecciones de datos controladas y limitadas a colecciones de datos masivas gracias a la captura continuada de flujos desde la web social, permitiendo la puesta en marcha de nuevas aplicaciones y técnicas. Es en esta fase cuando todos los investigadores del grupo podrán adecuar sus desarrollos a la nueva plataforma, así como comenzar a trabajar en líneas de investigación vetadas al grupo por las limitaciones de infraestructura

66 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA 4. Alcance del proyecto (indicar el alcance del proyecto ) El proyecto que se presenta tiene un alcance a corto y largo plazo, que se detalla a continuación: Grupo de investigación SINAI en sus líneas principales. La infraestructura hardware y software será explotada por todos los miembros del grupo SINAI, pues el tratar con conjuntos de datos de tamaño medio-grande es ya una constante en nuestras líneas de investigación. Proyectos en marcha del grupo de investigación. Asimismo, se permitirá su uso por parte de los investigadores colaboradores junto con los que suscribimos proyectos de investigación a nivel nacional y europeo. Esta plataforma y la adaptación de nuestras herramientas a la misma serían de gran utilidad en los mismos, esperando no sólo mejores resultados sino un incremento notable en cuanto a rendimiento y velocidad de procesamiento. El sistema desarrollado y las tecnologías propias adaptadas al mismo quedarían reflejados en la producción científica del grupo a nivel nacional e internacional. 5. Material y métodos (describir la metodología que se va a seguir) La metodología ya ha sido someramente esbozada en apartados anteriores. Podemos establecer tres fases: 1. Capacitación: Formación y participación en foros para el desarrollo de tecnologías del lenguaje humano sobre el paradigma de los datos masivos en Internet (Big Data) y su anexión a la red de datos abiertos (Open Linked Data). 2. Infraestructuras: Creación de una infraestructura hardware y software para la investigación, dentro de las líneas propias del grupo. 3. Adecuación y explotación: Adaptación de nuestros algoritmos y desarrollos a la nueva plataforma, posibilitando su explotación en las experimentaciones futuras. Los recursos necesarios se circunscriben a presupuesto para la participación en los foros señalados y la adquisición de hardware de almacenamiento. El grupo, dentro de una política de austeridad, apostará por software de código abierto para la instalación y configuración de los sistemas a explotar. Según las fases anteriormente descritas, las principales tareas a realizar en este proyecto son: M1. Capacitación. M2. Infraestructuras: T1. Análisis de alternativas T2. Adquisición y configuración de equipos T3. Instalación y prueba de plataformas. M3. Adecuación y explotación: T1. Selección de algoritmos de TLH T2. Diseño, implementación y pruebas T3. Experimentación. M4. Seguimiento y coordinación. 6

67 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA A continuación se presenta la planificación temporal de las tareas expuestas anteriormente. La duración total del proyecto se ha estimado en 18 meses. M1 M2 M2.T1 M2.T2 M2.T3 M3 M3.T1 M3.T2 M3.T3 M Resultados esperados (comentar los resultados que se esperan obtener, en especial como se adaptarán los mismos al objeto de la convocatoria y las obligaciones de los participantes) Para ser concretos en cuanto a los resultados esperados, podemos establecer lo siguiente: 1. Asistencia, al menos, tres congresos sobre Tecnologías del Lenguaje Humano dentro de los paradigmas del Big Data y el Open Linked Data. 2. Disponibilidad de una base de datos NoSQL para el almacenamiento de flujos de texto desde Internet, con una capacidad superior a los 10 Terabytes. 3. Publicaciones en revistas con índice de impacto sobre la experimentación realizada aprovechando estas infraestructuras. 7. Experimentación prevista (describir la experimentación que se propone realizar) Las baterías de experimentos previstas contemplan tanto la validación de las tecnologías actuales sobre la nueva plataforma como el desarrollo de nuevos algoritmos para el Análisis de Opiniones sobre el pilar de los datos masivos. En concreto, podemos comentar los siguientes experimentos planificados: 1. Seguimiento de entidades en Twitter. Filtrado de flujos de micro-publicaciones en Twitter, identificación de entidades (personas, empresas, productos, campañas promocionales ) 2. Detección de la polaridad sobre dichos flujos, calculando la orientación semántica emocional de los mismos, caracterizando de esta manera la opinión de los usuarios en torno a las entidades bajo monitorización

68 Convocatoria de Proyectos de Investigación 2013 Del Centro de Estudios Avanzados TIC de la UJA 3. Aplicación de los indicadores obtenidos mediante los procesos anteriores sobre tareas de orientación política y predicción de ventas de productos. 8. Presupuesto solicitado y su distribución (indicar el presupuesto solicitado, desglosado en sus capítulos de gastos) Asistencia a talleres y foros especializados 3,500 Servidor de almacenamiento NAS 1,500 TOTAL 5, Observaciones y comentarios (comentar aspectos no incluidos en los demás apartados) El proyecto constituye un proceso de renovación crítico en las líneas experimentales del grupo, modernizando y potenciando nuestras infraestructuras. En una época donde los recortes presupuestarios están llevando a muchas líneas de investigación a un camino sin salida, confiamos en que este proyecto nos permitirá seguir avanzando a nuestro grupo para que éste siga siendo referente en el procesamiento del lenguaje natural en España.

El gasto total elegible de la BBPP, Centro de Supercomputación es de 3.172.033,11. La ayuda FEDER, es el 80%, 2.537.626,48

El gasto total elegible de la BBPP, Centro de Supercomputación es de 3.172.033,11. La ayuda FEDER, es el 80%, 2.537.626,48 Otra buena práctica de actuación cofinanciada es la presentada por la Dirección General de Telecomunicaciones de la Junta de Castilla y León consistente en las actuaciones realizadas en la Fundación Centro

Más detalles

Fecha de Bases reguladoras

Fecha de Bases reguladoras CONVOCATORIA AYUDAS ACCIÓN ESTRATÉGICA ECONOMÍA Y SOCIEDAD DIGITAL (AEESD) 2013-2016 Secretaría de Estado de Telecomunicaciones y para la Sociedad de la Información Fecha de Bases reguladoras Fecha de

Más detalles

MARCO DE COOPERACIÓN CON LAS UNIDADES DE INFORMÁTICA DISTRIBUIDAS

MARCO DE COOPERACIÓN CON LAS UNIDADES DE INFORMÁTICA DISTRIBUIDAS MARCO DE COOPERACIÓN CON LAS UNIDADES DE INFORMÁTICA DISTRIBUIDAS Concepción Hortigüela Hortigüela Directora de la Oficina de Planificación Estratégica y Relaciones Oficina de Planificación Estratégica

Más detalles

Y por consiguiente los firmantes acuerdan las siguientes cláusulas: CLÁUSULAS

Y por consiguiente los firmantes acuerdan las siguientes cláusulas: CLÁUSULAS CONVENIO DE COLABORACIÓN ENTRE EL MINISTERIO DE CIENCIA E INNOVACIÓN Y LA ENTIDAD PROMOTORA CAMPO NOMBRE ENTIDAD PROMOTORA, A LOS EFECTOS DE LA CONVOCATORIA 2010 DE INFRAESTRUCTURAS CIENTIFICO- TECNOLÓGICAS,

Más detalles

Centro Nacional de Referencia de Aplicación de las TIC basadas en fuentes abiertas. Un ejemplo práctico: Plataforma de Archivo electrónico

Centro Nacional de Referencia de Aplicación de las TIC basadas en fuentes abiertas. Un ejemplo práctico: Plataforma de Archivo electrónico Centro Nacional de Referencia de Aplicación de las TIC basadas en fuentes abiertas Un ejemplo práctico: Plataforma de Archivo electrónico Índice 1. Presentación del proyecto 2. Objetivos del proyecto 3.

Más detalles

Sistemas de Información Geográficos (SIG o GIS)

Sistemas de Información Geográficos (SIG o GIS) Sistemas de Información Geográficos (SIG o GIS) 1) Qué es un SIG GIS? 2) Para qué sirven? 3) Tipos de datos 4) Cómo trabaja? 5) Modelos de datos, Diseño Conceptual 6) GeoDataase (GD) 7) Cómo evaluamos

Más detalles

App para realizar consultas al Sistema de Información Estadística de Castilla y León

App para realizar consultas al Sistema de Información Estadística de Castilla y León App para realizar consultas al Sistema de Información Estadística de Castilla y León Jesús M. Rodríguez Rodríguez rodrodje@jcyl.es Dirección General de Presupuestos y Estadística Consejería de Hacienda

Más detalles

UNIVERSIDAD DE SALAMANCA

UNIVERSIDAD DE SALAMANCA UNIVERSIDAD DE SALAMANCA FACULTAD DE CIENCIAS INGENIERÍA TÉCNICA EN INFORMÁTICA DE SISTEMAS Resumen del trabajo práctico realizado para la superación de la asignatura Proyecto Fin de Carrera. TÍTULO SISTEMA

Más detalles

Consejería para la Igualdad y Bienestar Social Programa: 31G Bienestar Social

Consejería para la Igualdad y Bienestar Social Programa: 31G Bienestar Social DOCUMENTO DE ORIENTACIONES ESTRATÉGICAS Consejería para la Igualdad y Bienestar Social Programa: 31G Bienestar Social Dirección General de Servicios Sociales y Atención a las Drogodependencias Presentación

Más detalles

Las prácticas de excelencia

Las prácticas de excelencia Las prácticas de excelencia Se enmarcan en la existencia de estrategias dedicadas a la gestión del conocimiento interno de la organización, promoviendo iniciativas, a través de distintos instrumentos que

Más detalles

PROYECTO AUD-GRA. REALIZACIÓN DE AUDITORíAS ENERGÉTICAS EN 84 MUNICIPIOS DE LA PROVINCIA DE GRANADA

PROYECTO AUD-GRA. REALIZACIÓN DE AUDITORíAS ENERGÉTICAS EN 84 MUNICIPIOS DE LA PROVINCIA DE GRANADA PROYECTO AUD-GRA REALIZACIÓN DE AUDITORíAS ENERGÉTICAS EN 84 MUNICIPIOS DE LA PROVINCIA DE GRANADA Granada, Febrero de 2006 PROYECTO AUD-GRA PLAN DE ACTUACIÓN ENERGÉTICA MUNICIPAL Índice: 1 Introducción...

Más detalles

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI)

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) OFERTAS TECNOLÓGICAS 1) GESTIÓN ORGANIZACIONAL Y LOGÍSTICA INTEGRADA: TÉCNICAS Y SISTEMAS DE INFORMACIÓN 2) GESTIÓN

Más detalles

Elementos requeridos para crearlos (ejemplo: el compilador)

Elementos requeridos para crearlos (ejemplo: el compilador) Generalidades A lo largo del ciclo de vida del proceso de software, los productos de software evolucionan. Desde la concepción del producto y la captura de requisitos inicial hasta la puesta en producción

Más detalles

Planificación de Sistemas de Información

Planificación de Sistemas de Información Planificación de Sistemas de Información ÍNDICE DESCRIPCIÓN Y OBJETIVOS...1 ACTIVIDAD 1: INICIO DEL PLAN DE SISTEMAS DE INFORMACIÓN...4 Tarea 1.1: Análisis de la Necesidad del...4 Tarea 1.2: Identificación

Más detalles

Planificación de Sistemas de Información

Planificación de Sistemas de Información Planificación de Sistemas de Información ÍNDICE DESCRIPCIÓN Y OBJETIVOS... 1 ACTIVIDAD 1: INICIO DEL PLAN DE SISTEMAS DE INFORMACIÓN... 4 Tarea 1.1: Análisis de la Necesidad del... 4 Tarea 1.2: Identificación

Más detalles

Unidad 1. Fundamentos en Gestión de Riesgos

Unidad 1. Fundamentos en Gestión de Riesgos 1.1 Gestión de Proyectos Unidad 1. Fundamentos en Gestión de Riesgos La gestión de proyectos es una disciplina con la cual se integran los procesos propios de la gerencia o administración de proyectos.

Más detalles

PROTOCOLO DE EVALUACIÓN PARA LA VERIFICACIÓN DE TÍTULOS OFICIALES (GRADO Y MÁSTER)

PROTOCOLO DE EVALUACIÓN PARA LA VERIFICACIÓN DE TÍTULOS OFICIALES (GRADO Y MÁSTER) PROTOCOLO DE EVALUACIÓN PARA LA VERIFICACIÓN DE TÍTULOS OFICIALES (GRADO Y MÁSTER) V.01.02/12/10 Página 2 de 17 Para facilitar la labor que desarrollan los evaluadores, nombrados por AGAE, en el proceso

Más detalles

Convocatoria de Acciones de Apoyo a la Transferencia de Tecnología y Conocimiento

Convocatoria de Acciones de Apoyo a la Transferencia de Tecnología y Conocimiento 4 de octubre de 2012 Convocatoria de Acciones de Apoyo a la Transferencia de Tecnología y Conocimiento El proyecto del programa CONSOLIDER INGENIO 2010 convoca acciones de apoyo para el desarrollo de proyectos

Más detalles

Gestión de Configuración del Software

Gestión de Configuración del Software Gestión de Configuración del Software Facultad de Informática, ciencias de la Comunicación y Técnicas Especiales Herramientas y Procesos de Software Gestión de Configuración de SW Cuando se construye software

Más detalles

DISPOSICIONES GENERALES. En primer lugar se determina que la UNED contará para realizar sus funciones y competencias con:

DISPOSICIONES GENERALES. En primer lugar se determina que la UNED contará para realizar sus funciones y competencias con: LA ESTRUCTURA ACADÉMICA DE LA UNED II. INSTITUTOS UNIVERSITARIOS DE INVESTIGACIÓN. CENTRO ADSCRITOS Y SERVICIOS DE ASISTENCIA A LA COMUNIDAD UNIVERSITARIA. En desarrollo del Capítulo I del Título II de

Más detalles

ayud@tec Sistema de Información de Gestión de Ayudas Públicas

ayud@tec Sistema de Información de Gestión de Ayudas Públicas ayud@tec Sistema de Información de Gestión de Ayudas Públicas ` Por Javier Bances Villaamil Subsecretaría del Ministerio de Industria, Turismo y Comercio S. G. de Tecnologías de la Información y de las

Más detalles

Bechtle Solutions Servicios Profesionales

Bechtle Solutions Servicios Profesionales Soluciones Tecnología Bechtle Solutions Servicios Profesionales Fin del servicio de soporte técnico de Windows Server 2003 No hacer nada puede ser un riesgo BECHTLE Su especialista en informática Ahora

Más detalles

2.11.1 CONTRATAS Y SUBCONTRATAS NOTAS

2.11.1 CONTRATAS Y SUBCONTRATAS NOTAS NOTAS 1 Cuando en un mismo centro de trabajo desarrollen actividades trabajadores de dos o más empresas, éstas deberán cooperar en la aplicación de la normativa sobre prevención de riesgos laborales. A

Más detalles

Plataforma inteligente de gestión dinámica de flujos de tráfico. Universidad de Málaga Lynka

Plataforma inteligente de gestión dinámica de flujos de tráfico. Universidad de Málaga Lynka Plataforma inteligente de gestión dinámica de flujos de tráfico Universidad de Málaga Lynka 1 2 Plataforma inteligente de gestión dinámica de flujos de tráfico 3 Agencia de Obra Pública de la Junta de

Más detalles

COMPETENCIAS. Máster universitario en Gestión y Dirección de Empresas e Instituciones Turísticas (GDEIT)

COMPETENCIAS. Máster universitario en Gestión y Dirección de Empresas e Instituciones Turísticas (GDEIT) COMPETENCIAS Máster universitario en Gestión y Dirección de Empresas e Instituciones Turísticas (GDEIT) COMPETENCIAS GENERALES Y BÁSICAS En términos amplios, el Máster en GDEIT se dirige a profundizar

Más detalles

Otra Buena práctica es la presentada por el Consejo Superior de Cámaras Programa Plan de Desarrollo Tecnológico

Otra Buena práctica es la presentada por el Consejo Superior de Cámaras Programa Plan de Desarrollo Tecnológico Otra Buena práctica es la presentada por el Consejo Superior de Cámaras Programa Plan de Desarrollo Tecnológico Esta operación tiene un Coste Elegible total de 15.727.532 Con una Ayuda FEDER de 12.582.026,

Más detalles

3 er premio Categoría de instituciones, organizaciones y centros. Programa Remote Controler para la empleabilidad juvenil

3 er premio Categoría de instituciones, organizaciones y centros. Programa Remote Controler para la empleabilidad juvenil 3 er premio Categoría de instituciones, organizaciones y centros Programa Remote Controler para la empleabilidad juvenil autores: Jorge García, José Manuel Pascual y María Robles de SEAS, Estudios Superiores

Más detalles

COORDINACION DE FORTALECIMIENTO DE GOBIERNO ELECTRONICO EGOB 3.0 PLAN DE ACCION EGOB 3.0

COORDINACION DE FORTALECIMIENTO DE GOBIERNO ELECTRONICO EGOB 3.0 PLAN DE ACCION EGOB 3.0 PLAN DE ACCION EGOB 3.0 1 PLAN DE ACCION PARA LA PRESENCIA WEB DE GOBIERNO ELECTRONICO, LA EFICIENCIA DE SERVICIOS PUBLICOS ELECTRONICOS Y DEL CUMPLIMIENTO A LOS COMPROMISOS ADQUIRIDOS POR EL ESTADO DE

Más detalles

PLAN DIRECTOR DE SERVICIOS MÓVILES DE VALOR AÑADIDO EN LA ADMINISTRACIÓN PÚBLICA

PLAN DIRECTOR DE SERVICIOS MÓVILES DE VALOR AÑADIDO EN LA ADMINISTRACIÓN PÚBLICA PLAN DIRECTOR DE SERVICIOS MÓVILES DE VALOR AÑADIDO EN LA ADMINISTRACIÓN PÚBLICA Manager LaneFour Strategy & Management Manager LaneFour Strategy & Management Palabras clave Plan Director, Mobile Government/Administración

Más detalles

Proceso: AI2 Adquirir y mantener software aplicativo

Proceso: AI2 Adquirir y mantener software aplicativo Proceso: AI2 Adquirir y mantener software aplicativo Se busca conocer los estándares y métodos utilizados en la adquisición de y mantenimiento del software. Determinar cuál es proceso llevado a cabo para

Más detalles

PE06. RESPONSABILIDAD SOCIAL

PE06. RESPONSABILIDAD SOCIAL Índice 1. Objeto 2. Alcance 3. Referencias/Normativa 4. Definiciones 5. Desarrollo de los procesos 6. Seguimiento y Medición 7. Archivo 8. Responsabilidades 9. Flujograma ANEXOS: No proceden Edición Fecha

Más detalles

FOMENTO DEL VOLUNTARIADO

FOMENTO DEL VOLUNTARIADO BASES CONVOCATORIAS 2010 PARA ENTIDADES SOCIALES FOMENTO DEL VOLUNTARIADO El voluntariado social constituye una expresión de la solidaridad ciudadana con las personas de nuestra sociedad que sufren necesidades.

Más detalles

FUNDACIÓN DÉDALO PARA LA SOCIEDAD DE LA INFORMACIÓN. - Diagnóstico de Posicionamiento Digital -

FUNDACIÓN DÉDALO PARA LA SOCIEDAD DE LA INFORMACIÓN. - Diagnóstico de Posicionamiento Digital - FUNDACIÓN DÉDALO PARA LA SOCIEDAD DE LA INFORMACIÓN - Diagnóstico de Posicionamiento Digital - Tudela, mayo de 2008 1 ÍNDICE 1 ÍNDICE... 2 2 INTRODUCCIÓN... 3 3 OBJETIVOS... 4 4 EL SERVICIO... 6 4.1 DESCRIPCIÓN

Más detalles

ICTE NORMAS DE CALIDAD DE AGENCIAS DE VIAJES REGLAS GENERALES DEL SISTEMA DE CALIDAD. Ref-RG Página 1 de 9

ICTE NORMAS DE CALIDAD DE AGENCIAS DE VIAJES REGLAS GENERALES DEL SISTEMA DE CALIDAD. Ref-RG Página 1 de 9 Página 1 de 9 1 Página 2 de 9 SUMARIO 1. OBJETO 2. ALCANCE 3. DEFINICIONES 4. GENERALIDADES 5. NORMAS DE CALIDAD DE SERVICIO 6. ESTRUCTURA TIPO DE LAS NORMAS 7. MECANISMOS DE EVALUACIÓN 8. PONDERACIÓN

Más detalles

2 EL DOCUMENTO DE ESPECIFICACIONES

2 EL DOCUMENTO DE ESPECIFICACIONES Ingeniería Informática Tecnología de la Programación TEMA 1 Documentación de programas. 1 LA DOCUMENTACIÓN DE PROGRAMAS En la ejecución de un proyecto informático o un programa software se deben de seguir

Más detalles

Enginyeria del Software III

Enginyeria del Software III Enginyeria del Software III Sessió 3. L estàndard ISO/IEC 15504 Antònia Mas Pichaco 1 Introducción El proyecto SPICE representa el mayor marco de colaboración internacional establecido con la finalidad

Más detalles

INFORME METODOLÓGICO Y DE RESULTADOS

INFORME METODOLÓGICO Y DE RESULTADOS INFORME METODOLÓGICO Y DE RESULTADOS DE LA ACCIÓN DE INVESTIGACIÓN E INNOVACIÓN ESTUDIO PARA LA DEFINICIÓN DE CUALIFICACIONES BÁSICAS TRANSVERSALES EN LAS TRABAJADORAS Y TRABAJADORES DE BAJO NIVEL DE CUALIFICACIÓN

Más detalles

UF1138 Instalación y Puesta en Marcha de un Sistema de Control de Acceso y Presencia (Online)

UF1138 Instalación y Puesta en Marcha de un Sistema de Control de Acceso y Presencia (Online) UF1138 Instalación y Puesta en Marcha de un Sistema de Control de Acceso y Presencia TITULACIÓN DE FORMACIÓN CONTINUA BONIFICADA EXPEDIDA POR EL INSTITUTO EUROPEO DE ESTUDIOS EMPRESARIALES UF1138 Instalación

Más detalles

Plataformas virtuales

Plataformas virtuales Plataformas virtuales Índice Introducción 1 Qué es una plataforma virtual? 2 Para qué sirve una plataforma virtual? 3 Cómo se usa una plataforma virtual? 5 Tipos de plataformas virtuales 6 Conclusión

Más detalles

El universo en la palma de tu mano. www.dialogaquilt.com. El software de gestión para organizaciones políticas e instituciones

El universo en la palma de tu mano. www.dialogaquilt.com. El software de gestión para organizaciones políticas e instituciones El universo en la palma de tu mano www.dialogaquilt.com El software de gestión para organizaciones políticas e instituciones Quiénes somos? Dialoga es una empresa constituida por un equipo humano con un

Más detalles

Sistemas de Gestión de Calidad. Control documental

Sistemas de Gestión de Calidad. Control documental 4 Sistemas de Gestión de Calidad. Control documental ÍNDICE: 4.1 Requisitos Generales 4.2 Requisitos de la documentación 4.2.1 Generalidades 4.2.2 Manual de la Calidad 4.2.3 Control de los documentos 4.2.4

Más detalles

Introducción. Definición de los presupuestos

Introducción. Definición de los presupuestos P o r q u é e l p r e s u p u e s t o d e b e s e r e l c a m i n o a s e g u i r p a r a g a r a n t i z a r e l é x i t o d e s u e m p r e s a? Luis Muñiz Economista Introducción El aumento de la incertidumbre

Más detalles

Metodología básica de gestión de proyectos. Octubre de 2003

Metodología básica de gestión de proyectos. Octubre de 2003 Metodología básica de gestión de proyectos Octubre de 2003 Dentro de la metodología utilizada en la gestión de proyectos el desarrollo de éstos se estructura en tres fases diferenciadas: Fase de Éjecución

Más detalles

ISO 9001:2000 DOCUMENTO INFORMATIVO DOCUMENTO ELABORADO POR CHRISTIAN NARBARTE PARA EL IVECE

ISO 9001:2000 DOCUMENTO INFORMATIVO DOCUMENTO ELABORADO POR CHRISTIAN NARBARTE PARA EL IVECE ISO 9001:2000 DOCUMENTO INFORMATIVO DOCUMENTO ELABORADO POR CHRISTIAN NARBARTE PARA EL IVECE MARZO 2007 Este documento contesta las preguntas más frecuentes que se plantean las organizaciones que quieren

Más detalles

Norma ISO 14001: 2015

Norma ISO 14001: 2015 Norma ISO 14001: 2015 Sistema de Gestión Medioambiental El presente documento es la versión impresa de la página www.grupoacms.com Si desea más información sobre la Norma ISO 14001 u otras normas relacionadas

Más detalles

Informe de Seguimiento. Máster Universitario en Dirección y Administración de Empresas-MBA. Empresas-MBA de la Universidad de Málaga

Informe de Seguimiento. Máster Universitario en Dirección y Administración de Empresas-MBA. Empresas-MBA de la Universidad de Málaga Informe de Seguimiento Máster Universitario en Dirección y Administración de Empresas-MBA de la Universidad de Málaga 1. ÁMBITO NORMATIVO El artículo 27 del Real Decreto 1393/2007, de 29 de octubre, modificado

Más detalles

UNIVERSIDAD DE ORIENTE FACULTAD DE CIENCIAS ECONOMICAS

UNIVERSIDAD DE ORIENTE FACULTAD DE CIENCIAS ECONOMICAS UNIVERSIDAD DE ORIENTE FACULTAD DE CIENCIAS ECONOMICAS AUDITORIA DE SISTEMAS COMPUTACIONALES TIPOS DE AUDITORIA LIC. FRANCISCO D. LOVOS Tipos de Auditorías Auditoría de Base de Datos Auditoría de Desarrollo

Más detalles

El Consejo de Gobierno de esta Universidad, en su reunión celebrada el día 14 de octubre de 2008, ha adoptado el siguiente acuerdo:

El Consejo de Gobierno de esta Universidad, en su reunión celebrada el día 14 de octubre de 2008, ha adoptado el siguiente acuerdo: El Consejo de Gobierno de esta Universidad, en su reunión celebrada el día 14 de octubre de 2008, ha adoptado el siguiente acuerdo: 21.- PROPUESTA DE APROBACIÓN DEL PROYECTO DE DEPORTISTAS DE ALTO NIVEL

Más detalles

Gestión y Desarrollo de Requisitos en Proyectos Software

Gestión y Desarrollo de Requisitos en Proyectos Software Gestión y Desarrollo de Requisitos en Proyectos Software Ponente: María Jesús Anciano Martín Objetivo Objetivo Definir un conjunto articulado y bien balanceado de métodos para el flujo de trabajo de Ingeniería

Más detalles

Trabajo lean (1): A que podemos llamar trabajo lean?

Trabajo lean (1): A que podemos llamar trabajo lean? Trabajo lean (1): A que podemos llamar trabajo lean? Jordi Olivella Nadal Director de Comunicación del Instituto Lean Management Este escrito inicia una serie de artículos sobre la organización en trabajo

Más detalles

ANEXO EVALUACIÓN Y SEGUIMIENTO DEL PLAN DE EXTREMADURA. A. CRITERIOS RECTORES DEL PROCESO DE REVISIÓN DEL PLAN DE CAULIFICACIONES Y FP DE EXTREMADURA.

ANEXO EVALUACIÓN Y SEGUIMIENTO DEL PLAN DE EXTREMADURA. A. CRITERIOS RECTORES DEL PROCESO DE REVISIÓN DEL PLAN DE CAULIFICACIONES Y FP DE EXTREMADURA. ANEXO EVALUACIÓN Y SEGUIMIENTO DEL PLAN DE EXTREMADURA. A. CRITERIOS RECTORES DEL PROCESO DE REVISIÓN DEL PLAN DE CAULIFICACIONES Y FP DE EXTREMADURA. La exigencia de autoevaluación forma ya, hoy día,

Más detalles

Tabla 10.2. Tabla de equivalencia entre asignaturas de Ingeniería Técnica en Informática de Gestión al Grado en Ingeniería Informática. Créd LRU.

Tabla 10.2. Tabla de equivalencia entre asignaturas de Ingeniería Técnica en Informática de Gestión al Grado en Ingeniería Informática. Créd LRU. El proceso de adaptación de los estudiantes de la actual Ingeniería Técnica en Informática de Gestión al título de grado en Ingeniería Informática se realizará a requerimiento de los propios estudiantes

Más detalles

La normativa reguladora que rigen las cartas de servicios son:

La normativa reguladora que rigen las cartas de servicios son: NORMATIVA PARA LA IMPLANTACIÓN DE LAS CARTAS DE SERVICIOS EN LAS UNIDADES ADMINISTRATIVAS DE LOS SERVICIOS DE LA UNIVERSIDAD DE HUELVA Y SU CERTIFICACIÓN Las Universidades españolas han ido priorizando

Más detalles

Criterio 2: Política y estrategia

Criterio 2: Política y estrategia Criterio 2: Política y estrategia Definición. Cómo implanta el servicio su misión, y visión mediante una estrategia claramente centrada en todos los grupos de interés y apoyada por políticas, planes, objetivos,

Más detalles

INFORME SOBRE LA PROPUESTA DE MODIFICACIÓN (Informe Final)

INFORME SOBRE LA PROPUESTA DE MODIFICACIÓN (Informe Final) FECHA: 01/06/2015 ID TÍTULO: 5600475 INFORME SOBRE LA PROPUESTA DE MODIFICACIÓN (Informe Final) Denominación del Título Universidad solicitante Universidad/es participante/s Programa de Doctorado en Electrónica:

Más detalles

CENTROS INTEGRADOS DE FORMACIÓN PROFESIONAL

CENTROS INTEGRADOS DE FORMACIÓN PROFESIONAL CENTROS INTEGRADOS DE FORMACIÓN PROFESIONAL 114 INTRODUCCIÓN La Ley Orgánica de las Cualificaciones y de la Formación Profesional recoge entre sus novedades la creación de Centros Integrados de Formación

Más detalles

Los proyectos podrán ser propuestos por el profesorado del ciclo formativo o por el alumnado.

Los proyectos podrán ser propuestos por el profesorado del ciclo formativo o por el alumnado. Instrucción nº 3/2011, de la Dirección General de Formación Profesional y Aprendizaje Permanente, sobre el módulo profesional de Proyecto incluido en los títulos de formación profesional de grado superior

Más detalles

Plantilla para Casos de Éxito

Plantilla para Casos de Éxito Plantilla para Casos de Éxito Nombre/Actividad de la EMPRESA objeto de estudio: INSIGNA Sector al que pertenece: Presidente o gerente de la empresa: Antonio Gil Moreno Localización: Valencia Facturación

Más detalles

Otra Buena Práctica es El Programa de Fomento de Naves Industriales

Otra Buena Práctica es El Programa de Fomento de Naves Industriales Otra Buena Práctica es El Programa de Fomento de Naves Industriales Dentro de la Orden de 9 de diciembre de 2008 de Incentivos a la Innovación y al Desarrollo Empresarial, la Agencia de Innovación y Desarrollo

Más detalles

4.4.1 Servicio de Prevención Propio.

4.4.1 Servicio de Prevención Propio. 1 Si se trata de una empresa entre 250 y 500 trabajadores que desarrolla actividades incluidas en el Anexo I del Reglamento de los Servicios de Prevención, o de una empresa de más de 500 trabajadores con

Más detalles

NBG Asesores Abogados

NBG Asesores Abogados Caso de Éxito www.sagedespachosprofesionales.com despachosprofesionales@sage.es 902 01 34 49 Caso de Éxito Las actualizaciones periódicas de Sage Profesional Class a nuevas normativas nos permiten atender

Más detalles

DIRECCION DE PROYECTOS II

DIRECCION DE PROYECTOS II DIRECCION DE PROYECTOS II DESARROLLO DEL CURSO PROFESIONAL EN DIRECCION DE PROYECTOS II: Durante el desarrollo del Curso Profesional en Dirección de Proyectos II, el alumno irá asimilando el contenido

Más detalles

MINING SOLUTIONS LIMITADA

MINING SOLUTIONS LIMITADA MINING SOLUTIONS LIMITADA Contenido... 1 Resumen Ejecutivo... 3... 4 Nuestros Servicios... 5 Administración de proyectos... 6 Operación y mantenimiento sobre los Sistema de Manejo de la Información Geológica

Más detalles

"Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios

Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios "Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios Miguel Alfonso Flores Sánchez 1, Fernando Sandoya Sanchez 2 Resumen En el presente artículo se

Más detalles

Resumen General del Manual de Organización y Funciones

Resumen General del Manual de Organización y Funciones Gerencia de Tecnologías de Información Resumen General del Manual de Organización y Funciones (El Manual de Organización y Funciones fue aprobado por Resolución Administrativa SBS N 354-2011, del 17 de

Más detalles

Oferta tecnológica: Sistema de gestión remota de dispositivos heterogéneos en la Nube

Oferta tecnológica: Sistema de gestión remota de dispositivos heterogéneos en la Nube Oferta tecnológica: Sistema de gestión remota de dispositivos heterogéneos en la Nube Oferta tecnológica: Sistema de gestión remota de dispositivos heterogéneos en la Nube RESUMEN El grupo de Investigación

Más detalles

Prácticas ITIL para un mejor flujo de trabajo en el helpdesk

Prácticas ITIL para un mejor flujo de trabajo en el helpdesk Prácticas ITIL para un mejor flujo de trabajo en el helpdesk Se diferencia tres partes de gestión para mejorar la resolución de las incidencias de soporte técnico según el marco ITIL: 1. Gestión de Incidencias

Más detalles

CAPITAL RIESGO: EL PLAN DE NEGOCIOS

CAPITAL RIESGO: EL PLAN DE NEGOCIOS CAPITAL RIESGO: EL PLAN DE NEGOCIOS Importancia del Plan de Negocios Por: Juan Luis Blanco Modelo Blanco, Ureña & Asociados El plan de negocios o business plan es el conjunto de ideas en las que se fundamenta

Más detalles

FÁBRICA DE SOFTWARE. Presentado por: Ing. Juan José Montero Román Gerente de Fábrica de Software USMP jmonteror@usmp.pe

FÁBRICA DE SOFTWARE. Presentado por: Ing. Juan José Montero Román Gerente de Fábrica de Software USMP jmonteror@usmp.pe FÁBRICA DE SOFTWARE Presentado por: Ing. Juan José Montero Román Gerente de Fábrica de Software USMP jmonteror@usmp.pe FÁBRICA DE AUTOS Entrada Salida Autos FÁBRICA DE SOFTWARE Entrada Salida Información

Más detalles

Oferta tecnológica: Vehículos autónomos para transporte de materiales en almacenes

Oferta tecnológica: Vehículos autónomos para transporte de materiales en almacenes Oferta tecnológica: Vehículos autónomos para transporte de materiales en almacenes Oferta tecnológica: Vehículos autónomos para transporte de materiales en almacenes RESUMEN Investigadores de la Universidad

Más detalles

PROYECTO GESTIÓN POR PROCESOS: INFORME DE AUTOEVALUACIÓN MEDIANTE CUESTIONARIO

PROYECTO GESTIÓN POR PROCESOS: INFORME DE AUTOEVALUACIÓN MEDIANTE CUESTIONARIO PROYECTO GESTIÓN POR PROCESOS: INFORME DE AUTOEVALUACIÓN MEDIANTE CUESTIONARIO UNIDAD: TÉCNICOS DE LABORATORIOS DE DEPARTAMENTOS, CENTROS E INSTITUTOS DE INVESTIGACIÓN (UTLA). Fecha de realización: DICIEMBRE

Más detalles

Anexo VI: Inventario de iniciativas horizontales incluidas en el Eje e-gobernanza.

Anexo VI: Inventario de iniciativas horizontales incluidas en el Eje e-gobernanza. Anexo VI: Inventario de iniciativas horizontales incluidas en el Eje e-gobernanza. Se describe a continuación en formato de ficha de proyecto el detalle de cada uno de los proyectos de la presente clasificación.

Más detalles

INFORME ANUAL DEL PROGRAMA PABLO NERUDA

INFORME ANUAL DEL PROGRAMA PABLO NERUDA INFORME ANUAL DEL PROGRAMA PABLO NERUDA 1. Título del Programa. PROGRAMA PABLO NERUDA(en adelante actuación ). 2008, XVIII Cumbre Iberoamericana de Jefes de Estado y de Gobierno, San Salvador, El Salvador.

Más detalles

GUÍA PARA LA JUSTIFICACIÓN DE AYUDAS RELATIVAS A LOS PROYECTOS DE INVESTIGACION EN LA RED DE PARQUES NACIONALES DE LA CONVOCATORIA DE 2014

GUÍA PARA LA JUSTIFICACIÓN DE AYUDAS RELATIVAS A LOS PROYECTOS DE INVESTIGACION EN LA RED DE PARQUES NACIONALES DE LA CONVOCATORIA DE 2014 GUÍA PARA LA JUSTIFICACIÓN DE AYUDAS RELATIVAS A LOS PROYECTOS DE INVESTIGACION EN LA RED DE DE LA CONVOCATORIA DE 2014 Bases Reguladoras y Convocatoria. ORDEN ARM/1498/2009, de 21 de mayo (BOE 139 de

Más detalles

Gestión de la Configuración

Gestión de la Configuración Gestión de la ÍNDICE DESCRIPCIÓN Y OBJETIVOS... 1 ESTUDIO DE VIABILIDAD DEL SISTEMA... 2 ACTIVIDAD EVS-GC 1: DEFINICIÓN DE LOS REQUISITOS DE GESTIÓN DE CONFIGURACIÓN... 2 Tarea EVS-GC 1.1: Definición de

Más detalles

Cuándo y qué virtualizar? Cuándo y qué virtualizar? 1

Cuándo y qué virtualizar? Cuándo y qué virtualizar? 1 Cuándo y qué virtualizar? Cuándo y qué virtualizar? 1 Por qué surge la virtualización? En proyectos de infraestructuras informáticas muchos responsables de IT se sienten más confortables con diseños basados

Más detalles

programación y guías docentes, el trabajo fin de grado y las prácticas externas.

programación y guías docentes, el trabajo fin de grado y las prácticas externas. Informe de Seguimiento Graduado o Graduada en Administración y Dirección de Empresas de la Universidad de Málaga 1. ÁMBITO NORMATIVO El artículo 27 del Real Decreto 1393/2007, de 29 de octubre, modificado

Más detalles

REGISTRO DE PEDIDOS DE CLIENTES MÓDULO DE TOMA DE PEDIDOS E INTEGRACIÓN CON ERP

REGISTRO DE PEDIDOS DE CLIENTES MÓDULO DE TOMA DE PEDIDOS E INTEGRACIÓN CON ERP REGISTRO DE PEDIDOS DE CLIENTES MÓDULO DE TOMA DE PEDIDOS E INTEGRACIÓN CON ERP Visual Sale posee módulos especializados para el método de ventas transaccional, donde el pedido de parte de un nuevo cliente

Más detalles

Anexo 2. Instrucciones de justificación para los proyectos de la Cátedra Real Madrid-UEM

Anexo 2. Instrucciones de justificación para los proyectos de la Cátedra Real Madrid-UEM Anexo 2. Instrucciones de justificación para los proyectos de la Cátedra Real Madrid-UEM 0. CUESTIONES BÁSICAS Cuándo tendrá que justificar el proyecto la institución beneficiaria? Dos justificaciones:

Más detalles

ANEXO : PERFILES. Guía de Comunicación Digital para la Administración General del Estado. ANEXO PERFILES

ANEXO : PERFILES. Guía de Comunicación Digital para la Administración General del Estado. ANEXO PERFILES ANEXO : PERFILES Guía de Comunicación Digital para la Administración General del Estado. ANEXO PERFILES ANEXO: PERFILES. 3 1. REQUISITOS ANTES DE TENER EL SITIO WEB. 4 1.1 TOMA DE REQUISITOS. 4 1.2 ANÁLISIS

Más detalles

SÍNTESIS Y PERSPECTIVAS

SÍNTESIS Y PERSPECTIVAS SÍNTESIS Y PERSPECTIVAS Los invitamos a observar, a identificar problemas, pero al mismo tiempo a buscar oportunidades de mejoras en sus empresas. REVISIÓN DE CONCEPTOS. Esta es la última clase del curso.

Más detalles

Bases de la convocatoria VIII CONVOCATORIA DE AYUDAS A PROYECTOS SOCIALES

Bases de la convocatoria VIII CONVOCATORIA DE AYUDAS A PROYECTOS SOCIALES Bases de la convocatoria VIII CONVOCATORIA DE AYUDAS A PROYECTOS SOCIALES Quién puede presentar proyectos Puede presentar su proyecto solidario, cualquier empleado o grupo de empleados que: Pertenezca

Más detalles

SERVICIOS. Reingeniería. Instalación / Puesta en marcha. Personalización. Cursos de formación. Servicio técnico. Servicio de mantenimiento

SERVICIOS. Reingeniería. Instalación / Puesta en marcha. Personalización. Cursos de formación. Servicio técnico. Servicio de mantenimiento Instalación / Puesta en marcha Reingeniería Personalización Cursos de formación Servicio técnico Servicio de mantenimiento Desarrollo de software Área reservada en la web Los Servicios de Software de PYV

Más detalles

Un seguro para los madrileños CENTRO INTEGRADO DE SEGURIDAD Y EMERGENCIAS DE MADRID

Un seguro para los madrileños CENTRO INTEGRADO DE SEGURIDAD Y EMERGENCIAS DE MADRID Un seguro para los madrileños CENTRO INTEGRADO DE SEGURIDAD Y EMERGENCIAS DE MADRID CISEM es el centro integral de coordinación del Ayuntamiento de Madrid para atender la gestión de Seguridad y Emergencias.

Más detalles

Estado de los Recursos Humanos en la UNED.

Estado de los Recursos Humanos en la UNED. Estado de los Recursos Humanos en la UNED. Estado de los Recursos Humanos en la UNED.... 1 RPT... 1 Provisión y Promoción... 2 Provisión...2 Promoción... 2 Formación... 3 Comisión gestora para la implantación

Más detalles

INSTRODUCCION. Toda organización puede mejorar su manera de trabajar, lo cual significa un

INSTRODUCCION. Toda organización puede mejorar su manera de trabajar, lo cual significa un INSTRODUCCION Toda organización puede mejorar su manera de trabajar, lo cual significa un incremento de sus clientes y gestionar el riesgo de la mejor manera posible, reduciendo costes y mejorando la calidad

Más detalles

Resumen de la solución SAP SAP Technology SAP Afaria. Gestión de la movilidad empresarial para mayor ventaja competitiva

Resumen de la solución SAP SAP Technology SAP Afaria. Gestión de la movilidad empresarial para mayor ventaja competitiva de la solución SAP SAP Technology SAP Afaria Gestión de la movilidad empresarial para mayor ventaja competitiva Simplificar la gestión de dispositivos y aplicaciones Simplificar la gestión de dispositivos

Más detalles

PROCEDIMIENTO ESPECÍFICO. Código G114-01 Edición 0

PROCEDIMIENTO ESPECÍFICO. Código G114-01 Edición 0 Índice 1. TABLA RESUMEN... 2 2. OBJETO... 2 3. ALCANCE... 2 4. RESPONSABILIDADES... 3 5. ENTRADAS... 3 6. SALIDAS... 3 7. PROCESOS RELACIONADOS... 3 8. DIAGRAMA DE FLUJO... 4 9. DESARROLLO... 5 9.1. PROYECTO

Más detalles

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual Introducción Algunas de las personas que trabajan con SGBD relacionales parecen preguntarse porqué deberían preocuparse del diseño de las bases de datos que utilizan. Después de todo, la mayoría de los

Más detalles

Red Temática de Investigación Cooperativa en Cáncer. www.rticc.org. Madrid, 07 Marzo 2013

Red Temática de Investigación Cooperativa en Cáncer. www.rticc.org. Madrid, 07 Marzo 2013 Red Temática de Investigación Cooperativa en Cáncer www.rticc.org Madrid, 07 Marzo 2013 Nueva pagina web de la RTICC Aclaraciones aspectos administrativos Aplicación seguimiento científico Nueva pagina

Más detalles

ADMINISTRACIÓN DE PROYECTOS

ADMINISTRACIÓN DE PROYECTOS QUITO INGENIERIA MECANICA ADMINISTRACIÓN DE PROYECTOS JUAN MARCELO IBUJES VILLACÍS ADMINISTRACIÓN DE PROYECTOS Contenido tomado de referencia de la Guía de los Fundamentos para la Dirección de Proyectos

Más detalles

gestión económica programación económica gestión financiera contratación administrativa

gestión económica programación económica gestión financiera contratación administrativa gestión económica programación económica gestión financiera contratación administrativa 45 46 Entendiendo la gestión económica como los procedimientos establecidos para la ejecución de los presupuestos

Más detalles

Funcionalidades Software SAT GotelGest.Net (Software de Servicio de Asistencia Técnica)

Funcionalidades Software SAT GotelGest.Net (Software de Servicio de Asistencia Técnica) Funcionalidades Software SAT GotelGest.Net (Software de Servicio de Asistencia Técnica) Servinet Sistemas y Comunicación S.L. www.softwaregestionsat.com Última Revisión: Octubre 2014 FUNCIONALIDADES SAT

Más detalles

PROGRAMA REDEMPRENDIA NUEVOS EMPRENDEDORES: APRENDIENDO A EMPRENDER

PROGRAMA REDEMPRENDIA NUEVOS EMPRENDEDORES: APRENDIENDO A EMPRENDER PROGRAMA REDEMPRENDIA NUEVOS EMPRENDEDORES: APRENDIENDO A EMPRENDER METODOLOGÍA Y PLAN DE TRABAJO PROGRAMA REDEMPRENDIA NUEVOS EMPRENDEDORES: APRENDIENDO A EMPRENDER 1.- Definición y objetivos del programa.

Más detalles

Sistema de Gestión de la Seguridad de la Información, UNE-ISO/IEC 27001

Sistema de Gestión de la Seguridad de la Información, UNE-ISO/IEC 27001 Sistema de Gestión de la Seguridad de la Información, UNE-ISO/IEC 27001 Aníbal Díaz Gines Auditor de SGSI Certificación de Sistemas Applus+ Sistema de Gestión de la Seguridad de la Información, UNE-ISO/IEC

Más detalles

LOS ESTUDIOS DE INGENIERÍA INDUSTRIAL EN EL NUEVO MARCO DEL ESPACIO EUROPEO DE EDUCACION SUPERIOR. GITI + MII = Ingeniero Industrial

LOS ESTUDIOS DE INGENIERÍA INDUSTRIAL EN EL NUEVO MARCO DEL ESPACIO EUROPEO DE EDUCACION SUPERIOR. GITI + MII = Ingeniero Industrial LOS ESTUDIOS DE INGENIERÍA INDUSTRIAL EN EL NUEVO MARCO DEL ESPACIO EUROPEO DE EDUCACION SUPERIOR. GITI + MII = Ingeniero Industrial Introducción El nuevo marco de los estudios universitarios españoles,

Más detalles

GUÍA PROGRAMA ACCIONES ESPECIALES DE ALTO COSTE

GUÍA PROGRAMA ACCIONES ESPECIALES DE ALTO COSTE GUÍA PROGRAMA ACCIONES ESPECIALES DE ALTO COSTE Índice A. Objeto 3 B. Tipos de de proyectos / Requisitos 3 C. Beneficiarios 4 D. Periodo de ejecución y duración 4 E. Procedimiento 4 F. Plazo de presentación

Más detalles

David Erosa García Programador del C.G.A. de la D.G. de Innovación Educativa y Formación del Profesorado. Consejería de Educación, Junta de Andalucía

David Erosa García Programador del C.G.A. de la D.G. de Innovación Educativa y Formación del Profesorado. Consejería de Educación, Junta de Andalucía CENTRO DE GESTIÓN AVANZADO (C.G.A.) : LA GESTIÓN CENTRALIZADA DE LOS ORDENADORES DE LOS CENTROS TIC S DE LA CONSEJERÍA DE EDUCACIÓN DE LA JUNTA DE ANDALUCÍA Director del C.G.A. y jefe del Departamento

Más detalles

GUÍA PARA LA PRESENTACIÓN DE PROPUESTAS UIS INGENIUM 2015

GUÍA PARA LA PRESENTACIÓN DE PROPUESTAS UIS INGENIUM 2015 GUÍA PARA LA PRESENTACIÓN DE PROPUESTAS UIS INGENIUM 2015 2015 CONTENIDO 1. PRESENTACIÓN DE PROPUESTAS... 3 2. CONTENIDO DE LA PROPUESTA... 3 2.1 Título de la propuesta... 3 2.2 Planteamiento del problema...

Más detalles

Proyecto Fin de Carrera

Proyecto Fin de Carrera Proyecto Fin de Carrera Gestión del Proyecto para una Plataforma online de intercambio, compra o venta de ayudas técnicas. Consultora: Ana Cristina Domingo Troncho Autor: Álvaro Fanego Lobo Junio de 2013

Más detalles