340455 - REIN-I7P23 - Recuperación de la Información



Documentos relacionados
CAIM - Búsqueda y Análisis de Información Masiva

REIN-I7P23 - Recuperación de la Información

FICHA DE ASIGNATURA Curso

Competencias generales vinculadas a los distintos módulos Módulo de Formación Básica

PAP - Programación y Arquitecturas Paralelas

Grado en Ingeniería Informática

ASO - Administración de Sistemas Operativos

SLDS - Software Libre y Desarrollo Social

EF - Estadística Financiera

GEET-I6O32 - Gestión de Empresas TIC

PBNAIM - Programación de Bajo Nivel: Aplicaciones Industriales de los Microcontroladores

- Capacidad para dirigir las actividades objeto de los proyectos del ámbito de la informática de acuerdo con los conocimientos adquiridos.

Guía Docente. Tipo: Obligatoria Créditos ECTS: 6. Curso: 3 Código: 3626

Tabla Tabla de equivalencia entre asignaturas de Ingeniería Técnica en Informática de Gestión al Grado en Ingeniería Informática. Créd LRU.

II - Informática Industrial

IM - Internet Móvil

Ingeniería del Software Web

ARIEIA - Automatización y Robótica Industrial

GPS - Gestión de Proyectos de Software

Guía docente de la asignatura

DAMO-I7P23 - Desarrollo de Aplicaciones Móviles

IES - Introducción a la Ingeniería del Software

INTELIGENCIA DE NEGOCIO (MASTER UNIVERSITARIO EN INGENIERÍA INFORMÁTICA)

SISTEMAS DE REPRESENTACIÓN Y PROCESAMIENTO AUTOMÁTICO DEL CONOCIMIENTO Licenciatura en Documentación

Dirección Comercial

240AU034 - Gestión de la Calidad

Decisiones a tomar en los estudios de INGENIERÍA INFORMÁTICA

Documento de Competencias. Facultad de Informática, UPV/EHU. 1 Estructura general del Grado TE1 TE2 TE3 TE4 TE5 TE6 TE7 TE8

ASIGNATURA FECHA HORA AULA. Matemática Discreta 25-ene 16,00-19,00 LAB. 7. Álgebra Lineal 06-feb 09,00-12,00 LAB. 7

NE - Negocio Electrónico

TGA - Tarjetas Gráficas y Aceleradores

Metodología y Tecnología de la Programación Tipo Obligatoria Impartición Anual Créditos ECTS 12,5 Curso 1º Código 42506

Bases de Datos

PROYECTO DOCENTE ASIGNATURA: "Lógica Informática"

CSL - Circuitos y Sistemas Lineales

TM1 - Tecnología de Minas I

ASIGNATURA: GESTIÓN DE PROYECTOS Y DE LABORATORIOS MATERIA: Gestión MÓDULO: Gestión ESTUDIOS: Máster en Química Analítica

DATOS DESCRIPTIVOS. Escuela Técnica Superior de Ingeniería de Sistemas Informáticos CICLO Máster sin atribuciones MÓDULO Seminarios Avanzados

PME - Proyectos Mineros y Energéticos

DIPR-D6O17 - Diseño y Producto

GUÍA DOCENTE DE LA ASIGNATURA

TECNÓLOGO EN INFORMÁTICA PLAN DE ESTUDIOS

Dirección Financiera

240EO014 - Dirección Financiera

240AU035 - Sistemas de Seguridad del Automóvil

Guía Docente MATEMÁTICAS I FICHA IDENTIFICATIVA. Datos de la Asignatura. Profesorado. Horario de tutorías: martes 16:00h.

Algunas aclaraciones para la realización de matrícula del. Grado en Ingeniería Informática. Curso

RICS - Circuitos Integrados y Sistemas de Radiofrecuencia

EGE - Estadística para la Gestión Empresarial

DCPE - Diseño y Construcción de Prototipos Electrónicos

GUÍA DOCENTE. Curso

POI-M - Programación Orientada a Internet

AEM - Aspectos Económicos y Marketing

GUÍA DE APRENDIZAJE TECNOLOGÍA MULTIMEDIA GRADUADO EN INGENIERÍA DE SOFTWARE

ESO - Energía Solar

Rehabilitación Energética y Energías Renovables

COMPLEJIDAD Y COMPUTABILIDAD

ECIA - Estudio de Casos en la Industria Alimentaria

ED - Electrónica Digital

PRLSME - Prevención de Riesgos Laborales del Sector Minero y Energético

GUÍA DOCENTE 1. DESCRIPCIÓN DE LA ASIGNATURA

ASIGNATURA: GESTIÓN DE PROYECTOS

240ST Administración y Dirección de Empresas

Año académico GUÍA DOCENTE MODELOS DE PROCESO Grado en Ingeniería Informática. Profesorado: JORDI TORRECILLAS GARCIA ROBERTO GARCÍA GONZÁLEZ

GUÍA DE APRENDIZAJE ARQUITECTURA Y DESARROLLO DE SISTEMAS DE INFORMACION

LCM - Laboratorio de Comunicaciones Móviles

Sistemas de Recuperación de Información

Escuela Universitaria de Turismo de Santa Cruz de Tenerife

Denominación de la materia. N créditos ECTS = 36 carácter = MIXTA INGENIERIA DE COMPUTADORAS

EIGE - Economía y Gestión de Empresas

EDEM - Economía y Dirección de la Empresa Minera

Guía Docente Modalidad Semipresencial. Técnicas y herramientas de gestión y control de la calidad. Curso 2014/15. Máster en Ingeniería.

Guía Docente Modalidad Presencial. Estructuras de Datos. Curso 2015/16. Grado en Ingeniería de. Sistemas de Información

Escuela Técnica Superior de Ingeniería Informática

Marketing Inmobiliario e Investigación de Mercado

Denominación de la materia. créditos ECTS = 36 carácter = OBLIGATORIA SISTEMAS OPERATIVOS, SISTEMAS DISTRIBUIDOS Y REDES

TÉCNICAS DE SIMULACIÓN

240EO013 - Dirección Comercial

GESTIÓN DE PROYECTOS

(ISI) Infraestructura de Sistemas de Información. 4º de Grado en Ingeniería Informática - Tecnologías Informáticas

En verde están algunas propuestas que entendemos que faltan y que ayudarían a mejorar las fichas sustancialmente.

Grado en Ingeniería Informática

Guía Docente Modalidad Semipresencial. Diseño de máquinas y motores. Curso 2014/15. Máster en Ingeniería. de Montes

PROGRAMACIÓN III (Curso de Adaptación)

E.U. CIENCIAS EMPRESARIALES MASTER EN DIRECCIÓN Y PLANIFICACIÓN DEL TURISMO

Escuela Técnica Superior de Ingeniería Informática

Escuela Técnica Superior de Ingeniería Informática

Escuela Técnica Superior de Ingeniería Informática

GRADO EN INGENIERIA INFORMATICA

Diseño de la Cadena de Suministro

Guía docente de la asignatura

Escuela Técnica Superior de. Informática. Máster en Ingeniería Informática. aplicada a la Industria, la Ingeniería del. Software y a los Sistemas y

GUÍA DOCENTE DE LA ASIGNATURA

GUÍA DOCENTE. Curso DESCRIPCIÓN DE LA ASIGNATURA. Ingeniería Informática en Sistemas de Información Doble Grado: Módulo: Módulo 6

Máster Universitario en Dirección de Empresas MBA. Programa de la Asignatura: Aprovechamiento de Oportunidades Empresariales

PRL - Prevención de Riesgos Laborales

PLANAE - Planificación y Análisis de Empresas

Guía Docente EL CONTROL DE RESULTADOS COMERCIALES MASTER UNIVERSITARIO EN GESTIÓN COMERCIAL

Escuela de Ciencias Empresariales. Grado en Contabilidad y Finanzas

Transcripción:

Unidad responsable: 340 - EPSEVG - Escuela Politécnica Superior de Ingeniería de Vilanova i la Geltrú Unidad que imparte: 723 - CS - Departamento de Ciencias de la Computación Curso: Titulación: 2015 GRADO EN INGENIERÍA INFORMÁTICA (Plan 2010). (Unidad docente Optativa) Créditos ECTS: 6 Idiomas docencia: Catalán Profesorado Responsable: Otros: Neus Català Roig Neus Català Roig Capacidades previas - Saber aplicar los conceptos básicos de álgebra lineal, matemática discreta, probabilidad y estadística. - Saber programar en lenguajes orientados a objetos, incluyendo herencia entre clases. - Conocer las principales estructuras de datos para el acceso eficiente a información y sus implementaciones (listas, hashing, árboles, grafos, heaps). Ser capaz de utilizarlas para construir programas eficientes. Poder analizar el tiempo de ejecución y memoria usada por un programa de dificultad media. Tener una cierta idea de la diferencia en tiempo de acceso entre memoria principal y memoria secundaria. Competencias de la titulación a las cuales contribuye la asignatura Específicas: 1. CECO7. Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos. 4. CEIS6. Capacidad para diseñar soluciones apropiadas en uno o más dominios de aplicación utilizando métodos de la ingeniería del software que integren aspectos éticos, sociales, legales y económicos. 3. CEIS4. Capacidad de identificar y analizar problemas y diseñar, desarrollar, implementar, verificar y documentar soluciones software sobre la base de un conocimiento adecuado de las teorías, modelos y técnicas actuales. 2. CEIS1. Capacidad para desarrollar, mantener y evaluar servicios y sistemas software que satisfagan todos los requisitos del usuario y se comporten de forma fiable y eficiente, sean asequibles de desarrollar y mantener y cumplan normas de calidad, aplicando las teorías, principios, métodos y prácticas de la Ingeniería del Software. Transversales: 5. EMPRENDEDURÍA E INNOVACIÓN: Conocer y entender la organización de una empresa y las ciencias que definen su actividad; capacidad para entender las normas laborales y las relaciones entre la planificación, las estrategias industriales y comerciales, la calidad y el beneficio. Metodologías docentes La asignatura consta de: - 2 horas a la semana de clases presenciales en el aula en las que el profesor expone los contenidos, - 2 horas a la semana en el aula de laboratorio en las que se aplican los conceptos y métodos aprendidos mediante la resolución de problemas haciendo uso de herramientas específicas del àrea de la Recuperación de la Información (Information Retrieval). Objetivos de aprendizaje de la asignatura El campo conocido como "Information Retrieval" contempla métodos para organizar la información de forma que sea 1 / 6

posible después para los usuarios encontrar la información de forma cómoda y eficiente. La asignatura cubre las técnicas básicas de búsqueda de documentación textual basada en palabras clave. También examina el caso de la búsqueda en la web, donde la presencia de hiperenlaces puede usarse no sólo para dirigir la búsqueda sino para valorar el interés de cada página -- éste es el caso del conocido algoritmo PageRank utilizado por Google. Se ve la extensión de este tipo de técnicas a redes sociales (por ejemplo Facebook o Twitter) donde el grafo de interacciones entre usuarios da mucha información sobre qué le puede interesar a cada usuario. Finalmente, se estudian formas posibles de explotación de este tipo de técnicas en beneficio de una organización. Horas totales de dedicación del estudiantado Dedicación total: 150h Horas grupo grande: 15h 10.00% Horas grupo mediano: 0h 0.00% Horas grupo pequeño: 30h 20.00% Horas actividades dirigidas: 0h 0.00% Horas aprendizaje autónomo: 105h 70.00% 2 / 6

Contenidos 1. Introducción Dedicación: 11h Grupo grande/teoría: 1h 30m Grupo pequeño/laboratorio: 2h 30m Necesidad de técnicas de búsqueda y análisis de información masiva. Búsqueda y análisis vs. bases de datos. Proceso de recuperación de la información. Preproceso y análisis léxico. 2. Modelos de recuperación de la información Dedicación: 12h Grupo grande/teoría: 1h 30m Grupo pequeño/laboratorio: 3h 30m Definición formal y conceptos básicos: Modelos abstractos de documentos y lenguajes de interrogación. Modelo booleano. Modelo vectorial. Latent Semantic Indexing 3. Implementación: Indexación y búsquedas Dedicación: 10h Grupo grande/teoría: 0h 30m Grupo pequeño/laboratorio: 2h 30m Ficheros inversos y ficheros de firmas. Compresión de índices. Ejemplo: Implementación eficiente de la regla del coseno con medida tf-idf. Ejemplo: Lucene. 3 / 6

4. Evaluación en recuperación de la información Dedicación: 10h Grupo grande/teoría: 0h 30m Grupo pequeño/laboratorio: 2h 30m Recall y precisión. Otras medidas de rendimiento. Colecciones de referencia. "Relevance feedback" y "query expansion". 5. Búsqueda en internet Dedicación: 16h Grupo grande/teoría: 3h Grupo pequeño/laboratorio: 6h Ranking y relevancia para modelos web. Algoritmos PageRank y HITS. Crawling. Arquitectura de un sistema simple de búsqueda en internet. 6. Análisis de redes Dedicación: 15h Grupo grande/teoría: 2h Grupo pequeño/laboratorio: 6h Parámetros descriptivos y características de las redes: grado, diámetro, redes "small-world", entre otros. Algoritmos sobre redes: clustering, detección de comunidades y de nodos influyentes, reputación, entre otros. 4 / 6

7. Arquitectura de sistemas para la gestión de información masiva Dedicación: 12h 30m Grupo grande/teoría: 3h Grupo pequeño/laboratorio: 6h Aprendizaje autónomo: 3h 30m Escalabilidad, alto rendimento y tolerancia a fallos: el caso de buscadores web masivos. Arquitecturas distribuidas. 8. Sistemas de información basados en análisis de información masiva. Dedicación: 10h 30m Grupo grande/teoría: 2h Grupo pequeño/laboratorio: 5h Aprendizaje autónomo: 3h 30m "Search Engine Optimization". Sistemas de recomendación. Sistema de calificación La asignatura contiene los siguientes actos de evaluación: - Informes de las actividades y/o prácticas de las sesiones de laboratorio (L). - Control parcial 1 realizado en la semana de evaluación parcial (C1). - En el periodo de evaluación final el estudiante puede elegir entre hacer un Control parcial 2 (C2), de la segunda mitad de la materia, o bien un Examen Final (F) de toda la materia. Las opciones son exclusivas. La ponderación de las calificaciones obtenidas es la siguiente: 0.4*L + máximo(0.3*c1+0.3*c2, 0.6*F) Normas de realización de las actividades Los informes de las actividades de laboratorio se entregan de forma no presencial en el plazo indicado para cada sesión. Los controles parciales y el examen final son presenciales e individuales. 5 / 6

Bibliografía Básica: Baeza-Yates, Ricardo ; Ribeiro-Neto, Berthier. Modern information retrieval : the concepts and technology behind search. 2nd. Harlow [etc.]: Addison-Wesley, 2011. ISBN 978-0321416919. Manning, Christopher D.; Raghavan, Prabhakar; Schütze, Hinrich. Introduction to information retrieval [en línea]. New York: Cambridge University Press, 2008 [Consulta: 27/11/2014]. Disponible a: <http://nlp.stanford.edu/irbook/html/htmledition/irbook.html>. ISBN 9780521865715. McCandless, Michael; Hatcher, Eric; Gospodnetic, Otis. Lucene in action [en línea]. 2nd ed. Greenwich, Conn: Manning, 2010 [Consulta: 22/10/2013]. Disponible a: <http://proquest.safaribooksonline.com/9781933988177?uicode=politicat>. ISBN 9781933988177. Croft, W. Bruce; Metzler, Donald; Strohman, Trevor. Search engines : information retrieval in practice. Boston [etc.]: Pearson, 2010. ISBN 9780131364899. Russell, Matthew A.. Mining the social web: data mining Facebook, Twitter, LinkedIn, google+, github, and more [en línea]. 2nd ed. Sebastopol, [California]: O'Reilly, 2013 [Consulta: 04/03/2015]. Disponible a: <http://site.ebrary.com/lib/upcatalunya/docdetail.action?docid=10779158>. ISBN 9781449367619. 6 / 6