webir /08/2018

Tamaño: px
Comenzar la demostración a partir de la página:

Download "webir /08/2018"

Transcripción

1 webir /08/2018

2 webir Libertad Tansini [webir] Lunes y Miércoles 14:30 a 16:00 2

3 webir Metodología y Evaluación Teórico Proyecto Investigación sobre un tema relacionado con el curso Diseño de una solución a un problema Posible implementación de la solución El tema deberá ser validado por el docente previamente Escribir un informe y hacer una presentación oral (15 min) Evaluación Asistencia a clases al menos 60% Informe sobre el proyecto realizado = 60% Presentación oral del proyecto = 40% 3

4 webir Bibliografía Manning, Raghavan and Schütze Introduction to Information Retrieval Cambridge University Press, ://nlp.stanford.edu nlp.stanford.edu/ir- /IR-book book/ 4

5 webir - Temas Recuperación de información Cada usuario debe poder obtener de manera rápida la información que satisfaga sus necesidades Se debe poder encontrar, indexar y analizar la información Funcionamiento de los motores de búsqueda de (Internet) Relevance feedback y expansión de consultas Filtrado colaborativo Análisis de enlaces 5

6 webir Recuperación de Información Ejemplo: se buscan obras de Shakespeare que tengan las palabras Brutus y Caesar, pero no Calpurnia Brutus AND Cesar AND NOT Calpurnia El caso de las obras completas de Shakespeare - menos de 1 millón de palabras Usar comando grep de Unix 6

7 webir Recuperación de Información Procesar la información que existe hoy en Internet - orden de millones de millones de palabras y sigue creciendo 7

8 webir Recuperación de Información Colecciones o corpus extensos como Internet Operaciones de búsqueda más complejas La palabra Romans cerca de countrymen A lo más a 5 palabras de distancia o Que aparezcan en la misma oración Devolver los documentos que contienen la información o la palabra ordenados por algún criterio de calidad ranking function 8

9 webir Matriz de palabras-documentos o de incidencia Antony and Cleopatra Julius Caesar The Tempest Hamlet Othello Macbeth... Antony Brutus Caesar Calpurnia Cleopatra mercy worser

10 webir Matriz de palabras-documentos Antony and Cleopatra Julius Caesar The Tempest Hamlet Othello Macbeth... Antony Brutus Caesar Calpurnia Operamos con los vectores para Brutus, Caesar y el complemento de Calpurnia AND AND =

11 webir Matriz de palabras-documentos Antony and Cleopatra Julius Caesar The Tempest Hamlet Othello Macbeth... Antony Brutus Caesar Calpurnia Operamos con los vectores para Brutus, Caesar y el complemento de Calpurnia AND AND =

12 webir Recuperación Booleana Modelo de recuperación de información Cualquier consulta se formula mediante una expresión booleana de palabras usando AND, OR y NOT Los documentos son conjuntos de palabras 12

13 webir Sistemas de RI Necesidad de información de un usuario no es lo mismo que la consulta Un documento es relevante si contiene información adecuada para satisfacer su necesidad de información Medidas de efectividad 13

14 webir Sistemas de RI Documentos Relevantes Documentos Recuperados Documentos No Relevantes 14

15 webir Sistemas de RI Precisión P = Documentos relevantes recuperados Documentos recuperados Exhaustividad en recuperación o Recall R = Documentos relevantes recuperados Documentos relevantes F = 2*(P*R)/(P+R) F β = (1+β 2 )*(P*R)/(β 2 P+R) 15

16 webir Sistemas de RI Precisión = Docs relevantes recuperados/ Docs recuperados Documentos Relevantes Documentos Recuperados Documentos No Relevantes Recall = Docs relevantes recuperados/ Docs relevantes 16

17 webir Indice Invertido Es siempre factible/útil construir la matriz? Matrices muy grandes Muy pocos 1 s Registrar sólo 1 s Indice invertido Diccionario de palabras (términos) - vocabulario Lista de documentos donde aparece cada palabra (ev. también la posición) - post o posting Se puede ordenar las listas por algún criterio, por ejemplo docid calpurnia

18 webir Indice Invertido Construcción Colección de documentos a indexar Friends, Romans, countrymen... Separar en palabras (tokenize) Friends Romans countrymen So let Procesamiento lingüístico para normalizar las palabras friend roman countryman so let Crear el índice So let it be with Caesar... 18

19 webir Indice Invertido Crear parejas de palabras y docid Ordenar las parejas en orden alfabético por palabras Unificar ocurrencias repetidas de palabras Agregar datos para mejorar la eficiencia número de documentos en que está cada palabra Ordenar postings por docid 19

20 webir Indice Invertido ambitious be 2 2 brutus 1 2 capitol 1 caesar 1 2 calpurnia Memoria vs disco veremos estructuras de datos Potings Listas enlazadas o vectores de tam. variable frec. modif. 20

21 webir Indice Invertido ambitious 1 be brutus capitol 1 1 caesar calpurnia Procesamiento de las consultas Orden Optimización 21

22 webir Indice Invertido Ejercicio Dibujar el índice invertido para los siguientes documentos: Doc1: Venta de casas en Montevideo Doc2: Alquiler y venta de inmuebles Doc3: Precios de casas en aumento Doc4: Montevideo record de precios de inmuebles 22

23 webir Indice Invertido Ejercicio Doc1: Venta de casas en Montevideo Doc2: Alquiler y venta de inmuebles Doc3: Precios de casas en aumento Doc4: Montevideo record de precios de inmuebles Alquiler: 2 Aumento: 3 Casas: 1, 3 De: 1, 2, 3, 4 En: 1, 3 Inmuebles: 2, 4 Montevideo: 1, 4 Precios: 3, 4 Venta: 1, 2 Record: 4 Y: 2 23

24 webir Recuperación Booleana Extendida Medidas de cercanía? a lo más a 5 palabras de distancia que aparezcan en la misma oración o párrafo Westlaw (1975) 24

25 webir Extensiones Deseables Recuperación tolerante a errores de ortografía y otras inconsistencias Búsqueda de conceptos, por ej. sistema operativo Medidas de cercanía, por ej. Gates cerca de Microsoft Registrar y considerar la cantidad de veces que aparecen las palabras en los documentos term frequency Devolver los documentos ordenados por algún criterio de calidad ranking function 25

26 webir - Procesamiento Lingüístico para la Construcción del Indice Invertido Elección de la unidad documento a indexar Páginas Libros o Capítulos Un buen sistema de RI debería ofrecer distintos niveles de granularidad Depende Colección de documentos Uso por parte de los usuarios 26

27 webir Tokenization para la Construcción del Indice Invertido Separar en palabras (tokenize) Friends, Romans, countrymen... So let it be with Caesar... Friends Romans countrymen So let Las palabras son unidades semánticas instanciadas que aparecen en los documentos Los términos son palabras (ev. normalizadas) que aparecen en el diccionario de un sistema de RI 27

28 webir Tokenization para la Construcción del Indice Invertido Ignorar espacios en blanco y caracteres especiales Cómo separar correctamente las palabras? aren t arent are aren n t t Depende del idioma Identificación del idioma 28

29 webir Tokenization para la Construcción del Indice Invertido Identificación del idioma 29

30 webir Tokenization para la Construcción del Indice Invertido Palabras especiales ev. dependen del idioma C++ o C# B-52 libertad@fing.edu.uy Direcciones IP Fechas Guiones: Hewlett-Packard, co-education Los Angeles, San Francisco, Universidad de la República 30

Análisis y Recuperación de Información

Análisis y Recuperación de Información Análisis y Recuperación de Información 1 er Cuatrimestre 2017 Página Web http://www.exa.unicen.edu.ar/catedras/ayrdatos/ Prof. Dra. Daniela Godoy ISISTAN Research Institute UNICEN University Tandil, Bs.

Más detalles

Banco Agrario de Colombia Quantil. Septiembre de 2015

Banco Agrario de Colombia Quantil. Septiembre de 2015 Recuperación de Información Matriz Término-Documento Índice Invertido Recuperación Ordenada Modelo de espacio vectorial Recuperación de Información Banco Agrario de Colombia Quantil Septiembre de 2015

Más detalles

IIC Sistemas Recomendadores

IIC Sistemas Recomendadores Filtrado Basado en Contenido IIC 3633 - Sistemas Recomendadores Denis Parra Profesor Asistente, DCC, PUC CHile Page 1 of 28 Lo que Queda del Semestre Tarea 1: Deadline el Lunes 5 de Septiembre. 2/28 Page

Más detalles

IIC Sistemas Recomendadores

IIC Sistemas Recomendadores Filtrado Basado en Contenido IIC 3633 - Sistemas Recomendadores Denis Parra Profesor Asistente, DCC, PUC CHile Page 1 of 27 Lo que Queda del Semestre Tarea 1: Deadline el Jueves 17 de Septiembre. Lecturas

Más detalles

Webir /09/2014

Webir /09/2014 Webir - 2014 08/09/2014 Extensiones Búsqueda de conceptos, por ej. sistema operativo Medidas de cercanía, por ej. Gates cerca de Microsoft Recuperación tolerante a errores de ortografía y otras inconsistencias

Más detalles

J. Vilares El Modelo Probabilístico: Características y Modelos Derivados p. 1

J. Vilares El Modelo Probabilístico: Características y Modelos Derivados p. 1 El Modelo Probabilístico: Características y Modelos Derivados Jesús Vilares Grupo de Lengua y Sociedad de la Información (LYS) Universidade da Coruña jvilares@udc.es J. Vilares El Modelo Probabilístico:

Más detalles

Análisis y Recuperación de Información

Análisis y Recuperación de Información Análisis y Recuperación de Información 1 er Cuatrimestre 2017 Página Web http://www.exa.unicen.edu.ar/catedras/ayrdatos/ Prof. Dra. Daniela Godoy ISISTAN Research Institute UNICEN University Tandil, Bs.

Más detalles

Webir - 2014 10/09/2014

Webir - 2014 10/09/2014 Webir - 2014 10/09/2014 Temas Recuperación tolerante a errores de ortografía y otras inconsistencias Construcción de índices 2 Búsquedas con Comodines mon* - árbol de búsqueda para las palabras del vocabulario

Más detalles

Recuperación de información

Recuperación de información Recuperación de información Motores de búsqueda, clasificación de documentos - 14/11/2015 Índice Motivación Objetivo Introducción Representación de un documento TF-IDF Más cosas... Búsquedas en internet

Más detalles

IIC Sistemas Recomendadores. Denis Parra Profesor Asistente, DCC, PUC CHile

IIC Sistemas Recomendadores. Denis Parra Profesor Asistente, DCC, PUC CHile Métricas de Evaluación IIC 3633 - Sistemas Recomendadores Denis Parra Profesor Asistente, DCC, PUC CHile TOC En esta clase 1. Prediccion de Ratings: MAE, MSE, RMSE 2. Evaluacion via Precision-Recall 3.

Más detalles

Análisis y Recuperación de Información

Análisis y Recuperación de Información Análisis y Recuperación de Información 1 er Cuatrimestre 2017 Página Web http://www.exa.unicen.edu.ar/catedras/ayrdatos/ Prof. Dra. Daniela Godoy ISISTAN Research Institute UNICEN University Tandil, Bs.

Más detalles

ANX-PR/CL/ GUÍA DE APRENDIZAJE. ASIGNATURA Recuperacion e integracion de informacion de recursos cientificos

ANX-PR/CL/ GUÍA DE APRENDIZAJE. ASIGNATURA Recuperacion e integracion de informacion de recursos cientificos ANX-PR/CL/001-02 GUÍA DE APRENDIZAJE ASIGNATURA Recuperacion e integracion de informacion de recursos cientificos CURSO ACADÉMICO - SEMESTRE 2015-16 - Primer semestre GA_10AN_103000653_1S_2015-16 Datos

Más detalles

Normas de estilo para resúmenes extendidos

Normas de estilo para resúmenes extendidos Normas de estilo para resúmenes extendidos Recordatorio: El documento debe ser enviado en un formato editable (.doc,.docx,.odt, etc.) a multiling.oviedo@gmail.com antes del 30 de abril de 2018. Extensión:

Más detalles

Procesamiento de Texto y Modelo Vectorial

Procesamiento de Texto y Modelo Vectorial Felipe Bravo Márquez 6 de noviembre de 2013 Motivación Cómo recupera un buscador como Google o Yahoo! documentos relevantes a partir de una consulta enviada? Cómo puede procesar una empresa los reclamos

Más detalles

Curso. Lingüística Aplicada III (Procesamiento inteligente de textos)

Curso. Lingüística Aplicada III (Procesamiento inteligente de textos) Curso Lingüística Aplicada III (Procesamiento inteligente de textos) DURACIÓN: 80 horas AUTOR DEL PROGRAMA: Dr. Alexander Gelbukh, Dr. Grigori Sidorov OBJETIVO GENERAL Describir que tipos de sistemas de

Más detalles

Modelos Alternativos de RI. UCR ECCI CI-2414 Recuperación de Información Prof. Kryscia Daviana Ramírez Benavides

Modelos Alternativos de RI. UCR ECCI CI-2414 Recuperación de Información Prof. Kryscia Daviana Ramírez Benavides Modelos Alternativos de RI UCR ECCI CI-244 Recuperación de Información Prof. Kryscia Daviana Ramírez Benavides Aspectos Generales de los Modelos Alternativos Estos modelos son en general bastante costosos

Más detalles

Recuperación de Información: una Introducción

Recuperación de Información: una Introducción Recuperación de Información: una Introducción Alfonso E. Romero Dep. Ciencias de la Computación e I.A. Universidad de Granada aeromero@decsai.ugr.es http://decsai.ugr.es/~aeromero E.P.S. Linares, 15 de

Más detalles

DEPARTAMENTO DE: Ciencias Básicas Licenciatura en Sistemas de Información. PROGRAMA DE LA ASIGNATURA: Recuperación de Información (11090)

DEPARTAMENTO DE: Ciencias Básicas Licenciatura en Sistemas de Información. PROGRAMA DE LA ASIGNATURA: Recuperación de Información (11090) Nº DISPOSICIÓN:... Universidad Nacional de Luján República Argentina ------ Ruta 5 y Av. Constitución C.C. 221-6700 LUJÁN (Bs. As.) DEPARTAMENTO DE: Ciencias Básicas CARRERA/S: Licenciatura en Sistemas

Más detalles

Aprendizaje para Clasificación con Factorización Matricial Basado en Listwise para Filtrado Colaborativo

Aprendizaje para Clasificación con Factorización Matricial Basado en Listwise para Filtrado Colaborativo 2012 Aprendizaje para Clasificación con Factorización Matricial Basado en Listwise para Filtrado Colaborativo Iván López Espejo 22/04/2012 2 Aprendizaje para Clasificación con Factorización Matricial Basado

Más detalles

Cursos de inglés. Preparación niveles A1, A2, B1, B2.1, B2 y C1. (Desde febrero a junio)

Cursos de inglés. Preparación niveles A1, A2, B1, B2.1, B2 y C1. (Desde febrero a junio) Cursos de inglés. Preparación niveles A1, A2, B1, B2.1, B2 y C1. (Desde febrero a junio) El Colegio de Docentes y Profesionales de la Cultura ha organizado unos cursos de inglés en los que los miembros

Más detalles

IIC Sistemas Recomendadores

IIC Sistemas Recomendadores Filtrado Basado en Contenido II IIC 3633 - Sistemas Recomendadores Denis Parra Profesor Asistente, DCC, PUC CHile Page 1 of 22 TOC En esta clase 1. Representación y Aprendizaje del Modelo de Usuario 1.

Más detalles

Preparado por: Carmen Taína Pérez González, MIS Bibliotecaria Profesional Programa de Destrezas de Información CRAAI Universidad Central de Bayamón

Preparado por: Carmen Taína Pérez González, MIS Bibliotecaria Profesional Programa de Destrezas de Información CRAAI Universidad Central de Bayamón Preparado por: Carmen Taína Pérez González, MIS Bibliotecaria Profesional Programa de Destrezas de Información CRAAI Universidad Central de Bayamón 10 de junio de 2013 Mencionar los tipos de necesidades

Más detalles

Sistemas de Información II Tema 9. Bases de datos de texto

Sistemas de Información II Tema 9. Bases de datos de texto Sistemas de Información II Tema 9. Bases de datos de texto Bibliografía: Baeza-Yates y Ribeiro-Neto: Modern Information Retrieval, 1999 Capítulo 7 Carlos Castillo UPF 2008 1 Agenda Ley de Zipf De bytes

Más detalles

REIN-I7P23 - Recuperación de la Información

REIN-I7P23 - Recuperación de la Información Unidad responsable: 340 - EPSEVG - Escuela Politécnica Superior de Ingeniería de Vilanova i la Geltrú Unidad que imparte: 723 - CS - Departamento de Ciencias de la Computación Curso: Titulación: 2018 GRADO

Más detalles

BUSCADORES POR PALABRA CLAVE

BUSCADORES POR PALABRA CLAVE BUSCADORES Es un sitio web que contiene una base de datos organizada que sirve para encontrar direcciones electrónicas de otros sitios. REQUISITO FUNDAMENTAL: Formular la pregunta adecuada para obtener

Más detalles

Clasificación de texto mediante atributos probabilísticos de coocurrencia de palabras.

Clasificación de texto mediante atributos probabilísticos de coocurrencia de palabras. Clasificación de texto mediante atributos probabilísticos de coocurrencia de palabras. J. Fernando Sánchez Vega 1 Coordinación de Ciencias Computacionales Instituto Nacional de Astrofísica Óptica y Electrónica,

Más detalles

REGLAMENTO DE PRESENTACIÓN DE TRABAJOS

REGLAMENTO DE PRESENTACIÓN DE TRABAJOS REGLAMENTO DE PRESENTACIÓN DE TRABAJOS TRABAJOS LIBRES (ORALES O POSTERS) Y CONFERENCIAS DE CONFERENCISTAS INVITADOS REGLAMENTO DE RESUMENES Y DE TRABAJOS COMPLETOS TRABAJOS: en este Congreso son denominados

Más detalles

Facultad de Ciencias Jurídicas. Escuela de Estudios Internacionales. Sílabo

Facultad de Ciencias Jurídicas. Escuela de Estudios Internacionales. Sílabo Facultad de Ciencias Jurídicas Escuela de Estudios Internacionales Sílabo 1. Datos generales: 1.1. Asignatura: Gramática Inglesa Intermedia (Intermediate English Grammar) 1.2. Código: CJU0085 1.3. Créditos:

Más detalles

Libros (BK), Recursos continuos (CR), Archivos de computador (CF), Mapas (MP), Música (MU), Materiales visuales (VM), Materiales mixtos (MX).

Libros (BK), Recursos continuos (CR), Archivos de computador (CF), Mapas (MP), Música (MU), Materiales visuales (VM), Materiales mixtos (MX). CÓDIGO AP-BIB-IN-02 VERSIÓN 1 VIGENCIA 2016 Página 1 de 7 1. PRE CATALOGACIÓN Ingresar al módulo de Catalogación e inmediatamente se abre el menú desplegable (+Nuevo registro) haciendo clic y elija la

Más detalles

Pontificia Universidad Católica del Ecuador

Pontificia Universidad Católica del Ecuador Pontificia Universidad Católica del Ecuador FACULTAD DE COMUNICACIÓN, LINGÜÍSTICA Y LITERATURA Escuela de Lenguas- Coordinación de Español E-MAIL: mejaramillo@puce.edu.ec Av. 12 de Octubre 1076 y Roca

Más detalles

Unidad 1. Análisis de Algoritmos. Ing. Leonardo R. L. Estructura de datos - Generalidades Unidad I Pág 1

Unidad 1. Análisis de Algoritmos. Ing. Leonardo R. L. Estructura de datos - Generalidades Unidad I Pág 1 Unidad 1 Análisis de Algoritmos Ing. Leonardo R. L. Estructura de datos - Generalidades Unidad I Pág 1 GENERALIDADES Qué se necesita para escribir un programa eficiente? Para diseñar programas eficientes

Más detalles

MINISTERIO DE EDUCACIÓN DIRECCIÓN DE EDUCACIÓN DE ADULTOS PROGRAMA DE LENGUA ESPANOLA CURSO DE SUPERACIÓN INTEGRAL PARA JÓVENES EOC I

MINISTERIO DE EDUCACIÓN DIRECCIÓN DE EDUCACIÓN DE ADULTOS PROGRAMA DE LENGUA ESPANOLA CURSO DE SUPERACIÓN INTEGRAL PARA JÓVENES EOC I MINISTERIO DE EDUCACIÓN DIRECCIÓN DE EDUCACIÓN DE ADULTOS PROGRAMA DE LENGUA ESPANOLA CURSO DE SUPERACIÓN INTEGRAL PARA JÓVENES EOC I Unidad 1? Conversar sobre temas seleccionados de interés nacional e

Más detalles

Nombre de la asignatura: INGLÉS IV. Clave de la asignatura: LEI-04. Horas teoría Horas Práctica Créditos: ASIGNATURA TEMAS ASIGNATURA TEMAS

Nombre de la asignatura: INGLÉS IV. Clave de la asignatura: LEI-04. Horas teoría Horas Práctica Créditos: ASIGNATURA TEMAS ASIGNATURA TEMAS 1) DATOS DE LA ASIGNATURA: Nombre de la asignatura: INGLÉS IV Clave de la asignatura: LEI-04 Horas teoría Horas Práctica Créditos: 1-2-0 2) UBICACIÓN DE LA ASIGNATURA a) RELACIÓN CON OTRAS ASIGNATURAS

Más detalles

BÚSQUEDA Y RECUPERACIÓN DE INFORMACIÓN

BÚSQUEDA Y RECUPERACIÓN DE INFORMACIÓN BÚSQUEDA Y RECUPERACIÓN DE INFORMACIÓN Qué son las competencias informacionales (CI2)? Son las destrezas desarrolladas para la resolución de problemas de información. Para estar dotado de competencia informacional

Más detalles

Módulo de Consultas. Procedimiento para hacer una consulta

Módulo de Consultas. Procedimiento para hacer una consulta Módulo de Consultas Éste módulo está destinado a facilitar el hallazgo de inmuebles en función de diferentes criterios de búsqueda, ya sea bajo petición de un cliente o para listados internos Procedimiento

Más detalles

340455 - REIN-I7P23 - Recuperación de la Información

340455 - REIN-I7P23 - Recuperación de la Información Unidad responsable: 340 - EPSEVG - Escuela Politécnica Superior de Ingeniería de Vilanova i la Geltrú Unidad que imparte: 723 - CS - Departamento de Ciencias de la Computación Curso: Titulación: 2015 GRADO

Más detalles

Motores de Búsqueda Web Tarea Tema 3: Limitaciones de la recuperación de información tradicional en la Web

Motores de Búsqueda Web Tarea Tema 3: Limitaciones de la recuperación de información tradicional en la Web Motores de Búsqueda Web Tarea Tema 3: Limitaciones de la recuperación de información tradicional en la Web 71454586A Motores de Búsqueda Web Máster en Lenguajes y Sistemas Informáticos - Tecnologías del

Más detalles

Introducción al Procesamiento de Lenguaje Natural. Grupo PLN - InCo 2017

Introducción al Procesamiento de Lenguaje Natural. Grupo PLN - InCo 2017 Introducción al Procesamiento de Lenguaje Natural Grupo PLN - InCo 2017 Recuperación de Información Recuperación de Información Dada una colección de documentos: cómo podemos recuperar información relevante

Más detalles

Curso. Lingüística Aplicada II (Sistemas de aplicación lingüística)

Curso. Lingüística Aplicada II (Sistemas de aplicación lingüística) Curso Lingüística Aplicada II (Sistemas de aplicación lingüística) DURACIÓN: 80 horas AUTOR DEL PROGRAMA: Dr. Alexander Gelbukh OBJETIVO GENERAL Describir que tipos de sistemas de aplicación lingüística

Más detalles

1. Escribir un texto básico conforme a nivel 1. Incentiva el logro 3 de las carreras Aceptar la diversidad...

1. Escribir un texto básico conforme a nivel 1. Incentiva el logro 3 de las carreras Aceptar la diversidad... INSTITUTO SUPERIOR TECNOLÓGICO DE CINE Y ACTUACIÓN SILABO Nombre de la asignatura: Inglés I Ciclo o semestre: Primero Eje de formación: De libre opción Créditos de la asignatura: 3 Modalidad: Presencial

Más detalles

Español 5. Guía para el docente 42

Español 5. Guía para el docente 42 Unidad 4: Seamos artistas del lenguaje Contenido: el párrafo, la descripción Actividad de activación de conocimientos previos Los estudiantes arman rompecabezas de párrafos, pueden trabajarlo en equipos.

Más detalles

Bases de Datos Textuales, Una Herramienta en el Trabajo de la Recuperación de Información

Bases de Datos Textuales, Una Herramienta en el Trabajo de la Recuperación de Información Bases de Datos Textuales, Una Herramienta en el Trabajo de la Recuperación de Información UCR ECCI CI-2414 Recuperación de Información Prof. Kryscia Daviana Ramírez Benavides Un Acercamiento a las Bases

Más detalles

EXPERIMENTO DE RECUPERACIÓN DE INFORMACIÓN USANDO LAS MEDIDAS DE SIMILITUD COSENO, JACCARD Y DICE

EXPERIMENTO DE RECUPERACIÓN DE INFORMACIÓN USANDO LAS MEDIDAS DE SIMILITUD COSENO, JACCARD Y DICE EXPERIMENTO DE RECUPERACIÓN DE INFORMACIÓN USANDO LAS MEDIDAS DE SIMILITUD COSENO, JACCARD Y DICE L. S. GARCÍA MONSALVE 1 LUZ STELLA GARCÍA MONSALVE 1 Ingeniera de Sistemas con énfasis en Desarrollo de

Más detalles

Algoritmos y Estructuras de Datos Curso 2010/2011 Práctica. Temas 2 y 3: Conjuntos y árboles

Algoritmos y Estructuras de Datos Curso 2010/2011 Práctica. Temas 2 y 3: Conjuntos y árboles A Contexto Para llevar a cabo su propósito, buscadores como Google o Yahoo deben de indexar enormes cantidades de páginas Web. De acuerdo con el portal WorldWideWebSize.com (http://www.worldwidewebsize.com/)

Más detalles

Programación II Práctica 02a: Tipos Abstractos de Datos (TAD) Básicos

Programación II Práctica 02a: Tipos Abstractos de Datos (TAD) Básicos Introducción Programación II Práctica 02a: Tipos Abstractos de Datos (TAD) Básicos Versión del 01/08/2015 En las clases teóricas se estudiaron las ventajas que tienen los TADs. A continuación las repasamos:

Más detalles

Materia Idioma 1. Inglés 1. Título de la asignatura o curso monográfico Tipo de asignatura Curso en que se imparte. Obligatoria 1 Curso

Materia Idioma 1. Inglés 1. Título de la asignatura o curso monográfico Tipo de asignatura Curso en que se imparte. Obligatoria 1 Curso Materia Idioma 1 Título de la asignatura o curso monográfico Tipo de asignatura Curso en que se imparte Inglés 1 Obligatoria 1 Curso Nombre y apellidos María del Carmen Méndez García Datos del coordinador

Más detalles

Aplicaciones Numéricas de la Informática

Aplicaciones Numéricas de la Informática Aplicaciones Numéricas de la Informática Guía de Aprendizaje Información al estudiante 1. Datos Descriptivos Asignatura Materia Departamento responsable Aplicaciones Numéricas de la Informática Matemáticas

Más detalles

Procesamiento básico de texto en Unix ProgPLN

Procesamiento básico de texto en Unix ProgPLN Procesamiento básico de texto en Unix ProgPLN Víctor Peinado v.peinado@filol.ucm.es 17-23 de octubre de 2014 Referencias Unix for poets 1 Comandos para procesar ficheros de texto 1 Church, K. W. Unix for

Más detalles

SECUENCIACIÓN DE CONTENIDOS

SECUENCIACIÓN DE CONTENIDOS SECUENCIACIÓN DE CONTENIDOS PRUEBA DE DIAGNÓSTICO 1.1. Captar el sentido global. 1.2. Contar un cuento. 1.3. Detectar errores. 1.4. Comprender noticias. 2.1. Palabras sinónimas y antónimas. 2.2. Palabras

Más detalles

TABLA DE CONTENIDOS. Dedicatoria. Agradecimientos. Tabla de Contenidos. Índice de Figuras. Índice de Tablas. Resumen

TABLA DE CONTENIDOS. Dedicatoria. Agradecimientos. Tabla de Contenidos. Índice de Figuras. Índice de Tablas. Resumen TABLA DE CONTENIDOS página Dedicatoria Agradecimientos Tabla de Contenidos Índice de Figuras Índice de Tablas Resumen I II IV VIII IX XII 1. Introducción 13 1.1. Marco general...............................

Más detalles

UNIDAD 8. LAS CONSULTAS DE RESUMEN

UNIDAD 8. LAS CONSULTAS DE RESUMEN UNIDAD 8. LAS CONSULTAS DE RESUMEN 8.1 Definición En Access podemos definir un tipo de consultas cuyas filas resultantes son un resumen de las filas del origen de la consulta, por eso las denominamos consultas

Más detalles

Tema 3. Dpto. de Métodos Cuantitativos e Informáticos Facultad de Ciencias de la Empresa. UPCT. Tema 3

Tema 3. Dpto. de Métodos Cuantitativos e Informáticos Facultad de Ciencias de la Empresa. UPCT. Tema 3 Tema 3 El almacenamiento de la información: Ficheros y GBD Información La información es la materia prima de toda organización Información de calidad = Información útil procesar la información: eficacia

Más detalles

2. Codificar de forma sistemática la secuencia de instrucciones en un lenguaje.

2. Codificar de forma sistemática la secuencia de instrucciones en un lenguaje. Modulo 1. Introducción a los lenguajes de programación La solución de problemas mediante en uso de un computador nos lleva a desarrollar programas o aplicaciones, la construcción de estos programas debe

Más detalles

Minería de Datos Web. Cursada 2018

Minería de Datos Web. Cursada 2018 Minería de Datos Web Cursada 2018 Proceso de Minería de Texto Clustering de Documentos Clasificación de Documentos Es un método supervisado para dividir documentos en base a categorías predefinidas Los

Más detalles

PSYCINFO Guía de consulta

PSYCINFO Guía de consulta PSYCINFO PSYCINFO Guía de consulta Contenido: Base de datos elaborada por la American Psychological Association (APA) con cobertura internacional sobre Psicología y disciplinas afines como Psiquiatría,

Más detalles

Fundamentos PHP. El término puntuación nos referimos a la sintaxis usada en PHP para la terminación de una línea de código (;)

Fundamentos PHP. El término puntuación nos referimos a la sintaxis usada en PHP para la terminación de una línea de código (;) Tags Fundamentos PHP La Sintaxis de PHP se deriva de muchos lenguajes de programación principalmente de C pero Perl también ha tenido mucha influencia en esta sintaxis Con las últimas incorporaciones agregadas,

Más detalles

Objetivos. Adultos: Elementary. Los alumnos aprenderán a: Captar el contenido esencial de comunicaciones verbales básicas.

Objetivos. Adultos: Elementary. Los alumnos aprenderán a: Captar el contenido esencial de comunicaciones verbales básicas. Objetivos Adultos: Elementary Captar el contenido esencial de comunicaciones verbales básicas. Recabar información necesaria de comunicaciones básicas para realizar una tarea específica. simples adecuadamente.

Más detalles

1. Escribir un texto básico conforme a nivel 2. Incentiva el logro 3 de las carreras Aceptar la diversidad...

1. Escribir un texto básico conforme a nivel 2. Incentiva el logro 3 de las carreras Aceptar la diversidad... INSTITUTO SUPERIOR TECNOLÓGICO DE CINE Y ACTUACIÓN SILABO Nombre de la asignatura: Inglés II Ciclo o semestre: Segundo Eje de formación: De libre opción Créditos de la asignatura: 3 Modalidad: Presencial

Más detalles

ANX-PR/CL/ GUÍA DE APRENDIZAJE. ASIGNATURA Lingüistica computacional. CURSO ACADÉMICO - SEMESTRE Primer semestre

ANX-PR/CL/ GUÍA DE APRENDIZAJE. ASIGNATURA Lingüistica computacional. CURSO ACADÉMICO - SEMESTRE Primer semestre ANX-PR/CL/001-02 GUÍA DE APRENDIZAJE ASIGNATURA Lingüistica computacional CURSO ACADÉMICO - SEMESTRE 2015-16 - Primer semestre GA_10MI_105000160_1S_2015-16 Datos Descriptivos Nombre de la Asignatura Titulación

Más detalles

UNIDAD ACADÉMICA DE ECOLOGÍA MARINA MAESTRÍA EN RECURSOS NATURALES Y ECOLOGÍA PROGRAMAS DE ESTUDIO DATOS GENERALES DE LA UNIDAD DE APRENDIZAJE

UNIDAD ACADÉMICA DE ECOLOGÍA MARINA MAESTRÍA EN RECURSOS NATURALES Y ECOLOGÍA PROGRAMAS DE ESTUDIO DATOS GENERALES DE LA UNIDAD DE APRENDIZAJE MRNyE UNIDAD ACADÉMICA DE ECOLOGÍA MARINA MAESTRÍA EN RECURSOS NATURALES Y ECOLOGÍA PROGRAMAS DE ESTUDIO DATOS GENERALES DE LA UNIDAD DE APRENDIZAJE IDENTIFICACIÓN Nombre: Seminario de Investigación 3

Más detalles

Asignatura: Informática Documental Código: Año académico: Centro:

Asignatura: Informática Documental Código: Año académico: Centro: Asignatura: Informática Documental Código: 41007308 Año académico: 2007-2008 Centro: Escuela Politécnica Superior Departamento: Lenguajes y Computación Área: Lenguajes y Sistemas Informáticos Titulación:

Más detalles

Universidad Nacional de Luján República Argentina Ruta 5 y Av. Constitución C.C LUJÁN (Bs. As.)

Universidad Nacional de Luján República Argentina Ruta 5 y Av. Constitución C.C LUJÁN (Bs. As.) Universidad Nacional de Luján República Argentina ------ Ruta 5 y Av. Constitución C.C. 221-6700 LUJÁN (Bs. As.) Nº DISPOSICIÓN:... DEPARTAMENTO DE: Ciencias Básicas CARRERA/S: Licenciatura en Sistemas

Más detalles

Análisis y Recuperación de Información

Análisis y Recuperación de Información Análisis y Recuperación de Información 1 er Cuatrimestre 2016 Página Web http://www.exa.unicen.edu.ar/catedras/ayrdatos/ Prof. Dra. Daniela Godoy ISISTAN Research Institute UNICEN University Tandil, Bs.

Más detalles

Curso Online My Oxford English

Curso Online My Oxford English Curso Online My Oxford English My Oxford English es un sistema formativo online compuesto por una extensa variedad de contenidos multimedia de la máxima calidad, diseñado para facilitar al usuario el aprendizaje

Más detalles

Sistemas de Recuperación de Información

Sistemas de Recuperación de Información Sistemas de Recuperación de Información Los SRI permiten el almacenamiento óptimo de grandes volúmenes de información y la recuperación eficiente de la información ante las consultas de los usuarios. La

Más detalles

Asignatura: Horas: Total (horas): Obligatoria X Teóricas 3.0 Semana 3.0 de elección Optativa Prácticas Semanas 48.0

Asignatura: Horas: Total (horas): Obligatoria X Teóricas 3.0 Semana 3.0 de elección Optativa Prácticas Semanas 48.0 UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE INGENIERÍA PROGRAMA DE ESTUDIO PROCESAMIENTO DEL LENGUAJE NATURAL 0751 8º, 9º 06 Asignatura Clave Semestre Créditos Ingeniería Eléctrica Ingeniería en

Más detalles

TÉCNICAS BASADAS EN GRAFOS APLICADOS AL PROCESAMIENTO DEL LENGUAJE

TÉCNICAS BASADAS EN GRAFOS APLICADOS AL PROCESAMIENTO DEL LENGUAJE ASIGNATURA DE MÁSTER: TÉCNICAS BASADAS EN GRAFOS APLICADOS AL PROCESAMIENTO DEL LENGUAJE Curso 2015/2016 (Código:31101305) 1.PRESENTACIÓN En muchas aplicaciones del Procesamiento del Lenguaje Natural las

Más detalles

INGLÉS CONVERSACIONAL III Y TALLER

INGLÉS CONVERSACIONAL III Y TALLER INGLÉS CONVERSACIONAL III Y TALLER I. JUSTIFICACIÓN Inglés Conversacional III y Taller es el tercero de cuatro módulos de inglés conversacional cuyo fin es brindar a los estudiantes los recursos y las

Más detalles

IIC Sistemas Recomendadores - PUC Chile

IIC Sistemas Recomendadores - PUC Chile Factorización Matricial para RecSys IIC 3633 - Sistemas Recomendadores - PUC Chile Denis Parra Profesor Asistente, DCC, PUC CHile Page 1 of 35 Memo del Semestre Tarea 1: Deadline nuevo, Jueves 8 de Septiembre.

Más detalles

UNIVERSIDAD AUTONOMA DE NAYARIT AREA DE CIENCIAS BIOLÓGICO AGROPECUARIAS Y PESQUERAS ESCUELA NACIONAL DE INGENIERIA PESQUERA

UNIVERSIDAD AUTONOMA DE NAYARIT AREA DE CIENCIAS BIOLÓGICO AGROPECUARIAS Y PESQUERAS ESCUELA NACIONAL DE INGENIERIA PESQUERA UNIVERSIDAD AUTONOMA DE NAYARIT AREA DE CIENCIAS BIOLÓGICO AGROPECUARIAS Y PESQUERAS ESCUELA NACIONAL DE INGENIERIA PESQUERA 1. IDENTIFICACIÓN DEL CURSO Área de Formación TRONCO BÁSICO UNIVERSITARIO Cuerpo

Más detalles

TEEN - Inglés Técnico para Ingenieros

TEEN - Inglés Técnico para Ingenieros Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2015 295 - EEBE - Escuela de Ingeniería de Barcelona Este 745 - EAB - Departamento de Ingeniería Agroalimentaria y Biotecnología

Más detalles

Módulo 1. Introducción a los lenguajes de programación

Módulo 1. Introducción a los lenguajes de programación Módulo 1. Introducción a los lenguajes de programación Objetivo - Definir qué es un lenguaje de programación e identificar cómo es su forma de clasificación. Introducción a los lenguajes de programación

Más detalles

1.1. Desde la página Web de nuestra biblioteca seleccione la pestaña Bases de datos e introduzca PSYCARTICLES en la casilla de búsqueda.

1.1. Desde la página Web de nuestra biblioteca seleccione la pestaña Bases de datos e introduzca PSYCARTICLES en la casilla de búsqueda. PSYCARTICLES PSYCARTICLES Guía de consulta Contenido: Colección de revistas a texto completo publicadas por diferentes entidades relacionadas con la psicología, entre ellas la American Psychological Association,

Más detalles

Mayo Fecha de elaboración: 28 de mayo de 2010 Fecha de última actualización:

Mayo Fecha de elaboración: 28 de mayo de 2010 Fecha de última actualización: PROGRAMA DE ESTUDIO Administración de bases de datos Programa Educativo: Licenciatura en Sistemas Computacionales. Área de Formación : Sustantiva Profesional Horas teóricas: 3 Horas prácticas: 2 Total

Más detalles

GUÍA DOCENTE CURSO FICHA TÉCNICA DE LA ASIGNATURA

GUÍA DOCENTE CURSO FICHA TÉCNICA DE LA ASIGNATURA GUÍA DOCENTE CURSO 2015-16 FICHA TÉCNICA DE LA ASIGNATURA Datos de la asignatura Nombre Inglés II Código E000003981 Titulación Grado en Relaciones Internacionales Curso 2º Créditos ECTS 6 Carácter Básica

Más detalles

Lingüística computacional

Lingüística computacional Lingüística computacional Definición y alcance Escuela Nacional de Antropología e Historia (ENAH) Agosto diciembre de 2015 Lingüística Ciencias de la computación Lingüística computacional Estudio del lenguaje

Más detalles

Herramientas para la Interoperabilidad y Normalización de datos en RI

Herramientas para la Interoperabilidad y Normalización de datos en RI Herramientas para la Interoperabilidad y Normalización de datos en RI Tesina Licenciatura en Sistemas FACULTAD DE INFORMÁTICA UNLP Autor: Almazán, María Belén Director: Ing. De Giusti, Marisa Motivación

Más detalles

Curso Online My Oxford English

Curso Online My Oxford English Curso Online My Oxford English My Oxford English es un sistema formativo online compuesto por una extensa variedad de contenidos multimedia de la máxima calidad, diseñado para facilitar al usuario el aprendizaje

Más detalles

Examen diagnóstico. Valentín:

Examen diagnóstico. Valentín: Fecha Temas y materiales Responsable Metodología Clase 1 Introducción a la clase Teresa Dey Presentación y entrega de programas. 29-08- 13 Examen diagnóstico. Clase 2 05-09- 13 Clase 3 12-09- 13 Un poco

Más detalles

Estructura de Google

Estructura de Google Recuperación de Información en Internet: Estructura de Google Martín Llamas Nistal Nuevos Servicios Telemáticos Curso 2003-2004 Contenidos Introducción Características de Google Arquitectura de Google

Más detalles

Microsoft Word Contenido programático Microsoft Excel Microsoft Word [Contenido programático] RESUMEN 1 / 12

Microsoft Word Contenido programático Microsoft Excel Microsoft Word [Contenido programático] RESUMEN 1 / 12 Microsoft Word 2007 Contenido programático Microsoft Excel 2007 [Contenido programático] RESUMEN Este curso provee a todos los profesionales que usan Word como herramienta de trabajo, un amplio co 1 /

Más detalles

Estrategias para la búsqueda y recuperación de información especializada. Centro de Información Empresarial de Bogotá -CIEB-

Estrategias para la búsqueda y recuperación de información especializada. Centro de Información Empresarial de Bogotá -CIEB- Estrategias para la búsqueda y recuperación de información especializada Centro de Información Empresarial de Bogotá -CIEB- Cámara de Comercio de Bogotá 2015 GENERALIDADES OBJETIVO Capacitar a los usuarios

Más detalles

PROCESADOR DE TEXTOS: WRITER

PROCESADOR DE TEXTOS: WRITER PROCESADOR DE TEXTOS: WRITER Profesor: José María González Centro: I.E.S. AZAHAR - ( Antas Almería ) Teoría OpenOffice Writer Capítulo IV: Herramientas Nivel de Dificultad: Medio 1. Barras de Herramientas.

Más detalles

UNIDAD ACADÉMICA DE ECOLOGÍA MARINA MAESTRÍA EN RECURSOS NATURALES Y ECOLOGÍA PROGRAMAS DE ESTUDIO DATOS GENERALES DE LA UNIDAD DE APRENDIZAJE

UNIDAD ACADÉMICA DE ECOLOGÍA MARINA MAESTRÍA EN RECURSOS NATURALES Y ECOLOGÍA PROGRAMAS DE ESTUDIO DATOS GENERALES DE LA UNIDAD DE APRENDIZAJE MRNyE UNIDAD ACADÉMICA DE ECOLOGÍA MARINA MAESTRÍA EN RECURSOS NATURALES Y ECOLOGÍA PROGRAMAS DE ESTUDIO DATOS GENERALES DE LA UNIDAD DE APRENDIZAJE IDENTIFICACIÓN Nombre: Seminario de Investigación 2

Más detalles

FORMATO SUGERIDO DE PROGRAMA OPERATIVO PARA LA PLANEACIÓN DIDÁCTICA (Colegio de Ciencias y Humanidades) Nombre: COLEGIO MADRID A.C.

FORMATO SUGERIDO DE PROGRAMA OPERATIVO PARA LA PLANEACIÓN DIDÁCTICA (Colegio de Ciencias y Humanidades) Nombre: COLEGIO MADRID A.C. FORMATO SUGERIDO DE PROGRAMA OPERATIVO PARA LA PLANEACIÓN DIDÁCTICA (Colegio de Ciencias y Humanidades) DATOS DE LA INSTITUCIÓN Nombre: COLEGIO MADRID A.C. Clave 1107 DATOS DEL PROFESOR Nombre: Lorena

Más detalles

18 / 19 enero Comprensión lectora y oral. 20 / 21 enero Expresión escrita + expresión oral. 11 / 12 abril Comprensión lectora y oral

18 / 19 enero Comprensión lectora y oral. 20 / 21 enero Expresión escrita + expresión oral. 11 / 12 abril Comprensión lectora y oral 5.5.2. Pruebas 5.5.2.1. Prueba de diagnóstico: Los alumnos de Nivel Intermedio 1 realizarán una prueba de diagnostico dentro de la Unidad 0. Esta se realizará en clase los días 7 y 8 de octubre para los

Más detalles

PSYCINFO Guía de consulta

PSYCINFO Guía de consulta PSYCINFO PSYCINFO Guía de consulta Contenido: Base de datos elaborada por la American Psychological Association (APA) con cobertura internacional sobre Psicología y disciplinas afines como Psiquiatría,

Más detalles

GUÍA DE APRENDIZAJE REDES DE COMPUTADORES

GUÍA DE APRENDIZAJE REDES DE COMPUTADORES GUÍA DE APRENDIZAJE REDES DE COMPUTADORES GRADO EN INGENIERIA DEL SOFTWARE Datos Descriptivos CENTRO RESPONSABLE: E.U. DE INFORMATICA OTROS CENTROS IMPLICADOS: CICLO: Grado sin atribuciones MÓDULO: MATERIA:

Más detalles

Para una mejor comprensión cada unidad de información participante debe leer esta hoja y el glosario de la terminología antes de comenzar.

Para una mejor comprensión cada unidad de información participante debe leer esta hoja y el glosario de la terminología antes de comenzar. CRITERIOS COMUNES PARA LA EVALUACIÓN DE UN MOTOR DE BÚSQUEDA FEDERADA, QUE PERMITA INTEGRAR BASES DE DATOS INTERNACIONALES POR SUSCRIPCIÓN, CATÁLOGOS PÚBLICOS DE ACCESO EN LÍNEA (OPAC S), REPOSITORIOS

Más detalles

PROGRAMA DE ESTUDIOS INGLÉS I HCA SEMANAL HTI SEMANAL SEMESTRAL

PROGRAMA DE ESTUDIOS INGLÉS I HCA SEMANAL HTI SEMANAL SEMESTRAL IDENTIFICACIÓN DEL CURSO Ubicación HCA SEMANAL PROGRAMA DE ESTUDIOS INGLÉS I HTI SEMANAL HCA SEMESTRAL HTI SEMESTRAL TOTAL SEMANAL TOTAL SEMESTRAL Valoren créditos 3er semestre 3 1 48 16 16 64 4 Tipo de

Más detalles

Alumnos Identifican vocabulario de la unidad al OA01

Alumnos Identifican vocabulario de la unidad al OA01 UNIDAD 1: HOW DO YOU FEEL? ACTITUDES ASOCIADAS: Demostrar interés, esfuerzo, perseverancia y rigor frente a la resolución de problemas y la búsqueda de nuevas soluciones para problemas reales. (OA C) Mostrar

Más detalles

La interacción con el usuario en los sistemas de recuperación de información: realimentación por relevancia

La interacción con el usuario en los sistemas de recuperación de información: realimentación por relevancia La interacción con el usuario en los sistemas de recuperación de información: realimentación por relevancia Carlos García Figuerola Ángel Francisco Zazo José Luis Alonso Berrocal Grupo de Recuperación

Más detalles

Pontificia Universidad Católica del Ecuador

Pontificia Universidad Católica del Ecuador Fax: 593 2 299 95 1. DATOS INFORMATIVOS: MATERIA O MÓDULO: ESPAÑOL CÓDIGO: 17218 CARRERA: NIVEL: No. CRÉDITOS: SEIS 9 (CURSO INTENSIVO DE 3 HRS. DIARIAS) CRÉDITOS TEORÍA: CRÉDITOS PRÁCTICA: SEMESTRE /

Más detalles

UNIDAD I Introducción al Sistema Manejador de Base de Datos (DBMS)

UNIDAD I Introducción al Sistema Manejador de Base de Datos (DBMS) UNIDAD I Introducción al Sistema Manejador de Base de Datos (DBMS) Un conjunto de elementos de datos que se describen a sí mismo, junto con relaciones y restricciones entre esos elementos, que presentan

Más detalles

Modelos de Razonamiento

Modelos de Razonamiento Modelos de Razonamiento P R E S E N T A C I Ó N D E L A A S I G N A T U R A C U R S O : 5 º P R O F E S O R E S : O S C A R C O R C H O G A R C Í A M I G U E L A N G E L G A R C Í A R E M E S A L Objetivos

Más detalles

INDICE Prefacio Capitulo 1: Introducción Parte Primeras: modelos de datos Capitulo 2: Modelos entidad-relación Capitulo 3: El modelo relacional

INDICE Prefacio Capitulo 1: Introducción Parte Primeras: modelos de datos Capitulo 2: Modelos entidad-relación Capitulo 3: El modelo relacional INDICE Prefacio XVII Capitulo 1: Introducción 1.1 Aplicaciones de los sistemas de bases de datos 1 1.2. Sistemas de bases de datos frente a sistemas de archivos 2 1.3 Visión de los datos 3 1.4 modelos

Más detalles