César Antonio Aguilar Facultad de Lenguas y Letras 16/10/2017

Documentos relacionados
Curso de semántica general

Curso de traducción automática de lenguas naturales

César Antonio Aguilar Facultad de Lenguas y Letras 10/06/2013

Seminario de análisis del discurso

César Antonio Aguilar Facultad de Lenguas y Letras 03/11/2016

Guía de uso de las opciones de búsqueda del Diccionario multilingüe de la ciencia del suelo

Nuevas Tecnologías aplicadas a las Finanzas. Especializaciones. 1. Ingeniería Lingüística. Un nuevo mercado. Presentación del curso:

EQUIVALENCIAS CON EL RESTO DE LAS CARRERAS DE INGENIERÍA

Bing (proveedor de busqueda) Bing es una herramienta de búsqueda que nos ayudará a encontrar lo que buscamos de forma rápida y sencilla.

Marco conceptual Diseño de investigación Objetivos Enfoque metodológico Muestreo Instrumentos Plan de campo Cronograma de actividades Presupuesto

1. Cómo introducir datos en SPSS/PC? - Recordatorio

Historia PERFIL VOCACIONAL CAMPO LABORAL DATO PONTIFICIA UNIVERSIDAD CATÓLICA DEL PERÚ

Recursos sobre Prevención de Riesgos Laborales en Construcción, disponibles en Internet: el proyecto de portal SIBP de Buenas Prácticas en PRL.

LENGUA ESPAÑOLA Y LITERATURA 1º ESO. - Análisis sintáctico: Sujeto, Predicado, SN y SV.

Curso sobre Literatura del programa de E/LE del Ministerio de Educación del Estado de Israel

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES CUAUTITLÁN PLAN DE ESTUDIOS DE LA LICENCIATURA EN QUÍMICA INDUSTRIAL

LICENCIATURA EN TRADUCCIÓN. Este programa educativo se ofrece en las siguientes sedes académicas de la UABC: Unidad académica donde se imparte

Temas de Reflexión en el

BILINGÜISMO Y ADQUISICIÓN DE UNA SEGUNDA LENGUA

Universidad Autónoma Metropolitana Unidad Azcapotzalco. División de Ciencias Básicas e Ingeniería. Licenciatura en Ingeniería en Computación

Introducción a la lingüística computacional

Quién hace blogs? Enric Bruguera Payà P08/93006/01568

Cómo se utiliza la tabla de Distribución de frecuencias?

Cursos. 2a Quinzena Desembre ª Quincena Diciembre 2016

COLEGIO DE POSTGRADUADOS CAMPUS VERACRUZ AGROECOSISTEMAS TROPICALES

CAPACITACIÓN GRATUITA EN IDIOMAS PARA DOCENTES DE LA UNLP

FACULTAD DE INGENIERÍA ESCUELA ACADÉMICA PROFESIONAL DE INGENIERÍA CIVIL

Capítulo 4. EL USO DE LOS MÉTODOS CUALITATIVOS PARA ELESTUDIO DELOS ASPECTOS COMUNES

Competencia Comunicativa y tipos de textos. Aníbal D. Guerra, Daniel E. Piñerez, Julio C. Castellanos. Universidad Cooperativa de Colombia

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

>> Tecnologías clave << Captura de de información. Infraestructura. Técnicas de de Prototipado rápido

PRACTICA: FUNCIONES HASH

Programa de Lectura y redacción

LICENCIATURA EN RELACIONES INTERNACIONALES. Este programa educativo se ofrece en las siguientes sedes académicas de la UABC:

Curso de procesamiento del lenguaje natural

Teorías del aprendizaje

BASES DE DATOS. Biblioteca Virgilio Dávila. Agosto, 2010.

CREACIÓN DE UNA PÁGINA WEB CON JIMDO

2. METODOLOGÍA. Los tipos fundamentales de Estudios de Investigación, como nos recuerda Bavaresco, son cuatro:

GRADO EN TURISMO COMPETENCIAS. Competencias genéricas. CG-1. Toma de decisiones. CG-2. Trabajo en un equipo de carácter interdisciplinar.

Semana 12. Metodología de la investigación

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO. Práctica periodística dirigida

GRADO EN. Traducción e Interpretación Inglés-Alemán

Bloque I. Técnicas de Investigación Cualitativa y Mixta

Guía para redactar una monografía. Por: Socorro Sánchez Bibliotecaria Programa de Instrucción al Usuario

Convocatoria para docentes ocasionales y catedráticos Facultad de Ciencias Humanas y Sociales. Requisitos generales de la convocatoria

Construcción de tablas de análisis sintáctico LL(1)

Existen diferentes recursos interactivos que han sido utilizados para la enseñanza

INGENIERO MECÁNICO. Este programa educativo se ofrece en las siguientes sedes académicas de la UABC:

SERVICIO NACIONAL DE APRENDIZAJE SENA SISTEMA INTEGRADO DE GESTIÓN Procedimiento Ejecución de la Formación Profesional Integral GUÍA DE APRENDIZAJE

Guía del Examen de Conocimientos del Idioma Japonés 2010

Ing. Eduardo Cruz Romero w w w. tics-tlapa. c o m

Gracia Pinero Pinero. Perfecto simple y perfecto compuesto en la norma culta de Las Palmas de Gran Canaria A

Unidad 4. Autómatas de Pila

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES A C A T L Á N

CARACTERÍSTICAS GENERALES

Aprendemos a crear un blog

ENCUESTA EGRESADOS DE NIVEL LICENCIATURA EN Quiénes son los egresados que contestaron la encuesta?

PROGRAMA DE LABORATORIO SECCIÓN: ÁREA A LA QUE PERTENECE: POS-REQUISITO: AUXILIAR:

ÍNDICE 3.- PROGRAMAS DE FORMACIÓN BASADOS EN NORMAS DE COMPETENCIA LABORAL

LICENCIATURA EN ECONOMÍA. Este programa educativo se ofrece en las siguientes sedes académicas de la UABC:

Bloque temático Marketing turístico Curso Segundo. Tipos asignatura Obligatoria Créditos 6 cr. ECTS Horas de trabajo autónomo

ESTRATEGIAS DE BÚSQUEDA DE INFORMACIÓN

ANEXO III 2.º DE EDUCACIÓN SECUNDARIA

Estimación para Proyectos Software

2. CONOCIMIENTO Actividad por la cual se adquiere certeza de la realidad, de la existencia del entorno, con características comprobadas.

EJERCICIO 26 DE EXCEL

UNIVERSIDAD AUTÓNOMA DE ZACATECAS (UAZ)

IDENTIFICACIÓN DE LA ACTIVIDAD PEDAGÓGICA. Búsquedas en Google

MANUAL DEL PROGRAMA EXCEL LABORAL

Curso de procesamiento del lenguaje natural

Seminario Avance de Proyectos de Investigación

Curso de procesamiento del lenguaje natural

Reconocimiento e Interpretación de Expresiones Temporales

DOBLE GRADO EN TURISMO - ADMINISTRACION Y DIRECCION DE EMPRESAS

Curso Práctico de Francés para Secretariado de Dirección. Idiomas

Volunteer. Realizar y entretener páginas Web sirviéndose de un sistema de gestión de contenidos y plantillas

Tema: Autómata de Pila

GUÍA DE EJERCICIOS. Área de Lectura y Escritura

UNIVERSIDAD DEL VALLE DE MÉXICO PROGRAMA DE ESTUDIO DE LICENCIATURA PRAXIS MES XXI

Las Campañas Multisensoriales: una nueva tendencia publicitaria

La voz pasiva en español: un análisis discursivo

Resumen de las Sesiones del Curso Roles del Hombre y la Mujer Kairós-RIA

Dado que en la actualidad alrededor del 80% de los adolescentes pasan 20 horas a la semana jugando

El conocimiento del alfabeto y la escritura temprana

Ingeniería de Software y Sistemas Computacionales

LICENCIADO EN SISTEMAS COMPUTACIONALES. Este programa educativo se ofrece en las siguientes sedes académicas de la UABC:

LENGUA, LENGUAJE HABLA, NORMA Y VARIEDADES LÉXICAS

Maestría en Administración de Negocios

Apropiación tecnológica de recursos educativos abiertos (REA) para la enseñanza del español como un segundo idioma

DIPLOMADO EN REDACCIÓN EJECUTIVA Y PROFESIONAL Coordinadora: Dra. Rosa Margarita Galán Vélez

Programa de Asignatura Herramientas Informáticas para la Investigación

10 Presencia del catalán en la Red

Métodos para la obtención automática de términos en un área de especialidad

PERFIL DE PUESTO DESCRIPCION GENERAL DEL PUESTO

UNIVERSIDAD DE GUADALAJARA

Índice Mexicano de Reputación Empresarial 2004 (IMRE) Resumen Ejecutivo Transparencia Mexicana / Consulta Mitofsky

Estructura y Redacción de un Artículo Científico. Elizabeth Lizeth Mayer Granados

Tema: Excel Formulas, Funciones y Macros

PERFIL PROFESIONAL EN COMPETENCIAS PROFESIONALES TÉCNICO SUPERIOR UNIVERSITARIO EN MECATRÓNICA ÁREA AUTOMATIZACIÓN. Versión Ejecutiva PRESENTACIÓN

Transcripción:

Métodos de Investigación en Letras César Antonio Aguilar Facultad de Lenguas y Letras 16/10/2017 caguilara@uc.cl

Síntesis de la clase pasada En la clase pasada hicimos una breve descripción sobre cómo funcionan los métodos cualitativos, destacando dos de sus características: 1. Su énfasis en desarrollar herramientas precisas para la colecta de datos, tales como las entrevistas con formatos libres o con micrófono abierto, la generación de relatos de vida, y otras similares. 2. Su interés por construir corpus lingüísticos, los cuales permiten analizar datos previamente colectados y organizados por investigadores interesados en compartirlos a la comunidad.

Qué es un corpus lingüístico? (1) Entrando en detalles, un corpus se concibe como un modelo que representa una realidad lingüística, por lo que ofrece una base empírica que muestra el funcionamiento de una lengua natural. En un plano estadístico debe ser neutral, esto es, proporcional respecto a las muestras que se tomen. Por ello, es un instrumento reutilizable para distintos tipos de análisis.

Qué es un corpus lingüístico? (2) Cómo se construye un corpus?:

Qué es un corpus lingüístico? (3)

Anotación textual (1)

Anotación textual (2) Veamos un ejemplo real para entender cómo funciona esta clase de anotado: www.corpus.unam.mx:8080/corcode/ Se trata de un buscador de contextos definitorios para el inglés, desarrollado por el Grupo de Ingeniería Lingüística, afiliado a la UNAM (México) www.iling.unam.mx/corpus/

Anotación textual (4)

Encabezado y Cuerpo (1) La cabeza (o Head), es un conjunto de descriptores que resumen la información contenida en una página WEB:

Encabezado y Cuerpo (2) En cambio, el Body ya es la estructuración de los contenidos de tal página:

Ordenar/clasificar (1)

Ordenar/clasificar (2)

Ordenar/clasificar (3)

Sistemas de etiquetado XML

Corpus con anotado lingüístico (1) Vamos a ver ahora un tipo de anotado que se enfoca en el reconocimiento de unidades gramaticales, y que vamos a denominar anotado morfo-sintáctico. Este etiquetado nos permite hacer, sobre todo, análisis gramaticales usando programas de cómputo específicos para esta clase de tareas.

Corpus con anotado lingüístico (2)

Corpus con anotado lingüístico (3)

Corpus con anotado lingüístico (4)

Tareas relacionadas con corpus anotados gramaticalmente (1) Veamos un ejemplo sobre cómo podemos usar un corpus con etiquetado gramatical. Para ello, vamos a usar un corpus de documentos técnicos llamado Bwananet, desarrollado por el Instituto Universitario de Lingüística Aplicada, afiliado a la Universidad Pompeu Fabra (Barcelona, Cataluña, España). http://bwananet.iula.upf.edu

Tareas relacionadas con corpus anotados gramaticalmente (2) Bwananet es un sistema que tiene almacenado distintos corpus de áreas especializadas en 3 lenguas: inglés, español y catalán. Igualmente, cuenta con un motor de búsqueda que permite realizar varias tareas terminológicas. Así, empecemos seleccionado un idioma: Pregunta: Vamos a plantearnos una que sea sencilla: la gente que trabaja en ingeniería y ciencias de la computación, usan términos derivados del concepto de gramática, igual que los lingüistas? Cómo podemos saberlo?

Tareas relacionadas con corpus anotados gramaticalmente (3) Ahora, seleccionamos un dominio de conocimiento, p.e., informática:

Tareas relacionadas con corpus anotados gramaticalmente (4) A continuación, viene una de las partes más difíciles del proceso: fijar una ventana de palabras, que no es otra cosa más que una secuencia de lexemas organizada según el número de unidades que consideramos contiene el patrón que buscamos.

Tareas relacionadas con corpus anotados gramaticalmente (5) Finalmente, tenemos una ventana que nos permite establecer los criterios de búsqueda que tenemos en mente para nuestros patrones.

Tareas relacionadas con corpus anotados gramaticalmente (6) Veamos los resultados: Qué nos muestra Bwananet?

Tareas relacionadas con corpus anotados gramaticalmente (7) Y ahora, vamos a hacer búsquedas con lemas :

Tareas relacionadas con corpus anotados gramaticalmente (8) Y los resultados son: Cuál es la diferencia, y qué clase de búsqueda les parece que es más eficiente?

Gracias por su atención Blog del curso: http://cesaraguilar.weebly.com/presentacioacuten.html