Seminario de análisis del discurso

Documentos relacionados
Seminario de análisis del discurso

Curso de procesamiento del lenguaje natural

Curso de traducción automática de lenguas naturales

Curso de semántica general

Temas de Reflexión en el

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 06/04/2016.

Raúl

Introducción a la lingüística computacional

PRUEBA EXTRAORDINARIA DE SEPTIEMBRE LENGUA CASTELLANA Y LITERATURA 1º ESO

Inteligencia artificial

4º ESO CRITERIOS DE EVALUACIÓN. Unidad 1. Unidad 2. Unidad 3. Unidad 4. Unidad 5

Curso de procesamiento del lenguaje natural

La fonología es esencialmente la descripción del sistema y de los patrones de los sonidos de una lengua (Yule 1998:66).

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 14/03/2016.

4.1 CONGRUENCIA ENTRE LOS OBJETIVOS DEL PLAN DE ESTUDIOS Y EL PERFIL DE EGRESO CON LAS LGAC:

LICENCIATURA EN LINGÜÍSTICA LISTADO DE MATERIAS CONTENIDO PLAN:

NARRACIÓN, DESCRIPCIÓN, DIÁLOGO. LA ORACIÓN

César Antonio Aguilar Facultad de Lenguas y Letras 10/06/2013

PLANES DE RECUPERACIÓN DE 1º ESO PARA SEPTIEMBRE - curso 2013/14 LENGUA CASTELLANA Y LITERATURA

b) Criterios específicos de evaluación. Se evaluarán sobre los siguientes criterios:

Universidad Autónoma Metropolitana Unidad Azcapotzalco. División de Ciencias Básicas e Ingeniería. Licenciatura en Ingeniería en Computación

Especialidades en GII-TI

ANEXO III 2.º DE EDUCACIÓN SECUNDARIA

Interfaces. Carrera: SCF Participantes. Representantes de la academia de sistemas y computación de los Institutos Tecnológicos.

Reconocimiento Automático de Voz

LENGUA ESPAÑOLA Y LITERATURA. Objetivos

COLEGIO de la UNLPam ASIGNATURA: INGLES CURSO Y NIVEL: 6º AÑO CICLO ORIENTADO Nivel C DOCENTE: PROF. JORGELINA ELENA RODRIGUEZ

Procesadores de Lenguaje

DEPARTAMENTO DE LENGUA CASTELLANA Y LITERATURA CURSO ESCOLAR APRENDIZAJES IMPRESCINDIBLES NIVEL 2º ESO

GUÍA BREVE SOBRE LENGUA CASTELLANA Y LITERATURA DE 2º DE BACHARELATO

Toda copia en PAPEL es un "Documento No Controlado" a excepción del original.

PROGRAMA DE LABORATORIO SECCIÓN: ÁREA A LA QUE PERTENECE: POS-REQUISITO: AUXILIAR:

HOJA INFORMATIVA LATÍN 4º ESO

PROYECTO DOCENTE ASIGNATURA: "Lengua Francesa VI" Grupo: GRUPO 2(989773) Titulacion: Grado en Estudios Franceses Curso:

PROYECTO DOCENTE ASIGNATURA: "Lengua Española"

Unidad III: Lenguaje de presentación

Curso de procesamiento del lenguaje natural

Información Académica para Familias y Alumnos/as LENGUA CASTELLANA Y LITERATURA CURSO PRIMERO DE ESO CONTENIDOS MÍNIMOS. 1.

RESUMEN INFORMATIVO PROGRAMACIÓN DIDÁCTICA CURSO 2015 /2016

PERCEPCIÓN DEL HABLA Reconocimiento de Palabras Habladas

Interfaces. Carrera: SCF Participantes. Representantes de la academia de sistemas y computación de los Institutos Tecnológicos.

CARACTERÍSTICAS GENERALES

Profesor de Español para Extranjeros ELE

Departamento de Filología PROGRAMACIÓN DIDÁCTICA. Nivel 3º ESO L. CASTELLANA

ACCESS 2010 FÁCIL - ONLINE - EN LÍNEA

EL TEXTO Y SU ANÁLISIS. Sanders, T. (2006). Text and Text Analysis Encyclopedia of Language and Linguistics

Diseño y desarrollo Web con HTML 5, CSS y Dreamweaver CS 4

1. CONSIDERACIONES GENERALES

PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR FACULTAD DE COMUNICACIÓN, LINGÜÍSTICA Y LITERATURA ESCUELA DE LINGÜÍSTICA

LÍNEAS DESARROLLADAS POR LOS DIFERENTES GRUPOS DE INVESTIGACIÓN EN LA FACULTAD DE CIENCIAS DE LA SALUD DE LA UNIVERSIDAD DE ALICANTE

Seminario de análisis del discurso

DREAMWEAVER CS4 Código: 3492

GUÍA DE EJERCICIOS. Área de Lectura y Escritura


CURSO: 1º LENGUA Y LITERATURA

Contenidos 1º E.S.O. Castellano

UNIVERSIDAD DE PLAYA ANCHA FACULTAD DE HUMANIDADES. Vicerrectora Académica Dirección de Estudios, Innovación Curricular y Desarrollo Docente

César Antonio Aguilar Facultad de Lenguas y Letras 03/11/2016

Propósitos por Ciclos

COMPETENCIAS BÁSICAS, GENERALES, TRANSVERSALES Y ESPECÍFICAS

Evaluación del lenguaje. Modelo psicolingüístico. 7. ANEXOS

Capítulo 4. Lógica matemática. Continuar

CONTENIDOS DE LENGUA CASTELLANA Y LITERATURA. 2º ESO. PRUEBA EXTRAORDINARIA DE SEPTIEMBRE

CINTENIDOS Y CRITERIOS DE EVALUACIÓN 3º ESO SEPTIEMBRE

Maestría en Ingeniería Énfasis en Sistemas y Computación

Diseño Organizacional. Lectura No. 7 Estructura y Diseño Organizacional

UNIVERSIDAD AUTÓNOMA DEL CARIBE PROCEDIMIENTO DE PROGRAMACIÓN DE LOS HORARIOS SEMESTRALES DEL ÁREA SALAS DE INFORMÁTICA GESTIÓN DOCENCIA

CONTENIDOS DE LENGUA CASTELLANA Y LITERATURA 1º ESO (CONVOCATORIA EXTRAORDINARIA SEPTIEMBRE 2013)

PROCESO SELECTIVO CRITERIOS DE VALORACIÓN ESPECIALIDAD: AUDICIÓN Y LENGUAJE

Rocío Pérez Carmona Páginas de 2 a 3. Carmen Elena Martínez Páginas de 4 a 5. Resto de profesores Páginas 6 a 7

COMUNICACIÓN Y LENGUAJE. EL PROCESO DE COMUNICACIÓN HUMANA.

Curso de procesamiento del lenguaje natural

UNIVERSIDAD AUTÓNOMA DE CHIAPAS LICENCIATURA EN SISTEMAS COMPUTACIONALES

UNIVERSIDAD CARLOS III DE MADRID PROGRAMA DE LA ASIGNATURA: LENGUA CASTELLANA

UNIVERSIDAD NACIONAL DE LA MATANZA

Carrera: Ingeniería en Tecnologías de la Información y Comunicaciones

El curso es de naturaleza aplicativa y teórico-práctica, y se estructura en cuatro unidades:

Web semántica, sistemas multiagente y redes sociales móviles

INTERFACES INTELIGENTES. ING. MA. MARGARITA LABASTIDA ROLDÁN E mail:

INGLES NM3 3º EM. Unidad temáticas CONOCIMIENTOS BÁSICOS DEL PROFESOR

Identificación de polaridad en textos en español basada en la creación de un léxico afectivo

CONTENIDOS MÍNIMOS BLOQUE 2. NÚMEROS

1. Conocer los orígenes de las lenguas habladas en España, clasificarlas y localizarlas en un mapa.

ORIENTACIONES PARA LA PRUEBA DE ACCESO A CICLOS FORMATIVOS DE GRADO SUPERIOR. PARTE COMÚN: LENGUA CASTELLANA Y LITERATURA

El cambio lingüístico. Sus causas, mecanismos y consecuencias

PROGRAMACIÓN DE AULA Iniciativa Emprendedora 4º ESO

Universidad Autónoma del Estado de México Licenciatura en Ingeniería en Sistemas Energéticos Sustentables

CONTENIDOS DEL CURSO ONLINE DE DISEÑO Y DESARROLLO WEB CON HTML5, CSS Y DREAMWEAVER CS4:

Borrador del temario de la guía PAA. PRIMERA PARTE: RAZONAMIENTO VERBAL.

Idioma Inglés PLANIFICACIONES Actualización: 2ºC/2016 Planificaciones Idioma Inglés Docente responsable: JOHNSTONE NANCY ELENA 1 de 6

Documentación FUNCIONAL. Sistema de Información para la gestión de DOCUMENTOS y REGISTROS del SISTEMA DE CALIDAD

3. ESTRUCTURA DE UN CONVERSOR TEXTO-VOZ

LENGUA Y LITERATURA CASTELLANA 2º BACHILLERATO. Curso

MASTER PROFESIONAL C# 5 Y ASP.NET MVC 5

Tema: Herramientas UML, Análisis y diseño UML

1.- DATOS DE LA ASIGNATURA. Multimedia y Realidad Virtual Licenciatura en Informática

Tema: Herramientas UML, Análisis y diseño UML

TEMARIO EXAMEN DE EXONERACIÓN

Componentes de la narrativa

PONTIFICIA UNIVERSIDAD CATOLICA DEL ECUADOR FACULTAD DE INGENIERIA ESCUELA DE INGENIERIA DE SISTEMAS

Transcripción:

Seminario de análisis del discurso Dr. César Antonio Aguilar Facultad de Lenguas y Letras 09/09/2010 CAguilar@iingen.unam.mx

Anotación lingüística (1) Algo que marca una diferencia fundamental entre tener una colección de textos o fragmentos y un CL, es su anotación o etiquetado. El etiquetado es una plantilla que ayuda a manipular electrónicamente el contenido textual de un CL. Básicamente, hay dos tipos de etiquetados: 1. Etiquetado textual: se emplea para compilar y organizar los documentos que van a formar parte del CL. 2. Etiquetado lingüística: es aquel que se usa para simbolizar los hechos lingüísticos particulares que se van a analizar. Si bien se considera el etiquetado fonético, prosódico, pragmático y discursivo, regularmente se asocia el etiquetado morfológico y sintáctico bajo el nombre de POST (Part-of-Speech-Tagging).

Anotación lingüística (2) Fonético Semántico (léxica) Discursivo Pragmático (diálogo)

Etiquetado textual (1) 1. Ayuda a los procesos de búsqueda y recuperación por medio de un sistemas computaciones. 2. Se relacionan con lenguajes de compilación como SGM, HTML, XML u otros similares. 3. Facilita su almacenamiento en repositorios o bases de datos. 4. Permite una mejor visualización vía el empleo de interfaces o Internet.

Etiquetado textual (2) Veamos un caso de la vida real: supongamos que queremos identificar en una colección de documentos técnicos términos y definiciones como las del ejemplo:

Interludio (1): contexto definitorio Patrón pragmático Término <Matemáticamente>, <la Teoría Lineal> <se considera como> <una primera aproximación de una descripción teórica completa acerca del comportamiento del oleaje.> Predicación verbal Definición CD

Interludio (2): contexto definitorio Qué es una definición? Expresión lingüística de un concepto asociado a un término. Se estructura en torno a dos unidades básicas: un género próximo y una diferencia específica. Género próximo Inicialmente podemos considerar un buque como un flotador que trata de permanecer en posición vertical frente a perturbaciones exteriores. Diferencia específica

Interludio (3): contexto definitorio Género próximo Sinonimia Diferencia específica Funcional Extensional

Buscando CDs (1) Esta búsqueda de términos y definiciones ligados (que podemos llamar contextos definitiorios (o Cds), plantea el siguiente problema: 1. Tengo un conjunto de potenciales CDs obtenidos de diferentes textos, pero tales Cds no están organizados 2. Si quiero desplegarlos en mi pantalla, necesito estructurarlos de una forma clara, con miras a identificar qué cosa es un término y qué cosa es una definición. 3. En concreto: necesito construir un corpus de CDs, el cual me muestre por lo menos tres unidades importantes: un término, una definición y una frase verbal.

Buscando CDs (2) Un etiquetado del tipo XML se basa en el uso de dos elementos básicos: Etiquetas: es el nombre o la variable que ocupo para reconocer a un objeto. Atributos: es el conjunto de rasgos mínimos que me sirven para identificar a dicho objeto. Nota: antes de hacer cualquier cosa, hay que diseñar un esquema de etiquetado (p. e., usando papel y lápiz)

Buscando CDs (3) Toda hoja que etiquetamos en XML debe considerar dos partes: una cabeza y un cuerpo. Estas serían las etiquetas para la cabeza (ing. Head):

Buscando CDs (4) Y estas son las partes que conforman el cuerpo (ing. Body):

Resultados (1) Y qué obtenemos tras aplicar etiquetas XML a un documento? Veamos el siguiente ejemplo. Primero, un corpus sin etiquetas:

Resultados (2) Apliquemos nuestras primeras etiquetas: dónde inicia y dónde termina un CD?:

Resultados (3)

Resultados (4)

Resultados (5)

Aplicaciones Veamos ahora dos aplicaciones. 1. Una mera consulta a un corpus de contextos definitorios: http://linux.iingen.unam.mx/iling/bpublica/v/varios_muestracorpuscds.pdf 2. Un buscador automático de CDs en colecciones de documentos técnicos: http://brangaene.upf.edu/ecode/

Etiquetado de partes de la oración (1) Etiquetado EAGLES: iniciativa de la Comisión Europea (1993-1996), propuesta para el desarrollo y generación de recursos para el procesamiento de lenguaje natural.

Etiquetado de partes de la oración (2) Etiquetado PennTreeBank: Desarrollado por el Laboratorio de Lingüística Computacional de la Universidad de Pensilvania, se plantea como una opción para la creación y explotación de análisis sintáctico computacional (parsing).

Métodos de análisis Híbridos Basados en reglas formales Estadísticos

Técnicas Conteo de palabras Medidas de asociación Concordancias Chunking y Parsing

Gracias por su atención Blog del curso: http://discurso-uaq.weebly.com/