Curso de procesamiento del lenguaje natural

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Curso de procesamiento del lenguaje natural"

Transcripción

1 Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 02/05/2012 Cesar.Aguilar72@gmail.com

2 Qué es una palabra dentro de un corpus? (1) Un hecho que se da muchas veces por sentado en lenguaje natural es el término palabra. Usualmente, la vemos como una cadena de caracteres delimitada por espacios en blanco, con un contenido léxico específico, además de tener rasgos fonológicos, morfológicos y sintácticos. Ahora, esto es así de claro siempre? Qué pasa con las lenguas que tienen como medio de escritura los ideogramas? El primer grafo se pronuncia rén, y significa persona ; el segundo se prouncia mù, y significa árbol. Ambos son identificados como palabras.

3 Qué es una palabra dentro de un corpus? (2) Otro caso, por ejemplo, son las lenguas con morfología aglutinante, p. e., en alemán una frase como La biblioteca de la Universidad de Stuttgart equivalen a dos palabras: Universitätsbibliothek Stuttgart. Existen casos curiosos como la palabra Bundeslandwirtschaftsministerin, que equivale en español a Ministro de Estado para Asuntos Económicos.

4 Qué es una palabra dentro de un corpus? (3) Incluso en español tenemos casos curiosos. Cómo escribirían estas palabras?:

5 Análisis al nivel de palabra (1)

6 Análisis al nivel de palabra (2)

7 Análisis al nivel de palabra (3)

8 Un déjà vu con el POS

9 Por qué es útil el etiquetado POS?

10 Textos crudos y cocidos

11 Procesando textos nuevamente (1) Retomemos nuestros experimentos con NLTK, para lo cual vamos a emplear nuestro conocido texto sobre Turing. Las herramientas que requerimos importar primero son: Una vez hecho esto, importemos nuestro archivo de texto: Cadena_Turing01 = open( Escritorio/turing01.txt', 'ru').read()

12 Procesando textos nuevamente (2) Volvamos a desarrollar el código que hicimos la clase pasada: 1. Tokenizar con la opción que NLTK da default: Tokens_Turing01 = nltk.word_tokenize(cadena_turing01) 2. Insertar etiquetas POS default desde NLTK: Tagged_Turing01 = nltk.pos_tag(tokens_turing01) 3. Mostrar algunos resultados: Tagged_Turing01[0:100]

13 Procesando textos nuevamente (3) Pregunta: que tenemos realmente en nuestro archivo Turing: types o tokens asociados a palabras? Mientras pensamos esto, resolvamos la siguiente cuestión: cuántas palabras hay aquí?

14 Procesando textos nuevamente (4)

15 Procesando textos nuevamente (5) >>> Tokens_Turing01 = nltk.word_tokenize(cadena_turing01)

16 Procesando textos nuevamente (6) Un resultado conocido:

17 Procesando textos nuevamente (6) Un atajo: podemos tokenizar directamente nuestro documento con las siguientes funciones:

18 El algoritmo de Porter (1) La lematización de corpus textuales (sobre todo en inglés) ha tenido un avance considerable a partir de la implementación del algoritmo de Porter.

19 El algoritmo de Porter (2) Para ahorrarnos unas palabras, veamos la explicación que da de este algortimo Dan Jurafsky en su curso:

20 El algoritmo de Porter (3) Las reglas que aplica Porter son las siguientes:

21 El algoritmo de de Porter (4) (4) El algoritmo permite trabajar con palabras que tengan flexión regular o irregular:

22 El algoritmo de Porter (5) Finalmente, este algoritmo nos permite hacer un análisis morfológico bastante eficaz, incluso adaptándolo a otras lenguas.

23 El algoritmo de Porter (6)

24 El algoritmo de Brill (1) Otro algoritmo útil en esta clase de procesamiento al nivel de palabra es el que desarrolló Eric Brill, el cual reconoce formas de palabras, asociándolas posteriormente a una etiqueta sintáctica. Al respecto pueden ver el siguiente sitio WEB: Brill_tagger Eric Brill

25 El algoritmo de Brill (2) El algoritmo de Brill se fundamenta en el aprendizaje basado en transformaciones y dirigido por el error. Este algoritmo consta de los siguientes módulos:

26 El algoritmo de Brill (3) El etiquetador léxico funciona del siguiente modo:

27 El algoritmo de Brill (4) Por su parte, el etiquetador de palabras desconocidas intenta adivinar una etiqueta para una palabra desconocida en función de sus afijos (sufijos o prefijos), y de otras propiedades relevantes similares

28 El algoritmo de Brill (5) El algoritmo de Brill cuenta también con una plantilla genérica de transformaciones léxicas, esto es:

29 El algoritmo de Brill (5) Un ejemplo de transformaciones:

30 El algoritmo de Brill (6) Ejemplos de aplicación en español:

31 El algoritmo de Brill (7) El etiquetador contextual actúa justo después del etiquetador de palabras desconocidas, ya que aplica en orden una secuencia de reglas contextuales que han sido aprendidas de manera automática a partir del corpus de entrenamiento. Un ejemplo es:

32 El algoritmo de Brill (8) El etiquetador contextual también cuenta con una plantilla de transformaciones:

33 El algoritmo de Brill (9) Veamos un caso aplicado al inglés. Supongamos que queremos aplicar un proceso de etiquetado basados en el Corpus Brown:

34 El algoritmo de Brill (10) Aplicamos nuestro etiquetador, y obtenemos oraciones anotadas como:

35 El algoritmo de Brill (11) Si aplicamos el algoritmo de Brill, el módulo de etiquetado contextual podría aplicar las siguientes reglas:

36 El algoritmo de Brill (12) Aplicando la segunda regla obtenemos: Para mayores detalles, pueden consultar la siguiente página, la cual es una explicación que dan Miguel Alonso, Jorge Graña y Jesús Virales, de la Universidad de La Coruña (España):

37 El algoritmo de Porter en NLTK (1) NLTK nos permite usar estos dos algoritmos de manera automática para detectar raíces en nuestros textos. En esta clase, vamos a abordar en concreto el algoritmo de Porter. La instrucción para importarlo es: >>> porter = nltk.porterstemmer() Vamos a complementar el uso del algoritmo de Porter con otro similar, llamado alroritmo de Lancaster: >>> lancaster = nltk.lancasterstemmer()

38 El algoritmo de Porter en NLTK (2) Apliquemos entonces el algoritmo de Porter con la siguiente instrucción: >>> [porter.stem(t) for t in Tokens_Turing01] El resultado lo podemos ver en la siguiente lámina:

39 El algoritmo de Porter en NLTK (3) Intuitivamente, qué errores comete el algoritmo en nuestro texto? De qué manera creen que puedan mejorarse?

40 El algoritmo de Porter en NLTK (4) Ahora, usemos el algoritmo de Lancaster: >>> [lancaster.stem(t) for t in Tokens_Turing01] El resultado lo podemos ver en la siguiente lámina:

41 El algoritmo de Porter en NLTK (5) Qué diferencias encuentran respecto a los resultados arrojados por el algoritmo de Porter?

42 Usando WordNet para lematizar palabras (1) Finalmente, también se puede lematizar un documento. Para ello, NLTK emplea como diccionario una red léxica (otros lo llamarían ontología) con un listado de palabras asociadas a uno o varios ítems léxicos. Esta red léxica es WordNet. La instrucción es: >>> wnl_turing01 = nltk.wordnetlemmatizer() >>> [wnl_turing01.lemmatize(t) for t in Tokens_Turing01]

43 Usando WordNet para lematizar palabras (2) Resultado: Qué diferencias encuentran respecto a la tokenización y la lematización? En qué les podría resultar útil?

44 Gracias por su atención Blog del curso:

Introducción a la lingüística computacional

Introducción a la lingüística computacional Introducción a la lingüística computacional César Antonio Aguilar Facultad de Lenguas y Letras 01/10/2013 Cesar.Aguilar72@gmail.com Buscando nuevos textos (1) Antes de empezar a trabajar con los documentos

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 24/09/2013 Cesar.Aguilar72@gmail.com Etiquetado morfo-sintáctico (1) Etiquetado morfo-sintáctico (2) Funciones

Más detalles

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 21/03/2016.

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 21/03/2016. Semántica española César Antonio Aguilar Facultad de Lenguas y Letras 21/03/2016 caguilara@uc.cl Síntesis de la clase anterior (1) En la clase anterior terminamos de revisar las nociones de referencia

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 31/08/2016 Cesar.Aguilar72@gmail.com Corpus lingüísticos (1) Para la lingüística contemporánea, y en particular

Más detalles

Introducción a la lingüística computacional

Introducción a la lingüística computacional Introducción a la lingüística computacional César Antonio Aguilar Facultad de Lenguas y Letras 15/10/2013 Cesar.Aguilar72@gmail.com Analizando frases con NLTK (1) En esta sesión vamos a empezar a emplear

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 11/04/2013 Cesar.Aguilar72@gmail.com Explorando NLTK (1) En esta sesión, vamos a ver algunos de los recursos

Más detalles

Raúl

Raúl Raúl Garreta @raulgarreta Subárea de Inteligencia Artificial, Ciencias de la Computación. Estudia métodos que permitan a las máquinas interactuar con las personas mediante lenguaje natural. Poder extraer

Más detalles

Seminario de análisis del discurso

Seminario de análisis del discurso Seminario de análisis del discurso Dr. César Antonio Aguilar Facultad de Lenguas y Letras 09/09/2010 CAguilar@iingen.unam.mx Anotación lingüística (1) Algo que marca una diferencia fundamental entre tener

Más detalles

Curso de traducción automática de lenguas naturales

Curso de traducción automática de lenguas naturales Curso de traducción automática de lenguas naturales César Antonio Aguilar Facultad de Lenguas y Letras 27/11/2015 Cesar.Aguilar72@gmail.com Extracción de términos (1) Vamos a cerrar el curso abordando

Más detalles

Aprendizaje de etiquetas basado en transformaciones

Aprendizaje de etiquetas basado en transformaciones Aprendizaje de etiquetas basado en transformaciones El etiquetador de Brill Miguel A. Alonso Jorge Graña Jesús Vilares Departamento de Computación, Facultad de Informática, Universidade da Coruña Miguel

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 18/04/2013 Cesar.Aguilar72@gmail.com Expresiones regulares (1) Para convertir nuestros archivos en cadenas,

Más detalles

Introducción a la lingüística computacional

Introducción a la lingüística computacional Introducción a la lingüística computacional César Antonio Aguilar Facultad de Lenguas y Letras 17/08/2017 Cesar.Aguilar72@gmail.com Síntesis de la clase pasada (1) En la clase anterior nos dedicamos a

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Letras 05/10/2016 Cesar.Aguilar72@gmail.com Análisis sintáctico (1) De acuerdo con Jurafsky y Martin (2007), el estudio de

Más detalles

Seminario de análisis del discurso

Seminario de análisis del discurso Seminario de análisis del discurso Dr. César Antonio Aguilar Facultad de Lenguas y Letras 27/09/2010 CAguilar@iingen.unam.mx Análisis sintáctico en corpus (1) En esta clase, terminaremos de revisar lo

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 13/06/2012 Cesar.Aguilar72@gmail.com Semántica y PLN Por qué queremos usar computadoras en cuestiones de semántica?

Más detalles

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 06/04/2016.

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 06/04/2016. Semántica española César Antonio Aguilar Facultad de Lenguas y Letras 06/04/2016 caguilara@uc.cl Síntesis de la clase anterior (1) En la clase pasada, observamos de qué forma la lógica aporta a la semántica

Más detalles

Seminario de análisis del discurso

Seminario de análisis del discurso Seminario de análisis del discurso Dr. César Antonio Aguilar Facultad de Lenguas y Letras 25/10/2010 CAguilar@iingen.unam.mx Tarea Para iniciar la clase, revisemos nuestra tarea anterior. El fragmento

Más detalles

César Antonio Aguilar Facultad de Lenguas y Letras 16/10/2017

César Antonio Aguilar Facultad de Lenguas y Letras 16/10/2017 Métodos de Investigación en Letras César Antonio Aguilar Facultad de Lenguas y Letras 16/10/2017 caguilara@uc.cl Síntesis de la clase pasada En la clase pasada hicimos una breve descripción sobre cómo

Más detalles

Curso de traducción automática de lenguas naturales

Curso de traducción automática de lenguas naturales Curso de traducción automática de lenguas naturales César Antonio Aguilar Facultad de Lenguas y Letras 13/11/2015 Cesar.Aguilar72@gmail.com Síntesis de la clase pasada (1) En la clase anterior, tratamos

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 09/05/2012 Cesar.Aguilar72@gmail.com Empezando a programar En esta clase, vamos a ver algunas tareas para

Más detalles

Curso de traducción automática de lenguas naturales

Curso de traducción automática de lenguas naturales Curso de traducción automática de lenguas naturales César Antonio Aguilar Facultad de Lenguas y Letras 28/08/2015 Cesar.Aguilar72@gmail.com Síntesis de la clase pasada (1) Como vimos en nuestra primera

Más detalles

Seminario de análisis del discurso

Seminario de análisis del discurso Seminario de análisis del discurso Dr. César Antonio Aguilar Facultad de Lenguas y Letras 14/10/2010 CAguilar@iingen.unam.mx Análisis retórico de textos (1) La teoría de centrado, como hemos visto en la

Más detalles

3. ESTRUCTURA DE UN CONVERSOR TEXTO-VOZ

3. ESTRUCTURA DE UN CONVERSOR TEXTO-VOZ Capítulo 3. Estructura de un conversor texto-voz Pagina 27 3. ESTRUCTURA DE UN CONVERSOR TEXTO-VOZ 3.1 INTRODUCCIÓN La conversión automática de texto a voz requiere la sucesión de una serie de procesos

Más detalles

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 17/04/2017.

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 17/04/2017. Semántica española César Antonio Aguilar Facultad de Lenguas y Letras 17/04/2017 caguilara@uc.cl Síntesis de la clase anterior (1) Durante la clase pasada vimos algunos criterios y conceptos útiles para

Más detalles

UNIVERSIDAD DE LOS ANDES FACULTAD DE INGENIERÍA DIVISIÓN DE ESTUDIOS DE POSTGRADO POSTGRADO EN COMPUTACIÓN

UNIVERSIDAD DE LOS ANDES FACULTAD DE INGENIERÍA DIVISIÓN DE ESTUDIOS DE POSTGRADO POSTGRADO EN COMPUTACIÓN UNIVERSIDAD DE LOS ANDES FACULTAD DE INGENIERÍA DIVISIÓN DE ESTUDIOS DE POSTGRADO POSTGRADO EN COMPUTACIÓN APRENDIZAJE AUTOMÁTICO DE ONTOLOGÍAS PARA UN MARCO ONTOLÓGICO DINÁMICO EN LA WEB SEMÁNTICA Autor:

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 30/05/2012 Cesar.Aguilar72@gmail.com ASCII y Unicode en NLTK (1) ASCII y Unicode en NLTK (2) ASCII y Unicode

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Letras 06/12/2017 Cesar.Aguilar72@gmail.com La semántica desde un enfoque lingüístico (1) De acuerdo a lo que hemos venido

Más detalles

Curso. Lingüística Aplicada III (Procesamiento inteligente de textos)

Curso. Lingüística Aplicada III (Procesamiento inteligente de textos) Curso Lingüística Aplicada III (Procesamiento inteligente de textos) DURACIÓN: 80 horas AUTOR DEL PROGRAMA: Dr. Alexander Gelbukh, Dr. Grigori Sidorov OBJETIVO GENERAL Describir que tipos de sistemas de

Más detalles

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 10/04/2017.

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 10/04/2017. Semántica española César Antonio Aguilar Facultad de Lenguas y Letras 10/04/2017 caguilara@uc.cl Semántica y lógica (1) En esta clase, vamos a abordar una de las líneas de investigación que tiene hoy mayor

Más detalles

SKETCH ENGINE. Seminario de Traducción Automática Magíster en Traducción Pontificia Universidad Católica de Chile

SKETCH ENGINE. Seminario de Traducción Automática Magíster en Traducción Pontificia Universidad Católica de Chile SKETCH ENGINE Seminario de Traducción Automática Magíster en Traducción Pontificia Universidad Católica de Chile Sketch Engine Es un programa disponible en la web (cloud computing): http://www.sketchengine.co.uk

Más detalles

Introducción a la lingüística computacional

Introducción a la lingüística computacional Introducción a la lingüística computacional César Antonio Aguilar Facultad de Lenguas y Letras 22/08/2017 Cesar.Aguilar72@gmail.com Teoría de autómatas (1) La teoría de autómatas es una línea de investigación

Más detalles

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 14/03/2016.

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 14/03/2016. Semántica española César Antonio Aguilar Facultad de Lenguas y Letras 14/03/2016 caguilara@uc.cl Síntesis de la clase anterior (1) En la clase pasada hicimos una primera aproximación a los contenidos de

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural MPGI UC MAGISTER EN PROCESAMIENTO Y GESTIÓN DE LA INFORMACIÓN Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 09/08/2017 Cesar.Aguilar72@gmail.com Aprendiendo

Más detalles

Un lematizador desambiguado con R

Un lematizador desambiguado con R Un lematizador desambiguado con R Carlos J. Gil Bellosta cgb@datanalytics.com Mayo 2013 Contenidos 1 Motivación: un discurso de Rajoy 2 Lematización basada en reglas Lematización basada en diccionarios

Más detalles

Universidad Fermín Toro. Cabudare Lara

Universidad Fermín Toro. Cabudare Lara Universidad Fermín Toro Cabudare Lara Lenguaje Natural y Lenguaje Artificial Autor: Jesús Colmenarez C.I.13.032.160 Sec. SAIA Introducción a la Computación Lenguaje Natural El lenguaje natural es el lenguaje

Más detalles

César Antonio Aguilar Facultad de Lenguas y Letras 10/06/2013

César Antonio Aguilar Facultad de Lenguas y Letras 10/06/2013 Métodos y técnicas de investigación cuantitativa César Antonio Aguilar Facultad de Lenguas y Letras 10/06/2013 Cesar.Aguilar72@gmail.com Obteniendo datos (1) Como complemento a lo que vimos en la primera

Más detalles

Enju. A fast, accurate, and deep parser for English

Enju. A fast, accurate, and deep parser for English Enju A fast, accurate, and deep parser for English Introducción Enju es un parser para el inglés Desarrollado en la Universidad de Tokio http://www.nactem.ac.uk/enju Basado en una gramática HPSG Output

Más detalles

Profesor de Español para Extranjeros ELE

Profesor de Español para Extranjeros ELE Profesor de Español para Extranjeros ELE Modalidad Online Horario Flexible Descuento Alumnos Duración 420 horas Nivel Superior Subvención Empresas Descripción Detallada Profesor de Español para Extranjeros

Más detalles

N.A.C.H.U.S (New Advanced Clinical Hospital Ultra Search) Buscador Sintáctico de Conceptos Clínicos en los Informes de Alta de Urgencias

N.A.C.H.U.S (New Advanced Clinical Hospital Ultra Search) Buscador Sintáctico de Conceptos Clínicos en los Informes de Alta de Urgencias Resumen COMUNICACIÓN PREMIADA DE INFORSALUD N.A.C.H.U.S (New Advanced Clinical Hospital Ultra Search) Buscador Sintáctico de Conceptos Clínicos en los Informes de Alta de Urgencias Ignacio Martinez Soriano

Más detalles

Introducción al Procesamiento de Lenguaje Natural. Grupo PLN - InCo

Introducción al Procesamiento de Lenguaje Natural. Grupo PLN - InCo Introducción al Procesamiento de Lenguaje Natural Grupo PLN - InCo 2017 Normalización de Textos Unidades de texto Cuáles son las unidades independientes más pequeñas del texto? - Segmento del discurso

Más detalles

Curso de traducción automática de lenguas naturales

Curso de traducción automática de lenguas naturales Curso de traducción automática de lenguas naturales César Antonio Aguilar Facultad de Lenguas y Letras 25/09/2015 Cesar.Aguilar72@gmail.com Síntesis de la clase pasada (1) En la clase pasada, abordamos

Más detalles

Seminario de análisis del discurso

Seminario de análisis del discurso Seminario de análisis del discurso Dr. César Antonio Aguilar Facultad de Lenguas y Letras 04/10/2010 CAguilar@iingen.unam.mx Lingüística computacional y discurso (1) En esta nueva unidad, vamos a abordar

Más detalles

Introducción al procesamiento del lenguaje natural (PLN)

Introducción al procesamiento del lenguaje natural (PLN) Introducción al procesamiento del lenguaje natural (PLN) Leticia Martín-Fuertes Moreno Lingüista computacional en Bitext @nimbusaeta nimbusaeta@gmail.com Lingẅars @ Cylicon Valley 9 de noviembre de 2017

Más detalles

Analizador Sintáctico Ascendente

Analizador Sintáctico Ascendente Analizador Sintáctico Ascente Un Analizador Sintáctico (A. St.) Ascente construye el árbol desde las hojas hacia la raíz. Funciona por reducción-desplazamiento, lo cual quiere decir que, siempre que puede,

Más detalles

Palabra o afijo? Es posible pensar, por la tradición de la escritura que compartimos, que es fácil determinar si un morfema

Palabra o afijo? Es posible pensar, por la tradición de la escritura que compartimos, que es fácil determinar si un morfema Palabra o afijo? Es posible pensar, por la tradición de la escritura que compartimos, que es fácil determinar si un morfema es un afijo o si es una palabra. o es siempre obvio. Son especialmente problemáticos

Más detalles

César Antonio Aguilar Facultad de Lenguas y Letras 03/11/2016

César Antonio Aguilar Facultad de Lenguas y Letras 03/11/2016 Métodos de Investigación en Letras César Antonio Aguilar Facultad de Lenguas y Letras 03/11/2016 caguilara@uc.cl Síntesis de la clase pasada (1) Síntesis de la clase pasada (2) Ahora bien, lo que debemos

Más detalles

César Antonio Aguilar Facultad de Lenguas y Letras 08/04/2013

César Antonio Aguilar Facultad de Lenguas y Letras 08/04/2013 Métodos y técnicas de investigación cuantitativa César Antonio Aguilar Facultad de Lenguas y Letras 08/04/2013 Cesar.Aguilar72@gmail.com Definiendo el concepto de probabilidad En la clase pasada estuvimos

Más detalles

César Antonio Aguilar Facultad de Lenguas y Letras 22/04/2013

César Antonio Aguilar Facultad de Lenguas y Letras 22/04/2013 Métodos y técnicas de investigación cuantitativa César Antonio Aguilar Facultad de Lenguas y Letras 22/04/2013 Cesar.Aguilar72@gmail.com Distribución de frecuencias (1) En esta sesión, retomaremos nuestro

Más detalles

Índice. Introducción. Introducción: análisis léxico. Tema 2. Primera parte. análisis. Objetivo: analizar las palabras del texto. Sintagmas: sintaxis.

Índice. Introducción. Introducción: análisis léxico. Tema 2. Primera parte. análisis. Objetivo: analizar las palabras del texto. Sintagmas: sintaxis. Tema 2. Primera parte. Análisis léxico Ingeniería del Lenguaje Natural Departamento de Lenguajes y Sistemas Informáticos Universidad de Alicante http://www.dlsi.ua.es/asignaturas/iln Índice 1. Introducción.

Más detalles

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 13/03/2017.

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 13/03/2017. Semántica española César Antonio Aguilar Facultad de Lenguas y Letras 13/03/2017 caguilara@uc.cl Síntesis de la clase anterior (1) En la clase pasada hicimos una primera aproximación a los contenidos de

Más detalles

Introducción al Procesamiento de Lenguaje Natural. Obligatorio Corrector Ortográfico en Python

Introducción al Procesamiento de Lenguaje Natural. Obligatorio Corrector Ortográfico en Python Introducción al Procesamiento de Lenguaje Natural Obligatorio 2 2010 Corrector Ortográfico en Python Facultad de Ingeniería Instituto de Computación Grupo de Procesamiento de Lenguaje Natural El objetivo

Más detalles

Desambiguación del Sentido de las Palabras (Word Sense Disambiguation)

Desambiguación del Sentido de las Palabras (Word Sense Disambiguation) Desambiguación del Sentido de las Palabras (Word Sense Disambiguation) Introducción qué es ambigüedad? qué significa desambiguar? qué entendemos por sentido de las palabras? en qué consiste la tarea de

Más detalles

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 03/05/2017.

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 03/05/2017. Semántica española César Antonio Aguilar Facultad de Lenguas y Letras 03/05/2017 caguilara@uc.cl Síntesis de la clase anterior (1) En la clase pasada vimos algunas cuestiones relacionadas con la teoría

Más detalles

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 06/03/2017.

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 06/03/2017. Semántica española César Antonio Aguilar Facultad de Lenguas y Letras 06/03/2017 caguilara@uc.cl Introducción (1) Introducción (2) Ahora, para entrar en el tema, consideremos algunas preguntas que podemos

Más detalles

3. Comprender el concepto de declinación/flexión verbal.

3. Comprender el concepto de declinación/flexión verbal. CRITERIOS DE EVALUACIÓN Y ESTÁNDARES DE APRENDIZAJE DE GRIEGO I, DE 1º DE BACHILLERATO BLOQUE I: LA LENGUA GRIEGA 1. Conocer y localizar en mapas el marco geográfico de la lengua griega. 1.1. Localiza

Más detalles

Temas de Reflexión en el

Temas de Reflexión en el Temas de Reflexión en el CUADERNO DE TRABAJO. Humberto Cueva G. Temas de Reflexión El objetivo de los Temas de Reflexión es proporcionar herramientas conceptuales para que los estudiantes alcancen una

Más detalles

CLASES DE PALABRAS EL SUSTANTIVO Y EL ADJETIVO I

CLASES DE PALABRAS EL SUSTANTIVO Y EL ADJETIVO I CLASES DE PALABRAS EL SUSTANTIVO Y EL ADJETIVO I Una palabra es cada una de las partes bien limitadas de una frase u oración, en lenguaje hablado y escrito, que está formada por, al menos, un lexema y,

Más detalles

4º. CURSO DE EDUCACIÓN SECUNDARIA OBLIGATORIA LATÍN CONTENIDOS MÍNIMOS CURSO

4º. CURSO DE EDUCACIÓN SECUNDARIA OBLIGATORIA LATÍN CONTENIDOS MÍNIMOS CURSO 4º. CURSO DE EDUCACIÓN SECUNDARIA OBLIGATORIA LATÍN CONTENIDOS MÍNIMOS CURSO 2009-2010 Bloque 1. El sistema de la lengua latina. El abecedario y la pronunciación del latín. El latín como lengua flexiva.

Más detalles

Introducción a la lingüística computacional

Introducción a la lingüística computacional Introducción a la lingüística computacional César Antonio Aguilar Facultad de Lenguas y Letras 03/08/2017 Cesar.Aguilar72@gmail.com Qué es la lingüística computacional? (1) Qué es la lingüística computacional?

Más detalles

Universidad Simón Bolívar Departamento de Computación y Tecnología de la Información Organización del Computador CI-3815

Universidad Simón Bolívar Departamento de Computación y Tecnología de la Información Organización del Computador CI-3815 Universidad Simón Bolívar Departamento de Computación y Tecnología de la Información Organización del Computador CI-385 Proyecto Objetivos Generales: realizar un programa en lenguaje de bajo nivel del

Más detalles

ply Teoría de Lenguajes Ramiro Camino Junio 2015 Universidad de Buenos Aires

ply Teoría de Lenguajes Ramiro Camino Junio 2015 Universidad de Buenos Aires ply Teoría de Lenguajes Ramiro Camino Universidad de Buenos Aires Junio 2015 Introducción Sirve para construir analizadores léxicos y sintácticos. Implementación de lex y yacc en python. Sitio oficial:

Más detalles

1. Conocer los orígenes de las lenguas habladas en España, clasificarlas y localizarlas en un mapa.

1. Conocer los orígenes de las lenguas habladas en España, clasificarlas y localizarlas en un mapa. CUARTO CURSO DE EDUCACIÓN SECUNDARIA OBLIGATORIA BLOQUE 1: EL LATÍN, ORIGEN DE LAS LENGUAS MODERNAS. Marco geográfico de la lengua. El indoeuropeo. Las lenguas de España: lenguas romances y no romances.

Más detalles

Evaluación del lenguaje. Modelo psicolingüístico. 7. ANEXOS

Evaluación del lenguaje. Modelo psicolingüístico. 7. ANEXOS 7. ANEXOS Plantillas para la observación y elaboración de los programas de estimulación del lenguaje oral Clave de estructuración sintáctica adaptada de la Clave Fiftgerald para sordos Evaluación de las

Más detalles

Desambigüación del sentido de las palabras (WSD)

Desambigüación del sentido de las palabras (WSD) Desambigüación del sentido de las palabras (WSD) Miguel A. Alonso Departamento de Computación, Facultad de Informática, Universidade da Coruña 1 / 18 Índice 1 Introducción 2 Evaluación 3 Enfoques basados

Más detalles

Poeta ayer, hoy triste y pobre filósofo trasnochado tengo en monedas de cobre el oro de ayer cambiado.

Poeta ayer, hoy triste y pobre filósofo trasnochado tengo en monedas de cobre el oro de ayer cambiado. Poeta ayer, hoy triste y pobre filósofo trasnochado tengo en monedas de cobre el oro de ayer cambiado. Análisis de base Análisis sintáctico El análisis semántico se realiza a partir del análisis sintáctico.

Más detalles

Capítulo 5. Conclusiones

Capítulo 5. Conclusiones Capítulo 5 Conclusiones En este trabajo se desarrolló un sistema capaz de clasificar enunciados dependiendo de la opinión que cada uno expresa acerca de una película. Se cumplió entonces con el objetivo

Más detalles

TEMA 3. MORFOLOGÍA FLEXIVA Y LEXICA.

TEMA 3. MORFOLOGÍA FLEXIVA Y LEXICA. TEMA 3. MORFOLOGÍA FLEXIVA Y LEXICA. Recuerda que los lexemas son las unidades mínimas de las palabras con significado, y que los morfemas son las unidades complementarias del lexema que designan el género,

Más detalles

Contenido. Prefacio Orígenes de la programación orientada a objetos... 1

Contenido. Prefacio Orígenes de la programación orientada a objetos... 1 Prefacio... xv 1. Orígenes de la programación orientada a objetos... 1 1.1 La crisis del software... 1 1.2 Evolución del software... 3 1.3 Introducción a la programación orientada a procedimientos... 4

Más detalles

Instituto José Manuel Estrada - Villa de Soto. Asignatura: Desarrollo de Soluciones Informáticas. Curso: 5to I. Docente: Contreras, María Elena

Instituto José Manuel Estrada - Villa de Soto. Asignatura: Desarrollo de Soluciones Informáticas. Curso: 5to I. Docente: Contreras, María Elena - Villa de Soto Asignatura: Desarrollo de Soluciones Informáticas Curso: 5to I Docente: Contreras, María Elena Contenido Algoritmos... 1 Diagramas de flujo... 2 Programar... 3 Programación... 10 Scratch...

Más detalles

CRITERIOS DE EVALUACIÓN

CRITERIOS DE EVALUACIÓN 4º ESO. LATÍN. OBJETIVOS - Identificar y relacionar elementos morfológicos, sintácticos y léxicos de la lengua latina que permitan el análisis y la traducción de textos sencillos. - Desarrollar los hábitos

Más detalles

Contextualización del aprendizaje automático en procesamiento del lenguaje natural. Contexto

Contextualización del aprendizaje automático en procesamiento del lenguaje natural. Contexto Contextualización del aprendizaje automático en procesamiento del lenguaje natural Autores: Sergio Rafael Flores, Ilda Flavia Millán, Susana Ruiz Instituto de Informática - Departamento de Informática

Más detalles

Entrenamiento de nombres propios Identificación de nombres propios

Entrenamiento de nombres propios Identificación de nombres propios Preprocesamiento Miguel A. Alonso Jorge Graña Jesús Vilares Departamento de Computación, Facultad de Informática, Universidade da Coruña Miguel A. Alonso, Jorge Graña, Jesús Vilares (Departamento Preprocesamiento

Más detalles

Introducción al Diseño de Compiladores. Año

Introducción al Diseño de Compiladores. Año Introducción al Diseño de Compiladores Año 2003 1 BIBLIOGRAFÍA [AHO] Compilers. Principles, Techniques, and Tools Aho, Sethi; Adisson-Wesley 1986 [TEU] Compiladores: Conceptos fundamentales. Teufel ; Addison

Más detalles

GRIEGO 1º BACHILLERATO CRITERIOS DE EVALUACIÓN

GRIEGO 1º BACHILLERATO CRITERIOS DE EVALUACIÓN GRIEGO 1º BACHILLERATO I. Conocer diferentes sistemas de escritura y distinguirlos del alfabeto. II. Conocer, identificar y distinguir los distintos formantes de las palabras. Distinguir y clasificar distintos

Más detalles

I.E.S.S.Ma. ESPACIO CURRICULAR: INGLÉS TÉCNICO CARRERA: TECNICATURA SUPERIOR EN EVALUACIÓN Y GESTIÓN AMBIENTAL CURSO: 3º AÑO (2º CUATRIMESTRE)

I.E.S.S.Ma. ESPACIO CURRICULAR: INGLÉS TÉCNICO CARRERA: TECNICATURA SUPERIOR EN EVALUACIÓN Y GESTIÓN AMBIENTAL CURSO: 3º AÑO (2º CUATRIMESTRE) I.E.S.S.Ma. ESPACIO CURRICULAR: INGLÉS TÉCNICO CARRERA: TECNICATURA SUPERIOR EN EVALUACIÓN Y GESTIÓN AMBIENTAL CURSO: 3º AÑO (2º CUATRIMESTRE) Nº DE HORAS SEMANALES: 5 (CINCO) PROFESOR: OMAR A. CHAILE

Más detalles

Introducción al Procesamiento de Lenguaje Natural. Grupo de PLN InCo

Introducción al Procesamiento de Lenguaje Natural. Grupo de PLN InCo Introducción al Procesamiento de Lenguaje Natural Grupo de PLN InCo morfología.(de morfo- y -logía). f. Parte de la biología que trata de la forma de los seres orgánicos y de las modificaciones o transformaciones

Más detalles

Qué es la morfología?

Qué es la morfología? [, Qué es la morfología? El estatus de la palabra Palabras léxicas y gramaticales El componente morfológico Palabras y lexemas 23 4. Las unidades morfológicas: los morfemas 25 5. Raíz 29 6. Tema Base 35

Más detalles

Diccionario inteligente TERMInológico para el sector TURístico

Diccionario inteligente TERMInológico para el sector TURístico Diccionario inteligente TERMInológico para el sector TURístico Índice Página principal... 2 Login/Registro en la aplicación... 3 Herramienta Termitur... 4 Realizar una búsqueda en el diccionario inteligente...

Más detalles

Pontificia Universidad Católica del Ecuador

Pontificia Universidad Católica del Ecuador 1. DATOS INFORMATIVOS MATERIA O MÓDULO: Morfología y Sintaxis del Español CÓDIGO: 13487 CARRERA: NIVEL: No. CRÉDITOS: CRÉDITOS TEORÍA: Lingüística Aplicada Segundo Cuatro Cuatro CRÉDITOS PRÁCTICA: SEMESTRE

Más detalles

César Antonio Aguilar Facultad de Lenguas y Letras 12/09/2017

César Antonio Aguilar Facultad de Lenguas y Letras 12/09/2017 Métodos de Investigación en Letras César Antonio Aguilar Facultad de Lenguas y Letras 12/09/2017 caguilara@uc.cl Síntesis de la clase pasada (1) En la clase pasada abordamos una nueva fase en el desarrollo

Más detalles

clases cerradas: preposiciones, artículos, conjunciones, pronombres, complementantes.

clases cerradas: preposiciones, artículos, conjunciones, pronombres, complementantes. Introducción al Procesamiento del Lenguaje Natural 1/2003 Apunte 1 El nivel sintáctico se ocupa de especificar las posibilidades de combinación de determinadas unidades. Según cuáles sean estas unidades,

Más detalles

1º ESO LENGUA CASTELLANA Y LITERATURA CONTENIDOS

1º ESO LENGUA CASTELLANA Y LITERATURA CONTENIDOS 1º ESO LENGUA CASTELLANA Y LITERATURA CONTENIDOS Bloque 1. Comunicación oral: escuchar y hablar Escuchar 1. Comprensión, interpretación y valoración de textos orales en relación con el ámbito de uso: personal,

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 04/04/2013 Cesar.Aguilar72@gmail.com Bases computacionales (1) Lenguaje natural versus lenguaje formal Lenguaje

Más detalles

Los criterios de evaluación y los estándares de aprendizaje de la asignatura Latín I para el curso 2015/2016 son los siguientes:

Los criterios de evaluación y los estándares de aprendizaje de la asignatura Latín I para el curso 2015/2016 son los siguientes: Los criterios de evaluación y los estándares de aprendizaje de la asignatura Latín I para el curso 2015/2016 son los siguientes: Criterios de evaluación 1. Conocer y localizar en mapas el marco geográfico

Más detalles

Manual rápido para evaluación de series en Python

Manual rápido para evaluación de series en Python Manual rápido para evaluación de series en Python Breve introducción Python es un lenguaje de programación interpretado con fines científicos, de educación y para hacer programas de uso rápido. Es la base

Más detalles

ÁRBOLES CRISTIAN ALFREDO MUÑOZ ÁLVAREZ JUAN DAVID LONDOÑO CASTRO JUAN PABLO CHACÓN PEÑA EDUARDO GONZALES

ÁRBOLES CRISTIAN ALFREDO MUÑOZ ÁLVAREZ JUAN DAVID LONDOÑO CASTRO JUAN PABLO CHACÓN PEÑA EDUARDO GONZALES ÁRBOLES CRISTIAN ALFREDO MUÑOZ ÁLVAREZ JUAN DAVID LONDOÑO CASTRO JUAN PABLO CHACÓN PEÑA EDUARDO GONZALES ÁRBOL Un árbol es un grafo no dirigido, conexo, sin ciclos (acíclico), y que no contiene aristas

Más detalles

Manual de morfolo del español

Manual de morfolo del español SUB Hamburg Manual de morfolo del español v ^ - / \\: í - " ((?/, t 'A / // i. Qué es la morfología? 1.1. El estatus de la palabra 17 1.1.1 Palabras léxicas y gramaticales ' 18 1.2. El componente morfológico

Más detalles

Dr. Carlos A. Coello Coello Departamento de Computación CINVESTAV IPN

Dr. Carlos A. Coello Coello Departamento de Computación CINVESTAV IPN Dr. Carlos A. Coello Coello Departamento de Computación CINVESTAV IPN ccoello@cs.cinvestav.mx Por qué estudiar conceptos de Lenguajes de Programación? Para incrementar nuestra capacidad de expresar ideas

Más detalles

RECURSOS BÁSICOS PARA EL LENGUA QUECHUA: BAS E DE DATOS LÉXIC A Y CORPUS TEXTU AL. Introducción

RECURSOS BÁSICOS PARA EL LENGUA QUECHUA: BAS E DE DATOS LÉXIC A Y CORPUS TEXTU AL. Introducción RUNASIMI RECURSOS BÁSICOS PARA EL PROCESAMIENTO AUTOMÁTICO DE LA LENGUA QUECHUA: BAS E DE DATOS LÉXIC A Y CORPUS TEXTU AL UNSAAC (Cusco, Peru) Ixa Taldea (UPV/EHU) 2013/2014 Introducción Este proyecto

Más detalles

3 er Grado Guía para los Padres /Terceras Nueve Semanas - 3 rd Grade Parent Guide Third Nine Weeks

3 er Grado Guía para los Padres /Terceras Nueve Semanas - 3 rd Grade Parent Guide Third Nine Weeks Estas nueve semanas amplian los conocimientos y conceptos aprendidos en las nueve semanas previas. Los estudiantes van a evaluar los puntos de vista del orador, del autor y de ellos mismos. Los estudiantes

Más detalles

Técnicas de Programación

Técnicas de Programación Técnicas de Programación 2.1.- Introducción: unos conceptos previos y primeros conceptos de la API Introducción La resolución de un problema con medios informáticos implica generalmente la siguiente secuencia

Más detalles

GENERACIÓN DE EXÁMENES TIPO TEST

GENERACIÓN DE EXÁMENES TIPO TEST PRÁCTICA Nº 5: 2 sesiones (S6: 25 de abril, 3, 4, 5 y 6 de mayo) (S7: 9, 10, 11, 12 y 13 de mayo) 0. OBJETIVOS GENERACIÓN DE EXÁMENES TIPO TEST a. Familiarizarse con el uso de listas con punto de interés.

Más detalles

( ) Lengua Castellana para Maestros GUÍA DOCENTE Curso

( ) Lengua Castellana para Maestros GUÍA DOCENTE Curso (206205000) Lengua Castellana para Maestros GUÍA DOCENTE Curso 2010-2011 Titulación: Grado de Maestro en Educación Primaria Asignatura: Lengua castellana para maestros Materia: Enseñanza y aprendizaje

Más detalles

La aplicación ofrece tres componentes lingüísticos: estructura textual, opciones de redacción y diccionario.

La aplicación ofrece tres componentes lingüísticos: estructura textual, opciones de redacción y diccionario. Presentación El Generador de Directors Reports (GEDIRE) es una aplicación semiautomática de apoyo a la redacción en inglés de un tipo de informe conocido como directors report, que no tiene un formato

Más detalles

Bloques Contenidos Criterios de evaluación Estándares Instrumentos Valor máx. estándar

Bloques Contenidos Criterios de evaluación Estándares Instrumentos Valor máx. estándar IES RECTOR DON FRANCISCO SABATER GARCÍA CURSO ESCOLAR: 2016/17 AREA/MATERIA: Latín (LOMCE) (00,50,20,40,30) CURSO: 4º ETAPA: Educación Secundaria Obligatoria Plan General Anual UNIDAD UF1: LENGUA LATINA

Más detalles

índice Prefacio Capítulo 1: La lingüística: Ciencia cognitiva 1 PorAntxon Olarrea

índice Prefacio Capítulo 1: La lingüística: Ciencia cognitiva 1 PorAntxon Olarrea índice Prefacio xi Capítulo 1: La lingüística: Ciencia cognitiva 1 PorAntxon Olarrea 1. Introducción 1 1.1. De la gramática tradicional a la lingüística moderna: Gramáticas prescriptivas y descriptivas

Más detalles

Máster Universitario en Lingüística y sus aplicaciones. Facultad de Filología (Universidad de A Coruña)

Máster Universitario en Lingüística y sus aplicaciones. Facultad de Filología (Universidad de A Coruña) Denominación del Máster Centro de adscripción Máster Universitario en Lingüística y sus aplicaciones Facultad de Filología (Universidad de A Coruña) Facultad de Filología y Traducción (Universidad de Vigo)

Más detalles

7 Esp. U 2. L 18 Elaborar un plan textual, organizando los elementos para producir oralmente un texto narrativo. 7 Esp. U 2. L 19

7 Esp. U 2. L 18 Elaborar un plan textual, organizando los elementos para producir oralmente un texto narrativo. 7 Esp. U 2. L 19 Logros 7 Esp. U1. L 1 Elaborar un plan textual organizando los elementos para producir un texto descriptivo oralmente. 7 Esp. U1. L 2 Reconocer las características de los textos descriptivos Producir textos

Más detalles

CALCULO I UNIDAD I MATRICES. Instituto Profesional Iplacex

CALCULO I UNIDAD I MATRICES. Instituto Profesional Iplacex CALCULO I UNIDAD I MATRICES 1.3 Transformación de matrices A las matrices se les pueden realizar ciertas transformaciones o cambios internos, siempre y cuando no afecten ni el orden ni el rango de la misma.

Más detalles