Curso de procesamiento del lenguaje natural

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Curso de procesamiento del lenguaje natural"

Transcripción

1 Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Letras 18/10/2017

2 Análisis de frases con NLTK (1) Como hemos señalado en clases anteriores, el análisis sintáctico de un texto es una tarea que podemos emprender usando y combinando criterios lingüísticos y estadísticos, creando así métodos híbridos eficaces. 2

3 Análisis de frases con NLTK (2) Ahora, como hemos señalado también antes, existen dos tipos de objetos sintácticos que podemos analizar: frases y oraciones. Los métodos y técnicas que se ocupan para hacer análisis de frase se les agrupa usualmente con el término chunking (literalmente, trozado o partición de oraciones en frases): 3

4 Análisis de frases con NLTK (3) La partición de una oración en frases es parte de un criterio jerárquico sencillo de deducir: lo que queremos identificar son combinaciones de palabras que, gramaticalmente, cumplan un rol como núcleo de una frase, o como modificador ligado a dicho núcleo. Los mejores candidatos son las frases nominales (NPs): 4

5 Implementando un chunker (1) Veamos ahora cómo podemos programar un analizador de frases con NLTK, importando las siguientes librerías: import nltk, re, os Una vez hecho esto, podemos analizar la siguiente oración, la cual cuenta con etiquetas morfosintácticas: sentence01 = [("the", "DT"), ("little", "JJ"), ("yellow", "JJ"), ("dog", "NN"), ("barked", "VBD"), ("at", "IN"), ("the", "DT"), ("cat", "NN")] 5

6 Implementando un chunker (2) Ahora, escribamos el siguiente código: grammar01 = "NP: {<DT>?<JJ>*<NN>} cp = nltk.regexpparser(grammar01) result01 = cp.parse(sentence01) print (result01) result01.draw() Qué obtenemos con esto?: 1. Una estructura arbórea, en donde se indica con paréntesis cuáles son las frases que cumplen con el patrón que establecimos en nuestra gramática. 2. El gráfico de un árbol sintáctico, el cual representa la estructura sintáctica de nuestra oración. 6

7 Implementando un chunker (3) El resultado es: 7

8 Implementando un chunker (4) Si observan, nuestra gramática es una secuencia de etiquetas con expresiones regulares, las cuales simplemente indican aquí: 1. Busca toda secuencia que inicie con un determinante (o DT), más cualquier otra palabra subsecuente. 2. A esta cadena se debe ligar un adjetivo (o JJ), el cual puede tener una recurrencia de 0 a infinito. 3. Finalmente, a esta secuencia se liga un nombre común (o NN). Las reglas y patrones que podamos construir con nuestras gramáticas pueden ser tan simples o complejos como lo creamos conveniente. Veamos el siguiente ejemplo: 8

9 Implementando un chunker (5) sentence02 = [("Rapunzel", "NNP"), ("let", "VBD"), ("down", "RP"), ("her", "PP$"), ("long", "JJ"), ("golden", "JJ"), ("hair", "NN")] Nuestra gramática va a ser la siguiente: grammar02 = r NP: {<DT PP\$>?<JJ>*<NN>} # Frases que tengan determinante/posesivo, adjetivo y nombre {<NNP>+} # Frases con nombres propios cp = nltk.regexpparser(grammar02) result02 = cp.parse(sentence02) print (result02) result02.draw() Y el resultado es: 9

10 Implementando un chunker (6) 10

11 Implementando un chunker (7) Las frases anteriores, claro está, son ejemplos simples. Qué pasa con secuencias más complejas? Veamos: Text01 = ''' he PRP B-NP accepted VBD B-VP the DT B-NP position NN I-NP of IN B-PP vice NN B-NP chairman NN I-NP of IN B-PP Carlyle NNP B-NP Group NNP I-NP,, O a DT B-NP merchant NN I-NP banking NN I-NP concern NN I-NP.. O ''' 11

12 Implementando un chunker (8) Apliquen ahora la siguiente instrucción: nltk.chunk.conllstr2tree(text01, chunk_types=['np']).draw() Y el resultado es: 12

13 Implementando un chunker (9) Como lo hemos comentado antes, NLTK cuenta con una serie de corpus etiquetados que podemos aprovechar para hacer varias tareas. Una de ellas es justo la detección de frases empleando estas técnicas de chunking. Por ejemplo, tratemos de identificar frases que sigan la secuencia Verbo + TO + Verbo en el Brown Corpus. Para ello, requerimos de una gramática, así como importar el Brown Corpus a nuestro intérprete: cp = nltk.regexpparser( CHUNK: {<V.*> <TO> <V.*>} ) brown = nltk.corpus.brown 13

14 Implementando un chunker (10) Ahora, lo que vamos a hacer es elaborar un ciclo, el cual nos permita reconocer cuáles son las oraciones que, dentro del Brown, cumplan con nuestra regla. Una vez que las detectemos, las agruparemos en un listado que se desplegará en pantalla. Veamos: for sent in brown.tagged_sents(): tree = cp.parse(sent) for subtree in tree.subtrees(): if subtree.label() == 'CHUNK': print (subtree) 14

15 Implementando un chunker (11) Y el resultado final, si confiamos en nuestro proceso, son frases verbales que dentro del Brown sigan el patrón Verbo + TO + Verbo : 15

16 Métodos de evaluación (1) Tras haber hecho una exploración en el Corpus Brown, ahora pasamos a implementar un método de evaluación estadístico, con el fin de evaluar si nuestras gramáticas son eficaces o no para localizar los patrones que buscamos. Para esta tarea, vamos a ocupar un corpus etiquetado llamado CoNLL 2000, el cual está seccionado en frases. Así, requerimos de esta instrucción: from nltk.corpus import conll2000

17 Métodos de evaluación (2) Veamos un fragmento del CoNLL 2000, usando esta instrucción: print(conll2000.chunked_sents('train.txt')[99]) El resultado es:

18 Métodos de evaluación (3) Una vez que hemos visto parte del contenido del CoNLL 2000, implementemos el siguiente ciclo: cp = nltk.regexpparser("") test_sents = conll2000.chunked_sents('test.txt', chunk_types=['np']) print (cp.evaluate(test_sents)) El resultado lo vemos en la siguiente lámina:

19 Métodos de evaluación (4) Pregunta: por qué nos da como resultado cero? Qué es lo que estamos buscando en este corpus?

20 Métodos de evaluación (5) La razón por la cual no nos presenta ningún resultado es porque no hemos definido una gramática. Probemos con la siguiente regla: grammar = r"np: {<[CDJNP].*>+}" La regla que acabos de escribir nos permite localizar frases nominales que estén conformadas por un número cardinal (CD), un determinante (DT), un adjetivo (JJ) y nombre (NN). Ahora, unamos esta gramática con nuestro código anterior, y obtenemos:

21 Métodos de evaluación (6) Nuestro código es: grammar = r"np: {<[CDJNP].*>+}" test_sents = conll2000.chunked_sents('test.txt, chunk_types=['np ]) cp = nltk.regexpparser(grammar) print (cp.evaluate(test_sents))

22 Métodos de evaluación (7) Las medidas que hemos generado indican lo siguiente: 1. El índice IOB indica el total de palabras que fueron excluidas de nuestra gramática, porque no forman parte de la estructura de una frase nominal. 2. El índice de Precision nos muestra el total de patrones que mejor encuadran con nuestra regla sobre constitución de una FN. 3. El índice de Recall indica el total de candidatos a FN que hay en nuestro corpus. 4. El índice F-Measure establece un ajuste entre Precision y Recall.

23 NLTK para el español: esto es lo que hay (1) Siendo demasiado francos, si bien NLTK cuenta con un corpus en español, las colecciones de árboles sintácticos llamadas CESS Treebanks (que son derivados del proyecto Freeling), en español y catalán, estos recursos no permiten todavía desarrollar un proceso de etiquetado de nuevos documentos, como pasa con el corpus Brown. Las razones son varias: 1. Los corpus CESS están diseñados para mostrar resultados respecto a las consultas que hagamos en ellos, pero no permiten implementar algún proceso de aprendizaje para un etiquetador en español. 2. Todavía no se ha desarrollado algún método en NLTK para entrenar un etiquetador en español. 3. No hay un corpus etiquetado de referencia en español, el cual sea de libre uso, y pueda formar parte de las librerías de NLTK. 4. No hay criterios unificados sobre el proceso de etiquetado de palabras en español.

24 NLTK para el español: esto es lo que hay (2) Si probamos la demo que ofrece Freeling en línea, podemos ver que se cuentan con algunos recursos para el etiquetado de oraciones, p.e.: Incluso podemos graficar árboles sintácticos con cierto grado de complejidad, digamos un parseo basado en gramática de dependencias. Veamos la siguiente lámina:

25 NLTK para el español: esto es lo que hay (3)

26 NLTK para el español: esto es lo que hay (4) Esto último sí podemos hacerlo desde NLTK: lanzar consultas al corpus CESS en español, mostrar sus resultados, e incluso generar árboles sintácticos con las oraciones que hay en tal corpus. Así, si ocupan la instrucción: from nltk.corpus import cess_esp nltk.corpus.cess_esp.words() Nos muestra el ejemplo de una oración: ['El', 'grupo', 'estatal', 'Electricit\xe9_de_France',...]

27 NLTK para el español: esto es lo que hay (5) Las etiquetas que ocupa este corpus son una variante del sistema de anotación EAGLES,el cual ustedes ya conocen. Si escriben: nltk.corpus.cess_esp.tagged_words() Nos arroja como resultado: [('El', 'da0ms0'), ('grupo', 'ncms000'),...] Finalmente, podemos generar un esquema arbóreo, seleccionado alguna de las oraciones que cuenta este corpus. Usemos esta instrucción, y veamos el resultado en la siguiente lámina: Tree01 = nltk.corpus.cess_esp.parsed_sents()[1].draw()

28 NLTK para el español: esto es lo que hay (6) A manera de comentario final: hay muchas cosas por hacer todavía respecto al uso de NLTK para el procesamiento de corpus, pero lo importante es que hay soluciones. Qué posibles vías creen que puedan ser útiles para aprovechar estos recursos para el análisis de textos en español?

29 Gracias por su atención Blog del curso:

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Letras 04/11/2015 Cesar.Aguilar72@gmail.com Solución de la Tarea I (1) Como quedamos en la clase pasada, vamos a revisar la

Más detalles

Introducción a la lingüística computacional

Introducción a la lingüística computacional Introducción a la lingüística computacional César Antonio Aguilar Facultad de Lenguas y Letras 15/10/2013 Cesar.Aguilar72@gmail.com Analizando frases con NLTK (1) En esta sesión vamos a empezar a emplear

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 30/05/2012 Cesar.Aguilar72@gmail.com ASCII y Unicode en NLTK (1) ASCII y Unicode en NLTK (2) ASCII y Unicode

Más detalles

Introducción a la lingüística computacional

Introducción a la lingüística computacional Introducción a la lingüística computacional César Antonio Aguilar Facultad de Lenguas y Letras 29/10/2013 Cesar.Aguilar72@gmail.com Precisión y cobertura (1) El tema que vamos a abordar en esta clase es

Más detalles

Introducción a la lingüística computacional

Introducción a la lingüística computacional Introducción a la lingüística computacional César Antonio Aguilar Facultad de Lenguas y Letras 24/08/2017 Cesar.Aguilar72@gmail.com Explorando NLTK (1) En esta sesión, vamos a ver algunos de los recursos

Más detalles

Seminario de análisis del discurso

Seminario de análisis del discurso Seminario de análisis del discurso Dr. César Antonio Aguilar Facultad de Lenguas y Letras 27/09/2010 CAguilar@iingen.unam.mx Análisis sintáctico en corpus (1) En esta clase, terminaremos de revisar lo

Más detalles

Introducción a la lingüística computacional

Introducción a la lingüística computacional Introducción a la lingüística computacional César Antonio Aguilar Facultad de Lenguas y Letras 12/09/2017 Cesar.Aguilar72@gmail.com Corpus lingüísticos (1) Para la lingüística contemporánea, y en particular

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Letras 05/10/2016 Cesar.Aguilar72@gmail.com Análisis sintáctico (1) De acuerdo con Jurafsky y Martin (2007), el estudio de

Más detalles

Introducción a la lingüística computacional

Introducción a la lingüística computacional Introducción a la lingüística computacional César Antonio Aguilar Facultad de Lenguas y Letras 17/08/2017 Cesar.Aguilar72@gmail.com Síntesis de la clase pasada (1) En la clase anterior nos dedicamos a

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 02/05/2012 Cesar.Aguilar72@gmail.com Qué es una palabra dentro de un corpus? (1) Un hecho que se da muchas

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 09/05/2012 Cesar.Aguilar72@gmail.com Empezando a programar En esta clase, vamos a ver algunas tareas para

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Letras 25/10/2017 Cesar.Aguilar72@gmail.com Precisión y cobertura (1) El tema que vamos a abordar en esta clase es una técnica

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 24/09/2013 Cesar.Aguilar72@gmail.com Etiquetado morfo-sintáctico (1) Etiquetado morfo-sintáctico (2) Funciones

Más detalles

Introducción a la lingüística computacional

Introducción a la lingüística computacional Introducción a la lingüística computacional César Antonio Aguilar Facultad de Lenguas y Letras 14/09/2017 Cesar.Aguilar72@gmail.com Síntesis de la clase anterior En la clase anterior, hicimos una exploración

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 16/05/2012 Cesar.Aguilar72@gmail.com Análisis sintáctico (1) De acuerdo con Jurafsky y Martin (2007), el estudio

Más detalles

Introducción a la lingüística computacional

Introducción a la lingüística computacional Introducción a la lingüística computacional César Antonio Aguilar Facultad de Lenguas y Letras 16/10/2017 Cesar.Aguilar72@gmail.com Gramáticas léxicas (1) En esta clase vamos a seguir revisando modelos

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 13/09/2017 Cesar.Aguilar72@gmail.com Buscando nuevos textos (1) Una de las tareas que más nos interesa resolver

Más detalles

Seminario de análisis del discurso

Seminario de análisis del discurso Seminario de análisis del discurso Dr. César Antonio Aguilar Facultad de Lenguas y Letras 09/09/2010 CAguilar@iingen.unam.mx Anotación lingüística (1) Algo que marca una diferencia fundamental entre tener

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 31/08/2016 Cesar.Aguilar72@gmail.com Corpus lingüísticos (1) Para la lingüística contemporánea, y en particular

Más detalles

Introducción a la lingüística computacional

Introducción a la lingüística computacional Introducción a la lingüística computacional César Antonio Aguilar Facultad de Lenguas y Letras 28/09/2017 Cesar.Aguilar72@gmail.com Qué es una palabra dentro de un corpus? (1) Un hecho que se da muchas

Más detalles

Curso de traducción automática de lenguas naturales

Curso de traducción automática de lenguas naturales Curso de traducción automática de lenguas naturales César Antonio Aguilar Facultad de Lenguas y Letras 27/11/2015 Cesar.Aguilar72@gmail.com Extracción de términos (1) Vamos a cerrar el curso abordando

Más detalles

Introducción a la lingüística computacional

Introducción a la lingüística computacional Introducción a la lingüística computacional César Antonio Aguilar Facultad de Lenguas y Letras 31/08/2017 Cesar.Aguilar72@gmail.com Ejercicio de la clase pasada (1) Antes de empezar la clase de hoy, vamos

Más detalles

César Antonio Aguilar Facultad de Lenguas y Letras 16/10/2017

César Antonio Aguilar Facultad de Lenguas y Letras 16/10/2017 Métodos de Investigación en Letras César Antonio Aguilar Facultad de Lenguas y Letras 16/10/2017 caguilara@uc.cl Síntesis de la clase pasada En la clase pasada hicimos una breve descripción sobre cómo

Más detalles

Curso de traducción automática de lenguas naturales

Curso de traducción automática de lenguas naturales Curso de traducción automática de lenguas naturales César Antonio Aguilar Facultad de Lenguas y Letras 20/11/2015 Cesar.Aguilar72@gmail.com Síntesis de la clase pasada (1) En la clase anterior, abordamos

Más detalles

Introducción a la lingüística computacional

Introducción a la lingüística computacional Introducción a la lingüística computacional César Antonio Aguilar Facultad de Lenguas y Letras 29/08/2017 Cesar.Aguilar72@gmail.com Síntesis de la clase pasada (1) En la clase anterior empezamos a revisar,

Más detalles

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 06/04/2016.

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 06/04/2016. Semántica española César Antonio Aguilar Facultad de Lenguas y Letras 06/04/2016 caguilara@uc.cl Síntesis de la clase anterior (1) En la clase pasada, observamos de qué forma la lógica aporta a la semántica

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 18/04/2013 Cesar.Aguilar72@gmail.com Expresiones regulares (1) Para convertir nuestros archivos en cadenas,

Más detalles

Introducción a la lingüística computacional

Introducción a la lingüística computacional Introducción a la lingüística computacional César Antonio Aguilar Facultad de Lenguas y Letras 03/10/2017 Cesar.Aguilar72@gmail.com Síntesis de la clase pasada (1) En la clase pasada vimos cómo puede realizarse

Más detalles

Introducción a la lingüística computacional

Introducción a la lingüística computacional Introducción a la lingüística computacional César Antonio Aguilar Facultad de Lenguas y Letras 01/10/2013 Cesar.Aguilar72@gmail.com Buscando nuevos textos (1) Antes de empezar a trabajar con los documentos

Más detalles

Pragmática. César Antonio Aguilar Facultad de Lenguas y Letras 23/05/2017.

Pragmática. César Antonio Aguilar Facultad de Lenguas y Letras 23/05/2017. Pragmática César Antonio Aguilar Facultad de Lenguas y Letras 23/05/2017 caguilara@uc.cl Síntesis de la clase anterior (1) En la clase anterior vimos algunos detalles respecto al uso de corpus como herramienta

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 11/04/2013 Cesar.Aguilar72@gmail.com Explorando NLTK (1) En esta sesión, vamos a ver algunos de los recursos

Más detalles

Seminario de análisis del discurso

Seminario de análisis del discurso Seminario de análisis del discurso Dr. César Antonio Aguilar Facultad de Lenguas y Letras 25/10/2010 CAguilar@iingen.unam.mx Tarea Para iniciar la clase, revisemos nuestra tarea anterior. El fragmento

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural MPGI UC MAGISTER EN PROCESAMIENTO Y GESTIÓN DE LA INFORMACIÓN Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 09/08/2017 Cesar.Aguilar72@gmail.com Aprendiendo

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 13/08/2012 Cesar.Aguilar72@gmail.com Aprendiendo a programar (1) Siguiendo con los intereses del curso, en

Más detalles

Introducción a la lingüística computacional

Introducción a la lingüística computacional Introducción a la lingüística computacional César Antonio Aguilar Facultad de Lenguas y Letras 22/08/2017 Cesar.Aguilar72@gmail.com Teoría de autómatas (1) La teoría de autómatas es una línea de investigación

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 13/06/2012 Cesar.Aguilar72@gmail.com Semántica y PLN Por qué queremos usar computadoras en cuestiones de semántica?

Más detalles

César Antonio Aguilar Facultad de Lenguas y Letras 27/10/2016

César Antonio Aguilar Facultad de Lenguas y Letras 27/10/2016 Métodos de Investigación en Letras César Antonio Aguilar Facultad de Lenguas y Letras 27/10/2016 caguilara@uc.cl Síntesis de la clase pasada (1) En la clase pasada vimos de manera general el uso de corpus

Más detalles

SKETCH ENGINE. Seminario de Traducción Automática Magíster en Traducción Pontificia Universidad Católica de Chile

SKETCH ENGINE. Seminario de Traducción Automática Magíster en Traducción Pontificia Universidad Católica de Chile SKETCH ENGINE Seminario de Traducción Automática Magíster en Traducción Pontificia Universidad Católica de Chile Sketch Engine Es un programa disponible en la web (cloud computing): http://www.sketchengine.co.uk

Más detalles

César Antonio Aguilar Facultad de Lenguas y Letras 08/04/2013

César Antonio Aguilar Facultad de Lenguas y Letras 08/04/2013 Métodos y técnicas de investigación cuantitativa César Antonio Aguilar Facultad de Lenguas y Letras 08/04/2013 Cesar.Aguilar72@gmail.com Definiendo el concepto de probabilidad En la clase pasada estuvimos

Más detalles

Introducción al Procesamiento de Lenguaje Natural. Obligatorio Corrector Ortográfico en Python

Introducción al Procesamiento de Lenguaje Natural. Obligatorio Corrector Ortográfico en Python Introducción al Procesamiento de Lenguaje Natural Obligatorio 2 2010 Corrector Ortográfico en Python Facultad de Ingeniería Instituto de Computación Grupo de Procesamiento de Lenguaje Natural El objetivo

Más detalles

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 30/05/2016.

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 30/05/2016. Semántica española César Antonio Aguilar Facultad de Lenguas y Letras 30/05/2016 caguilara@uc.cl Relaciones entre sintaxis y semántica En esta sección del curso, nos vamos a concentrar en tratar de identificar

Más detalles

f (d, t) max{f (d, x) : x d} TF (d, t) = f (d, t) TF (d, t) =

f (d, t) max{f (d, x) : x d} TF (d, t) = f (d, t) TF (d, t) = Clase 10 Repaso NLTK plot() Con esta función de las distribuciones de frecuencia, es posible obtener una gráfica con los datos de frecuencia de cada una de las palabras de un texto. Pueden dar un parámetro

Más detalles

Inteligencia artificial

Inteligencia artificial Inteligencia artificial Proceso de Lenguaje Natural Qué es el Lenguaje? Qué es el Lenguaje Natural? Procesamiento del lenguaje Natural (PLN) Aplicaciones PLN Niveles del Lenguaje Arquitectura de un sistema

Más detalles

Curso de semántica general

Curso de semántica general Curso de semántica general César Antonio Aguilar Facultad de Lenguas y Letras 14/11/2011 caguilara@uc.cl Más sobre LG (1) De acuerdo con lo que vimos la semana pasada, LG es un modelo léxico que nos permite

Más detalles

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 27/03/2017.

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 27/03/2017. Semántica española César Antonio Aguilar Facultad de Lenguas y Letras 27/03/2017 caguilara@uc.cl Síntesis de la clase anterior (1) En la clase pasada establecimos algunos conceptos importantes que iremos

Más detalles

Introducción a la lingüística computacional

Introducción a la lingüística computacional Introducción a la lingüística computacional César Antonio Aguilar Facultad de Lenguas y Letras 07/11/2017 Cesar.Aguilar72@gmail.com 2 Explorando WordNet desde NLTK (1) En la clase pasada, vimos varios

Más detalles

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 29/03/2017.

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 29/03/2017. Semántica española César Antonio Aguilar Facultad de Lenguas y Letras 29/03/2017 caguilara@uc.cl El ABC de la composicionalidad (1) Esta clase la dedicaremos por completo a entender lo más que se pueda

Más detalles

Tema 2. Tercera parte. Clases abiertas: Clases cerradas:

Tema 2. Tercera parte. Clases abiertas: Clases cerradas: Análisis categorial Tema 2. Tercera parte. Análisis categorial Ingeniería del Lenguaje Natural Departamento de Lenguajes y Sistemas Informáticos Universidad de Alicante http://www.dlsi.ua.es/asignaturas/iln

Más detalles

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 06/03/2017.

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 06/03/2017. Semántica española César Antonio Aguilar Facultad de Lenguas y Letras 06/03/2017 caguilara@uc.cl Introducción (1) Introducción (2) Ahora, para entrar en el tema, consideremos algunas preguntas que podemos

Más detalles

Seminario de análisis del discurso

Seminario de análisis del discurso Seminario de análisis del discurso Dr. César Antonio Aguilar Facultad de Lenguas y Letras 14/10/2010 CAguilar@iingen.unam.mx Análisis retórico de textos (1) La teoría de centrado, como hemos visto en la

Más detalles

Curso de traducción automática de lenguas naturales

Curso de traducción automática de lenguas naturales Curso de traducción automática de lenguas naturales César Antonio Aguilar Facultad de Lenguas y Letras 13/11/2015 Cesar.Aguilar72@gmail.com Síntesis de la clase pasada (1) En la clase anterior, tratamos

Más detalles

Introducción al Procesamiento de Lenguaje Natural. Obligatorio Corrector Ortográfico en Python

Introducción al Procesamiento de Lenguaje Natural. Obligatorio Corrector Ortográfico en Python Introducción al Procesamiento de Lenguaje Natural Obligatorio 3 2010 Corrector Ortográfico en Python Facultad de Ingeniería Instituto de Computación Grupo de Procesamiento de Lenguaje Natural El objetivo

Más detalles

Curso de traducción automática de lenguas naturales

Curso de traducción automática de lenguas naturales Curso de traducción automática de lenguas naturales César Antonio Aguilar Facultad de Lenguas y Letras 28/08/2015 Cesar.Aguilar72@gmail.com Síntesis de la clase pasada (1) Como vimos en nuestra primera

Más detalles

Seminario de análisis del discurso

Seminario de análisis del discurso Seminario de análisis del discurso Dr. César Antonio Aguilar Facultad de Lenguas y Letras 04/10/2010 CAguilar@iingen.unam.mx Lingüística computacional y discurso (1) En esta nueva unidad, vamos a abordar

Más detalles

Enju. A fast, accurate, and deep parser for English

Enju. A fast, accurate, and deep parser for English Enju A fast, accurate, and deep parser for English Introducción Enju es un parser para el inglés Desarrollado en la Universidad de Tokio http://www.nactem.ac.uk/enju Basado en una gramática HPSG Output

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Letras 06/12/2017 Cesar.Aguilar72@gmail.com La semántica desde un enfoque lingüístico (1) De acuerdo a lo que hemos venido

Más detalles

Pragmática. César Antonio Aguilar Facultad de Lenguas y Letras 25/05/2017.

Pragmática. César Antonio Aguilar Facultad de Lenguas y Letras 25/05/2017. Pragmática César Antonio Aguilar Facultad de Lenguas y Letras 25/05/2017 caguilara@uc.cl Síntesis de la clase anterior (1) En la clase anterior abordamos la relación que existe entre los corpus lingüísticos

Más detalles

César Antonio Aguilar Facultad de Lenguas y Letras 12/06/2012 Cesar.Aguilar72@gmail.com

César Antonio Aguilar Facultad de Lenguas y Letras 12/06/2012 Cesar.Aguilar72@gmail.com Métodos y técnicas de investigación cuantitativa César Antonio Aguilar Facultad de Lenguas y Letras 12/06/2012 Cesar.Aguilar72@gmail.com Tareas realizables con corpus En esta clase, vamos a tratar de hacer

Más detalles

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 03/05/2017.

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 03/05/2017. Semántica española César Antonio Aguilar Facultad de Lenguas y Letras 03/05/2017 caguilara@uc.cl Síntesis de la clase anterior (1) En la clase pasada vimos algunas cuestiones relacionadas con la teoría

Más detalles

ÁRBOLES DE SINTAXIS. Los nodos no terminales (nodos interiores) están rotulados por los símbolos no terminales.

ÁRBOLES DE SINTAXIS. Los nodos no terminales (nodos interiores) están rotulados por los símbolos no terminales. ÁRBOLES DE SINTAXIS ÁRBOL grafo dirigido acíclico. Los nodos no terminales (nodos interiores) están rotulados por los símbolos no terminales. Los nodos terminales (nodos hojas) están rotulados por los

Más detalles

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 21/03/2016.

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 21/03/2016. Semántica española César Antonio Aguilar Facultad de Lenguas y Letras 21/03/2016 caguilara@uc.cl Síntesis de la clase anterior (1) En la clase anterior terminamos de revisar las nociones de referencia

Más detalles

Objetivos. Adultos: Elementary. Los alumnos aprenderán a: Captar el contenido esencial de comunicaciones verbales básicas.

Objetivos. Adultos: Elementary. Los alumnos aprenderán a: Captar el contenido esencial de comunicaciones verbales básicas. Objetivos Adultos: Elementary Captar el contenido esencial de comunicaciones verbales básicas. Recabar información necesaria de comunicaciones básicas para realizar una tarea específica. simples adecuadamente.

Más detalles

César Antonio Aguilar Facultad de Lenguas y Letras 29/04/2013

César Antonio Aguilar Facultad de Lenguas y Letras 29/04/2013 Métodos y técnicas de investigación cuantitativa César Antonio Aguilar Facultad de Lenguas y Letras 29/04/2013 Cesar.Aguilar72@gmail.com Revisión de tarea (1) Para iniciar, vamos a resolver la tarea: analizar

Más detalles

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 15/05/2017.

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 15/05/2017. Semántica española César Antonio Aguilar Facultad de Lenguas y Letras 15/05/2017 caguilara@uc.cl Síntesis de la clase anterior (1) En la sección anterior vimos cómo representar significados a través del

Más detalles

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 17/04/2017.

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 17/04/2017. Semántica española César Antonio Aguilar Facultad de Lenguas y Letras 17/04/2017 caguilara@uc.cl Síntesis de la clase anterior (1) Durante la clase pasada vimos algunos criterios y conceptos útiles para

Más detalles

Inteligencia Artificial II (Curso ) Ejercicios propuestos del tema 3

Inteligencia Artificial II (Curso ) Ejercicios propuestos del tema 3 Inteligencia Artificial II (Curso 2010-2011) Ejercicios propuestos del tema 3 Ejercicio 1: Describe los modelos probabilísticos del lenguaje unigram y bigram y cómo se calcula la probabilidad de una secuencia

Más detalles

Segunda Práctica. Teoría de Autómatas y Lenguajes Formales I. Escuela Politécnica Superior Universidad Autónoma de Madrid.

Segunda Práctica. Teoría de Autómatas y Lenguajes Formales I. Escuela Politécnica Superior Universidad Autónoma de Madrid. Segunda Práctica Teoría de Autómatas y Lenguajes Formales I Escuela Politécnica Superior Universidad Autónoma de Madrid Curso 2009-2010 Fechas de Entrega Electrónica (por grupos): grupo 2a : miércoles

Más detalles

Gramáticas Formales para el Lenguaje Natural. Análisis sintáctico probabilístico

Gramáticas Formales para el Lenguaje Natural. Análisis sintáctico probabilístico Gramáticas Formales para el Lenguaje Natural Análisis sintáctico probabilístico Análisis sintáctico probabilístico Insuficiencias de GLC GLC probabilísticas (GLCP) Definición Probabilidad de un árbol y

Más detalles

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 14/03/2016.

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 14/03/2016. Semántica española César Antonio Aguilar Facultad de Lenguas y Letras 14/03/2016 caguilara@uc.cl Síntesis de la clase anterior (1) En la clase pasada hicimos una primera aproximación a los contenidos de

Más detalles

Curso de semántica general

Curso de semántica general Curso de semántica general César Antonio Aguilar Facultad de Lenguas y Letras 20/11/2014 caguilara@uc.cl Más sobre LG (1) De acuerdo con lo que vimos la semana pasada, LG es un modelo léxico que nos permite

Más detalles

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 27/10/2017.

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 27/10/2017. Semántica española César Antonio Aguilar Facultad de Lenguas y Letras 27/10/2017 caguilara@uc.cl Síntesis de la clase anterior (1) En la clase pasada, observamos de qué forma la lógica aporta a la semántica

Más detalles

Gramáticas Formales para el Lenguaje Natural. Análisis sintáctico probabilístico

Gramáticas Formales para el Lenguaje Natural. Análisis sintáctico probabilístico Gramáticas Formales para el Lenguaje Natural Análisis sintáctico probabilístico Análisis sintáctico probabilístico Insuficiencias de GIC GIC probabilistas (GICP) Definición Probabilidad de un árbol y de

Más detalles

UNIVERSIDAD DE PLAYA ANCHA FACULTAD DE HUMANIDADES. Vicerrectora Académica Dirección de Estudios, Innovación Curricular y Desarrollo Docente

UNIVERSIDAD DE PLAYA ANCHA FACULTAD DE HUMANIDADES. Vicerrectora Académica Dirección de Estudios, Innovación Curricular y Desarrollo Docente UNIVERSIDAD DE PLAYA ANCHA FACULTAD DE HUMANIDADES Vicerrectora Académica Dirección de Estudios, Innovación Curricular y Desarrollo Docente PROGRAMA FORMATIVOS CARRERA DE PEDAGOGÍA EN CASTELLANO Módulo:

Más detalles

César Antonio Aguilar Facultad de Lenguas y Letras 07/11/2017

César Antonio Aguilar Facultad de Lenguas y Letras 07/11/2017 Métodos de Investigación en Letras César Antonio Aguilar Facultad de Lenguas y Letras 07/11/2017 caguilara@uc.cl Síntesis de la clase pasada (1) En la clase pasada vimos cómo podíamos organizar una investigación

Más detalles

César Antonio Aguilar Facultad de Lenguas y Letras 22/04/2013

César Antonio Aguilar Facultad de Lenguas y Letras 22/04/2013 Métodos y técnicas de investigación cuantitativa César Antonio Aguilar Facultad de Lenguas y Letras 22/04/2013 Cesar.Aguilar72@gmail.com Distribución de frecuencias (1) En esta sesión, retomaremos nuestro

Más detalles

Profesor de Español para Extranjeros ELE

Profesor de Español para Extranjeros ELE Profesor de Español para Extranjeros ELE Modalidad Online Horario Flexible Descuento Alumnos Duración 420 horas Nivel Superior Subvención Empresas Descripción Detallada Profesor de Español para Extranjeros

Más detalles

Raúl

Raúl Raúl Garreta @raulgarreta Subárea de Inteligencia Artificial, Ciencias de la Computación. Estudia métodos que permitan a las máquinas interactuar con las personas mediante lenguaje natural. Poder extraer

Más detalles

El proceso del Análisis Léxico

El proceso del Análisis Léxico El proceso del Análisis Léxico El proceso de análisis léxico se refiere al trabajo que realiza el scanner con relación al proceso de compilación. El scanner representa una interfaz entre el programa fuente

Más detalles

Los estudiantes practicarán los términos de parentesco en su lengua indígena y en español, creando un cuadro que representa a su familia.

Los estudiantes practicarán los términos de parentesco en su lengua indígena y en español, creando un cuadro que representa a su familia. OBJETIVO Los estudiantes practicarán los términos de parentesco en su lengua indígena y en español, creando un cuadro que representa a su familia. APRENDIZAJES ESPERADOS Identifica las letras para escribir

Más detalles

Gramática Sintagmática Nuclear. HPSG: Head-driven Phrase Structure Grammar

Gramática Sintagmática Nuclear. HPSG: Head-driven Phrase Structure Grammar Gramática Sintagmática Nuclear HPSG: Head-driven Phrase Structure Grammar Jerarquía de tipos y restricciones top val-cat [SPR COMPS ] expression [HEAD pos VAL val-cat] pos agr-cat [PER per-cat

Más detalles

Repaso Expresiones Regulares

Repaso Expresiones Regulares Clase 7 Repaso Expresiones Regulares () Ya hemos visto que los paréntesis nos ayudan a juntar múltiples caracteres en una solo expresión regular que queremos afectar con modificadores que normalmente afectan

Más detalles

Compiladores e Intérpretes Análisis Léxico

Compiladores e Intérpretes Análisis Léxico 1 Compiladores e Intérpretes Análisis Léxico Sebastian Gottifredi 2017 Organizacion Esquema General de Análisis Léxico Tokens Especificando Tokens Expresiones Regulares Reconociendo Tokens Autómatas Finitos

Más detalles

Seminario de análisis del discurso

Seminario de análisis del discurso Seminario de análisis del discurso Dr. César Antonio Aguilar Facultad de Lenguas y Letras 16/08/2010 CAguilar@iingen.unam.mx Algo más sobre correferencia (1) Retomando lo que vimos la clase pasada, abordamos

Más detalles

Semántica y pragmática

Semántica y pragmática Semántica y pragmática César Antonio Aguilar Facultad de Lenguas y Letras 09/08/2018 caguilara@uc.cl Introducción (1) Dentro de la investigación lingüística, el estudio de los niveles semántico y pragmático

Más detalles

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 31/05/2017.

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 31/05/2017. Semántica española César Antonio Aguilar Facultad de Lenguas y Letras 31/05/2017 caguilara@uc.cl Síntesis de la clase anterior (1) En la clase pasada revisamos una metodología de análisis para describir

Más detalles

roducción a la programación con el lenguaje C usando el entorno de trabajo Dev-C. Nociones básicas de programación

roducción a la programación con el lenguaje C usando el entorno de trabajo Dev-C. Nociones básicas de programación There are no translations available. Introducción a la programación con el lenguaje C usando el entorno de trabajo Dev-C. roducción a la programación con el lenguaje C usando el entorno de trabajo Dev-C.

Más detalles

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 01/06/2016.

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 01/06/2016. Semántica española César Antonio Aguilar Facultad de Lenguas y Letras 01/06/2016 caguilara@uc.cl Información semántica del verbo (1) En la clase pasada tratamos de delinear cómo se dan las relaciones entre

Más detalles

UNIVERSIDAD NACIONAL DE EDUCACIÓN A DISTANCIA Escuela Técnica Superior de Ingeniería Informática Procesadores de Lenguajes. Tema 2.

UNIVERSIDAD NACIONAL DE EDUCACIÓN A DISTANCIA Escuela Técnica Superior de Ingeniería Informática Procesadores de Lenguajes. Tema 2. UNIVERSIDAD NACIONAL DE EDUCACIÓN A DISTANCIA Escuela Técnica Superior de Ingeniería Informática Procesadores de Lenguajes Tema 2 Análisis Léxico Javier Vélez Reyes jvelez@lsi.uned.es Objetivos del Tema

Más detalles

ANÁLISIS LÉXICO Ing. Ronald Rentería Ayquipa

ANÁLISIS LÉXICO Ing. Ronald Rentería Ayquipa ANÁLISIS LÉXICO Ing. Ronald Rentería Ayquipa ANALIZADOR LÉXICO (AL) El Analizador léxico (scanner), lee la secuencia de caracteres del programa fuente, caracter a caracter, y los agrupa para formar unidades

Más detalles

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 23/05/2016.

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 23/05/2016. Semántica española César Antonio Aguilar Facultad de Lenguas y Letras 23/05/2016 caguilara@uc.cl Síntesis de la clase anterior (1) En la clase pasada revisamos una metodología de análisis para describir

Más detalles

Lenguajes y Compiladores Aspectos Formales (Parte 2) Compiladores

Lenguajes y Compiladores Aspectos Formales (Parte 2) Compiladores Facultad de Ingeniería de Sistemas Lenguajes y Aspectos Formales (Parte 2) 2007 1 Derivaciones El proceso de búsqueda de un árbol sintáctico para una cadena se llama análisis sintáctico. El lenguaje generado

Más detalles

Curso de semántica general

Curso de semántica general Curso de semántica general César Antonio Aguilar Facultad de Lenguas y Letras 21/11/2011 caguilara@uc.cl Semántica y conceptualización (1) De acuerdo a lo que vimos la clase pasada sobre LG, parece ser

Más detalles

Etiquetado gramatical

Etiquetado gramatical Etiquetado gramatical ITALICA Universidad de Sevilla José A. Troyano Índice Introducción Etiquetado con el modelo de Markov Etiquetado con el modelo de Markov oculto Etiquetado transformacional Precisión

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 04/04/2013 Cesar.Aguilar72@gmail.com Bases computacionales (1) Lenguaje natural versus lenguaje formal Lenguaje

Más detalles