ETIQUETA EAGLE (v. 2.0) REDUCIDA Esta documentación fue elaborada a partir de la documentación del proyecto FreeLing El analizador morfológico Tree Tagger para el portugués utiliza un conjunto de etiquetas para representar la información morfológica de las palabras. Este conjunto de etiquetas se basa en las etiquetas propuestas por el grupo EAGLE para la anotación morfosintáctica de lexicones y corpus para todas las lenguas europeas. Así pues está previsto que recojan los accidentes gramaticales existentes en las lenguas europeas. Es por esto que dependiendo de la lengua hay atributos que pueden no especificarse. i un atributo no se especifica significa que o bien expresa un tipo de información que no existe en la lengua o que la información no se considera relevante. La infraespecificación de un atributo se marca con el 0. A continuación presentamos las etiquetas que el analizador morfológico utiliza para el portugués en formato de tabla. Aquí sólo ofrecemos la versión reducida utilizada por Tree Tagger. La versión expandida de Tree Tagger es la misma que utiliza FreeLing para el castellano. ara cada categoría se presentan los atributos, valores y códigos que puede tomar: ETIQUETA osición Atributo Valor Código Columna 1 Columna 2 Columna 3 Columna 4 En la columna 1 encontramos un número que hace referencia al orden y posición en que aparecen los atributos. La columna 2 hace referencia a los atributos, el número de los cuales varía dependiendo de la categoría. En la columna 3 encontramos los valores que puede tomar cada atributo y, finalmente, la columna 4 representa los códigos que se han establecido para su representación. Las etiquetas en sí sólo son los códigos (columna 4) y se sabe a qué atributo pertenecen por la posición (columna 1) en la que se encuentran. TABLA DE ETIQUETA OR CATEGORÍA 1. ADJETIVO 2. ADVERBIO 3. DETERMINANTE 4. NOMBRE 5. VERBO 6. RONOMBRE 7. CONJUNCIONE 8. INTERJECCIONE 9. REOICIONE 10. IGNO DE UNTUACIÓN 11. NUMERALE http://www.cis.uni muenchen.de/~schmid/tools/treetagger/data/ortuguese Tagset.html 1/5
1. ADJETIVO ADJETIVO 1 Categoría Adjetivo A 2 Tipo Calificativo Q Ordinal O 0 3 Grado 0 Aumentativo A Diminutivo C uperlativo 2. ADVERBIO 3. DETERMINANTE ADVERBIO 1 Categoría Adverbio R 2 Tipo General G Negativo N DETERMINANTE 1 Categoría Determinante D 2 Tipo Demostrativo D osesivo Interrogativo T Exclamativo E Indefinido I Artículo A 3 ersona rimera 1 egunda 2 Tercera 3 4. NOMBRE http://www.cis.uni muenchen.de/~schmid/tools/treetagger/data/ortuguese Tagset.html 2/5
NOMBRE 1 Categoría Nombre N 2 Tipo Común C ropio 3 Género Masculino M Femenino Común 4 Número ingular 5 6 Clasificación semántica lural Invariable ersona Lugar Organización Otros F C N G0 O0 V0 Los atributos de Clasificación emántica se especificarán sólo en el caso de que se utilice un clasificador de entidades nombradas (NEC). 5. VERBO VERBO 1 Categoría Verbo V 2 Tipo rincipal M Auxiliar emiauxiliar 3 Modo Indicativo I ubjuntivo Imperativo Infinitivo Gerundio articipio A M N G 6. RONOMBRE RONOMBRE 1 Categoría ronombre http://www.cis.uni muenchen.de/~schmid/tools/treetagger/data/ortuguese Tagset.html 3/5
1 Categoría ronombre 2 Tipo ersonal Demostrativo D osesivo X Indefinido I Interrogativo T Relativo R Exclamativo E 3 ersona rimera 1 egunda 2 Tercera 3 El atributo ersona se especificará para los pronombres personales y posesivos, para el resto de formas el valor será 0. 7. CONJUNCIONE 8. INTERJECCIONE 9. REOICIONE CONJUNCIONE > 1 Categoría Conjunción C 2 Tipo Coordinada C ubordinada INTERJECCIONE 1 Categoría Interjección I REOICIONE 1 Categoría Adposición 2 Tipo reposición 3 Forma imple Contraída C 10. IGNO DE UNTUACIÓN IGNO DE UNTUACIÓN http://www.cis.uni muenchen.de/~schmid/tools/treetagger/data/ortuguese Tagset.html 4/5
IGNO DE UNTUACIÓN 1 Categoría untuación F Ejemplos: Forma Lema Etiqueta Faa!! Fat,, Fc [ [ Fca ] ] Fct : : Fd " " Fe Fg / / Fh Fia?? Fit { { Fla } } Flt.. Fp ( ( Fpa ) ) Fpt ««Fra»» Frc...... Fs % % Ft ; ; Fx Fz + + Fz = = Fz 11. CIFRA Y NUMERALE CIFRA 1 Categoría Cifra Z http://www.cis.uni muenchen.de/~schmid/tools/treetagger/data/ortuguese Tagset.html 5/5