1. Introducción Análisis de opiniones Tipos de opiniones Detección y clasificación de opiniones

Tamaño: px
Comenzar la demostración a partir de la página:

Download "1. Introducción... 2 2. Análisis de opiniones... 3 2.1. Tipos de opiniones... 4 2.2. Detección y clasificación de opiniones... 5 3."

Transcripción

1

2

3 Índice 1. Introducción Análisis de opiniones Tipos de opiniones Detección y clasificación de opiniones Generación automática de resúmenes de textos Aspectos a tener en cuenta Tipos de resúmenes Generación automática de resúmenes valorativos Procesamiento de la información valorativa para la sumarización Estructura de los resúmenes de opiniones Evaluación Evaluación objetiva Evaluación subjetiva Foros de evaluación Recapitulación Conclusiones Referencias bibliográficas

4 Procesamiento de expresiones valorativas para la sumarización de opiniones Lic. Gail García Delgado, Dr. C. José E. Medina Pagola Centro de Aplicaciones de Tecnología de Avanzada, 7a #21812 e/ 218 y 222, Siboney, Playa, Ciudad de La Habana, Cuba ggarcia@cenatav.co.cu RT 010 CENATAV Fecha del camera-ready: 28 de enero de 2010 Resumen: La minería de opiniones es una disciplina reciente que deriva de la minería de texto, la recuperación de información y la lingüística computacional. Esta disciplina tiene como objetivo el estudio de la información subjetiva en los textos. A partir del análisis de la información subjetiva contenida en textos, se pueden realizar diversos procesamientos, entre los que se encuentra la generación automática de resúmenes valorativos. La generación automática de resúmenes valorativos deriva de una de las tareas de investigación de la minería de textos que concurre en la minería de opiniones, la generación automática de resúmenes de textos. Este reporte centra su atención en la generación automática de resúmenes valorativos, presentando previamente una serie de conocimientos relacionados tanto con opiniones, como con la generación de resúmenes de textos. En este trabajo se centra particular atención en dos pasos esenciales de la sumarización, la detección de tópicos y la selección de segmentos de textos a incluir en el resumen; analizando trabajos donde los textos a resumir son textos valorativos. Se muestran varias formas de realizar la detección de tópicos en opiniones, detectando problemas comunes en los trabajos de sumarización de opiniones consultados. Por otro lado, también se analizan distintas estrategias para la selección de los segmentos de textos valorativos, detectándose también problemas generales en estos trabajos. Palabras clave: minería de opiniones, minería de texto, recuperación de información, generación automática de resúmenes de texto, generación automática de resúmenes de opiniones Abstract: The opinion mining is a recent discipline that it derives of the text mining, the information retrieval and the computational linguistics. This discipline aims the study of the subjective information in texts. From the analysis of the subjective information in texts, various processings could be doing, such the automatic generation of opinion summaries. The automatic generation of opinion summaries derives of an one tasks of the texts mining that attends in the opinion mining, the automatic generation of texts summaries. This report centers its attention in the automatic generation of opinion summaries, previously presenting a series of knowledge related with opinions and with the generation of texts summaries. This report centers special attention in two essential steps of the sumarization, the topics detection and the selection of texts segments to include in the summary. We see a varied of ways to accomplish the topics detection in opinions, detecting common problems in the works of opinions sumarization of looked up. In addition, different strategies for the selection of the segments of opinion texts are explored, also detecting general problems in the works. Keywords: Opinion Mining, Text Mining, Information Retrieval, Automatic Text Summarization, Automatic Opinion Summarization 1. Introducción En los últimos años, debido al surgimiento y desarrollo de la Internet y las comunicaciones, se ha observado un interés creciente del hombre por extraer conocimiento útil de la información a la que tiene acceso. Gran parte de la información existente se encuentra en forma de textos o documentos escritos en algún lenguaje natural. La información expresada en textos escritos en lenguaje natural se divide principalmente en dos tipos: información subjetiva (también referida como opiniones) y hechos objetivos. Se entiende como opinión a

5 Procesamiento de expresiones valorativas para la sumarización de opiniones 3 aquella unidad léxica (palabra, proposición, oración, párrafo) donde sea detectada información subjetiva, categorizándose como información subjetiva a: emociones, sentimientos, creencias, intenciones, especulaciones, propósitos, etc. La minería de opiniones es la disciplina que tiene como objetivo el estudio de la información subjetiva en textos. La minería de opiniones es una sub-disciplina reciente que deriva de la minería de texto, la recuperación de información y la lingüística computacional. La motivación para el estudio de esta disciplina proviene del deseo de proporcionar herramientas para analistas que procesan información sobre diferentes contextos (político, comercial, gubernamental) con el objetivo de detectar o dar seguimiento automático a los propósitos y juicios insertados en la prensa y en diversos medios y fuentes. A consecuencia del surgimiento y desarrollo de la Web son cada vez más los sitios en los que los usuarios expresan sus opiniones sobre diversos temas. Para que la información emitida sea útil, se hace necesario el procesamiento de la misma y es aquí donde tareas relacionadas con la minería de opiniones desempeñan un papel fundamental. A partir del análisis de las opiniones contenidas en textos, se pueden realizar diversos procesamientos, entre los que pude mencionarse: la segmentación de textos valorativos 2, la recuperación de información que contenga opiniones, la generación automática de resúmenes valorativos, la indexación de opiniones, la recuperación de respuestas valorativas, etc. Este reporte centra su atención en uno de los procesamientos antes mencionados, la generación automática de resúmenes valorativos. Este tipo de procesamiento deriva de una de las tareas de investigación de la minería de textos que concurre en la minería de opiniones, la generación automática de resúmenes de textos. El presente trabajo se organiza como sigue: primeramente, para un mejor entendimiento de la generación de resúmenes valorativos, se introducen en este reporte una serie de conocimientos relacionados tanto con opiniones en la sección 2, como con la generación de resúmenes de textos en la sección 3. En la sección 4 se abordan dos pasos esenciales en la sumarización, analizándose cómo han sido realizados estos pasos en textos valorativos. El primero de estos pasos es la detección de tópicos, que en el caso de textos valorativos nos referimos a esta tarea como detección de tópicos valorativos. El segundo paso es la selección de segmentos de textos a incluir en el resumen, que será referido como selección de segmentos de textos valorativos a agregar en el resumen. La detección de tópicos valorativos se analiza en la sección 4.1 como un tipo de procesamiento de la información valorativa para la sumarización. Por otro lado, la selección de textos valorativos se analiza en la sección 4.2 como un tipo de información a presentar en el resumen, que para obtenerla se hace necesario realizar un procesamiento no superficial. En la sección 5 se presentan algunas técnicas de evaluación de la calidad de los resúmenes. En la sección 6 se presentan las conferencias en en las que se incluyen tareas relacionadas con la generación de resúmenes valorativos. En la sección 7 se hace una recapitulación del trabajo y finalmente, en la sección 8 se presentan las conclusiones de este reporte. 2. Análisis de opiniones Como se ha mencionado anteriormente, la minería de opiniones es una disciplina que ha cobrado auge en la actualidad y a partir del análisis de estas se pueden realizar diversos procesamientos a los textos valorativos. En cada uno de dichos procesamientos juegan un papel fundamental tareas del análisis de opiniones, tales como: la extracción y catego- 1 Un conjunto de aplicaciones donde el usuario tiene el control y se caracterizan por estar basadas en la inteligencia colectiva y el uso de servicios interactivos en red 2 A partir de este momento en el resto del reporte se utilizarán análogamente las frases textos valorativos y textos evaluativos para referirnos a textos que contienen opiniones.

6 4 Lic. Gail García Delgado, Dr. C. José E. Medina Pagola rización de expresiones que contengan opiniones y la clasificación de textos (documentos o segmentos de ellos) según los sentimientos y opiniones expresadas. Para la ejecución de las tareas mencionadas anteriormente, es necesario identificar las unidades léxicas que contienen información subjetiva de aquellas que expresan hechos objetivos y posteriormente; definir modelos que permitan representar y procesar la información subjetiva con el propósito de determinar aspectos tales como: el tipo de opinión, su clasificación (positiva o negativa teniendo en cuenta la orientación semántica (o polaridad como también se llama) de la información subjetiva y afecto, apreciación y juicio de acuerdo al tipo de actitud que expresan), quién expresa la opinión (fuente), respecto a qué o a quién es emitida la opinión (tema), la intensidad (gradación como también se llama) de la opinión que indica un grado (puede ser un valor o una categoría) asignado a aspectos como: subjetividad, orientación semántica, etc. En esta sección se presentan brevemente algunas definiciones y teorías abordadas en la literatura como tipos de opiniones. Además, se presentan los principales enfoques abordados por los métodos de detección y clasificación de opiniones, así como el nivel de profundidad al que se analizan las mismas Tipos de opiniones Para identificar las unidades léxicas que contienen información subjetiva de aquellas que expresan hechos objetivos es necesario primero definir lo que va a ser contemplado como una opinión o expresión subjetiva. Desde que comenzó el interés en el estudio de las opiniones se han reportado en la literatura trabajos en los que se proponen diferentes definiciones de lo que se considera como opinión, identificando las opiniones como: adjetivos [1], [2], [3], sustantivos [4], términos [5], segmentos de oraciones [6], [7], [8], oraciones [6], [9], [7], [10], [8], [11], documentos [12], etc. Las definiciones de opiniones son variadas, los investigadores en esta área no han asumido como consenso una definición o teoría general. Lo anterior se debe a que las opiniones se manifiestan de diversas formas en los diferentes textos valorativos, muchas veces dependiendo del dominio y estilo de los mismos. En algunos trabajos se definen como opiniones a los adjetivos, basándose en el carácter subjetivo que expresan [1], [13], [3], [2], [5]. En algunos trabajos [8], [12], la evaluación y la especulación son reconocidas como tipos de opiniones. Los autores plantean que las oraciones subjetivas pueden ser identificadas debido a que contienen expresiones (evaluativas y especulativas) individuales de subjetividad. En [4] los autores se proponen el desarrollo de un sistema que pueda distinguir oraciones subjetivas de objetivas. Persiguiendo este propósito se clasifican las palabras en Strong Subjective, Weak Subjective y Objective. En [10] se basan en identificar las expresiones polares en oraciones individuales. Los autores identifica cuatro rasgos en los que se pueden clasificar las opiniones: lenguaje (explícito/implícito), mundo (real/posible), modalidad (temporalidad/condicionalidad) y atribución. La polaridad en el proceso de clasificación la obtienen mediante la relación con un léxico previamente seleccionado para el dominio en cuestión. Algunos autores han definido las opiniones o sentimientos a partir de estados privados [9], los cuales manifiestan estados de actitud de un sujeto hacia un objeto y están abiertos a la observación o verificación subjetiva. En el trabajo se identifican tres estados privados (intelectuales, emotivos y perceptivos) y se analizan dos tipos de oraciones subjetivas. Usando su definición de opinión, Wiebe et al. [6] proponen un amplio esquema de anotación para expresiones subjetivas y crean el corpus MPQA 3. En su primera versión el MPQA (versión 1.2) contiene 535 documentos manualmente anotados; señalando las expresiones 3

7 Procesamiento de expresiones valorativas para la sumarización de opiniones 5 valorativas, sus fuentes, polaridades e intensidades. La segunda edición (versión 2.0) adiciona 157 documentos para un total de 692 y adiciona anotaciones referidas al tópico de las opiniones. Bethard et al. [7] proponen como opinión una oración o segmento de oración que se ajuste como respuesta a la pregunta What does X feel about Y. Los autores definen los complementos del predicado de la oración como opinión proposicional y se proponen identificar tantos las opiniones como los emisores de la misma (fuente de la opinión). Bethard et al., basados en su definición de opinión crean un corpus que contiene 5,139 oraciones anotadas para opiniones. A cada oración se le asigna una de las siguientes etiquetas: NON OPINION, OPINION-PROPOSITION y OPINION-SENTENCE; las cuales indican respectivamente que la oración no contiene opinión, que la oración contiene opinión proposicional y que la oración contiene opinión pero esta no es un complemento del predicado de la oración (no proposicional). Las anotaciones también contienen información acerca de las fuentes de algunas de las opiniones proposicionales. Kim y Hovy definen como opinión la tupla [Topic, Holder, Claim, Sentiment] [14], donde Topic se refiere a un tema sobre el cual una fuente (Holder) emite una argumentación valorativa (Claim) asociada a un sentimiento (Sentiment) que puede ser bueno o malo (positivo/negativo). Stoyano et al. [15], [16], [17] se basan en una definición de opinión muy parecida a la definida anteriormente, planteando que una opinión está compuesta por la tupla [Trigger, Source, Topic, Polarity] donde las componentes (en orden) son equivalentes en significado a Claim, Holder, Topic y Sentiment en la definición de Kim y Hovy. Algunos autores se han basado en la teoría de la valoración para determinar la información subjetiva en los textos [18], [19]. Esta teoría se enfoca en particular en la expresión linguística de la actitud, así como en el conjunto de recursos que explícitamente posicionan de manera interpersonal las propuestas y las proposiciones textuales. La teoría de la valoración se divide en tres sub-sistemas en los que son clasificadas las opiniones: actitud (afecto, juicio y apreciación), gradación (fuerza y foco) y compromiso (apariencia, pronunciamientos, negaciones, etc.) Detección y clasificación de opiniones En la detección y clasificación de opiniones hay un aspecto que es muy importante tener en cuenta, se trata del dominio al que pertenecen los textos valorativos. Las expresiones que se utilizan para emitir opiniones pueden variar y tener diferentes significados en dependencia del dominio. Por ejemplo, en el segmento El objeto es bastante grande, donde la expresión bastante grande es la opinión, si el objeto fuera un teléfono celular (lo deseable es que el teléfono sea pequeño), la opinión sería negativa respecto al objeto; sucediendo lo contrario si el objeto fuera un televisor (siendo deseable que el televisor sea grande). Desarrollar métodos de detección de opiniones independientes del dominio es todo un reto en este tema, porque aún cuando se intente el no ajuste a un dominio específico, existe un problema de estilo propio en cada tipo de texto valorativo que no se puede obviar. Granularidad De acuerdo a la granularidad o nivel al que se realiza el análisis para la detección y clasificación de opiniones, es posible separar los métodos en dos categorías [15]: granulado grueso (coarse-grained en inglés) y granulado fino (fine-grained en inglés). En los métodos categorizados como granulado grueso, la detección de opiniones se realiza a nivel de documentos, donde se persigue como propósito clasificar los documentos en valorativos o no, pudiéndose además en el caso de los valorativos clasificarse de acuerdo a la orientación semántica. Muchos de los trabajos que detectan las opiniones a este nivel trabajan con textos cortos como son los comentarios sobre diversas entidades (productos comerciales, películas, editoriales, restaurantes, etc.) [20], [21], [22], encargándose

8 6 Lic. Gail García Delgado, Dr. C. José E. Medina Pagola de detectar los comentarios valorativos y de clasificarlos en positivos o negativos. Estos trabajos generalmente se apoyan mucho en el dominio al que pertenecen los comentarios, identificando características y patrones regulares que cumplen las opiniones en el marco de los mismos. La complejidad y retos de estas aproximaciones no son tan grandes con respecto a otras que intentan divorciarse del dominio de los textos. La dependencia directa del dominio no permite aplicar las aproximaciones propuestas de manera ampliada a cualquier texto valorativo, lo cual es una deficiencia de estos métodos. En los métodos de granulado fino la detección de opiniones se realiza al nivel de oraciones o a un menor nivel (expresiones o términos). Los trabajos clasificados en este nivel incluyen una amplia variedad de aproximaciones basadas en diferentes definiciones, características y dominios de las opiniones. Los trabajos clasificados bajo esta categoría realizan un análisis más profundo para la detección de opiniones. A diferencia del granulado grueso, en el granulado fino se detectan y clasifican las opiniones por las que están compuestos los textos valorativos, lo cual permite realizar luego de la detección procesamientos de mayor calidad con la información detectada, ya que es mucho más rica e informativa. En el granulado fino al igual que en el grueso la mayoría de los trabajos son dependientes del dominio (comentarios), aunque hay otros sobre noticias generales o editoriales que persiguen la independencia. El granulado fino tiene diferentes niveles de complejidad que diferencian al granulado fino dependiente del dominio del granulado fino no dependiente del dominio, siendo este último el más complejo. En el caso de los comentarios sobre alguna entidad, donde se realice el análisis de opiniones mediante granulado fino dependiente del dominio, existen diferencias con respecto al análisis en otros textos valorativos en los que se aplique granulado fino independiente del dominio. Entre estas diferencias se puede mencionar que en el caso de los comentarios, los temas abordados están acotados, ya que la detección de opiniones en los comentarios es solo sobre aquellas relacionadas con la entidad y con los rasgos o aspectos de la misma. Los rasgos sobre una entidad son los aspectos que la caracterizan, por ejemplo, los rasgos de una cámara digital pueden ser: el enfoque del lente, el tamaño, la calidad de la fotos, etc. En el caso de los temas o tópicos abordados en textos valorativos en los que se aplique granulado fino independiente del dominio la detección de temas es más desafiante. En la sección 4.1 se le prestará atención diferenciada a la detección de temas, debido a la importancia que tiene este procesamiento en la generación de resúmenes valorativos. Enfoques Los métodos que persiguen la detección y clasificación de opiniones se han abordado fundamentalmente a partir de tres enfoques: realizando anotaciones manuales [23], apoyándose en corpus y basándose en diccionarios [24]. No se ha tomado como consenso la superioridad de alguno de los enfoques con respecto a los otros, cada uno tiene sus características, así como ventajas y desventajas. El enfoque manual se basa en la observación de los textos para definir patrones de extracción a partir de sus características y peculiaridades. Luego, apoyados en estos patrones se procede anotando y etiquetando la información. Esta estrategia tiene como inconvenientes el alto costo en tiempo y esfuerzo humano. Los enfoques que se basan en corpus se apoyan en patrones sintácticos [1], semánticos [13], [3] o de co-ocurrencia [25]. A partir de un conjunto inicial de términos semillas extraídos del corpus, se pueden aplicar métodos que identifican en el conjunto de datos, otros términos que se encuentran relacionados con los primeros. Estas relaciones han sido definidas mediante: conjunciones (adjetivos enlazados por conjunciones como y, o usualmente tienen orientación similar, mientras que pero, ni se utiliza con adjetivos de orientaciones opuestas) [1]; un grado significativo (depende de la definición de un umbral) de co-ocurrencia de términos en una vecindad determinada (términos con orientación sim-

9 Procesamiento de expresiones valorativas para la sumarización de opiniones 7 ilar tienden a co-ocurrir en los mismos documentos) [25]; sinonimia y antonimia (términos que son sinónimos tienden a tener orientaciones similares, mientras que términos que son antónimos tienden a tener orientaciones opuestas) [3]; significados (términos con glosas similares tienden a tener orientación similar) [26]. La aproximación basada en corpus tiene como desventaja la fuerte dependencia del dominio del conjunto de datos utilizado. Por otra parte, de la definición inicial del conjunto de términos semilla depende la suficiencia del conjunto final de palabras identificadas (usualmente no es suficiente). Como ventaja cabe señalar, que en esta estrategia debido a que se basa en corpus, se tiene en cuenta en el análisis, el contexto en que se utilizan los términos, por lo que la eficacia de la clasificación es mayor que en el enfoque basado en diccionarios. El enfoque basado en diccionarios consiste básicamente en un proceso similar al anterior, pero en este caso los términos semillas no son extraídos del corpus sino que se definen genéricos, por ejemplo, conjunto de adjetivos representativos por cada una de las orientaciones semánticas seleccionados de un diccionario [27]. Este enfoque apoyándose en una base de conocimientos como WordNet 4 o en un diccionario léxico como General Inquirer 5, identifican igualmente otros términos relacionados. Esta aproximación a diferencia de la anterior no es dependiente del dominio del corpus pero si es necesario la correcta definición del conjunto de términos semillas y tener disponible los lexicones que son recursos necesarios en este tipo de aproximación. 3. Generación automática de resúmenes de textos La sumarización 6 es el proceso de abreviar un texto o un conjunto de ellos; o sea, brindar a partir de estos una versión más corta sin perder el contenido esencial de la información ofrecida. Los algoritmos tradicionales para la generación de resúmenes de textos se basan en los datos importantes presentes en los documentos, para eliminar información redundante y posteriormente presentar una vista sintetizada de los mismos. La generación automática de resúmenes es una tarea muy importante ya que ahorra tener que revisar manualmente grandes volúmenes de textos para encontrar información relevante a nuestras necesidades. La sumarización se encuentra estrechamente relacionada con otras tareas de la minería de datos, entre las que se pueden mencionar: sistemas preguntas/respuestas, recuperación de pasajes, indexación, recuperación de información, etc. Existen sistemas de sumarización que generan resúmenes que pueden verse como respuestas argumentadas [28], [29] y por ese motivo es que se dice que la sumarización está vinculada con la recuperación de respuestas (ver sección 6). Este tipo de sistema de sumarización, a partir de una consulta de usuario, produce un resumen enfocándose en el tipo de información requerida y solicitada mediante la consulta. También puede verse la sumarización relacionada con la recuperación de información y extracción de pasajes, ya que la tarea de resumir es precisamente la recuperación de información relevante a ciertas necesidades a partir de una fuente o conjunto de ellas, muchas veces extrayéndose segmentos textuales identificativos de las mismas. En el proceso de sumarización, el conocimiento extraído del volumen de información a resumir o la propia información a resumir, de alguna manera tiene que almacenarse para que sea recuperada fácilmente y realizarle el tipo de procesamiento definido en cada 4 Ontología del idioma inglés muy útil en diferentes tareas de procesamiento del lenguaje natural. WordNet es un sistema léxico de referencia donde los sustantivos, verbos, adjetivos y adverbios se agrupan en conjuntos de sinónimos. 5 En GI se describen las orientaciones semánticas de las palabras de manera general. El GI es un sistema de análisis de texto que con el fin de llevar a cabo su tarea, usa un gran número de categorías (la definición de estas está disponible en cada una denotando la presencia de un trato específico en un término. Las dos categoría principales son Positivo (PRO)/Negativo (CON). 6 En lo siguiente se utilizará también el término sumarización para referirse a la tarea de resumir

10 8 Lic. Gail García Delgado, Dr. C. José E. Medina Pagola método. En cada uno de los sistemas de sumarización debe haber un módulo encargado del almacenamiento de la información; sin embargo, en muy pocos trabajos se aborda este tema, porque se ha centrado la atención a otro u otros aspectos. La información se almacena generalmente en bases de datos o se crean índices para luego realizar recuperaciones rápidas, en este caso se ha utilizado Lucene 7 como herramienta de indexación [30]. El interés en el desarrollo de sistemas que proporcionen de manera automática resúmenes de documentos o conjuntos de ellos data de varias décadas. La primera publicación registrada en la historia donde se describe la implementación de un sistema automático para la sumarización, es el método de Luhn publicado en 1958 [31]. El próximo trabajo notorio luego del propuesto por Luhn fue desarrollado diez años después por Edmundson [32]. Tras una disminución en el desarrollo de trabajos relevantes sobre el tema, en la década de los 90 se comienza a observar un renovado interés en esta línea, el cual ha ido creciendo notablemente. En esta sección se presentan un conjunto de variables o criterios necesarios a tener en cuenta al hacer un resumen. Además, se argumentan diferentes clasificaciones de los tipos de resúmenes existentes Aspectos a tener en cuenta Aunque todos los resúmenes de manera general persigan la sintetización de la información, mostrando el contenido relevante, no todos los resúmenes tienen las mismas necesidades. Existen un conjunto de variables o criterios que es necesario tener en cuenta a la hora de hacer un resumen automático de una fuente, como por ejemplo: la persona a la que va dirigido, la estructuración, el medio de donde se extrae (con sus tipos de datos, su idioma, la diversidad de fuentes textuales), etc. Esto provoca que en ocasiones sea necesario que el resumen se ajuste a las necesidades individuales del momento, y que por lo tanto se generen diferentes resúmenes para una misma fuente de entrada. Casos como el mencionado anteriormente, se pueden representar en las necesidades de la audiencia de cierta película, donde la fuente de entrada sean las opiniones relacionadas con la misma y exista un grupo de usuarios que necesite un resumen de la trama de la película y otro grupo de usuarios necesite un resumen de las opiniones acerca de la misma. En cada caso la información de la fuente documental se procesa ajustándose a requerimientos. En general, las propiedades que debe tener un resumen son diferentes para cada persona y situación, lo que hace que las posibilidades sean muy variadas. A continuación se expondrán brevemente algunas de estas variables. - Fuente Un factor importante a tener en cuenta es si se trata de resumir un solo documento o de un conjunto de ellos. El procesamiento de varias fuentes puede hacer más compleja la tarea de búsqueda y la selección de información, pero también puede ayudar en la valoración de la redundancia (información repetitiva) presente entre las diferentes fuentes, para encontrar el contenido más identificativo. - Idioma El idioma en el que se encuentra la fuente es otro factor importante, ya que es necesario en el tratamiento del lenguaje natural prestarle atención a las características específicas de cada idioma. Por otro lado las fuentes pueden estar escritas en un solo idioma (monolingüe) o en múltiples idiomas (multilingüe) lo cual dificulta aún más el procesamiento. 7 Lucene es una librería de alto rendimiento que permite añadir funcionalidades de indexación y búsqueda a las aplicaciones facilitando tareas relacionadas con la recuperación de información. (

11 Procesamiento de expresiones valorativas para la sumarización de opiniones 9 - Género El género de la fuente es también una característica que las herramientas de resumen automático deben tener en cuenta para generar buenos resúmenes. Existen muchos tipos de géneros que también están muy relacionados con el estilo en que se presenta la información escrita (artículos científicos, noticias, novelas, poemas, editoriales, reportes, mails, blogs, etc.), los cuales tienen peculiaridades a considerar en el momento en que el procesamiento de su contenido se lleva a cabo para extraer los datos relevantes. Por ejemplo, cuando se trata de resumir una noticia, hay que darle especial importancia al titular y al subtitular de esta, además de a las referencias que puedan aparecer en el contenido. - Dominio El dominio sobre el que se tiene que hacer un resumen es otra de las variables a considerar. Cuando se procesan documentos de un dominio particular, es preciso aplicar conocimientos y técnicas de tratamiento del lenguaje natural adaptadas y específicas para dicho dominio. Si el dominio utiliza términos médicos, es necesario que las técnicas utilizadas sean capaces de comprender correctamente lo que analizan, lo cual implica el uso de diccionarios de términos médicos y el conocimiento de expertos en la materia para que el tratamiento sea el adecuado. - Grado de compresión En dependencia de las exigencias o necesidades de la persona, el sistema o el dispositivo que requiera el resumen, es necesario que este se ajuste a un volumen adecuado. Por ejemplo, un teléfono móvil de tamaño reducido necesita que el resumen sea pequeño, mientras que un resumen destinado a ser visualizado en una página web puede tener mayor tamaño. - Contenido a extraer Cuando se trate de decidir la naturaleza de los datos que deben extraerse, es necesario tener en cuenta las necesidades de la persona o el sistema que solicite el resumen. Es posible que de todo el contenido, solo se deseen extraer datos relacionados con precios o con otro tipo de referencias Tipos de resúmenes Los métodos para la generación automática de resúmenes de textos reportados en la literatura pueden clasificarse de acuerdo a varios criterios. También es posible tener en cuenta criterios de clasificación basados en las variables a considerar expuestas anteriormente, por ejemplo un resumen se puede clasificar atendiendo al lenguaje en: resumen multilingüe o resumen monolingüe. A continuación se expondrán brevemente algunos tipos de resúmenes. Forma de la información mostrada Los resúmenes se clasifican, según la forma en que se muestra la información, en estructurados y no estructurados. - Resumen estructurado El resumen posee una estructura u organización fácil de entender a partir de algunos aspectos o etiquetas identificados en el contenido a resumir. Estas etiquetas pueden ser tomadas de un conjunto predefinido o extraerse de manera dinámica. Asociado a las etiquetas se puede ofrecer información relacionada, que en dependencia de lo que se quiera mostrar, puede ser muy diversa (ver sección 4.2). Como caso particular de lo antes mencionado, existen métodos que estructuran la información empaquetándola en tablas o plantillas. Estas tablas se llenan identificando en el documento o conjunto de documentos a resumir, un grupo de entidades y aspectos específicos predefinidos; así como, extrayendo conocimiento que permita generar algún

12 10 Lic. Gail García Delgado, Dr. C. José E. Medina Pagola tipo de información específica requerida (contabilizar la ocurrencia de determinados rasgos o informaciones, por cientos de información, etc.). - Resumen no estructurado La información mostrada en el resumen no se estructura a partir de etiquetas como en el caso anterior, sino que se muestran los resúmenes a partir de uno o varios segmentos de textos (palabras, expresiones, proposiciones, oraciones, etc.). Los resúmenes no estructurados pueden dividirse atendiendo a la forma de obtención de la información mostrada, en resúmenes de extracción y abstractos. Resúmenes de extracción En este tipo de resumen, son procesados uno o más documentos con el fin de extraer de ellos información textual de interés. El resumen es conformado finalmente con información textual exacta (segmentos exactos de texto). Resúmenes abstractos En este tipo de resumen, la información que se muestra no está constituida en su totalidad por información textual exacta extraída de los textos originales como en el caso anterior. En los resúmenes abstactos a diferencia del anterior, el resumen es generado a partir de la información de interés, haciendo uso de técnicas de procesamiento de la información para su generación en lenguaje natural. Nivel de procesamiento de la información Los resúmenes se clasifican, según el nivel al que se procesa la información, en resumen a nivel superficial y resumen a nivel profundo. - Resumen a nivel superficial En los métodos superficiales no se utiliza análisis lingüístico complejo. En estos métodos la información es resumida mediante la selección de rasgos extraídos de los documentos. Ejemplos de estos rasgos pueden ser: términos frecuentes, posiciones de términos, oraciones o párrafos, términos contenidos en títulos y subtítulos, términos contenidos en lexicones, términos de dominios específicos o términos presentes en las consultas de usuarios. - Resumen a nivel profundo En los métodos profundos es necesario hacer uso de técnicas complejas de procesamiento de información como análisis lingüístico para la generación en lenguaje natural. En estos métodos se hace uso de algún tipo de análisis semántico para encontrar los segmentos importantes en los textos. Independientemente del nivel al que se procese la información para obtener el resumen, existen varios tipos de pre-procesamientos que se les realiza a los textos, ya sea para obtener un conjunto de términos más representativos de los documentos, reducir dimensionalidad, etc. Entre las operaciones más comunes realizadas en el pre-procesamiento inicial de los documentos se tienen: - Eliminación de signos de puntuación, espaciados, acentos (en documentos en idioma español), reducción de mayúsculas, reconocimiento del formato del documento (eliminación de etiquetas si es una página HTML), reconocimiento de las palabras, etc. Cuando esta primera etapa es terminada se tiene el texto plano y las palabras identificadas en él. - Eliminación de las palabras vacías (stopwords). Tras este paso se logra una reducción del documento entre un 30 y un 50 por ciento. Las stopwords son palabras que carecen de significado a la hora de representar un documento, ya que con seguridad aparecen en todos los documentos de la colección. Como ejemplos de palabras vacías se pueden mencionar: las preposiciones, las conjunciones, los artículos y los pronombres. Aunque algunas de estas pueden considerarse atendiendo al procesamiento lingüístico y semántico que se requiera.

13 Procesamiento de expresiones valorativas para la sumarización de opiniones 11 - Extracción de raíces o de lemas (lematización). Los algoritmos de extracción de raíces o lemas obtienen un único término, a partir de diferentes palabras que constituyen variaciones morfológicas con un mismo significado. Por ejemplo, en el caso de los verbos un infinitivo puede ser obtenido a partir de sus conjugaciones verbales. Este proceso además comprende la eliminación de los plurales, de ciertos prefijos, de sufijos, etc. Existen herramientas libres que ofrecen entre otros procesamientos, la lematización de palabras, las cuales ofrecen de forma eficiente buenos resultados de eficacia, entre estas se puede mencionar el TreeTagger 8 y Freling 9. - Etiquetado gramatical (Part-of-speech tagging en inglés y por sus siglas POS tagging o POST). Este etiquetado es el proceso de asignar a cada una de las palabras de un texto su categoría gramatical (sustantivo, adjetivo, artículo, verbo, etc.). Este proceso se puede realizar en base a la definición de la palabra o el contexto en que aparece, por ejemplo su relación con las palabras adyacentes en una frase, oración, o párrafo. Entre las herramientas libres que realizan este procesamiento se pueden mencionar Balie 10, TreeTagger y Freeling. - Extracción de entidades nombradas. El reconocimiento de entidades nombradas es una tarea que persigue la identificación de elementos en el texto y su clasificación en distintas categorías predefinidas como: nombres de personas, organizaciones, direcciones de lugares, expresiones de tiempo (Fecha/Hora), cantidades numéricas (por ciento, cantidades monetarias, medidas de magnitud expresadas en distintas unidades de medidas: metros, litros, libras, km/h, etc.). Entre las herramientas libres que existen para la detección de entidades nombradas se puede mencionar Freeling y Balie. No resulta necesario aplicar todas las operaciones antes comentadas, estas se emplean de acuerdo al tipo de procesamiento que vaya a realizar después. Por ejemplo, si se van a detectar entidades nombradas, no es conveniente eliminar previamente stopwords como la preposición de, ya que dicha eliminación afectaría la recuperación de fechas en el formato día de mes. Distinción a partir de la audiencia Los resúmenes se clasifican, según su distinción a partir de la audiencia, en genéricos, basados en consultas (query-based en inglés) y basados en tópicos (topic-focused o userfocused en inglés). - Resumen genérico Este tipo de resumen brinda un resultado de interés para una amplia comunidad de lectores donde todos los asuntos abordados son valorados como importantes. - Resumen basado en consultas En este tipo de resumen el resultado es basado en una consulta determinada, dando respuesta resumida sobre un interés particular expresado mediante la misma. - Resumen enfocado en tópicos Este tipo de resumen es ajustado al interés particular de un tipo de usuario. Los sistemas enfocados en tópicos se especializan en un conjunto de temas particulares. 4. Generación automática de resúmenes valorativos La tarea de sumarización de opiniones se encarga de la elaboración de un resumen a partir de procesar la información contenida en un documento o conjunto de documentos, teniendo en cuenta las opiniones insertadas. Debido a sus múltiples aplicaciones, la generación automática de resúmenes de opiniones es un tema que ha cobrado gran importancia en la actualidad. Métodos para generar de forma automática resúmenes de opiniones se han 8 ( http: //lordpimpington.com/codespeaks/drupal - 5,1/?q = node/5

14 12 Lic. Gail García Delgado, Dr. C. José E. Medina Pagola aplicado en diferentes contextos: discursos, forums en línea, editoriales, actas de reuniones, comentarios sobre productos comerciales, en encuestas a grupos de personas que permitan a analistas de información crear un perfil de la opinión pública sobre determinados temas de interés, etc. Los resúmenes de opiniones pueden verse como un tipo particular de resumen de texto, que persigue como propósito específico el análisis evaluativo o crítico de la información y brinda una vista sintetizada a partir de procesar las opiniones insertadas. Los resúmenes de comentarios u opiniones están fuera del ámbito de los actuales sistemas automáticos de resúmenes de textos. Como ha sido tratado anteriormente, los métodos de sumarización no se aplican indistintamente para cualquier situación, sino que dependen de ciertos parámetros y condiciones; por lo tanto, los resúmenes de texto no se pueden aplicar a opiniones directamente. Cuando se pretende hacer un resumen de opiniones es necesario realizar un procesamiento específico a la información para tener en cuenta el componente subjetivo de las opiniones y diversos aspectos relacionados con las mismas como pueden ser: la polaridad, el tipo de actitud, el emisor, el tema sobre el que se opina, etc. En esta sección se abordan dos pasos esenciales en la sumarización, analizándose cómo han sido realizados estos pasos en textos valorativos. El primero de estos pasos es la detección de tópicos, que en el caso de textos valorativos nos referimos a esta tarea como detección de tópicos valorativos. El segundo paso es la selección de segmentos de textos a incluir en el resumen, que será referido como selección de segmentos de textos valorativos a agregar en el resumen. La detección de tópicos valorativos se analiza a continuación como un tipo de procesamiento de la información valorativa para la sumarización. Por otro lado, la selección de textos valorativos se analiza como un tipo de información a presentar en el resumen (sección 4.2) Procesamiento de la información valorativa para la sumarización Para la sumarización de opiniones, como ha sido mencionado anteriormente, es necesario hacer un análisis de las opiniones insertadas en los textos, ya sea para: detectarlas, clasificarlas, encontrar los temas abordados, detectar los emisores de las opiniones, etc. La calidad del resumen final depende en gran medida de la eficacia conque se realice cada uno de los procesamientos; sin embargo, hay trabajos de sumarización de opiniones que no se encargan, en el proceso de análisis de las opiniones, de la detección y clasificación de las mismas. Existen trabajos de sumarización de opiniones que asumen que las opiniones ya han sido detectadas y clasificadas previamente [29], [15], [33] y centran su atención y novedad en otros aspectos. Algunos trabajos han centrado la atención en la forma de agregar de manera eficiente la información en el resumen (ver sección 4.2) y otros se han concentrado en la detección de los tópicos sobre los que se opina. La detección de los temas discutidos (tópicos de las opiniones) es un procesamiento de gran importancia en el análisis de las opiniones, el cual ha sido abordado en trabajos de sumarización de opiniones, sobre todo donde los textos evaluativos son comentarios. En la detección de los tópicos de las opiniones, al igual que en la detección y clasificación de las mismas, se pude tener en cuenta o no el dominio de los textos valorativos. La detección de tópicos se ha tratado en trabajos de sumarización de diversas maneras, aplicando técnicas de: agrupamiento [34], [35], [36], minería de asociación [27], patrones de extracción [29], secuencias frecuentes de palabras [37], etc. El problema de detección de tópicos en textos valorativos, exceptuando los comentarios, no ha sido muy explorado [15] y la detección no se ha realizado en profundidad aplicando técnicas de procesamiento de lenguaje natural y en particular de procesamiento de opiniones. A continuación se analizan brevemente varias formas de detectar tópicos en opiniones, haciéndose distinción entre dos tipos de textos valorativos: textos cortos (comentarios) y textos más largos (noticias, blogs, etc.).

15 Procesamiento de expresiones valorativas para la sumarización de opiniones 13 La detección de los tópicos (rasgos) en comentarios se ha abordado de varias formas. En el sistema propuesto por Hu y Liu en el 2004 se aplica una técnica no dependiente del dominio para la detección de los rasgos [27]. Hu y Liu aplican un método de minería de asociación [38] para la detección de los rasgos más frecuentes, realizando luego dos tipos de podas para refinar el conjunto de rasgos seleccionados, en las que se eliminan los rasgos redundantes y los que no son compactos [13]. Una técnica dependiente del dominio aplicada para la detección de rasgos, es la de mapear rasgos detectados mediante el método propuesto en [13] a una taxonomía existente, donde se organizan los rasgos de la entidad, este mapeo se realiza a partir de la definición de medidas de semejanza [39], [40]. Entre otras estrategias dependientes del dominio también, se pueden mencionar: la definición de patrones de extracción definidos a partir de la observación de los rasgos en los textos a resumir [41], [29], la creación manual de listados de rasgos basándose en la observación de que los usuarios utilizan las mismas palabras o frases para referirse a los rasgos de ciertas entidades [42], la extracción de rasgos dinámicos y estáticos y su combinación [43], etc. De manera general, la mayoría de los trabajos no tienen en cuenta en la detección de tópicos, a aquellos temas o rasgos que no estén expresados explícitamente en un segmento donde se emita una opinión sobre él. En todos estos trabajos, la detección de tópicos se realiza a partir de detectar ciertas entidades (rasgos) mencionados en los textos, por lo que la detección de tópicos en estos casos se basa en detección de entidades nombradas. Finalmente, los tópicos detectados en los comentarios están limitados; es por esto que se dijo anteriormente (ver sección 2.2) que los temas abordados en los comentarios son acotados. El conjunto de tópicos está definido por un conjunto de entidades mencionadas explícitamente, lo cual es una deficiencia que provoca pérdida de información, ya que hay opiniones referidas a rasgos implícitos que no se tienen en cuenta durante el análisis. Cabe destacar que en [42] se tratan dos casos de rasgos implícitos, aunque son dos casos bastantes simples, los autores reconocen su importancia y dieron un primer paso en su detección. Otra deficiencia que está muy relacionada con la anterior, es que usualmente en los comentarios, en el momento de hacer referencia a un rasgo, en vez de mencionarlo se utilizan pronombres. La solución a este problema, denominado anaforismo, no se tiene en cuenta en muchos trabajos, lo cual también provoca pérdida de información relevante en la detección de los tópicos. La detección de tópicos en textos valorativos de mayor extensión ha sido tratada en varios trabajos. Seki et al. en el 2005 [44], [45] aplican un método no dependiente del dominio para encontrar los temas principales. Mediante el algoritmo de agrupamiento Ward [46], se agrupan los párrafos que son previamente representados en el espacio vectorial y finalmente cada grupo representa un tópico. En el método de Chang y Tsai [34] igual que en el trabajo anterior, se utiliza un algoritmo de agrupamiento para detectar los tópicos. En este caso se agrupan por separado las razones positivas y negativas, aplicando el algoritmo de agrupamiento jerárquico FIHC basado en conjuntos de términos frecuentes [47]. En [34] las unidades léxicas en que se expresan las razones son los párrafos, los cuales pueden ser representados de dos maneras: por el conjunto de palabras que contienen o por el conjunto de palabras que contienen y que se encuentran relacionadas con el tema en mayor medida (conjunto previamente determinado). En el sistema propuesto por Zhan et al. en el 2008 [37], para la identificación de tópicos, los autores aplican una técnica no dependiente del dominio basada en la detección de secuencias frecuentes de palabras y en clases de equivalencia. En ninguno de los trabajos anteriores se aprovecha el significado semántico de la información en la detección de tópicos. Al tener en cuenta solo frecuencias de términos se pierden las relaciones que tienen estos en base a su significado. Como solución a esto, en algunos trabajos donde también se agrupan las oraciones mediante la aplicación de algo-

16 14 Lic. Gail García Delgado, Dr. C. José E. Medina Pagola ritmos de agrupamiento, se redefine la función de semejanza entre oraciones teniendo en cuenta la semántica de la información. Bossard et al. [48] aplican el algoritmo fast global kmeans para agrupar las oraciones, utilizando como función de semejanza una variante de Jaccard [49], donde si dos términos no son iguales se utilizan las relaciones de sinonimia/hiperonimia de Wordnet para tenerlos en cuenta en la función de semejanza. Gaurav y Roshan [50] redefinen la medida de semejanza entre oraciones teniendo en cuenta la semejanza entre palabras basándose en las relaciones que tiene las mismas en Wordnet; por ejemplo, fruta es ancestro de manzana en la jerarquía de conceptos de Wordnet. Ku et al. [51] para la identificación de las oraciones relevantes a los tópicos abordados, se seleccionan términos (palabras) representativos que identifiquen los conceptos principales de un conjunto de documentos. En el caso la estrategia seguida sí depende del dominio y de las características del lenguaje también, ya para la selección de términos representativos se apoyan en la frecuencia de los caracteres que los componen, aprovechando las características especiales del lenguaje chino. En los trabajos anteriores se tratan los textos valorativos, sin distinción alguna con respecto a textos no valorativos, de esta manera no se aprovechan las propiedades particulares de las opiniones. Las opiniones en ninguno de los trabajos anteriores se representan teniendo en cuenta características o aspectos identificativos de las mismas, sino que se representan a partir de modelos frecuentistas, tratando los textos valorativos como textos en general. Por ejemplo, en los trabajos donde se detectan los tópicos mediante algoritmos de agrupamiento, en la representación de las unidades léxicas a agrupar no se utilizan propiedades de las opiniones como pueden ser la polaridad o la intensidad. Para la correcta detección de los tópicos abordados en textos valorativos es importante definir modelos para representar las opiniones teniendo en cuenta aspectos o características de las mismas y proponer funciones que determinen grados de semejanza entre ellas. Por otro lado, en algunos de los trabajos donde se detectan los tópicos mediante algoritmos de agrupamiento no se justifica la selección de los algoritmos de agrupamiento aplicados [34]; mientas que en otros simplemente se justifica a partir de la realización de pruebas con varios algoritmos, seleccionando finalmente aquel con el que se obtuvieron mejores resultados en la sumarización [44]. Otros trabajos utilizan como forma de justificación del algoritmo de agrupamiento, la exposición de las ventajas (respecto a algunos aspectos) del algoritmo aplicado con respecto a otros algoritmos de agrupamiento [35], [36]. Sin embargo, ninguna de las justificaciones mencionados anteriormente es válida. No es correcto decir que alguna forma o técnica de agrupamiento de las abordadas en la literatura es mejor que otra, pero sí, algunas son más apropiadas para ciertos problemas o aplicaciones. El conocimiento del dominio y la aplicación en específico, pueden en muchos casos ayudar a determinar qué tipo de grupos se van a formar y qué tipo de agrupamiento se va utilizar con el objetivo de obtener los mejores resultados [52] Estructura de los resúmenes de opiniones Los resúmenes de opiniones pueden ser al igual que los resúmenes de textos clasificados de acuerdo a la forma de la información mostrada en: resúmenes estructurados o no estructurados (sección 3.2).

17 Procesamiento de expresiones valorativas para la sumarización de opiniones 15 Los resúmenes de opiniones estructurados poseen una organización fácil de entender a partir de etiquetas identificadas que pueden ser tomadas de un conjunto predefinido o extraerse de manera dinámica. En el caso de las opiniones, el conjunto predefinido puede ser una jerarquía predefinida de rasgos de ciertas entidades [40] y entre las etiquetas que se pueden extraer dinámicamente se puede mencionar: los principales temas comentados en textos valorativos, ya sean rasgos en comentarios [41], [29] o tópicos abordados en otros textos valorativos [34], [37], las fuentes emisoras de las opiniones, etc. Estas etiquetas pueden tenerse organizadas de acuerdo a diferentes criterios y visualizarse de alguna manera: espacio bidimensional [29], estructurados en listas [27], [42], grafos [15], etc. Los criterios de ordenación u organización de las etiquetas pueden ser dependientes o no de la información que se ofrece relacionada con estas, la cual en dependencia de lo que se quiera mostrar, puede ser muy diversa. Como se dijo anteriormente (sección 3.2), la información que se muestra relacionada con las etiquetas puede ser muy variada y en cada caso relevante a necesidades específicas de información, como ejemplo se podría mencionar: vínculo a los documentos que contienen la etiqueta [37], opinión o conjunto de opiniones representativas de la etiqueta; quizás organizadas o categorizadas de acuerdo a algún criterio (de acuerdo a la polaridad [27], [42], mostrar opiniones más fuertes [40], etc.), resumen de las opiniones asociadas (como un resumen no estructurado de la etiqueta) [44], valores estadísticos [27], [15] (frecuencia, por ciento, polaridad, intensidad, promedio de la polaridad de las opiniones relacionadas con la etiqueta, etc.), etc. La forma de obtención de la información relacionada con las etiquetas algunas veces es superficial, como es el caso de algunos de los valores estadísticos mencionadas en los ejemplos anteriores, ya que no es necesario realizar procesamiento profundo para determinarlos. Por otro lado, como es un resumen de opiniones, precisamente mucha de la información agregada es fácil de obtener una vez hecho el análisis de las opiniones, pues con este análisis se puede obtener información relacionada con las mismas (la polaridad, la intensidad, la fuente, etc.) y solo bastaría con agrupar las opiniones relacionadas con la etiqueta en positivas y negativas y mostrarlas todas o un subconjunto de ellas [27], determinar el promedio de la polaridad [15], mostrar la opinión de mayor intensidad [40], mostrar el número de opiniones positivas y negativas [42], ordenar las opiniones basados en su fortaleza o intensidad [53], etc. Como mismo hay información relacionada con las etiquetas que es fácil de obtener, hay información que para obtenerla se hace necesario realizar un procesamiento más profundo, como es el caso de la selección de segmentos de textos a incluir en los resúmenes de opiniones. En la literatura existen muchos métodos de selección propuestos en diversos trabajos de sumarización de textos basados en extracción [54], [55], [56]. En los métodos de selección en los trabajos de sumarización de textos no se tiene en cuenta en la definición de los criterios de selección, el trabajo específico con opiniones. Por lo tanto, como mismo no son aplicables los métodos para la sumarización de textos a la sumarización de opiniones (ver sección 4), no son aplicables ninguno de los criterios definidos para textos si lo que se quiere es resaltar segmentos valorativos. En el caso de la sumarización de comentarios donde se detectan rasgos, la mayoría de los resúmenes tienen como objetivo ofrecer una panorámica general sobre las opiniones acerca de los mismos, mostrando los puntos de vista de las personas que ha interactuado con la entidad sobre la que se comenta. En la sumarización de comentarios no es de interés general definir criterios de selección de segmentos de textos valorativos, sino que la información que se agrega relacionada con los rasgos es superficial generalmente. La selección de segmentos de texto a agregar en el resumen no ha sido muy explorado en textos evaluativos, debido a que la mayoría de los trabajos de sumarización de opiniones son de sumarización de comentarios sobre ciertas entidades. Al igual que en la detección

18 16 Lic. Gail García Delgado, Dr. C. José E. Medina Pagola de tópicos valorativos, en la selección de segmentos de textos valorativos a adicionar al resumen, no se han realizado trabajos en los que se aplique en profundidad técnicas de procesamiento de lenguaje natural y en particular de procesamiento de opiniones. En todos los métodos de selección es necesario definir un criterio para asignar grados de importancia o representatividad a cada segmento (generalmente oraciones). Para determinar esta representatividad se han seguido estrategias estadísticas, en las que se tiene en cuenta valores de determinados aspectos para pesar las oraciones [44], [48] [57], [33]. Estos aspectos pueden ser criticables en cada caso, así como el peso o importancia que se asigna a cada uno de ellos, pero de manera general lo más cuestionable en cada trabajo es la no distinción entre segmentos valorativos y no valorativos en base a las propiedades de las opiniones insertadas en los textos. A continuación se describen de forma general, algunas estrategias de selección propuestas en métodos de sumarización de textos valorativos. Meishan et al. en el 2007 [57] basados en que generalmente los lectores comentan los temas interesantes abordados en los blogs, extraen un conjunto de oraciones representativas de un blog a partir de información valiosa descubierta en el conjunto de comentarios asociados al mismo. La representatividad de las oraciones se determina a partir de la importancia o representatividad de las palabras que contiene. La importancia de una palabra es determinada a partir del conjunto de comentarios, teniendo en cuenta para ello tres estrategias estadísticas conocidas para el pesado de términos (Binario, CF y TF) y se propone una nueva estrategia (ReQuT) que se define en función de tres medidas: RM (Reader), QM (Quotation) y T M (Topic). El peso de las palabras mediante la aplicación de ReQuT se determina como: Rep(w k ) = α RM(w k ) + β QM(w k ) + γ T M(w k ). (1) En la función anterior se relacionan los comentarios a partir de tres aspectos mencionados en ellos: los lectores o usuarios que comentan (RM), las oraciones textuales (QM) y los principales tópicos comentados (T M), donde α, β, γ son grados de importancia para cada aspecto y cumplen que α + β + γ 1. Fotis et al. en el 2008 [33], para la sumarización de comentarios sobre productos comerciales ofrecidos en la web, presentan una aproximación que selecciona las oraciones basándose en una estrategia que tiene en cuenta la información que ofrecen un conjunto de metadatos relacionados con los comentarios. Para la selección del conjunto de oraciones representativas, primeramente se determina la importancia (R i ) de cada una de ellas mediante un método estadístico que se apoya en un diccionario del dominio (D) creado previamente. Luego, esta importancia es ajustada (aumenta o disminuye) determinando un peso final para las oraciones. Para determinar el peso final (W i ), se realiza un análisis de la influencia que tienen los valores de un conjunto de metadatos relacionados con los comentarios: utilidad o importancia del comentario de un usuario para otros usuarios (usefulness en inglés), grado de familiaridad que tiene el usuario que comenta con el producto relacionado (tech level en inglés), el tiempo que hace que el usuario que comenta adquirió el producto (ownership duration en inglés) y el grado de confiabilidad que se tiene en el comentario de un usuario (respectability en inglés). Cabe destacar que la idea del uso de los metadatos es un aporte de este trabajo [33]. La importancia inicial R i y el peso final (W i ) de las oraciones se determinan como: R i = v l / D W i = R i + R i f vl + 2 f vl, (2) v l D k M j, (3) j=1

19 Procesamiento de expresiones valorativas para la sumarización de opiniones 17 donde v l son las palabras contenidas en la oración i, f vl representa la frecuencia de aparición de la palabra v l en la oración i que en caso de estar presente en el diccionario D se multiplica por 2 para aumentar su significado, k representa la cantidad total de metadatos y M j define el valor que tiene el metadato j en el comentario donde está contenida la oración i. En los trabajos anteriores se puede señalar la misma deficiencia que en la detección de tópicos en textos valorativos. En estas definiciones, no se tiene en cuenta la información valorativa que estos ofrecen y se contemplan como textos de manera general sin aprovechar las características de las opiniones en los textos valorativos. En los métodos que previamente detectan los tópicos abordados es muy común que el proceso de selección de oraciones se apoye en la detección anterior. Zhan et al. [37] una vez que extraen los tópicos, por cada uno de ellos se detectan todas las oraciones relevantes iniciales. En caso de que los tópicos sean representados mediante secuencias frecuentes, las oraciones relevantes son aquellas que contienen la secuencia frecuente representativa. Si el tópico es representado mediante clases de equivalencia, las oraciones relevantes del tópico son aquellas que contengan alguna de las secuencias frecuentes que pertenezca a la clase. Luego del proceso inicial de selección de las oraciones, para reducir la redundancia de las mismas, se implementa el método Maximal Marginal Relevance para determinar el valor MMR de una oración y seleccionar finalmente las que van a pertenecer al resumen: MM(S i ) = λsim(s i, D) (1 λ) máx S j S Sim(S i, S j ), (4) donde D es el conjunto de oraciones relevantes de un tema particular, S es el conjunto de oraciones ya incluidas en el resumen, λ es el parámetro de redundancia que toma valores entre 0 y 1. Como medida de semejanza Sim se adopta la medida del coseno y las oraciones son representadas a partir del modelo de espacio vectorial después de haber eliminado las palabras vacías y haber lematizado la colección de comentarios. La medida MMR de una oración determina la importancia o representatividad de la oración con respecto al tópico en un grado de redundancia (primera parte de la ecuación) y penaliza este valor por el grado de representatividad de la oración con respecto a las oraciones ya seleccionadas para visualizar en el resumen. Este trabajo presenta la misma deficiencia de los anteriores. La medida del coseno es una medida basada en la aparición de los términos, si se aplica esta medida sin ninguna variación para tener en cuenta la semántica de la información se pierde significado semántico, lo cual es una deficiencia de este método. Carenini et al. [40] aprovechan en cierta medida el tratamiento de opiniones en la selección de las oraciones a presentar en el resumen. En el método se forman grupos (solapados) de oraciones por cada rasgo extraído cf, asignando a cada uno, todas las oraciones que contengan evaluaciones sobre el cf representativo del mismo. Luego, se selecciona de cada grupo (ordenados de forma descendente de acuerdo a la cantidad de oraciones que contienen) la oración de mayor valor CF sum, teniendo en cuenta no seleccionar la misma oración dos veces. El valor de CF sum de una oración S k se basa en la cantidad y fortaleza de los cf s presentes en cada oración: CF sum(s k ) = ps i eval(s k ) ps i, (5) donde eval(s k ) representa el conjunto de evaluaciones sobre los rasgos contenidas en la oración S k. Cada evaluación ps i es representada por un entero en el rango [ 3, 2, 1, 1, 2, 3] que refleja su orientación y fortaleza. El valor 3 representa la opinión más positiva posible y -3 la opinión más negativa posible. En este trabajo a diferencia de los anteriores, si se tiene en cuenta el tratamiento de las opiniones pero aun así cabe señalar que la polari-

20 18 Lic. Gail García Delgado, Dr. C. José E. Medina Pagola dad es un aspecto característico muy importante de las opiniones y aún teniéndolo como información no lo aprovechan en el resumen. Seki et al. [44] aplican un criterio para la selección de oraciones que radica en un peso que se asigna a cada una de ellas, teniendo en cuenta varios rasgos relacionados con la misma. El peso de una oración s es calculado como: W (s) = L(s) (a 1 Q(s) + a 2 H(s) + a 3 T (s) + a 4 N(s) + a 5 S(s)), (6) donde a los parámetros a1,..., a5 se asignan valores de manera empírica (a 1 = 0, 4, a 3 = 1, a 4 = 0, 4, a 5 = 20, a 2 = 1 Nc ), L(s) es el peso asociado a la oración s basado en la ubicación de la misma en el documento, Q(s) es el número de palabras de contenido en narraciones y títulos que están presentes en la oración s, H(s) es el número de palabras de cabecera que aparecen en s, T (s) son los valores TF en el grupo. N(s) y S(s) son pesos opcionales basados en el análisis específico de opiniones, donde N(s) es la frecuencia de entidades nombradas en s y S(s) = 1 si la oración es subjetiva y 0 en otro caso. En este trabajo también se tiene en cuenta el tratamiento con opiniones pero solo para distinguir las oraciones subjetivas de las objetivas. 5. Evaluación Un aspecto de gran importancia a tener en cuenta en cualquier método, algoritmo o sistema, es la evaluación de los resultados, para contemplar aspectos como la validez, utilidad o correctitud de los mismos; por lo tanto, aunque no se considere que forme parte como tal del proceso de sumarización, es muy común incluir entre los pasos en los que se divide el proceso de resumir, un proceso de evaluación de la calidad de los resúmenes generados. La evaluación y validación de la calidad de los resúmenes es una tarea desafiante. Las medidas de evaluación de la sumarización pueden ser clasificadas en: manuales y automáticas, globales y locales, subjetivas y objetivas, internas y externas, etc. Inicialmente los métodos de evaluación eran esencialmente manuales; es decir, las personas eran las encargadas de juzgar la calidad de los resúmenes generados. Los métodos de evaluación manuales requieren de personas que se dediquen a leer los resúmenes resultantes y las fuentes originales a partir de las cuales fue generado, para constatar de que en el resumen estén contenidas realmente las ideas principales expresadas en la fuente de información y también para comprobar aspectos como la coherencia y cohesión. Debido al alto costo en tiempo y esfuerzo humano característico de los métodos manuales; así como, de la gran probabilidad de la presencia de errores humanos, surgió la necesidad de desarrollar métodos de evaluación automática. La evaluación automática no se exonera de la necesidad de anotar manualmente algunos aspectos en la preparación de los datos a comparar (semi-automático), pero en esta se disminuye grandemente el alto costo en esfuerzo humano y tiempo. Las medidas globales describen la calidad del resultado completo de un resumen usando un único valor real [58], [59], [60], mientras que las locales evalúan por separado cada uno de los pasos realizados para la obtención del resumen final [53], [42], [13]. Para la evaluación de la eficacia con que se realiza cada uno de los pasos donde se extrae información (extracción de rasgos, extracción y clasificación de opiniones, detección de tópicos, etc.) se realizan comparaciones con datos anotados de forma manual por un conjunto de expertos. También se pueden efectuar comparaciones con los resultados obtenidos por otros métodos que se tracen los mismo objetivos y que extraigan de manera automática la misma información, teniendo como base, la información extraída de forma manual. La eficacia se determina generalmente haciendo uso dos métricas ampliamente utilizadas en tareas de recuperación de información, la precisión (Precision en inglés), el

Análisis y síntesis El proceso documental Lenguajes documentales El proceso de indización El resumen documental

Análisis y síntesis El proceso documental Lenguajes documentales El proceso de indización El resumen documental Análisis y síntesis El proceso documental Lenguajes documentales El proceso de indización El resumen documental El proceso documental El proceso o cadena documental es la razón fundamental de un centro

Más detalles

activuspaper Text Mining and BI Abstract

activuspaper Text Mining and BI Abstract Text Mining and BI Abstract Los recientes avances en lingüística computacional, así como la tecnología de la información en general, permiten que la inserción de datos no estructurados en una infraestructura

Más detalles

Unidad 1. Fundamentos en Gestión de Riesgos

Unidad 1. Fundamentos en Gestión de Riesgos 1.1 Gestión de Proyectos Unidad 1. Fundamentos en Gestión de Riesgos La gestión de proyectos es una disciplina con la cual se integran los procesos propios de la gerencia o administración de proyectos.

Más detalles

ANÁLISIS DE CARGOS. 1. Nombre del cargo 2. Posición del cargo en el organigrama. 3. Contenido del cargo. 1. Requisitos intelectuales

ANÁLISIS DE CARGOS. 1. Nombre del cargo 2. Posición del cargo en el organigrama. 3. Contenido del cargo. 1. Requisitos intelectuales Análisis de CARGOS ANÁLISIS DE CARGOS Autor: Herman Bachenheimer Correo: herman@puj.edu.co Después de la descripción, sigue el análisis del cargo. Una vez identificado el contenido del cargo (aspectos

Más detalles

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas.

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas. El primer paso en el diseño de una base de datos es la producción del esquema conceptual. Normalmente, se construyen varios esquemas conceptuales, cada uno para representar las distintas visiones que los

Más detalles

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322 Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322 Nicole García Gómez 2830047-6 Diego Riquelme Adriasola 2621044-5 RESUMEN.- La minería de datos corresponde a la extracción

Más detalles

1.4.1.2. Resumen... 1.4.2. ÁREA DE FACTURACIÓN::INFORMES::Pedidos...27 1.4.2.1. Detalle... 1.4.2.2. Resumen... 1.4.3. ÁREA DE

1.4.1.2. Resumen... 1.4.2. ÁREA DE FACTURACIÓN::INFORMES::Pedidos...27 1.4.2.1. Detalle... 1.4.2.2. Resumen... 1.4.3. ÁREA DE MANUAL DE USUARIO DE ABANQ 1 Índice de contenido 1 ÁREA DE FACTURACIÓN......4 1.1 ÁREA DE FACTURACIÓN::PRINCIPAL...4 1.1.1. ÁREA DE FACTURACIÓN::PRINCIPAL::EMPRESA...4 1.1.1.1. ÁREA DE FACTURACIÓN::PRINCIPAL::EMPRESA::General...4

Más detalles

App para realizar consultas al Sistema de Información Estadística de Castilla y León

App para realizar consultas al Sistema de Información Estadística de Castilla y León App para realizar consultas al Sistema de Información Estadística de Castilla y León Jesús M. Rodríguez Rodríguez rodrodje@jcyl.es Dirección General de Presupuestos y Estadística Consejería de Hacienda

Más detalles

Capítulo VI. Diagramas de Entidad Relación

Capítulo VI. Diagramas de Entidad Relación Diagramas de Entidad Relación Diagramas de entidad relación Tabla de contenido 1.- Concepto de entidad... 91 1.1.- Entidad del negocio... 91 1.2.- Atributos y datos... 91 2.- Asociación de entidades...

Más detalles

Recuperación de información Bases de Datos Documentales Licenciatura en Documentación Curso 2011/2012

Recuperación de información Bases de Datos Documentales Licenciatura en Documentación Curso 2011/2012 Bases de Datos Documentales Curso 2011/2012 Miguel Ángel Rodríguez Luaces Laboratorio de Bases de Datos Universidade da Coruña Introducción Hemos dedicado la primera mitad del curso a diseñar e implementar

Más detalles

Objeto del informe. ALUMNO 1 Página: 1

Objeto del informe. ALUMNO 1 Página: 1 Nombre: ALUMNO 1 Centro: NOMBRE DEL COLEGIO Curso: 5º E. PRIMARIA Responsable: RESPONSABLE Localidad: LOCALIDAD Fecha: 21 / julio / 2015 Objeto del informe El presente informe recoge la evaluación psicológica

Más detalles

Decisión: Indican puntos en que se toman decisiones: sí o no, o se verifica una actividad del flujo grama.

Decisión: Indican puntos en que se toman decisiones: sí o no, o se verifica una actividad del flujo grama. Diagrama de Flujo La presentación gráfica de un sistema es una forma ampliamente utilizada como herramienta de análisis, ya que permite identificar aspectos relevantes de una manera rápida y simple. El

Más detalles

Catoira Fernando Fullana Pablo Rodriguez Federico [MINERIA DE LA WEB] Proyecto Final - Informe Final

Catoira Fernando Fullana Pablo Rodriguez Federico [MINERIA DE LA WEB] Proyecto Final - Informe Final Catoira Fernando Fullana Pablo Rodriguez Federico [MINERIA DE LA WEB] Proyecto Final - Informe Final INTRODUCCION En principio surgió la idea de un buscador que brinde los resultados en agrupaciones de

Más detalles

Sistema para el control y tramitación de documentos SITA MSc. María de la Caridad Robledo Gómez y Ernesto García Fernández.

Sistema para el control y tramitación de documentos SITA MSc. María de la Caridad Robledo Gómez y Ernesto García Fernández. Sistema para el control y tramitación de documentos SITA MSc. María de la Caridad Robledo Gómez y Ernesto García Fernández. CITMATEL Ave 47 e/18 A y 20, Playa, Ciudad de La habana, CP 10300 Cuba. E mail:

Más detalles

Mesa de Ayuda Interna

Mesa de Ayuda Interna Mesa de Ayuda Interna Documento de Construcción Mesa de Ayuda Interna 1 Tabla de Contenido Proceso De Mesa De Ayuda Interna... 2 Diagrama Del Proceso... 3 Modelo De Datos... 4 Entidades Del Sistema...

Más detalles

FACULTAD DE CONTADURIA Y CIENCIAS ADMINISTRATIVAS FINANZAS I NORMAS DE INFORMACION FINANCIERA

FACULTAD DE CONTADURIA Y CIENCIAS ADMINISTRATIVAS FINANZAS I NORMAS DE INFORMACION FINANCIERA Normas de Información Financiera Durante más de 30 años, la Comisión de Principios de Contabilidad (CPC) del Instituto Mexicano de Contadores Públicos A. C. (IMCP) fue la encargada de emitir la normatividad

Más detalles

UNIDAD I: LÓGICA PROPOSICIONAL

UNIDAD I: LÓGICA PROPOSICIONAL UNIDAD I: LÓGICA PROPOSICIONAL ASIGNATURA: INTRODUCCIÓN A LA COMPUTACIÓN CARRERAS: LICENCIATURA Y PROFESORADO EN CIENCIAS DE LA COMPUTACIÓN DEPARTAMENTO DE INFORMÁTICA FACULTAD DE CIENCIAS FÍSICO MATEMÁTICA

Más detalles

GUIA SOBRE LOS REQUISITOS DE LA DOCUMENTACION DE ISO 9000:2000

GUIA SOBRE LOS REQUISITOS DE LA DOCUMENTACION DE ISO 9000:2000 1 INTRODUCCIÓN Dos de los objetivos más importantes en la revisión de la serie de normas ISO 9000 han sido: desarrollar un grupo simple de normas que sean igualmente aplicables a las pequeñas, a las medianas

Más detalles

I INTRODUCCIÓN. 1.1 Objetivos

I INTRODUCCIÓN. 1.1 Objetivos I INTRODUCCIÓN 1.1 Objetivos En el mundo de la informática, la auditoría no siempre es aplicada en todos las empresas, en algunos de los casos son aplicadas por ser impuestas por alguna entidad reguladora,

Más detalles

CAPÍTULO 3 Servidor de Modelo de Usuario

CAPÍTULO 3 Servidor de Modelo de Usuario CAPÍTULO 3 Servidor de Modelo de Usuario Para el desarrollo del modelado del estudiante se utilizó el servidor de modelo de usuario desarrollado en la Universidad de las Américas Puebla por Rosa G. Paredes

Más detalles

Conciliación bancaria en CheqPAQ Cargado de estado de cuenta

Conciliación bancaria en CheqPAQ Cargado de estado de cuenta Conciliación bancaria en CheqPAQ Cargado de estado de cuenta Introducción Con la finalidad de mantenerte informado respecto a todos los cambios y mejoras de los productos de CONTPAQ i, ponemos a tu disposición

Más detalles

EN LA LA EMPRESA EMPRESA

EN LA LA EMPRESA EMPRESA PANEL DE OPINIÓN Nº 6 NIVELDE FORMACIÓN EN LA LA EMPRESA EMPRESA ESPAÑOLA RESULTADOSGenerales Más del 6 de las s que necesitan personal formado en idiomas detectan carencias sobre este aspecto en los candidatos

Más detalles

Apunte. Estrategias de Búsqueda de Recursos en Internet 3

Apunte. Estrategias de Búsqueda de Recursos en Internet 3 Apunte Estrategias de Búsqueda de Recursos en Internet 3 Dada la enorme cantidad de sitios existentes en la Red (cerca de mil millones y creciendo en forma constante) y la dudosa calidad o valor educativo

Más detalles

Sistemas de Gestión de Calidad. Control documental

Sistemas de Gestión de Calidad. Control documental 4 Sistemas de Gestión de Calidad. Control documental ÍNDICE: 4.1 Requisitos Generales 4.2 Requisitos de la documentación 4.2.1 Generalidades 4.2.2 Manual de la Calidad 4.2.3 Control de los documentos 4.2.4

Más detalles

Reseña. formas culturales como el cine o el teatro. Generalmente, cuando se busca la definición, varios

Reseña. formas culturales como el cine o el teatro. Generalmente, cuando se busca la definición, varios Reseña Definición La reseña, en una extensión de dos a tres cuartillas, contiene el resumen y el comentario valorativo realizado sobre un libro, un artículo u otro texto publicado; también alude a otras

Más detalles

SÍNTESIS Y PERSPECTIVAS

SÍNTESIS Y PERSPECTIVAS SÍNTESIS Y PERSPECTIVAS Los invitamos a observar, a identificar problemas, pero al mismo tiempo a buscar oportunidades de mejoras en sus empresas. REVISIÓN DE CONCEPTOS. Esta es la última clase del curso.

Más detalles

NORMA INTERNACIONAL DE AUDITORÍA 520

NORMA INTERNACIONAL DE AUDITORÍA 520 NORMA INTERNACIONAL DE AUDITORÍA 520 PROCEDIMIENTOS ANALíTICOS (En vigor para auditorías de estados financieros por periodos que comiencen en, o después del, 15 de diciembre de 2004)* CONTENIDO Párrafo

Más detalles

1.- INTRODUCCIÓN 2.- PARÁMETROS

1.- INTRODUCCIÓN 2.- PARÁMETROS 1.- INTRODUCCIÓN Hemos diseñado una aplicación que facilite el envío a las entidades bancarias de las de cobro por domiciliación. La entrada de esta aplicación pueden ser, tanto ficheros cuyos formatos

Más detalles

Elementos requeridos para crearlos (ejemplo: el compilador)

Elementos requeridos para crearlos (ejemplo: el compilador) Generalidades A lo largo del ciclo de vida del proceso de software, los productos de software evolucionan. Desde la concepción del producto y la captura de requisitos inicial hasta la puesta en producción

Más detalles

Capítulo IV. Manejo de Problemas

Capítulo IV. Manejo de Problemas Manejo de Problemas Manejo de problemas Tabla de contenido 1.- En qué consiste el manejo de problemas?...57 1.1.- Ventajas...58 1.2.- Barreras...59 2.- Actividades...59 2.1.- Control de problemas...60

Más detalles

El Futuro de la Computación en la Industria de Generación Eléctrica

El Futuro de la Computación en la Industria de Generación Eléctrica El Futuro de la Computación en la Industria de Generación Eléctrica Retos a los que se enfrenta la industria de generación La industria de generación eléctrica se enfrenta a dos retos muy significativos

Más detalles

Capitulo I. Introducción

Capitulo I. Introducción Capitulo I. Introducción 1.1 Descripción del trabajo El ser humano, como todos sabemos tiene la necesidad de comunicarse, de ser escuchado y sobretodo interactuar con los demás seres vivos que lo rodean.

Más detalles

Propuesta de Portal de la Red de Laboratorios Virtuales y Remotos de CEA

Propuesta de Portal de la Red de Laboratorios Virtuales y Remotos de CEA Propuesta de Portal de la Red de Laboratorios Virtuales y Remotos de CEA Documento de trabajo elaborado para la Red Temática DocenWeb: Red Temática de Docencia en Control mediante Web (DPI2002-11505-E)

Más detalles

Copyright 2011 - bizagi. Gestión de Cambios Documento de Construcción Bizagi Process Modeler

Copyright 2011 - bizagi. Gestión de Cambios Documento de Construcción Bizagi Process Modeler Copyright 2011 - bizagi Gestión de Cambios Bizagi Process Modeler Tabla de Contenido Gestión de Cambios... 4 Descripción... 4 Principales factores en la Construcción del Proceso... 5 Modelo de Datos...

Más detalles

2014 Néstor A. Jiménez J. Derechos reservados. Celular 3155003650

2014 Néstor A. Jiménez J. Derechos reservados. Celular 3155003650 Diplomado Práctico en NORMAS INTERNACIONALES DE INFORMACIÓN FINANCIERA (NIIF) Tema 24: Estados financieros separados NIC 27 Estados financieros consolidados NIIF 10 Estados financieros separados y consolidados

Más detalles

Introducción En los años 60 s y 70 s cuando se comenzaron a utilizar recursos de tecnología de información, no existía la computación personal, sino que en grandes centros de cómputo se realizaban todas

Más detalles

FICHEROS Y BASES DE DATOS (E44) 3º INGENIERÍA EN INFORMÁTICA. Tema 8. Elementos Básicos

FICHEROS Y BASES DE DATOS (E44) 3º INGENIERÍA EN INFORMÁTICA. Tema 8. Elementos Básicos FICHEROS Y BASES DE DATOS (E44) 3º INGENIERÍA EN INFORMÁTICA Tema 8. Elementos Básicos 1.- Ejemplo Introductorio. 2.- Dominios. 3.- Relaciones. 4.- Bases de Datos Relacionales. (Capítulo 11 del Date) EJEMPLO

Más detalles

Portafolio de Servicios y Productos

Portafolio de Servicios y Productos Portafolio de Servicios y Productos Introducción Somos una empresa que se dedica a generar ventajas competitivas para nuestros clientes a través de desarrollos y consultoría en inteligencia de negocios

Más detalles

Master en Gestion de la Calidad

Master en Gestion de la Calidad Master en Gestion de la Calidad 3. La Calidad en la Actualidad La calidad en la actualidad 1 / 9 OBJETIVOS Al finalizar esta unidad didáctica será capaz: Conocer la calidad en la actualidad. La familia

Más detalles

ANEXO 26-A COMITÉ PERMANENTE DE INTERPRETACIÓN SIC N 32 ACTIVOS INTANGIBLES COSTOS DE SITIOS WEB. (Modificada en 2008) (IV Difusión)

ANEXO 26-A COMITÉ PERMANENTE DE INTERPRETACIÓN SIC N 32 ACTIVOS INTANGIBLES COSTOS DE SITIOS WEB. (Modificada en 2008) (IV Difusión) ANEXO 26-A COMITÉ PERMANENTE DE INTERPRETACIÓN SIC N 32 ACTIVOS INTANGIBLES COSTOS DE SITIOS WEB (Modificada en 2008) (IV Difusión) Interpretación SIC-32 Activos Intangibles - Costos de Sitios Web Referencias

Más detalles

Usos de los Mapas Conceptuales en Educación

Usos de los Mapas Conceptuales en Educación Usos de los Mapas Conceptuales en Educación Carmen M. Collado & Alberto J. Cañas Introducción Los mapas conceptuales son una poderosa herramienta de enseñanza-aprendizaje. Su utilización en (y fuera de)

Más detalles

CAPITULO V. Conclusiones y recomendaciones. Este capítulo tiene como objetivo mostrar las conclusiones más significativas que se

CAPITULO V. Conclusiones y recomendaciones. Este capítulo tiene como objetivo mostrar las conclusiones más significativas que se CAPÍTULO V 74 CAPITULO V Conclusiones y recomendaciones Este capítulo tiene como objetivo mostrar las conclusiones más significativas que se identificaron a lo largo de la investigación. Asimismo, se presentan

Más detalles

Funcionalidades Software PROYECTOS GotelGest.Net Software para la gestión de Proyectos GotelGest.Net

Funcionalidades Software PROYECTOS GotelGest.Net Software para la gestión de Proyectos GotelGest.Net 2012 Funcionalidades Software PROYECTOS GotelGest.Net Software para la gestión de Proyectos GotelGest.Net Servinet Sistemas y Comunicación S.L. www.softwaregestionproyectos.com Última Revisión: Febrero

Más detalles

GESTIÓN COMERCIAL Con nuestras aplicaciones podrá gestionar toda su publicidad de la forma más sencilla e intuitiva Ahorrando tiempo.

GESTIÓN COMERCIAL Con nuestras aplicaciones podrá gestionar toda su publicidad de la forma más sencilla e intuitiva Ahorrando tiempo. GESTIÓN COMERCIAL Con nuestras aplicaciones podrá gestionar toda su publicidad de la forma más sencilla e intuitiva Ahorrando tiempo. Mejorando su rentabilidad. GESTIÓN COMERCIAL En los Medios de Comunicación

Más detalles

Escuela de Organización Industrial

Escuela de Organización Industrial TRABAJO: MEJORA DE LA METODOLOGÍA DE IDENTIFICACIÓN Y PRIORIZACIÓN DE LOS TEMAS RELEVANTES DE RESPONSABILIDAD CORPORATIVA, A TRAVÉS DE LA INVOLUCRACIÓN CON LOS GRUPOS DE INTERÉS. PROMOTOR: VODAFONE ESPAÑA

Más detalles

Capítulo I. Definición del problema y objetivos de la tesis. En la actualidad Internet se ha convertido en una herramienta necesaria para todas

Capítulo I. Definición del problema y objetivos de la tesis. En la actualidad Internet se ha convertido en una herramienta necesaria para todas Capítulo I Definición del problema y objetivos de la tesis 1.1 Introducción En la actualidad Internet se ha convertido en una herramienta necesaria para todas las personas ya que nos permite realizar diferentes

Más detalles

ISO 9001:2000 DOCUMENTO INFORMATIVO DOCUMENTO ELABORADO POR CHRISTIAN NARBARTE PARA EL IVECE

ISO 9001:2000 DOCUMENTO INFORMATIVO DOCUMENTO ELABORADO POR CHRISTIAN NARBARTE PARA EL IVECE ISO 9001:2000 DOCUMENTO INFORMATIVO DOCUMENTO ELABORADO POR CHRISTIAN NARBARTE PARA EL IVECE MARZO 2007 Este documento contesta las preguntas más frecuentes que se plantean las organizaciones que quieren

Más detalles

Técnicas para identificar la causa-raíz de los problemas

Técnicas para identificar la causa-raíz de los problemas Técnicas para identificar la causa-raíz de los problemas OBJETIVO: Aplicar las técnicas para la identificación de la causa real o potencial de un problema y su posible solución. CONTENIDO: 1. Introducción

Más detalles

Metodología de trabajo

Metodología de trabajo El objetivo de este apéndice es describir brevemente la metodología de trabajo que aplico para realizar el proceso de de los poemas. Esta metodología de se compone de tres fases, que se dividen, a su vez,

Más detalles

Gestión de Permisos. Bizagi Suite. Copyright 2014 Bizagi

Gestión de Permisos. Bizagi Suite. Copyright 2014 Bizagi Gestión de Permisos Bizagi Suite Gestión de Permisos 1 Tabla de Contenido Gestión de Permisos... 3 Definiciones... 3 Rol... 3 Perfil... 3 Permiso... 3 Módulo... 3 Privilegio... 3 Elementos del Proceso...

Más detalles

LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN

LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN Tabla de Contenidos LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN... 1 Tabla de Contenidos... 1 General... 2 Uso de los Lineamientos Estándares...

Más detalles

"Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios

Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios "Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios Miguel Alfonso Flores Sánchez 1, Fernando Sandoya Sanchez 2 Resumen En el presente artículo se

Más detalles

PANEL DE CONTROL (Zona de Administración) MANUAL DE USO Por conexanet. Revisión 1.1 Fecha 2006-08

PANEL DE CONTROL (Zona de Administración) MANUAL DE USO Por conexanet. Revisión 1.1 Fecha 2006-08 PANEL DE CONTROL (Zona de Administración) MANUAL DE USO Por conexanet Revisión 1.1 Fecha 2006-08 Índice 1. Acceder 2. Menú 3. Gestión Básica 3.1 Añadir 3.2 Editar 3.3 Eliminar 3.4 Eliminación de registros

Más detalles

INFORME EJECUTIVO DE IDC

INFORME EJECUTIVO DE IDC INFORME EJECUTIVO DE IDC De qué forma Big Data transforma la protección y el almacenamiento de datos Agosto 2012 Escrito por Carla Arend Patrocinado por CommVault Introducción: De qué forma Big Data transforma

Más detalles

DIRECTRIZ DE ICC/ESOMAR SOBRE MANTENIMIENTO DE LAS DISTINCIONES ENTRE LA INVESTIGACIÓN DE MERCADO Y EL MARKETING DIRECTO

DIRECTRIZ DE ICC/ESOMAR SOBRE MANTENIMIENTO DE LAS DISTINCIONES ENTRE LA INVESTIGACIÓN DE MERCADO Y EL MARKETING DIRECTO DIRECTRIZ DE ICC/ESOMAR SOBRE MANTENIMIENTO DE LAS DISTINCIONES ENTRE LA INVESTIGACIÓN DE MERCADO Y EL MARKETING DIRECTO Copyright ICC/ESOMAR, 1997 Introducción El Código Internacional ICC/ESOMAR sobre

Más detalles

CONSTRUCCIÓN DEL PROCESO MESA DE AYUDA INTERNA. BizAgi Process Modeler

CONSTRUCCIÓN DEL PROCESO MESA DE AYUDA INTERNA. BizAgi Process Modeler CONSTRUCCIÓN DEL PROCESO MESA DE AYUDA INTERNA BizAgi Process Modeler TABLA DE CONTENIDO PROCESO DE MESA DE AYUDA INTERNA... 3 1. DIAGRAMA DEL PROCESO... 4 2. MODELO DE DATOS... 5 ENTIDADES DEL SISTEMA...

Más detalles

NIFBdM A-3 NECESIDADES DE LOS USUARIOS Y OBJETIVOS DE LOS ESTADOS FINANCIEROS

NIFBdM A-3 NECESIDADES DE LOS USUARIOS Y OBJETIVOS DE LOS ESTADOS FINANCIEROS NIFBdM A-3 NECESIDADES DE LOS USUARIOS Y OBJETIVOS DE LOS ESTADOS FINANCIEROS OBJETIVO Identificar las necesidades de los usuarios y establecer, con base en las mismas, los objetivos de los estados financieros

Más detalles

CRM Gestión de Oportunidades Documento de Construcción Bizagi Process Modeler

CRM Gestión de Oportunidades Documento de Construcción Bizagi Process Modeler Bizagi Process Modeler Copyright 2011 - Bizagi Tabla de Contenido CRM- Gestión de Oportunidades de Venta... 4 Descripción... 4 Principales Factores en la Construcción del Proceso... 5 Modelo de Datos...

Más detalles

de la empresa Al finalizar la unidad, el alumno:

de la empresa Al finalizar la unidad, el alumno: de la empresa Al finalizar la unidad, el alumno: Identificará el concepto de rentabilidad. Identificará cómo afecta a una empresa la rentabilidad. Evaluará la rentabilidad de una empresa, mediante la aplicación

Más detalles

ICTE NORMAS DE CALIDAD DE AGENCIAS DE VIAJES REGLAS GENERALES DEL SISTEMA DE CALIDAD. Ref-RG Página 1 de 9

ICTE NORMAS DE CALIDAD DE AGENCIAS DE VIAJES REGLAS GENERALES DEL SISTEMA DE CALIDAD. Ref-RG Página 1 de 9 Página 1 de 9 1 Página 2 de 9 SUMARIO 1. OBJETO 2. ALCANCE 3. DEFINICIONES 4. GENERALIDADES 5. NORMAS DE CALIDAD DE SERVICIO 6. ESTRUCTURA TIPO DE LAS NORMAS 7. MECANISMOS DE EVALUACIÓN 8. PONDERACIÓN

Más detalles

Gestión de la Configuración

Gestión de la Configuración Gestión de la ÍNDICE DESCRIPCIÓN Y OBJETIVOS... 1 ESTUDIO DE VIABILIDAD DEL SISTEMA... 2 ACTIVIDAD EVS-GC 1: DEFINICIÓN DE LOS REQUISITOS DE GESTIÓN DE CONFIGURACIÓN... 2 Tarea EVS-GC 1.1: Definición de

Más detalles

DECLARACION DE PRINCIPIOS DE CONTABILIDAD

DECLARACION DE PRINCIPIOS DE CONTABILIDAD DECLARACION DE PRINCIPIOS DE CONTABILIDAD DPC-12. TRATAMIENTO CONTABLE DE LAS TRANSACCIONES EN MONEDA EXTRANJERA Y TRADUCCION 0 CONVERSION A MONEDA NACIONAL DE OPERACIONES EN EL EXTRANJERO ANTECEDENTES

Más detalles

Ciclo de vida y Metodologías para el desarrollo de SW Definición de la metodología

Ciclo de vida y Metodologías para el desarrollo de SW Definición de la metodología Ciclo de vida y Metodologías para el desarrollo de SW Definición de la metodología La metodología para el desarrollo de software es un modo sistemático de realizar, gestionar y administrar un proyecto

Más detalles

Normas y procedimientos para la clasificación de los documentos administrativos

Normas y procedimientos para la clasificación de los documentos administrativos Normas y procedimientos para la clasificación de los documentos administrativos La Universidad de Lleida (UdL) necesita desarrollar el cuadro de clasificación de los documentos administrativos, para toda

Más detalles

Tema 6: Diseño de bases de datos relacionales.

Tema 6: Diseño de bases de datos relacionales. 6.1 Introducción. Tema 6:. Las dificultades inherentes al diseño de una base de datos han de afrontarse con procedimientos ordenados y metódicos. En el proceso de diseño de una base de datos hemos de distinguir

Más detalles

Metodología básica de gestión de proyectos. Octubre de 2003

Metodología básica de gestión de proyectos. Octubre de 2003 Metodología básica de gestión de proyectos Octubre de 2003 Dentro de la metodología utilizada en la gestión de proyectos el desarrollo de éstos se estructura en tres fases diferenciadas: Fase de Éjecución

Más detalles

UNIVERSIDAD DE ORIENTE UNIVO FACULTAD DE CIENCIAS ECONÓMICAS

UNIVERSIDAD DE ORIENTE UNIVO FACULTAD DE CIENCIAS ECONÓMICAS CAPITULO IV 4.0- ANÁLISIS DE RESULTADOS 4.1- CEDULA DE ENTREVISTA UNIVERSIDAD DE ORIENTE UNIVO FACULTAD DE CIENCIAS ECONÓMICAS Entrevista dirigida al: Director del Complejo Educativo Sor Cecilia Santillana

Más detalles

Capítulo 12: Indexación y asociación

Capítulo 12: Indexación y asociación Capítulo 12: Indexación y asociación Conceptos básicos Índices ordenados Archivos de índice de árbol B+ Archivos de índice de árbol B Asociación estática Asociación dinámica Comparación entre indexación

Más detalles

PROCEDIMIENTO DE PRESTACIÓN DE SERVICIOS TECNOLÓGICOS

PROCEDIMIENTO DE PRESTACIÓN DE SERVICIOS TECNOLÓGICOS PROCEDIMIENTO DE PRESTACIÓN DE SERVICIOS TECNOLÓGICOS OBJETIVO Facilitar el proceso de enlace entre la comunidad universitaria, el sector productivo e instituciones gubernamentales mediante el aprovechamiento

Más detalles

La Web Semántica como herramienta para e-learning

La Web Semántica como herramienta para e-learning La Web Semántica como herramienta para e-learning Lidia Marina López llopez@uncoma.edu.ar Departamento de Ciencias de la Computación Universidad Nacional del Comahue Buenos Aires 1400 8300 Neuquén Tel.

Más detalles

IAP 1005 - CONSIDERACIONES PARTICULARES SOBRE LA AUDITORÍA DE LAS EMPRESAS DE REDUCIDA DIMENSIÓN

IAP 1005 - CONSIDERACIONES PARTICULARES SOBRE LA AUDITORÍA DE LAS EMPRESAS DE REDUCIDA DIMENSIÓN IAP 1005 - CONSIDERACIONES PARTICULARES SOBRE LA AUDITORÍA DE LAS EMPRESAS DE REDUCIDA DIMENSIÓN Introducción 1. Las Normas Internacionales de Auditoría (NIA) se aplican a la auditoría de la información

Más detalles

punto, es que los criterios de evaluación de las medidas antes citadas se ajustan a las medidas señaladas para la toma del indicador VTD.

punto, es que los criterios de evaluación de las medidas antes citadas se ajustan a las medidas señaladas para la toma del indicador VTD. CONSULTA Para esta Comisión es muy importante conocer los comentarios sectoriales relacionados con el contenido del entregable presentado por la firma Iteco en el marco del Contrato 038 de 2014, para avanzar

Más detalles

DISEÑO DE FUNCIONES (TRATAMIENTOS)

DISEÑO DE FUNCIONES (TRATAMIENTOS) DISEÑO DE FUNCIONES (TRATAMIENTOS) Diseño Estructurado. Estrategias para Derivar el Diagrama de Estructura. Diseño de Módulos Programables. 1. DISEÑO ESTRUCTURADO El Diseño es el proceso por el cual se

Más detalles

La explicación la haré con un ejemplo de cobro por $100.00 más el I.V.A. $16.00

La explicación la haré con un ejemplo de cobro por $100.00 más el I.V.A. $16.00 La mayor parte de las dependencias no habían manejado el IVA en los recibos oficiales, que era el documento de facturación de nuestra Universidad, actualmente ya es formalmente un CFD pero para el fin

Más detalles

Traducción del. Our ref:

Traducción del. Our ref: Traducción del Documento: Our ref: Secretaría del ISO/TC 176/SC 2 Fecha: 15 de octubre de 2008 A los Miembros del ISO/TC 176/SC 2 - Gestión de la Calidad y Aseguramiento de la Calidad/ Sistemas de la Calidad

Más detalles

CAPITULO 4. Requerimientos, Análisis y Diseño. El presente capítulo explica los pasos que se realizaron antes de implementar

CAPITULO 4. Requerimientos, Análisis y Diseño. El presente capítulo explica los pasos que se realizaron antes de implementar CAPITULO 4 Requerimientos, Análisis y Diseño El presente capítulo explica los pasos que se realizaron antes de implementar el sistema. Para esto, primero se explicarán los requerimientos que fueron solicitados

Más detalles

Día 5-6-2012 17:00h Lugar: Obra Social Ibercaja, Sala De actos, Rambla Ferran 38, 3º, Lleida

Día 5-6-2012 17:00h Lugar: Obra Social Ibercaja, Sala De actos, Rambla Ferran 38, 3º, Lleida Resumen de la conferencia Día 5-6-2012 17:00h Lugar: Obra Social Ibercaja, Sala De actos, Rambla Ferran 38, 3º, Lleida Ponente: Luis Muñiz Socio Director de Sisconges & Estrategia y experto en Sistemas

Más detalles

Procedimiento para el Manejo de No Conformidades, Acciones Preventivas y Correctivas del Sistema de Gestión Integral

Procedimiento para el Manejo de No Conformidades, Acciones Preventivas y Correctivas del Sistema de Gestión Integral Página: 1 de 1 Hoja de Control de Emisión y Revisiones. N de Revisión Páginas Afectadas Motivo del Cambio Aplica a partir de: 0 Todas Generación de documento 01-Agosto-2009 1 Todas Mejora del documento

Más detalles

2. MÉTODOS, INSTRUMENTOS Y ESTRATEGIAS

2. MÉTODOS, INSTRUMENTOS Y ESTRATEGIAS 2. MÉTODOS, INSTRUMENTOS Y ESTRATEGIAS Objetivo específico: El alumno conocerá la importancia de la investigación en psicología industrial/organizacional, su proceso y limitaciones. Asimismo entenderá

Más detalles

PROCEDIMIENTO DE AUDITORÍAS INTERNAS DEL SISTEMA DE GESTIÓN DE CALIDAD

PROCEDIMIENTO DE AUDITORÍAS INTERNAS DEL SISTEMA DE GESTIÓN DE CALIDAD Página : 1 de 12 PROCEDIMIENTO DE DEL SISTEMA DE GESTIÓN DE CALIDAD Esta es una copia no controlada si carece de sello en el reverso de sus hojas, en cuyo caso se advierte al lector que su contenido puede

Más detalles

Funcionalidades Software SAT GotelGest.Net (Software de Servicio de Asistencia Técnica)

Funcionalidades Software SAT GotelGest.Net (Software de Servicio de Asistencia Técnica) Funcionalidades Software SAT GotelGest.Net (Software de Servicio de Asistencia Técnica) Servinet Sistemas y Comunicación S.L. www.softwaregestionsat.com Última Revisión: Octubre 2014 FUNCIONALIDADES SAT

Más detalles

Servicios y aplicaciones clave de la web 2.0

Servicios y aplicaciones clave de la web 2.0 Servicios y aplicaciones clave de la web 2.0 Etiquetado y social bookmarking La web 2,0 ha permitido crear comunidades llamadas Social Bookmarking o marcadores sociales, las cuales son una forma en la

Más detalles

www.fundibeq.org Además se recomienda su uso como herramienta de trabajo dentro de las actividades habituales de gestión.

www.fundibeq.org Además se recomienda su uso como herramienta de trabajo dentro de las actividades habituales de gestión. TORMENTA DE IDEAS 1.- INTRODUCCIÓN Este documento sirve de guía para la realización de una Tormenta de Ideas, también llamado "Brainstorming o Lluvia de ideas, la herramienta por medio de la cual se puede

Más detalles

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual Introducción Algunas de las personas que trabajan con SGBD relacionales parecen preguntarse porqué deberían preocuparse del diseño de las bases de datos que utilizan. Después de todo, la mayoría de los

Más detalles

Unidad 8. Estado de Perdidas y Ganancias o Estados de Resultados

Unidad 8. Estado de Perdidas y Ganancias o Estados de Resultados Unidad 8 Estado de Perdidas y Ganancias o Estados de Resultados Al termino de cada ejercicio fiscal, a todo comerciante no solo le interesa conocer la situación financiera de su negocio, sino también el

Más detalles

Sistemas de Recuperación de Información

Sistemas de Recuperación de Información Sistemas de Recuperación de Información Los SRI permiten el almacenamiento óptimo de grandes volúmenes de información y la recuperación eficiente de la información ante las consultas de los usuarios. La

Más detalles

Un primer acercamiento a la CMDB.

Un primer acercamiento a la CMDB. Un Versión primer 1.2 acercamiento a la CMDB. 20/07/2005 Un primer acercamiento a la CMDB. Versión 1.1 1.2 18/02/05 20/02/05 Fecha Jose Autores Carlos Manuel García Viejo García Lobato http://ars.viejolobato.com

Más detalles

Elaboración de Mapas Conceptuales

Elaboración de Mapas Conceptuales UNIVERSIDAD PEDAGOGICA LIBERTADOR INSTITUTO PEDAGÓGICO DE CARACAS. DEPARTAMENTO DE PEDAGOGIA. SOCIOLOGIA DE LA EDUCACIÓN (PHB-104) Prof. Robert Rodríguez Raga PAGINA WEB http://sociologiaeducacion.tripod.com

Más detalles

revista transparencia transparencia y... 3.3. UNIVERSIDADES

revista transparencia transparencia y... 3.3. UNIVERSIDADES revista transparencia transparencia y... 3.3. UNIVERSIDADES 35 revista transparencia Mónica López del Consuelo Documentalista Open Data Universidad de Granada 3.3.1. El filtro básico de la transparencia.

Más detalles

Orientación acerca de los requisitos de documentación de la Norma ISO 9001:2000

Orientación acerca de los requisitos de documentación de la Norma ISO 9001:2000 Orientación acerca de los requisitos de documentación de la Norma ISO 9001:2000 Documento: ISO/TC 176/SC 2/N 525R Marzo 2001 ISO Traducción aprobada el 2001-05-31 Prólogo de la versión en español Este

Más detalles

XBRL extensible Business Reporting Language. Noviembre / 2014

XBRL extensible Business Reporting Language. Noviembre / 2014 XBRL extensible Business Reporting Language Noviembre / 2014 Qué es XBRL o datos interactivos? XBRL es un lenguaje para la comunicación electrónica de datos de negocio y financieros basados en XML utilizada

Más detalles

Sesión No. 4. Contextualización INFORMÁTICA 1. Nombre: Procesador de Texto

Sesión No. 4. Contextualización INFORMÁTICA 1. Nombre: Procesador de Texto INFORMÁTICA INFORMÁTICA 1 Sesión No. 4 Nombre: Procesador de Texto Contextualización La semana anterior revisamos los comandos que ofrece Word para el formato del texto, la configuración de la página,

Más detalles

SAQQARA. Correlación avanzada y seguridad colaborativa_

SAQQARA. Correlación avanzada y seguridad colaborativa_ SAQQARA Correlación avanzada y seguridad colaborativa_ Tiene su seguridad 100% garantizada con su SIEM?_ Los SIEMs nos ayudan, pero su dependencia de los eventos y tecnologías, su reducida flexibilidad

Más detalles

Ingeniería del Software I

Ingeniería del Software I - 1 - Ingeniería del Software I Introducción al Modelo Conceptual 2do. Cuatrimestre 2005 INTRODUCCIÓN... 2 CLASES CONCEPTUALES... 3 ESTRATEGIAS PARA IDENTIFICAR CLASES CONCEPTUALES... 3 Utilizar lista

Más detalles

Diseño orientado al flujo de datos

Diseño orientado al flujo de datos Diseño orientado al flujo de datos Recordemos que el diseño es una actividad que consta de una serie de pasos, en los que partiendo de la especificación del sistema (de los propios requerimientos), obtenemos

Más detalles

Introducción a la Firma Electrónica en MIDAS

Introducción a la Firma Electrónica en MIDAS Introducción a la Firma Electrónica en MIDAS Firma Digital Introducción. El Módulo para la Integración de Documentos y Acceso a los Sistemas(MIDAS) emplea la firma digital como método de aseguramiento

Más detalles

Máster en Lenguajes y Sistemas Informáticos: Tecnologías del Lenguaje en la Web Universidad de Educación a Distancia Marzo 2013

Máster en Lenguajes y Sistemas Informáticos: Tecnologías del Lenguaje en la Web Universidad de Educación a Distancia Marzo 2013 Presentación de Trabajo de Fin de Máster PROPUESTA DE BÚSQUEDA SEMÁNTICA: APLICACIÓN AL CATÁLOGO DE MAPAS, PLANOS Y DIBUJOS DEL ARCHIVO GENERAL DE SIMANCAS Máster en Lenguajes y Sistemas Informáticos:

Más detalles

RECOMENDACIONES DE INVESTIGACIÓN FUTURA.

RECOMENDACIONES DE INVESTIGACIÓN FUTURA. Capítulo 6 CONCLUSIONES Y RECOMENDACIONES DE INVESTIGACIÓN FUTURA. 212 METODOLOGÍA PARA LA DETECCIÓN DE REQUERIMIENTOS SUBJETIVOS EN EL DISEÑO DE PRODUCTO. CAPÍTULO 6. CONCLUSIONES, APORTACIONES Y RECOMENDACIONES.

Más detalles

NORMA INTERNACIONAL DE AUDITORÍA 520 PROCEDIMIENTOS ANALÍTICOS

NORMA INTERNACIONAL DE AUDITORÍA 520 PROCEDIMIENTOS ANALÍTICOS NORMA INTERNACIONAL DE AUDITORÍA 520 PROCEDIMIENTOS ANALÍTICOS (NIA-ES 520) (adaptada para su aplicación en España mediante Resolución del Instituto de Contabilidad y Auditoría de Cuentas, de 15 de octubre

Más detalles

Base de datos en Excel

Base de datos en Excel Base de datos en Excel Una base datos es un conjunto de información que ha sido organizado bajo un mismo contexto y se encuentra almacenada y lista para ser utilizada en cualquier momento. Las bases de

Más detalles