RESUMEN DE TESIS DOCTORAL. Minería de Texto empleando la Semejanza entre Estructuras Semánticas

Tamaño: px
Comenzar la demostración a partir de la página:

Download "RESUMEN DE TESIS DOCTORAL. Minería de Texto empleando la Semejanza entre Estructuras Semánticas"

Transcripción

1 RESUMEN DE TESIS DOCTORAL Computacón y Sstemas Vol. 9 Núm., pp , CIC-IPN, ISSN , Impreso en Méxco Mnería de Texto empleando la Semeanza entre Estructuras Semántcas Text Mnng usng Comparson of Semantc Structures raduated: Manuel Montes y ómez Centro de Investgacón en Computacón IPN Av. Juan de Dos Bátz s/n esq. Mguel Othón de Mendzábal C. P Méxco D. F. raduado en febrero 26, 2002 Insttuto Naconal de Astrofísca, Óptca y Electrónca (INAOE) Lus Enrque Erro #, Sta. María Tonantzntla, Puebla, Méxco. mmontesg@naoep.mx Advsor: Alexander elbukh Centro de Investgacón en Computacón - IPN Av. Juan de Dos Bátz s/n esq. Mguel Othón de Mendzábal C. P Méxco D. F. cc.pn.mx; Co-Advsor Aurelo López López Insttuto Naconal de Astrofísca, Óptca y Electrónca (INAOE) Lus Enrque Erro #, Sta. María Tonantzntla, Puebla, Méxco. allopez@naoep.mx Resumen El tesoro más valoso de la raza humana es el conocmento. ran parte de este conocmento exste en forma de lenguae natural: lbros, peródcos, artículos, etcétera. La posesón real de todo este conocmento depende de nuestra habldad para realzar certas operacones con la nformacón, por eemplo: buscarla, compararla, y resumrla. La mnería de texto, una nueva área de nvestgacón defnda como descubrmento de conocmento en coleccones de textos, se enfoca en el análss de grandes conuntos de documentos. En partcular, consdera el descubrmento de patrones nteresantes, tales como grupos, asocacones y desvacones, en coleccones de textos. Los métodos actuales de mnería de texto se caracterzan por usar representacones sencllas del contendo de los documentos, por eemplo, bolsas o vectores de palabras. Por una parte estas representacones son fácles de obtener y analzar, pero por otra parte restrngen los patrones descubertos a un nvel temátco. Con el propósto de obtener resultados más útles y sgnfcatvos deben usarse representacones más completas de la nformacón. Basándonos en esta suposcón se propuso un nuevo método para realzar mnería de texto a nvel detalle. Este método usa los grafos conceptuales como representacón del contendo de los textos, y obtene algunos patrones descrptvos de los documentos aplcando varos tpos de operacones sobre estos grafos. Palabras Clave: Mnería de Texto, rafos Conceptuales, Agrupamento Conceptual, Descubrmento de Conocmento. Abstract Knowledge s the most valuable treasure of humanknd. Most of ths knowledge exsts n natural language format, for nstance, n books, ournals, reports, etc. The real possesson of all ths knowledge depends on our capabltes to perform dfferent tasks wth texts, such as: searchng for nterestng texts, comparng dfferent documents, and summarzng them.text mnng, an emergng research area that can be roughly characterzed as knowledge dscovery n large text collectons, s focused on automatcally analyzng a set of texts. Manly, t s concerned wth the dscovery of nterestng 63

2 Manuel Montes y ómez patterns such as clusters, assocatons, and devatons from large text collectons. Current methods of text mnng tend to use smplstc and shallow representatons of texts, e.g., keyword sets or keyword frequency vectors. On one hand, such representatons are easy to obtan from texts and easy to analyze, but on the other hand, however, they restrct the knowledge dscovery results to the topc level. To obtan more useful and meanngful results, rcher text representatons are necessary. On the bass of ths assumpton, we propose a new method for dong text mnng at detal level. Ths method uses conceptual graphs for representng text content and reles on performng some tasks on these graphs, allowng the dscovery of more descrptve patterns. Keywords: Text Mnng, Conceptual raphs, Conceptual Clusterng, Knowledge Dscovery Introduccón El tesoro más valoso de la raza humana es el conocmento. ran parte de este conocmento exste en forma de lenguae natural: lbros, peródcos, artículos, etcétera. La posesón real de todo este conocmento depende de nuestra habldad para hacer certas operacones con la nformacón, por eemplo: buscar nformacón nteresante, comparar fuentes de nformacón dferentes y resumr grandes conuntos de nformacón. La lngüístca computaconal se enfoca prncpalmente en el dseño de los mecansmos que permtan a las computadoras entender el lenguae natural, aunque tambén consdera varas tareas relaconadas con el procesamento de nformacón textual. Algunos eemplos de estas tareas son la búsqueda de nformacón, la extraccón de nformacón y la mnería de texto. El desarrollo de los métodos para el procesamento de nformacón textual ha sdo paralelo al desarrollo de los métodos para la comprensón del lenguae (análss morfológco, sntáctco y semántco). Por ello, típcamente se busca y analza la nformacón textual consderando úncamente el tema de los textos y no su contendo completo. Esta estratega faclta el análss de grandes conuntos de textos, e ncluso mantene una ndependenca del domno, pero lmta grandemente la expresvdad y la dversdad de los resultados de los sstemas de análss de textos. En la recuperacón de nformacón, por eemplo, esta estratega de análss mpde hacer búsquedas que consderen detalles del contendo de los textos que van más allá de sus temas (por eemplo: propóstos, planes, obetvos y enfoques). Por su parte, en la mnería de texto, esta estratega mpde descubrr patrones nteresantes relaconados con dchos detalles del contendo de los textos. Actualmente, buscando una solucón a este problema de expresvdad y dversdad de los resultados, se comenzan a usar más elementos provenentes de la lngüístca computaconal comprensón del lenguae en las tareas de procesamento de textos. Así pues, se empezan a susttur las representacones sencllas de los textos, como las lstas de palabras clave, por representacones más completas que consderan aspectos estructurales y contextuales del contendo de los textos. En la recuperacón de nformacón se han usado tanto representacones sntáctcas como semántcas del contendo de los textos aunque su aplcacón no ha sdo tan defntva y valosa como se esperaba (Sparck-Jones, 999). Las prncpales causas de este resultado desfavorable son, entre otras, las sguentes:. Los métodos de comparacón de las nuevas representacones no son los adecuados. 2. Algunas característcas de la búsqueda de nformacón, por eemplo, su naturaleza temátca, la rapdez de respuesta requerda, y en muchas ocasones la necesdad de ndependenca del domno, complcan la aplcacón de estas nuevas representacones. En la mnería de texto no se han usado representacones que consderen algunos elementos estructurales y contextuales de los textos; ello a pesar de que tanto su obetvo, el descubrmento de conocmento, como algunas de sus característcas hacen suponer una notable meoría en los resultados. Algunas de estas característcas son: 64

3 Mnería de texto empleando la Semeanza entre Estructuras Semántcas. El descubrmento de conocmento es una tarea típcamente dependente del domno. 2. La rapdez no es un factor determnante en el proceso de descubrmento, por el contraro, lo más mportante es la expresvdad y precsón de los resultados. 3. El proceso de descubrmento generalmente no se realza en un ambente de pregunta y respuesta. Este trabao de tess consderó el problema de la expresvdad de los resultados de la mnería de texto, y tambén la oportundad de comenzar a usar representacones más completas del contendo de los textos en ella. Báscamente en esta tess se planteó el uso de una representacón semántca del contendo de los textos, y se propuseron algunos métodos para el descubrmento de patrones nteresantes en un conunto de dchas representacones. Así pues, el obetvo de este trabao fue defnr algunas estrategas de mnería de texto para meorar la expresvdad y la dversdad de los patrones descubertos con respecto a los obtendos usando las técncas tradconales. 2 Mnería de Texto La mnería de texto es el área de nvestgacón más recente del procesamento automátco de textos. Ella se defne como el proceso automátco de descubrmento de patrones nteresantes en una coleccón de textos. Estos patrones no deben de exstr explíctamente en nngún texto de la coleccón, y deben de surgr de relaconar el contendo de varos de ellos (Hearst, 999; Kodratoff, 999). El proceso de mnería de texto consste de dos etapas prncpales: una etapa de preprocesamento y una etapa de descubrmento (Tan, 999). En la prmera etapa, los textos se transforman a algún tpo de representacón estructurada o semestructurada que faclte su posteror análss, mentras que en la segunda etapa las representacones ntermedas se analzan con el obetvo de descubrr en ellas algunos patrones nteresantes o nuevos conocmentos. Entonces, dependendo del tpo de métodos aplcados en la etapa de preprocesamento es el tpo de representacones ntermedas construdas, y en funcón de dcha representacón se determnan los métodos usados en la etapa de descubrmento, y en consecuenca, el tpo de patrones descubertos. La fgura muestra las prncpales estrategas usadas en los actuales sstemas de mnería de texto. De acuerdo con esta fgura, la mayoría de los actuales de mnería de texto lmtan sus resultados a un nvel temátco o de entdad, y por lo tanto mposbltan el descubrmento de cosas más detalladas como por eemplo: Consensos, que por eemplo respondan a preguntas como: Cuál es la opnón mayortara de los mexcanos sobre el goberno de Fox? Tendencas, que ndquen por eemplo s han exstdo varacones en la postura de Fox con respecto a la educacón. Desvacones, que dentfquen por eemplo opnones raras con respecto al desempeño de la seleccón mexcana de fútbol. Etapa de pre-procesamento Tpode representacón Tpode descubrmentos Categorzacón Vector detemas Nvel temátco Full-text Secuencadepalabras Patronesdelenguae Extraccóndenformacón Tabladedatos Relaconesentreentdades Fg.. Estado del arte de la mnería de texto 65

4 Manuel Montes y ómez A contnuacón se descrben brevemente los prncpales métodos empleados en ambas etapas de la mnería de texto. Una descrpcón más completa del estado del arte del área, y una lsta de referencas pertnentes puede consultarse en (Montes-y-ómez, 2002; Hearst, 999; Kodratoff, 999; Tan, 999). 2. Etapa de Preprocesamento En la etapa de preprocesamento los textos se transforman a una representacón estructurada o semestructurada de su contendo. Estas representacones ntermedas de los textos deben ser, por una parte, sencllas para facltar el análss de los textos, pero por otra parte, completas para permtr el descubrmento de patrones nteresantes, e ncluso de nuevos conocmentos. Las representacones ntermedas más usadas en la mnería de texto son báscamente de dos tpos: A nvel documento, donde cada representacón se refere a un texto dferente de la coleccón. A nvel concepto, donde cada representacón ndca un obeto, tema o concepto nteresante para el domno específco de aplcacón. La construccón de estas representacones sgue dferentes estrategas. Por eemplo, las representacones a nvel documento se construyen típcamente usando métodos de categorzacón, de texto completo e ndexamento. Por su parte, las representacones a nvel concepto se obtenen báscamente aplcando métodos dependentes del domno tales como la extraccón de térmnos mportantes y la extraccón de nformacón. 2.2 Etapa de Descubrmento Típcamente, los descubrmentos de mnería de texto y por consecuenca sus métodos y sus tareas se clasfcan en: descrptvos y predctvos. Sn embargo es posble clasfcarlos de otras maneras. Por eemplo, una clasfcacón alternatva de la mnería de texto consdera que los textos son una descrpcón de stuacones y obetos del mundo, y que las representacones ntermedas de dchos textos obtendas en la etapa de preprocesamento son una descrpcón estructurada del contendo de estos últmos. Con base en esta consderacón, los descubrmentos de la mnería de texto se pueden clasfcar en tres enfoques: () descubrmentos a nvel representacón, () descubrmentos a nvel texto, y () descubrmentos a nvel mundo. Descubrmentos a Nvel Representacón Los métodos de este enfoque ntentan construr o descubrr una representacón estructurada o semestructurada de los textos. Los más comunes se encargan de la clasfcacón, categorzacón e ndexamento de los textos. Descubrmentos a Nvel Texto Los métodos de este enfoque son de dos tpos: métodos que descubren patrones de lenguae a partr de una coleccón de textos, y métodos que descubren la organzacón oculta de una coleccón de textos. Los métodos relaconados con la dentfcacón de patrones de lenguae se dstnguen por consderar todas las palabras de los textos y mantener su orden relatvo, es decr, usar representacones de texto completo (full-text, en nglés). Estos métodos detectan secuencas frecuentes de palabras, y en ocasones tambén construyen, con base en estas secuencas, un conunto de reglas asocatvas que expresan combnacones de palabras de uso común. Por su parte los métodos relaconados con el agrupamento de textos se caracterzan por utlzar dversos tpos de métodos, desde tradconales basados en una medda eucldana de la dstanca entre los textos, hasta sofstcados basados en redes neuronales de tpo mapas auto-organzados. En partcular estos métodos enfatzan la vsualzacón e nterpretacón de 66

5 Mnería de texto empleando la Semeanza entre Estructuras Semántcas los resultados. Por eemplo, algunos emplean nterfaces gráfcas para analzar los agrupamentos, otros determnan una etqueta descrptva del contendo de cada grupo, y otros más determnan el documento representatvo de cada clase. Adconalmente, el agrupamento de los textos se usa en el análss exploratoro de las coleccones de textos, en la generacón de resúmenes multdocumento, y en otras tareas de descubrmento tales como la deteccón de asocacones y desvacones. Descubrmentos a Nvel Mundo Este enfoque consdera dstntas tareas, entre ellas el descubrmento de asocacones, la deteccón de desvacones y el análss de tendencas. Los métodos de este enfoque comparten las sguentes característcas: () emplean tanto representacones de los textos a nvel concepto como a nvel documento; () usan conocmentos de domno, generalmente expresados en erarquías de conceptos o conuntos de predcados, y () permten que el usuaro guíe el proceso de descubrmento, especfcando prncpalmente las regones y los conceptos de mayor nterés. Entre los trabaos de descubrmento de asocacones destacan aquellos que plantean la deteccón de asocacones temátcas no-exactas de la forma smlar ( A) B ( confanza / soporte), y el uso de los elementos estructurados y no estructurados para la obtencón de dchas relacones. Por su parte, los métodos de deteccón de desvacones consderan la deteccón de los textos raros con temátca dferente al promedo de una coleccón, así como la deteccón de los nuevos temas en una coleccón dnámca, por eemplo en un fluo de notcas. El análss de tendencas se encarga de la descrpcón de la evolucón de una coleccón de textos. Entre sus métodos destacan los sguentes dos enfoques: () la deteccón de temas de dscusón con un comportamento preestablecdo, y la comparacón de la temátca de una coleccón en dos tempos dferentes. 3 Mnería de Texto usando rafos Conceptuales En esta seccón se presentan los métodos prncpales de nuestro enfoque de mnería de texto a nvel detalle basado en el uso de representacones semántcas grafos conceptuales de los documentos. Prmero se defnen los crteros para la comparacón de dos grafos conceptuales, y después de presentan algunos métodos para descubrr patrones nteresantes (grupos, asocacones y desvacones) en una coleccón de grafos conceptuales. Los prncpos de la teoría de grafos conceptuales se ntroducen en el apéndce A, mentras que la transformacón de los textos a grafos conceptuales es tratada en (Sowa and Way, 986; Sowa, 999). 3. Comparacón de rafos Conceptuales El procedmento general propuesto para la comparacón de dos grafos conceptuales consste de dos etapas: () el apareamento de los grafos, y () la medcón de la semeanza. En la prmera etapa se dentfcan todos los elementos, conceptos y relacones, comunes de ambos grafos, y se construye, a partr de estos, la o las descrpcones de dcha semeanza. Estas descrpcones las llamamos traslapes. En la segunda etapa se calcula la medda de la semeanza de los dos grafos. Esta medda expresa la mportanca relatva del traslape con respecto a los grafos conceptuales orgnales. Cuando se dentfca más de un traslape, se calcula una medda de semeanza con respecto a cada uno. La mayor medda se consdera la medda de semeanza fnal, y el traslape que la produce la meor descrpcón de la semeanza. En ambas etapas, la de apareamento y la de medcón, se utlza conocmento del domno y se consderan los ntereses del usuaro. El conocmento del domno se expresa a través de un conunto de erarquías de conceptos. Báscamente, estas erarquías permten determnar semeanzas entre los conceptos de los grafos a dferentes nveles de generalzacón. Por su parte, los ntereses del usuaro se expresan por dos medos. En prmer lugar, a través de algunos parámetros de la medda 67

6 Manuel Montes y ómez de semeanza, por eemplo, los que determnan la mportanca relatva de las entdades, accones y atrbutos. En segundo lugar, a través del conocmento del domno que el usuaro establece lbremente. Apareamento de rafos Conceptuales Típcamente, el apareamento de dos grafos conceptuales permte dentfcar todos sus elementos generalzacones comunes. Debdo a que el operador de proyeccón π no es necesaramente uno-a-uno y tampoco únco (referrse al apéndce), algunas de estas generalzacones comunes pueden expresar nformacón redundante o duplcada. Entonces, para lograr construr una descrpcón precsa de la semeanza entre dos grafos conceptuales es necesaro dentfcar los conuntos de generalzacones comunes que formen una máxma generalzacón común compatble. Cada uno de estos conuntos es lo que llamamos un traslape. Un traslape lo defnmos de la sguente manera: = de los grafos conceptuales y 2 es compat Defncón. El conunto de generalzacones comunes O { g, g, 2, g n } ble s y solo s exste un mapeo { π, π, 2, } n π = n g = π 2 = g = Ο/ π n tal que sus correspondentes proyeccones en y 2 no se ntercepten: Defncón 2. El conunto de generalzacones comunes O { g, g, 2, } = de los grafos conceptuales y 2 es máxmo s y solo s no exste otra generalzacón común g de y 2, tal que alguna de las sguentes condcones se satsfaga:. O = { g, g,, g, 2 n g} es compatble. : g g, g g, y O = g,, g, g, g+,, g n es compatble. 2. { } Defncón 3. El conunto de generalzacones comunes O { g, g, 2, } = de los grafos conceptuales y 2 es un traslape s y sólo s es compatble y máxmo. g n De acuerdo con esto, cada traslape expresa en forma completa y precsa la semeanza entre dos grafos conceptuales. Esto mplca que traslapes dstntos pueden ndcar dferentes maneras de vsualzar e nterpretar dcha semeanza. Debdo a que el apareamento y la proyeccón de los grafos conceptuales son problemas defndos como NP-completos (Mugner, 995), nuestro algortmo es de compledad exponencal con respecto al número de conceptos comunes de los dos grafos. Sn embargo, esto no mplca nnguna lmtacón mportante para su aplcacón en la mnería de texto (tal y como nosotros la pretendemos realzar), ya que los grafos que serán comparados son generalmente el resultado del análss sntáctco superfcal (shallow parsng, en nglés) de pequeñas partes descrptvas del contendo de los textos, y en consecuenca son pequeños 30 conceptos como máxmo y tenen solamente unos cuantos conceptos comunes. Medcón de la Semeanza La medcón de la semeanza es la segunda etapa de la comparacón de los grafos conceptuales. En esta etapa se recbe como entrada los dos grafos que se comparan y el conunto de todos sus posbles traslapes. Para cada traslape se calcula una medda de semeanza. Fnalmente se entrega como resultado la mayor medda y el traslape que la produce (que es la descrpcón fnal de la semeanza). Dados dos grafos conceptuales y 2, y uno de sus traslapes, la medda de semeanza expresa la mportanca relatva de los elementos comunes (traslape) con respecto a toda la nformacón de los grafos orgnales. En general, nuestra medda tene las sguentes característcas:. Se fundamenta en las sguentes ntucones báscas (Ln, 998): () la semeanza entre dos grafos conceptuales se relacona con su traslape (elementos comunes), entre más especalzado y más extenso sea éste, más semeantes son los grafos; () la semeanza entre dos grafos conceptuales se relacona con sus dferencas, entre más dferencas tengan, g n 68

7 Mnería de texto empleando la Semeanza entre Estructuras Semántcas menos semeantes son; () la mayor semeanza entre dos grafos conceptuales se obtene cuando son déntcos, sn mportar cuantos elementos comunes tengan, y (v) la semeanza entre dos grafos conceptuales es nula cuando los grafos no tenen nngún elemento común, esto es, cuando su traslape es nulo. 2. Se basa en una medda conocda para la comparacón de textos; a saber: el coefcente de Dce. El valor de este coefcente entre dos textos T y T 2 se defne como: s ( T, T2 ) = 2 t2 t + t 2, donde t es el número de térmnos del texto T, y t 2 es el número de térmnos comunes de los textos T y T Aprovecha la estructura bpartta de los grafos conceptuales. La medda de semeanza se obtene combnando dos tpos de semeanzas parcales: una semeanza conceptual y una semeanza relaconal. La semeanza conceptual expresa que tan smlares son las entdades, accones y atrbutos menconados en los dos grafos conceptuales, mentras que la semeanza relaconal señala que tan parecdas son las nterconexones entre los conceptos comunes de ambos grafos. 4. Consdera conocmento del domno. Este conocmento se expresa en forma de un dcconaro de snónmos y algunas erarquías de conceptos, y permte evaluar adecuadamente la contrbucón de las semeanzas no exactas. 5. Permte que el usuaro establezca algunos parámetros de la medda de semeanza. Por eemplo, la mportanca relatva de las semeanzas conceptual y relaconal, y la mportanca relatva de las entdades, accones y atrbutos. Esta característca otorga una gran flexbldad al proceso de comparacón de los grafos conceptuales. Medda de Semeanza Dados dos grafos conceptuales y 2, y uno de sus traslapes, denotado por O, su semeanza 0 s es una combnacón de dos valores: una semeanza conceptual s c y una semeanza relaconal s r. Semeanza Conceptual La semeanza conceptual 0 s c depende de la cantdad de conceptos comunes de y 2. A grandes rasgos, esta semeanza ndca que tan parecdas son las entdades, accones y atrbutos menconados en ambos grafos conceptuales. La semeanza conceptual s c se calcula usando una expresón análoga al coefcente de Dce: s c ( ), 2 ( weght( c) β ( π c π c) ) 2, 2 c O = weght ( c) + weght( c) c En esta expresón, la funcón weght ( c) ndca la mportanca del concepto c dependendo de su tpo, y la funcón ( π c c) β,π 2 expresa el nvel de generalzacón del concepto común c O con respecto a sus proyeccones en los grafos orgnales π c y π 2 c. La funcón weght ( c) evalúa en forma dferente los dstntos tpos de conceptos. Esta funcón se defne de la sguente manera: we s c representa una entdad weght( c) = wv s c representa una accón wa s c representa un atrbuto Aquí, we, wv y wa son constantes postvas que ndcan la mportanca relatva de las entdades, accones y atrbutos respectvamente. Sus valores son asgnados por el usuaro de acuerdo con sus ntereses de análss. Por su parte, la funcón β ( π c,π c) 2 expresa la semeanza semántca entre los conceptos orgnales π c y π 2 c con base en una erarquía de conceptos preestablecda. Esta funcón se defne de la sguente manera : En esta defncón, la condcón type( c) type( c) π = tambén se satsface cuando los tpos conceptuales son snónmos. π 2 c 2 69

8 Manuel Montes y ómez β ( π c, π c) 2 depth = depth + 2 d c d + d π c π c 2 s type s type s type ( π c) = type( π c) y referent( π c) = referent( π c) ( π c) = type( π c) y referent ( π c) referent( π c) ( π c) type( π c) En la prmera condcón, los conceptos π c y π 2 c son guales, y por lo tanto β ( π c, c ) = π 2. En la segunda condcón, los conceptos π c y π 2 c se referen a dferentes ndvduos del msmo tpo, esto es, a dferentes nstancas de la msma clase. En este caso, β ( π c π c) = depth ( depth ), donde depth ndca el número de nve 2 2 2, + 2 les de la erarquía de conceptos dada. De acuerdo con esta asgnacón, la semeanza entre dos conceptos con el msmo tpo pero con dferentes referentes es sempre mayor que la semeanza entre dos conceptos con dferentes tpos. En la tercera condcón, los conceptos π c y π 2 c tenen dferentes tpos, es decr, señalan elementos de dstntas clases. En este caso, β ( π c,π c) 2 expresa la semeanza semántca de los conceptos type( π c) y type( π 2 c) en la erarquía de conceptos preestablecda. Esta semeanza se calcula usando, una vez más, una expresón análoga al coefcente de Dce: β ( π c, π c) 2 = d 2 d c + d En este caso, d es la dstanca, expresada como el número de nodos, desde el concepto hasta la raíz de la erarquía. Semeanza Relaconal π c La semeanza relaconal 0 s r ndca que tan smlares son las relacones entre los conceptos comunes en ambos grafos conceptuales y 2. En otras palabras, la semeanza relaconal ndca que tan parecdos son los vecndaros de los conceptos del traslape en los grafos conceptuales orgnales. El vecndaro del traslape O en el grafo conceptual, denotado como N O ( ), es el conunto de todas las relacones conceptuales conectadas a los conceptos comunes en el grafo ; esto es: N N O ( ) = N ( c) c O, donde : π c 2 ( c) = { r r está conectada a π c en } Con base en esta defncón, la semeanza relaconal se calcula de la sguente manera; tambén análoga al coefcente de Dce: 2 weghto ( r ) (, r O sr 2 ) = weght ( r ) + weght ( ) r 2 r N ( ) r N ( ) O En esta fórmula weght ( r ) ndca la mportanca de la relacón conceptual r en el grafo conceptual. Este valor se calcula de acuerdo con el vecndaro de r en ; así se garantza la homogenedad entre los pesos de los conceptos y las relacones conceptuales. weght N ( r ) = c N weght ( r ) N r ( ) ( c) ( r ) = { c c está conectado a r en } O 2, donde :

9 Mnería de texto empleando la Semeanza entre Estructuras Semántcas Semeanza Total La semeanza total se obtene combnando la semeanza conceptual s c y la semeanza relaconal s r. En prmer lugar, esta combnacón debe ser estrctamente multplcatva, de tal forma que la semeanza total sea proporconal a ambos componentes. Con base en esta consderacón, la semeanza total se defne como: s = s c sr. Sn embargo, la semeanza relaconal debe tener una mportanca secundara, porque su exstenca depende drectamente de la exstenca de algunos conceptos comunes, y además porque aún cuando los dos grafos no tenen nnguna relacón común, certo nvel de semeanza puede exstr entre ellos. Así, la semeanza total s debe ser proporconal a las semeanzas conceptual y relaconal, pero puede ser dferente de cero cuando s r = 0. Este comportamento se modela suavzando el efecto de la semeanza relaconal sobre la semeanza total: ( a ) s = s + c bs r Con esta defncón, cuando no exste nnguna semeanza relaconal entre los dos grafos conceptuales (es decr, cuando s r = 0), la semeanza total depende exclusvamente de la semeanza conceptual, sendo s = asc. Los coefcentes a y b ndcan la mportanca relatva de la semeanza conceptual y relaconal respectvamente. Sus valores son establecdos por el usuaro de acuerdo con sus ntereses de análss, consderando úncamente las sguentes dos condcones: 0 < a, b < y a + b =. 3.2 Agrupamento de rafos Conceptuales Dada una coleccón de textos representados por grafos conceptuales, una de las tareas más mportantes para su análss es su agrupamento. En prmer lugar, este agrupamento permte descubrr la estructura oculta de la coleccón. En segundo lugar, este agrupamento consttuye un resumen organzado de la coleccón que faclta su vsualzacón, su posteror análss, y tambén el descubrmento de otros tpos de patrones nteresantes. El método propuesto es un agrupamento conceptual que, a dferenca de las técncas tradconales de agrupamento, no sólo permte dvdr el conunto de grafos conceptuales en varos grupos, sno tambén asocar una descrpcón a cada uno de estos grupos y organzarlos erárqucamente de acuerdo con dchas descrpcones (Mchalsk, 980). Báscamente, dado un conunto de grafos conceptuales, nuestro método dentfca todas sus regulardades elementos comunes de dos o más grafos del conunto y construye una erarquía conceptual de ellas. La erarquía resultante H no es necesaramente un árbol o lattce, sno un conunto de árboles, es decr, un bosque. Esta erarquía es una espece de red de herenca, en donde los nodos nferores ndcan regulardades especalzadas y los nodos superores sugeren regulardades generalzadas. Formalmente, cada nodo h de esta erarquía se representa por una trada (cov(h ), desc(h ), coh(h )), donde: cov(h ), llamada cobertura de h, es el conunto de grafos cubertos por o asocados con la regulardad h. desc(h ), llamada descrpcón de h, es el conunto de los elementos comunes de los grafos cubertos por h, es decr, es el traslape de los grafos de cov(h ). Entonces, desc(h ) ndca propamente la regulardad. coh(h ), llamada cohesón de h, es la semeanza mínma entre dos grafos cualesquera de cov(h ). Esto sgnfca que para todo nodo h se cumple la sguente condcón:, cov( h ) : sm(, ) coh( h ). Dados dos nodos h y h de la erarquía, el nodo h es un descendente del nodo h, o lo que es lo msmo, el nodo h es un ascendente del nodo h, descrto como h < h, s y sólo s:. El nodo h agrupa o cubre más grafos que el nodo h : cov( h ) cov( h ). 2. La descrpcón del nodo h es una generalzacón de la descrpcón del nodo h : ( h ) desc( h ) desc <. 3. La cohesón de los grafos del agrupamento h es menor o gual que la cohesón de los grafos del agrupamento h : coh coh( h ). 7

10 Manuel Montes y ómez Con base en estas consderacones, el conunto de nodos hos de h, denotado por S ( h ) de h, denotado por P ( h ), se defnen de la sguente manera: S P = { h H h < h, h : h < h < h } = { h H h < h, / h : h < h < h } k k k k, y el conunto de nodos padre Construccón de la Jerarquía Conceptual El método propuesto emplea una estratega de aprendzae no supervsado que permte construr ncrementalmente el agrupamento conceptual del conunto de grafos. Así, la ncorporacón de un grafo n a la erarquía conceptual H se realza en dos pasos. En el prmer paso se añade a la erarquía un nodo que cubre exclusvamente al nuevo grafo (ver la fgura 2). Este nuevo nodo se defne como ({ n}, n, ). En el segundo paso se dentfcan todas las regulardades asocadas con la nueva evdenca. Estas regulardades (nuevos nodos) se añaden a la erarquía sguendo una estratega ascendente, esto es, cada nodo de nvel superor se construye combnando dos nodos de nveles más baos. Por eemplo, el nodo h n de la fgura 2(b) se construye a partr de los nodos h o y h l. En este caso, el nodo nuevo h n se defne de la sguente manera: ( hn ) ( ho ) cov( hl ) ( hn ) = match( desc( ho ) desc( hl ) ) sm( desc( ho ), desc( hl ) ) s cov( ho ) = cov( ho ) ( hn ) = mn( coh, coh ) otro caso cov = cov desc, coh = o En este caso, la funcón match (, ) regresa el meor traslape de los grafos y ; la funcón ( ) la medda de semeanza de los grafos y ; y la funcón ( coh, coh( h )) l sm, regresa mn regresa la menor cohesón entre los grupos h y h. Por otra parte, cada vez que una nueva regulardad h n se añade a la erarquía conceptual H, las regulardades duplcadas redundantes se elmnan. Las reglas de elmnacón de redundancas son las sguentes: S desc( h o) = desc( h n), entonces el nodo h o se elmna de la erarquía. S desc( h l) = desc( h n), entonces h l se elmna. 3.3 Descubrmento de Asocacones Dado un conunto de grafos conceptuales C = { }, donde cada grafo conceptual representa un texto dferente, una regla asocatva es una expresón de la forma g g (c/s), donde g es una generalzacón de g (g < g ), c es la confanza de la regla y s es su soporte. 72

11 Mnería de texto empleando la Semeanza entre Estructuras Semántcas h n h o h l k n k n I ncorporacón de Nuevas regulardades (a) (b) Fg. 2. Incorporacón de un nuevo grafo a la erarquía Báscamente, una regla de este tpo ndca que los grafos conceptuales del conunto que contenen el grafo g, c% de las veces tambén contenen el grafo más especalzado g. Además que s% de los grafos de la coleccón contenen el grafo especalzado g. Entonces, el descubrmento de asocacones en un conunto de grafos conceptuales se defne como el problema de encontrar todas las reglas asocatvas g g (c/s), tal que c mnconf y s mnsup. El descubrmento de las reglas asocatvas en un conunto de grafos conceptuales C = { } se auxla de su erarquía agrupamento conceptual H. Cada nodo h de esta erarquía expresa una regulardad, cuya descrpcón desc(h ) es una generalzacón común de dos o más grafos de C. Además, todo grafo conceptual g mplícto en h, es decr, todo grafo conceptual g tal que: desc(h ) < g y / hk H : desc( h < desc( hk ) < g ), es tambén una generalzacón común mplícta del msmo subconunto de grafos de C. Con base en la erarquía conceptual H es posble determnar dos tpos de reglas asocatvas. Asocacones Explíctas: Para cada par de nodos h y h de la erarquía conceptual H, tal que h < h, la sguente regla asocatva es valda: desc desc cov c = cov cov, s = C Asocacones Implíctas: Para todo grafo conceptual g mplícto en h, las sguentes reglas asocatvas son valdas: Además, h H: desc(h ) < desc(h ): y h k H: desc(h ) < g < desc(h k): g desc g desc desc k g cov c =, s = C cov c = cov cov c = cov De acuerdo con estas defncones es posble descubrr todas las reglas asocatvas en un conunto de grafos conceptuales. Usualmente, el conunto de todas estas reglas es muy grande y contene mucha nformacón redundante que debe ser elmnada. ( h ) k, s =, s = cov C cov C 73

12 Manuel Montes y ómez Asocacón Implícta Redundante: La regla asocatva mplícta g k (,α ) g es redundante, s y sólo s, una de las sguentes dos condcones se satsface: Exste otra regla asocatva mplícta gh g l (,α ), tal que g h es una generalzacón de g (g g h), y/o g l es una especalzacón de g k (g l g k). Exste la regla asocatva mplícta g (, g β ) en combnacón con la regla asocatva explícta g k ( γ,α ) en donde, g k < g < g. g, 3.4 Deteccón de Desvacones Dado un conunto de grafos conceptuales C = { }, donde cada grafo conceptual representa un texto dferente, una desvacón contextual es una expresón de la forma: g : g ( r, s). En esta expresón, g ndca un contexto y g expresa algunas desvacones para dcho contexto; r es el grado de rareza de la desvacón g en el contexto g, y s es el soporte de dcha desvacón contextual, es decr, es la representatvdad del contexto g en el conunto C. Báscamente, esta expresón ndca que: dentro del subconunto de grafos conceptuales textos que contenen el grafo g, y que representa el s% del conunto completo de grafos, los grafos textos que contenen el grafo g son raros; sendo éstos solamente el r%. Entonces, con base en lo anteror, la deteccón de desvacones en un conunto de grafos conceptuales se defne como el problema de encontrar todas las desvacones contextuales g : g (r/s) para un umbral m preestablecdo por el usuaro. La deteccón de las desvacones contextuales en un conunto de grafos conceptuales C = { } se auxla de su erarquía conceptual H. En esta erarquía, cada nodo h ndca un contexto específco de C descrto por la regulardad desc(h ) y compuesto por el conunto de grafos cov(h ). Además, el conunto de nodos ho de h, defndo como: = { h H h < h / h : h < h h } S <, k k, ndca una partcón del contexto h, donde la descrpcón de cada uno de estos nodos ho desc(h ) expresa una característca posblemente representatva del contexto h. De acuerdo con esto se establece lo sguente: Característca Representatva: La descrpcón desc(h ) del nodo S ( h ) h es una característca representatva del contexto h s: cov m cov( h ). Entonces, el conunto de característcas representatvas del contexto h se defne como: rafo Conceptual Raro: El grafo conceptual cov( h ) F { } desc h S, cov m cov =. característca representatva desc ( h ) en el contexto h tal que: ( ) es un grafo raro en el contexto h, s y sólo s, no exste nnguna cov h. { } Entonces, el conunto de grafos raros del contexto h se defne como: R( h ) cov( h ) / g F ( h ) : cov( g ) Desvacón Contextual: El grafo conceptual ( h k ) s y sólo s: cov ( hk ) R( h ). =. desc, relaconado con el nodo h k < h, es una desvacón en el contexto h, 74

13 Mnería de texto empleando la Semeanza entre Estructuras Semántcas Cobertura: 8 Cohesón: solve mnr numercally Cobertura: 6 Cohesón: 0.3 Cobertura: 4 Cohesón: 0.28 solve mnr numercally equaton numercally mnr solve ob problem Cobertura: 4 Cohesón: Cobertura: 2 Cohesón: 0.89 Cobertura: 2 Cohesón: 0.35 solve ob polynomal-equaton mnr numercally solve ob problem mnr solve ob boundary-value-problem atr lnear mnr atr numercally equaton atr ordnary numercally pont atr dfferental art art 2 art 3 art 4 art 5 art 6 art 7 art 8 art a art 4...(numercal soluton of the polynomal equaton)... art 5...(the numercal soluton of boundary value problems for lnear ordnary dfferental equatons)... art 6...(the numercal soluton of an n-pont boundary value problem for lnear ordnary dfferental equatons)... art (the numercal soluton of a thn plate heat transfer problem)... art (the numercal soluton of nonlnear two-pont boundary problems by fnte dfference methods)... Fg. 3. rupo nterno de la coleccón B En este caso, la desvacón contextual puede defnrse de la sguente manera: desc : desc k cov r = cov ( hk ) cov, s = C Esta defncón permte encontrar todas las desvacones contextuales en un conunto de grafos conceptuales con respecto a un valor predefndo de m. Muchas de estas desvacones contenen nformacón redundante o nformacón mplícta en otras desvacones. Por eemplo, s es raro que se hable de anmales en un conunto determnado de grafos conceptuales, entonces obvamente es aún más raro que se hable de perros. Entonces, para vsualzar meor las desvacones es necesaro elmnar las redundantes. Nosotros defnmos una desvacón redundante de la sguente manera: g es redundante s exste otra desvacón con cov gk cov g. Desvacón Contextual Redundante: La desvacón contextual : gk ( α, β ) textual : g ( γ, β ) g, con α < γ, tal que g es una generalzacón de g k. Esto mplca que: ( ) ( ) 75

14 Manuel Montes y ómez analyze ob dscplne revew ob dscplne (63%, 7/225) revew revew mnr anually (63%, 7/225) dscplne scence (75%, 2/225) nformaton-scence ob nformaton-scence revew ob technology (66%, 6/225) mnr annually nformaton-system desgn ob nformaton-system (55%, 6/225) (a) Algunos eemplos de asocacones revew ob dscplne : revew ob lterature (4%, 7/225) nformaton-scence : evaluate ob nformaton-scence (%, 9/225) 4 Resultados Expermentales (b) Algunos eemplos de desvacones Fg. 4. Patrones descrptvos del conunto A Nuestro método de mnería de texto fue probado medante el análss de dos conuntos de artículos centífcos. El prmero, denomnado a partr de ahora conunto A, se compone de 225 artículos sobre cencas de la nformacón; el segundo, referdo como conunto B, consste de 495 artículos de cencas de la computacón. Los resultados descrtos a contnuacón son de dos tpos, cualtatvos y cuanttatvos. Los resultados cualtatvos muestran la capacdad de nuestro método para descubrr patrones nteresantes a un nvel más descrptvo y completo que el temátco. Por su parte, los resultados cuanttatvos demuestran la vabldad de nuestro método de mnería de texto. 4. Evaluacón Cualtatva Nuestro método de mnería de texto permte descubrr patrones más descrptvos sobre el contendo de los textos que los métodos tradconales. En esta seccón se muestran algunos eemplos de estos patrones; en especal se muestran algunos grupos (segmentos del agrupamento erárquco), asocacones y desvacones obtendas a partr de los conuntos de prueba. Agrupamento Conceptual El agrupamento del conunto A generó una erarquía conceptual de 50 nodos; donde 225 representan los artículos orgnales. Por su parte, el agrupamento del conunto B creó una erarquía conceptual de 272 nodos, donde 495 representan los artículos orgnales. En la fgura 3 se presenta un grupo nterno de una de las erarquías conceptuales obtendas. 76

15 Mnería de texto empleando la Semeanza entre Estructuras Semántcas Asocacones y Desvacones Los métodos de descubrmento de asocacones y deteccón de desvacones dsmnuyen el problema de nterpretacón contextual de los patrones descubertos. Báscamente generan reglas que preservan las relacones semántcas (o de cualquer tpo de relacón representada en los grafos) entre los conceptos partcpantes, y además permten determnar patrones a dferentes nveles de generalzacón. La fgura 4 muestra algunos eemplos de asocacones y desvacones correspondentes al conunto de prueba A. Estos patrones ndcan que una parte mportante de los artículos del conunto A se enfoca en el análss de dstntas dscplnas; sendo las cencas las más analzadas y la lteratura la menos. Además, señala que estos análss son en la mayoría de las veces revsones anuales. 4.2 Evaluacón Cuanttatva Crecmento del Agrupamento Conceptual Los agrupamentos conceptuales tenen característcas muy nteresantes para los propóstos de descubrmento de conocmento y mnería de texto, por eemplo, son muy descrptvos y altamente estructurados. Sn embargo, su tamaño (que puede ser exponencal con respecto al número de grafos del conunto) lmta consderablemente su aplcacón. Nuestros expermentos demostraron que el agrupamento conceptual de un conunto de grafos conceptuales que representan el contendo de textos es factble. Por eemplo, en la fgura 5 se descrbe el crecmento de los agrupamentos conceptuales correspondentes a los dos conuntos de prueba. Algunas conclusones mportantes son las sguentes:. El crecmento del agrupamento conceptual, meddo en funcón del número de grupos y conexones, es cas lneal. Además de que esta tendenca se mantene cuando se emplea el conocmento del domno. 2. El mpacto del conocmento del domno es mayor en las conexones que en los grupos. Intutvamente esto sgnfca que se logran formar grupos más grandes y más homogéneos (más nterconectados), pero no muchos más grupos. 3. Los grupos y las conexones crecen ncalmente muy parecdo, pero después, conforme se nsertan más grafos en el agrupamento, las conexones crecen más rápdamente. Este comportamento sucede porque en un prncpo, cuando el agrupamento no exste, cada nuevo grafo genera nuevos grupos, pero después cuando el agrupamento es mayor, cada nuevo grafo sólo se nserta en algunos grupos exstentes. Densdad de Conexones 77

16 Manuel Montes y ómez # deelementos rafos nsertados.5 (a) Conunto A rupos Conexones # de elementos conexones /grupo (a) Análss del conunto A rafos nsertados Snconocmentos conexones /grupos (b) Conunto B 0.5 rafos nsertados rupos Conconocmentos Conexones Fg. 5. Crecmento del agrupamento (b) Análss del conunto B rafos nsertados Snconocmentos Conconocmentos Fg. 6. Densdad de conexones Otra característca nteresante de los agrupamentos conceptuales (prncpalmente del proceso de su construccón) es la densdad de conexones, es decr, el número de conexones por grupo. La fgura 6 muestra la varacón de la densdad de conexones durante el proceso de construccón de los agrupamentos correspondentes a los dos conuntos de prueba. Con base en esta fgura deducmos lo sguente:. La densdad de conexones se ncrementa conforme se nsertan los grafos conceptuales en el agrupamento. La razón de aumento de la densdad de conexones es en prncpo muy elevada, pero se establza conforme se nsertan más grafos en el agrupamento. Este comportamento sucede porque ncalmente, cuando el agrupamento no exste, cada nuevo grafo genera nuevos grupos, pero después cuando el agrupamento es mayor, cada nuevo grafo solamente se nserta o se conecta con algunos grupos exstentes. 2. La densdad de conexones aumenta cuando se usa conocmento del domno. Este ncremento es cas constante a través de todo el proceso de construccón. Tempo de Construccón 78

17 Mnería de texto empleando la Semeanza entre Estructuras Semántcas Las gráfcas de crecmento del agrupamento y de densdad de conexones exponen algunas ventaas del uso de conocmento del domno en la construccón del agrupamento de los grafos conceptuales. Báscamente, estas gráfcas muestran que este conocmento permte encontrar grupos más grandes y más homogéneos (meor nterconectados). Estas ventaas tenen un costo prncpal: el tempo de construccón del agrupamento. En la fgura 7 se muestran los tempos de construccón de los agrupamentos de los conuntos de prueba. Allí se observa que el uso de conocmento del domno afecta consderablemente la rapdez del análss de los grafos. A pesar del aumento en el tempo de análss de los grafos conceptuales, la construccón de su agrupamento conceptual sgue sendo factble. Por eemplo, el tempo de nsercón del grafo 495 del conunto B en la erarquía conceptual necesto solamente de un segundo. Analzando la fgura 7 se determna que el tempo de nsercón de un grafo conceptual en el agrupamento, cuando no se usa conocmento del domno, es cas estable. Esto últmo nos permte suponer que el ncremento en el tempo de construccón cuando se usa conocmento del domno se orgna de una mala mplementacón del sstema (prncpalmente de la erarquía de conceptos); y que por lo tanto, un esfuerzo en esta dreccón permtrá meorar consderablemente el funconamento del método de mnería de texto propuesto. 5 Conclusones La mayoría de los métodos actuales de mnería de texto utlzan representacones sencllas del contendo de los textos, por eemplo lstas de palabras clave o tablas de datos. Estas representacones son relatvamente fácles de construr a partr de los textos, pero mpden representar varos detalles de su contendo. Como consecuenca, los resultados de estos sstemas, es decr, los patrones que con ellos se descubren, son poco descrptvos y de nvel temátco. Una dea generalzada para meorar la expresvdad de los resultados de los métodos de mnería de texto consste en emplear representacones de los textos más compleas que las palabras clave, es decr, representacones que consderen más tpos de elementos textuales. Sguendo esta dea, propusmos un método para hacer mnería de texto a nvel detalle. Este método tene la capacdad de usar grafos conceptuales para representar el contendo de los textos, y el potencal para trasladar los resultados, es decr, los patrones descubertos, del actual nvel temátco a un nvel mucho más descrptvo. Algunas contrbucones mportantes de esta nvestgacón son las sguentes: Se planteó, por prmera vez, el uso una representacón semántca, en especfco grafos conceptuales, en las tareas de mnería de texto. Se demostró que el uso de los grafos conceptuales, y en general de las representacones semántcas, en la mnería de texto es factble, pero sobre todo, benefcoso para meorar el nvel descrptvo de resultados. Se dseñó una nueva aproxmacón para realzar mnería de texto. Para ello se adaptaron algunos métodos de comparacón y agrupamento de grafos conceptuales para las tareas propas de mnería de texto; y se dseñaron nuevas estrategas para descubrr asocacones y detectar desvacones en un conunto de grafos conceptuales. 79

18 Manuel Montes y ómez segundos (a) Análss del conunto A rafos nsertados Snconocmentodedomno Conconocmentodedomno segundos (b) Análss del conunto B rafos nsertados Snconocmentodedomno Conconocmentodedomno Fg. 7. Tempo de construccón del agrupamento Así pues, esta nvestgacón contrbuyó al estado del arte de dversas áreas del conocmento, entre las que destacan la mnería de texto y la teoría de grafos conceptuales. Lmtacones del Método El método de mnería de texto propuesto en este trabao tene dos problemas que lmtan consderablemente su aplcacón. Estos problemas y sus lmtacones relaconadas se descrben a contnuacón. Prmer problema: El casamento de los grafos conceptuales es exponencal con respecto al número de conceptos comunes entre los dos grafos. Las prncpales lmtacones son: Análss de grafos conceptuales relatvamente pequeños, con unas cuantas decenas de nodos concepto. Esta lmtacón ndca que nuestro método de mnería de texto es más adecuado para analzar grafos conceptuales que representen algunas partes de los textos con un sgnfcado especal (por eemplo, descrpcones de eventos u opnones sobre algún tema) o los detalles más mportantes de su contendo, que para analzar grafos que ntenten representar completamente el contendo de los textos. El uso de erarquías de conceptos relatvamente pequeñas. Esta lmtacón se orgna por el sguente efecto: entre más grande es la erarquía de conceptos, más correspondencas elementos comunes entre los grafos pueden detectarse, y por lo tanto, mayor es la compledad del análss. 80

19 Mnería de texto empleando la Semeanza entre Estructuras Semántcas Una consecuenca mportante de esta lmtacón es la pérdda de nformacón, es decr, el uso de erarquías pequeñas puede ocasonar que no se detecten semeanzas posblemente nteresantes entre los grafos. Segundo problema: La transformacón automátca de los textos a grafos conceptuales no es una tarea senclla. Sus prncpales efectos son: Análss de textos cortos o sólo de algunas de sus partes. Esta lmtacón es una consecuenca drecta de los problemas de los métodos actuales de procesamento de textos (por eemplo, métodos de análss sntáctco y semántco). Báscamente, mplca que nuestro método de mnería de texto es más adecuado para el análss de textos cortos o de algunas partes de los textos con un sgnfcado especal. Análss de textos de un solo domno. La transformacón de un texto en grafo conceptual, como todo proceso que nvolucra el análss semántco de los textos, requere de certo conocmento del domno. Esto últmo sgnfca que es necesaro un consderable esfuerzo humano para trasladar el mecansmo de transformacón de los textos en grafos conceptuales, y por ende nuestro método de mnería de texto, de un domno a otro. 6 Rumbos de Investgacón Posteror En este trabao propusmos un esquema general para hacer mnería de texto usando grafos conceptuales, aunque nuestros esfuerzos se concentraron en la etapa de descubrmento. Por ello, gran parte del trabao futuro que se presenta a contnuacón consdera el desarrollo de las demás etapas del proceso de mnería de texto usando grafos conceptuales.. Desarrollar un método para transformar los textos en grafos conceptuales. Este método deberá ser flexble, de tal forma que permta transformar textos de dstntos domnos a grafos conceptuales sn la necesdad de un gran esfuerzo humano. Tambén deberá ser adaptvo, de tal forma que aprenda las dstntas maneras de comuncar la nformacón que se desea extraer y convertr a grafo conceptual. 2. Dseñar otros métodos para descubrr más patrones descrptvos en un conunto de grafos conceptuales. Estos métodos deberán consderar varas tareas de descubrmento que complementen las actuales, por eemplo: el análss de tendencas, la deteccón de contradccones y la clasfcacón de textos. 3. Desarrollar varos mecansmos de postprocesamento. En este sentdo deberán crearse algunos crteros para evaluar el nvel de utldad de los patrones descubertos, y tambén algunas nterfaces para vsualzar e nterpretar dchos resultados. Otras líneas de nvestgacón que se desprenden de este trabao consderan el uso de los métodos propuestos en este trabao en otras tareas de procesamento de textos. Por eemplo: 4. Aplcar el método de comparacón de grafos conceptuales en la búsqueda de nformacón para manear adecuadamente consultas compleas que consderen detalles del contendo de los textos. 5. Aplcar los nuestros métodos de análss de grafos conceptuales en la mnería semántca de la web. Referencas. Hearst (999), Untanglng Text Data Mnng, Proc. of ACL 99: The 37th Annual Meetng of the Assocaton for Computatonal Lngustcs, Unversty of Maryland, June 20-26,

Un método de agrupamiento de grafos conceptuales para minería de texto *

Un método de agrupamiento de grafos conceptuales para minería de texto * Un método de agrupamento de grafos conceptuales para mnería de texto * M. Montes-y-Gómez y A. Gelbukh Centro de Investgacón en Computacón (CIC IPN, Méxco. mmontesg@susu.naoep.mx, gelbukh@cc.pn.mx A. López-López

Más detalles

CAPÍTULO 4 MARCO TEÓRICO

CAPÍTULO 4 MARCO TEÓRICO CAPÍTULO 4 MARCO TEÓRICO Cabe menconar que durante el proceso de medcón, la precsón y la exacttud de cualquer magntud físca está lmtada. Esta lmtacón se debe a que las medcones físcas sempre contenen errores.

Más detalles

Medidas de Variabilidad

Medidas de Variabilidad Meddas de Varabldad Una medda de varabldad es un ndcador del grado de dspersón de un conjunto de observacones de una varable, en torno a la meda o centro físco de la msma. S la dspersón es poca, entonces

Más detalles

Operadores por Regiones

Operadores por Regiones Operadores por Regones Fltros por Regones Los fltros por regones ntentan determnar el cambo de valor de un píxel consderando los valores de sus vecnos I[-1,-1] I[-1] I[+1,-1] I[-1, I[ I[+1, I[-1,+1] I[+1]

Más detalles

ANEXO A: Método de Interpolación de Cokriging Colocado

ANEXO A: Método de Interpolación de Cokriging Colocado ANEXO A: Método de Interpolacón de Corgng Colocado A. Conceptos Báscos de Geoestadístca Multvarada La estmacón conunta de varables aleatoras regonalzadas, más comúnmente conocda como Corgng (Krgng Conunto),

Más detalles

CAPÍTULO III ACCIONES. Artículo 9º Clasificación de las acciones. Artículo 10º Valores característicos de las acciones. 10.

CAPÍTULO III ACCIONES. Artículo 9º Clasificación de las acciones. Artículo 10º Valores característicos de las acciones. 10. CAÍTULO III ACCIONES Artículo 9º Clasfcacón de las accones Las accones a consderar en el proyecto de una estructura o elemento estructural serán las establecdas por la reglamentacón específca vgente o

Más detalles

Detección de los patrones raros en un conjunto de datos semiestructurados

Detección de los patrones raros en un conjunto de datos semiestructurados Deteccón de los patrones raros en un conjunto de datos semestructurados M. Montes-y-Gómez 1, A. Gelbukh 1 y A. López-López 2 1 Centro de Investgacón en Computacón (CIC-IPN), Méxco. mmontesg@susu.naoep.mx,

Más detalles

Para dos variables x1 y x2, se tiene el espacio B 2 el que puede considerarse definido por: {0, 1}X{0, 1} = {(00), (01), (10), (11)}

Para dos variables x1 y x2, se tiene el espacio B 2 el que puede considerarse definido por: {0, 1}X{0, 1} = {(00), (01), (10), (11)} Capítulo 4 1 N-cubos 4.1. Representacón de una funcón booleana en el espaco B n. Los n-cubos representan a las funcones booleanas, en espacos n-dmensonales dscretos, como un subconjunto de los vértces

Más detalles

Capítulo 2: Introducción al método de los Elementos Finitos 2. CAPÍTULO 2 INTRODUCCIÓN AL MÉTODO DE LOS ELEMENTOS FINITOS

Capítulo 2: Introducción al método de los Elementos Finitos 2. CAPÍTULO 2 INTRODUCCIÓN AL MÉTODO DE LOS ELEMENTOS FINITOS Capítulo 2: Introduccón al método de los Elementos Fntos 2. CAPÍTULO 2 ITRODUCCIÓ AL MÉTODO DE LOS ELEMETOS FIITOS 2.. ITRODUCCIÓ Vrtualmente cada fenómeno en la naturaleza, sea bológco, geológco o mecánco

Más detalles

Apéndice A: Metodología para la evaluación del modelo de pronóstico meteorológico

Apéndice A: Metodología para la evaluación del modelo de pronóstico meteorológico Apéndce A: Metodología para la evaluacón del modelo de pronóstco meteorológco Apéndce A: Metodología para la evaluacón del modelo de pronóstco meteorológco Tabla de contendos Ap.A Apéndce A: Metodología

Más detalles

OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls. Examen Final

OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls. Examen Final OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls Examen Fnal Pregunta ( punto) Responda brevemente a las sguentes preguntas: a) Cuál es el obetvo en el aprendzae del Perceptron

Más detalles

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso CURSO ITERACIOAL: COSTRUCCIÓ DE ESCEARIOS ECOÓMICOS ECOOMETRÍA AVAZADA Instructor: Horaco Catalán Alonso Modelo de Regresón Lneal Smple El modelo de regresón lneal representa un marco metodológco, que

Más detalles

FISICOQUÍMICA FARMACÉUTICA (0108) UNIDAD 1. CONCEPTOS BÁSICOS DE CINÉTICA QUÍMICA

FISICOQUÍMICA FARMACÉUTICA (0108) UNIDAD 1. CONCEPTOS BÁSICOS DE CINÉTICA QUÍMICA FISICOQUÍMICA FARMACÉUTICA (008) UNIDAD. CONCEPTOS BÁSICOS DE CINÉTICA QUÍMICA Mtra. Josefna Vades Trejo 06 de agosto de 0 Revsón de térmnos Cnétca Químca Estuda la rapdez de reaccón, los factores que

Más detalles

Extracción de Atributos. Dr. Jesús Ariel Carrasco Ochoa Oficina 8311

Extracción de Atributos. Dr. Jesús Ariel Carrasco Ochoa Oficina 8311 Extraccón de Atrbutos Dr. Jesús Arel Carrasco Ochoa arel@naoep.mx Ofcna 8311 Contendo Introduccón PCA LDA Escalamento multdmensonal Programacón genétca Autoencoders Extraccón de atrbutos Objetvo Preprocesamento

Más detalles

Slide 1. Slide 2 Organización y Resumen de Datos. Slide 3. Universidad Diego Portales. Tablas de Frecuencia. Estadística I

Slide 1. Slide 2 Organización y Resumen de Datos. Slide 3. Universidad Diego Portales. Tablas de Frecuencia. Estadística I Slde 1 Unversdad Dego Portales Estadístca I Seccón II: Dstrbucones de Frecuenca y Representacón Gráfca Sgla: EST2500 Nombre Asgnatura: Estadístca I Slde 2 Organzacón y Resumen de Datos Como recordará,

Más detalles

3.- Programación por metas.

3.- Programación por metas. Programacón Matemátca para Economstas 1 3.- Programacón por metas. Una vez menconados algunos de los nconvenentes de las técncas generadoras, la ncorporacón de nformacón se va a traducr en una accón del

Más detalles

Pronósticos. Humberto R. Álvarez A., Ph. D.

Pronósticos. Humberto R. Álvarez A., Ph. D. Pronóstcos Humberto R. Álvarez A., Ph. D. Predccón, Pronóstco y Prospectva Predccón: estmacón de un acontecmento futuro que se basa en consderacones subjetvas, en la habldad, experenca y buen juco de las

Más detalles

CAPÍTULO IV. MEDICIÓN. De acuerdo con Székely (2005), existe dentro del período información

CAPÍTULO IV. MEDICIÓN. De acuerdo con Székely (2005), existe dentro del período información IV. Base de Datos CAPÍTULO IV. MEDICIÓN De acuerdo con Székely (2005), exste dentro del período 950-2004 nformacón representatva a nvel naconal que en algún momento se ha utlzado para medr la pobreza.

Más detalles

Espacios de Búsqueda en un Árbol Binario para Resolver Problemas de Optimización Discreta

Espacios de Búsqueda en un Árbol Binario para Resolver Problemas de Optimización Discreta Espacos de Búsueda en un Árbol Bnaro para Resolver Problemas de Optmzacón Dscreta María Elena Gómez-Torres J. Crspín Zavala-Díaz Marco Antono Cruz- Chávez 3 Insttuto Tecnológco de Zacatepec Calzada Insttuto

Más detalles

EL MÉTODO DE DIFERENCIAS FINITAS POR GUILLERMO HERNÁNDEZ GARCÍA

EL MÉTODO DE DIFERENCIAS FINITAS POR GUILLERMO HERNÁNDEZ GARCÍA EL MÉTODO DE DIFERENCIAS FINITAS POR GUILLERMO HERNÁNDEZ GARCÍA . El Método de Dferencas Fntas El Método consste en una aproxmacón de las dervadas parcales por expresones algebracas con los valores de

Más detalles

Estimación de incertidumbres en calibración de Osciladores

Estimación de incertidumbres en calibración de Osciladores Estmacón de ncertdumbres en calbracón de Oscladores J. Maurco López R. Dvsón de Tempo Frecuenca Centro Naconal de Metrología maurco.lopez@cenam.mx Resumen La frecuenca de salda de los oscladores debe ser

Más detalles

2. EL TENSOR DE TENSIONES. Supongamos un cuerpo sometido a fuerzas externas en equilibrio y un punto P en su interior.

2. EL TENSOR DE TENSIONES. Supongamos un cuerpo sometido a fuerzas externas en equilibrio y un punto P en su interior. . EL TENSOR DE TENSIONES Como se explcó prevamente, el estado tensonal en un punto nteror de un cuerpo queda defndo por 9 componentes, correspondentes a componentes por cada una de las tensones nternas

Más detalles

EXPERIMENTACIÓN COMERCIAL(I)

EXPERIMENTACIÓN COMERCIAL(I) EXPERIMENTACIÓN COMERCIAL(I) En un expermento comercal el nvestgador modfca algún factor (denomnado varable explcatva o ndependente) para observar el efecto de esta modfcacón sobre otro factor (denomnado

Más detalles

OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls

OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls Redes de Neuronas: Preparacón de datos para el aprendzaje y meddas de evaluacón 1. Preparacón de datos Característcas de los datos

Más detalles

PROYECTO DE TEORIA DE MECANISMOS. Análisis cinemático y dinámico de un mecanismo plano articulado con un grado de libertad.

PROYECTO DE TEORIA DE MECANISMOS. Análisis cinemático y dinámico de un mecanismo plano articulado con un grado de libertad. Nombre: Mecansmo: PROYECTO DE TEORIA DE MECANISMOS. Análss cnemátco y dnámco de un mecansmo plano artculado con un grado de lbertad. 10. Análss dnámco del mecansmo medante el método de las tensones en

Más detalles

Diagnóstico de Fortalezas y Debilidades Comunales

Diagnóstico de Fortalezas y Debilidades Comunales Dagnóstco de Fortalezas y Debldades Comunales Introduccón Los avances y mayores nveles de desarrollo que el país ha mostrado durante los últmos 15 años, se han traducdo, entre otros aspectos, en un aumento

Más detalles

Análisis de Resultados con Errores

Análisis de Resultados con Errores Análss de Resultados con Errores Exsten dos tpos de errores en los expermentos Errores sstemátcos errores aleatoros. Los errores sstemátcos son, desde lejos, los más mportantes. Errores Sstemátcos: Exsten

Más detalles

) para toda permutación (p p 1 p

) para toda permutación (p p 1 p 09 Elena J. Martínez do cuat. 004 Análss de la varanza de dos factores El problema anteror consderaba la comparacón de muestras para detectar dferencas entre las respectvas poblacones. En el modelo de

Más detalles

5. PROGRAMAS BASADOS EN RELACIONES DE RECURRENCIA.

5. PROGRAMAS BASADOS EN RELACIONES DE RECURRENCIA. Programacón en Pascal 5. PROGRAMAS BASADOS EN RELACIONES DE RECURRENCIA. Exsten numerosas stuacones que pueden representarse medante relacones de recurrenca; entre ellas menconamos las secuencas y las

Más detalles

FORMULARIO PARA LA PRESENTACIÓN DE RESUMEN DE PONENCIA

FORMULARIO PARA LA PRESENTACIÓN DE RESUMEN DE PONENCIA FORMULARIO PARA LA PRESENTACIÓN DE RESUMEN DE PONENCIA TÍTULO DE LA PONENCIA: Heterogenedad en los perfles de ngreso y retornos a la educacón superor en el Perú AUTOR: Gustavo Yamada, Juan F. Castro y

Más detalles

Tema 4: Variables aleatorias

Tema 4: Variables aleatorias Estadístca 46 Tema 4: Varables aleatoras El concepto de varable aleatora surge de la necesdad de hacer más manejables matemátcamente los resultados de los expermentos aleatoros, que en muchos casos son

Más detalles

Tema 6. Estadística descriptiva bivariable con variables numéricas

Tema 6. Estadística descriptiva bivariable con variables numéricas Clase 6 Tema 6. Estadístca descrptva bvarable con varables numércas Estadístca bvarable: tpos de relacón Relacón entre varables cuanttatvas Para dentfcar las característcas de una relacón entre dos varables

Más detalles

Circuitos eléctricos en corriente continúa. Subcircuitos equivalentes Equivalentes en Serie Equivalentes en Paralelo Equivalentes de Thevenin y Norton

Circuitos eléctricos en corriente continúa. Subcircuitos equivalentes Equivalentes en Serie Equivalentes en Paralelo Equivalentes de Thevenin y Norton ema II Crcutos eléctrcos en corrente contnúa Indce Introduccón a los crcutos resstvos Ley de Ohm Leyes de Krchhoff Ley de correntes (LCK) Ley de voltajes (LVK) Defncones adconales Subcrcutos equvalentes

Más detalles

CÁLCULO DEL BALANCE Y PÉRDIDAS DE ENERGIA EN CHILECTRA

CÁLCULO DEL BALANCE Y PÉRDIDAS DE ENERGIA EN CHILECTRA COMISIÓN DE INTEGRACIÓN ENERGÉTICA REGIONAL COMITÉ NACIONAL CHILENO V CIERTEC - SEMINARIO INTERNACIONAL SOBR E GESTIÓN DE PÉRDIDAS, EFICIENCIA ENERGÉTICA Y PROTECCIÓN DE LOS INGRESOS EN EL SECTOR ELÉCTRICO

Más detalles

Instituto Nacional de Estadísticas Chile METODOLOGÍA. Encuesta Estructural de Transporte por Carretera Año contable 2012

Instituto Nacional de Estadísticas Chile METODOLOGÍA. Encuesta Estructural de Transporte por Carretera Año contable 2012 Insttuto Naconal de Estadístcas Cle METODOLOGÍA Encuesta Estructural de Transporte por Carretera Año contable 0 Insttuto Naconal de Estadístcas 04 ÍNDICE I. METODOLOGÍA ENCUESTA ESTRUCTURAL DE TRANSPORTE

Más detalles

GERENCIA DE OPERACIONES Y PRODUCCIÓN DISEÑO DE NUEVOS PRODUCTOS Y SERVICIOS ESTRATEGIAS DE OPERACIONES

GERENCIA DE OPERACIONES Y PRODUCCIÓN DISEÑO DE NUEVOS PRODUCTOS Y SERVICIOS ESTRATEGIAS DE OPERACIONES GERENCIA DE OPERACIONES Y PRODUCCIÓN DISEÑO DE NUEVOS PRODUCTOS Y SERVICIOS ESTRATEGIAS DE OPERACIONES PRONÓSTICOS PREDICCIÓN, PRONÓSTICO Y PROSPECTIVA Predccón: estmacón de un acontecmento futuro que

Más detalles

Matemáticas Discretas

Matemáticas Discretas Coordnacón de Cencas Computaconales - INAOE Matemátcas Dscretas Cursos Propedéutcos 2010 Cencas Computaconales INAOE Dr. Lus Vllaseñor Pneda vllasen@naoep.mx http://ccc.naoep.mx/~vllasen Algo de nformacón

Más detalles

Fugacidad. Mezcla de gases ideales

Fugacidad. Mezcla de gases ideales Termodnámca del equlbro Fugacdad. Mezcla de gases deales rofesor: Alí Gabrel Lara 1. Fugacdad 1.1. Fugacdad para gases Antes de abarcar el caso de mezclas de gases, debemos conocer como podemos relaconar

Más detalles

CAPÍTULO IV. IV.1 Correlación de los resultados experimentales

CAPÍTULO IV. IV.1 Correlación de los resultados experimentales CAPÍTULO IV IV. Correlacón de los resultados expermentales La aplcacón de modelos de solucón para correlaconar los resultados que se obtenen en los expermentos, resulta de gran mportanca para amplar la

Más detalles

Hidrología superficial

Hidrología superficial Laboratoro de Hdráulca Ing. Davd Hernández Huéramo Manual de práctcas Hdrología superfcal 7o semestre Autores: Héctor Rvas Hernández Juan Pablo Molna Agular Rukmn Espnosa Díaz alatel Castllo Contreras

Más detalles

EL ANÁLISIS DE LA VARIANZA (ANOVA) 2. Estimación de componentes de varianza

EL ANÁLISIS DE LA VARIANZA (ANOVA) 2. Estimación de componentes de varianza EL ANÁLSS DE LA VARANZA (ANOVA). Estmacón de componentes de varanza Alca Maroto, Rcard Boqué Grupo de Qumometría y Cualmetría Unverstat Rovra Vrgl C/ Marcel.lí Domngo, s/n (Campus Sescelades) 43007-Tarragona

Más detalles

Enlaces de las Series de Salarios. Metodología

Enlaces de las Series de Salarios. Metodología Enlaces de las eres de alaros Metodología ntroduccón La Encuesta de alaros en la ndustra y los ervcos (E, cuyo últmo cambo de base se produjo en 996) ha sufrdo certas modfcacones metodológcas y de cobertura,

Más detalles

CI63G Planificación de Sistemas de Transporte Público Urbano. Clase 8 Semestre Otoño 2008

CI63G Planificación de Sistemas de Transporte Público Urbano. Clase 8 Semestre Otoño 2008 CI63G Planfcacón de Sstemas de Transporte Públco Urbano Clase 8 Semestre Otoño 2008 Undades Temátcas 1. La oferta de transporte públco urbano (2 semanas) 2. La demanda por TPU (1,5 sem.) 3. Dseño y optmzacón

Más detalles

Universidad Simón Bolívar Conversión de Energía Eléctrica - Prof. José Manuel Aller

Universidad Simón Bolívar Conversión de Energía Eléctrica - Prof. José Manuel Aller Unversdad Smón Bolívar Conversón de Energía Eléctrca Prof José anuel Aller 41 Defncones báscas En este capítulo se estuda el comportamento de los crcutos acoplados magnétcamente, fjos en el espaco El medo

Más detalles

ENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 2013 INSTITUTO NACIONAL DE ESTADÍSTICAS

ENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 2013 INSTITUTO NACIONAL DE ESTADÍSTICAS METODOLOGÍA ENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 013 INSTITUTO NACIONAL DE ESTADÍSTICAS 015 ÍNDICE I. METODOLOGÍA ENCUESTA ESTRUCTURAL DE TRANSPORTE INTERURBANO DE PASAJEROS POR

Más detalles

3 LEYES DE DESPLAZAMIENTO

3 LEYES DE DESPLAZAMIENTO eyes de desplazamento EYES DE DESPAZAMIENTO En el capítulo dos se expone el método de obtencón de las leyes de desplazamento dseñadas por curvas de Bézer para mecansmos leva palpador según el planteamento

Más detalles

Propuesta de diseño de la subasta de Temporada Abierta Diciembre 2016

Propuesta de diseño de la subasta de Temporada Abierta Diciembre 2016 Introduccón Propuesta de dseño de la subasta de Temporada Aberta Dcembre 2016 1. En la prmera subasta de temporada aberta se ofrecerá el transporte y almacenamento de gasolnas y désel en las zonas 1 Rosarto

Más detalles

CÁLCULO DE INCERTIDUMBRE EN MEDIDAS FÍSICAS: MEDIDA DE UNA MASA

CÁLCULO DE INCERTIDUMBRE EN MEDIDAS FÍSICAS: MEDIDA DE UNA MASA CÁLCULO DE INCERTIDUMBRE EN MEDIDAS FÍSICAS: MEDIDA DE UNA MASA Alca Maroto, Rcard Boqué, Jord Ru, F. Xaver Rus Departamento de Químca Analítca y Químca Orgánca Unverstat Rovra Vrgl. Pl. Imperal Tàrraco,

Más detalles

Gráficos de flujo de señal

Gráficos de flujo de señal Gráfcos de flujo de señal l dagrama de bloques es útl para la representacón gráfca de sstemas de control dnámco y se utlza extensamente en el análss y dseño de sstemas de control. Otro procedmento alternatvo

Más detalles

Sistemas Lineales de Masas-Resortes 2D

Sistemas Lineales de Masas-Resortes 2D Sstemas neales de Masas-Resortes D José Cortés Pareo. Novembre 7 Un Sstema neal de Masas-Resortes está consttudo por una sucesón de puntos (de ahí lo de lneal undos cada uno con el sguente por un resorte

Más detalles

Tipología de nudos y extremos de barra

Tipología de nudos y extremos de barra Tpología de nudos y extremos de barra Apelldos, nombre Basset Salom, Lusa (lbasset@mes.upv.es) Departamento Centro ecánca de edos Contnuos y Teoría de Estructuras Escuela Técnca Superor de Arqutectura

Más detalles

Generación de e Modelos 3D a Partir de e Datos de e Rango de e Vistas Parciales.

Generación de e Modelos 3D a Partir de e Datos de e Rango de e Vistas Parciales. Generacón de e Modelos 3D a Partr de e Datos de e Rango de e Vstas Parcales. Santago Salamanca Mño Escuela de Ingenerías Industrales Unversdad de Extremadura (UNED, UCLM, UEX) Introduccón (I) Qué es un

Más detalles

Un estimado de intervalo o intervalo de confianza ( IC

Un estimado de intervalo o intervalo de confianza ( IC Un estmado puntual, por ser un sólo número, no proporcona por sí msmo nformacón alguna sobre la precsón y confabldad de la estmacón. Debdo a la varabldad que pueda exstr en la muestra, nunca se tendrá

Más detalles

ENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 2011 INSTITUTO NACIONAL DE ESTADÍSTICAS

ENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 2011 INSTITUTO NACIONAL DE ESTADÍSTICAS METODOLOGÍA ENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 0 INSTITUTO NACIONAL DE ESTADÍSTICAS 03 ÍNDICE I. METODOLOGÍA ENCUESTA ESTRUCTURAL DE TRANSPORTE INTERURBANO DE PASAJEROS POR CARRETERA.

Más detalles

ESTADÍSTICA. Definiciones

ESTADÍSTICA. Definiciones ESTADÍSTICA Defncones - La Estadístca es la cenca que se ocupa de recoger, contar, organzar, representar y estudar datos referdos a una muestra para después generalzar y sacar conclusones acerca de una

Más detalles

CAPITULO 3º SOLUCIÓN ECUACIÓN DE ESTADO- 01. Ing. Diego A. Patiño G. M.Sc, Ph.D.

CAPITULO 3º SOLUCIÓN ECUACIÓN DE ESTADO- 01. Ing. Diego A. Patiño G. M.Sc, Ph.D. CAPITULO 3º SOLUCIÓN ECUACIÓN DE ESTADO- 0 Ing. Dego A. Patño G. M.Sc, Ph.D. Solucón de la Ecuacón de Estado Solucón de Ecuacones de Estado Estaconaras: Para el caso estaconaro (nvarante en el tempo),

Más detalles

SISTEMA DIÉDRICO I Intersección de planos y de recta con plano TEMA 8 INTERSECCIONES. Objetivos y orientaciones metodológicas. 1.

SISTEMA DIÉDRICO I Intersección de planos y de recta con plano TEMA 8 INTERSECCIONES. Objetivos y orientaciones metodológicas. 1. Objetvos y orentacones metodológcas SISTEMA DIÉDRICO I Interseccón de planos y de recta con plano TEMA 8 Como prmer problema del espaco que presenta la geometría descrptva, el alumno obtendrá la nterseccón

Más detalles

Reconciliación de datos experimentales. MI5022 Análisis y simulación de procesos mineralúgicos

Reconciliación de datos experimentales. MI5022 Análisis y simulación de procesos mineralúgicos Reconclacón de datos expermentales MI5022 Análss y smulacón de procesos mneralúgcos Balances Balances en una celda de flotacón En torno a una celda de flotacón (o un crcuto) se pueden escrbr los sguentes

Más detalles

SEMANA 13. CLASE 14. MARTES 20/09/16

SEMANA 13. CLASE 14. MARTES 20/09/16 SEMAA 3. CLASE. MARTES 20/09/6. Defncones de nterés.. Estadístca descrptva. Es la parte de la Estadístca que se encarga de reunr nformacón cuanttatva concernente a ndvduos, grupos, seres de hechos, etc..2.

Más detalles

El diodo Semiconductor

El diodo Semiconductor El dodo Semconductor J.I. Hurcán Unversdad de La Frontera Aprl 9, 2012 Abstract Se plantean procedmentos para analzar crcutos con dodos. Para smpl car el trabajo, el dodo semconductor es reemplazado por

Más detalles

SEGUNDA PARTE RENTAS FINANCIERAS

SEGUNDA PARTE RENTAS FINANCIERAS SEGUNDA PARTE RENTAS FINANCIERAS 5 INTRODUCCIÓN A LA TEORÍA DE RENTAS 5.1 CONCEPTO: Renta fnancera: conjunto de captales fnanceros cuyos vencmentos regulares están dstrbudos sucesvamente a lo largo de

Más detalles

UNIVERSIDAD TECNOLÓGICA DE PANAMÁ H. R. Alvarez A., Ph. D.

UNIVERSIDAD TECNOLÓGICA DE PANAMÁ H. R. Alvarez A., Ph. D. Qué es capacdad? La cantdad de producto, sea este tangble o ntangble, que puede producrse bajo condcones dadas de operacón Las meddas relatvas al producto son normalmente utlzadas por organzacones enfocadas

Más detalles

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1 Tema 8 - Estadístca - Matemátcas CCSSI 1º Bachllerato 1 TEMA 8 - ESTADÍSTICA 8.1 NOCIONES GENERALES DE ESTADÍSTICA 8.1.1 INTRODUCCIÓN Objetvo: La estadístca tene por objeto el desarrollo de técncas para

Más detalles

Equilibrio fásico. (b) El sistema heterogéneo se considera aislado.

Equilibrio fásico. (b) El sistema heterogéneo se considera aislado. Termodnámca del equlbro Equlbro fásco Profesor: lí Lara En el área de Ingenería Químca exsten muchos procesos ndustrales en los cuales está nvolucrado el equlbro entre fases. Una de estas operacones es

Más detalles

CAPÍTULO II Métodos experimentales

CAPÍTULO II Métodos experimentales CAPÍTULO II Métodos expermentales En este capítulo se descrbe la técnca expermental para la obtencón y representacón de dagramas líqudo-líqudo de sstemas ternaros y cuaternaros y el equpo expermental utlzado.

Más detalles

Sistema Evolutivo Generador De Bases De Conocimiento

Sistema Evolutivo Generador De Bases De Conocimiento Sstema Evolutvo Generador De Bases De Conocmento Área de conocmento: Sstemas Basados en Conocmento Guadalupe Gaxola Castro 1, Olaf Yadr Cazarez Saraba 2, Jesús Manuel Olvares Ceja 3 1 Unversdad Autónoma

Más detalles

Probabilidad Grupo 23 Semestre Segundo examen parcial

Probabilidad Grupo 23 Semestre Segundo examen parcial Probabldad Grupo 3 Semestre 015- Segundo examen parcal La tabla sguente presenta 0 postulados, algunos de los cuales son verdaderos y otros son falsos. Analza detendamente cada postulado y elge tu respuesta

Más detalles

H 0 : La distribución poblacional es uniforme H 1 : La distribución poblacional no es uniforme

H 0 : La distribución poblacional es uniforme H 1 : La distribución poblacional no es uniforme Una hpótess estadístca es una afrmacón con respecto a una característca que se desconoce de una poblacón de nterés. En la seccón anteror tratamos los casos dscretos, es decr, en forma exclusva el valor

Más detalles

Problema: Existe relación entre el estado nutricional y el rendimiento académico de estudiantes de enseñanza básica?

Problema: Existe relación entre el estado nutricional y el rendimiento académico de estudiantes de enseñanza básica? Relacones entre varables cualtatvas Problema: xste relacón entre el estado nutrconal y el rendmento académco de estudantes de enseñanza básca? stado Nutrconal Malo Regular Bueno TOTAL Bajo 13 95 3 55 Rendmento

Más detalles

Adquisición y Tratamiento de Datos (Febrero 2005). 1ª parte: Cuestiones.

Adquisición y Tratamiento de Datos (Febrero 2005). 1ª parte: Cuestiones. Adquscón y Tratamento de Datos (Febrero 2005). Las cuestones: 1ª parte: Cuestones. Se deben responder en la hoja adjunta. Debe marcarse una únca respuesta. Por favor, leer los enuncados y las solucones

Más detalles

Interacción de Métodos Teóricos, Numéricos y Experimentales en el Rediseño y Análisis de un Elemento Estructural Hecho de Materiales Compuestos.

Interacción de Métodos Teóricos, Numéricos y Experimentales en el Rediseño y Análisis de un Elemento Estructural Hecho de Materiales Compuestos. Interaccón de Métodoeórcos, Numércos y Expermentales en el Redseño y Análss de un Elemento Estructural Hecho de Materales ompuestos. Juan arlos Valdés alazar McME Gerente de Ingenería y Desarrollo PADA

Más detalles

Población 1. Población 1. Población 2. Población 2. Población 1. Población 1. Población 2. Población 2. Frecuencia. Frecuencia

Población 1. Población 1. Población 2. Población 2. Población 1. Población 1. Población 2. Población 2. Frecuencia. Frecuencia MAT-3 Estadístca I Tema : Meddas de Dspersón Facltador: Félx Rondón, MS Insttuto Especalzado de Estudos Superores Loyola Introduccón Las meddas de tendenca central son ndcadores estadístcos que resumen

Más detalles

Facultad de Ciencias Básicas

Facultad de Ciencias Básicas Facultad de Cencas Báscas ANÁLISIS GRÁFICO DE DATOS EXPERIMENTALES OBJETIVO: Representar gráfcamente datos expermentales. Ajustar curvas a datos expermentales. Establecer un crtero para el análss de grafcas

Más detalles

ESTADISTÍCA. 1. Población, muestra e individuo. 2. Variables estadísticas. 3. El proceso que se sigue en estadística

ESTADISTÍCA. 1. Población, muestra e individuo. 2. Variables estadísticas. 3. El proceso que se sigue en estadística ESTADISTÍCA. Poblacón, muestra e ndvduo Las característcas de una dstrbucón se pueden estudar drectamente sobre la poblacón o se pueden nferr a partr de l estudo de una muestra. Poblacón estadístca es

Más detalles

Universidad Diego Portales Facultad de Economía y Empresa

Universidad Diego Portales Facultad de Economía y Empresa Unversdad Dego Portales Profesor: Carlos R. Ptta Hasta este momento nos hemos enfocado en juegos en los cuales cualquer nformacón que es conocda por un jugador es conocda por todos los demás (es decr,

Más detalles

FE DE ERRATAS Y AÑADIDOS AL LIBRO FUNDAMENTOS DE LAS TÉCNICAS MULTIVARIANTES (Ximénez & San Martín, 2004)

FE DE ERRATAS Y AÑADIDOS AL LIBRO FUNDAMENTOS DE LAS TÉCNICAS MULTIVARIANTES (Ximénez & San Martín, 2004) FE DE ERRATAS Y AÑADIDOS AL LIBRO FUNDAMENTOS DE LAS TÉCNICAS MULTIVARIANTES (Xménez & San Martín, 004) Capítulo. Nocones báscas de álgebra de matrces Fe de erratas.. Cálculo de la transpuesta de una matrz

Más detalles

16.21 Técnicas de diseño y análisis estructural. Primavera 2003 Unidad 8 Principio de desplazamientos virtuales

16.21 Técnicas de diseño y análisis estructural. Primavera 2003 Unidad 8 Principio de desplazamientos virtuales 16.21 Técncas de dseño y análss estructural Prmavera 2003 Undad 8 Prncpo de desplazamentos vrtuales Prncpo de desplazamentos vrtuales Tengamos en cuenta un cuerpo en equlbro. Sabemos que el campo de esfuerzo

Más detalles

Introducción a la Física. Medidas y Errores

Introducción a la Física. Medidas y Errores Departamento de Físca Unversdad de Jaén Introduccón a la Físca Meddas y Errores J.A.Moleón 1 1- Introduccón La Físca y otras cencas persguen la descrpcón cualtatva y cuanttatva de los fenómenos que ocurren

Más detalles

CARTAS DE CONTROL. Han sido difundidas exitosamente en varios países dentro de una amplia variedad de situaciones para el control del proceso.

CARTAS DE CONTROL. Han sido difundidas exitosamente en varios países dentro de una amplia variedad de situaciones para el control del proceso. CARTAS DE CONTROL Las cartas de control son la herramenta más poderosa para analzar la varacón en la mayoría de los procesos. Han sdo dfunddas extosamente en varos países dentro de una ampla varedad de

Más detalles

Figura 1

Figura 1 5 Regresón Lneal Smple 5. Introduccón 90 En muchos problemas centífcos nteresa hallar la relacón entre una varable (Y), llamada varable de respuesta, ó varable de salda, ó varable dependente y un conjunto

Más detalles

Dpto. Física y Mecánica

Dpto. Física y Mecánica Dpto. Físca y Mecánca Mecánca analítca Introduccón Notacón Desplazamento y fuerza vrtual Fuerza de lgadura Trabao vrtual Energía cnétca. Ecuacones de Lagrange Prncpode los trabaos vrtuales Prncpo de D

Más detalles

Capítulo 2: ANALISIS EXPLORATORIO de DATOS Estadística Computacional 1º Semestre 2003

Capítulo 2: ANALISIS EXPLORATORIO de DATOS Estadística Computacional 1º Semestre 2003 Unversdad Técnca Federco Santa María Departamento de Informátca ILI-80 Capítulo : ANALISIS EXPLORATORIO de DATOS Estadístca Computaconal º Semestre 003 Profesor :Héctor Allende Págna : www.nf.utfsm.cl/~hallende

Más detalles

FORMA TRADICIONAL DE CÁLCULO DE DESPLAZAMIENTOS Y FUERZAS EN ESTRUCTURAS SIN MAMPOSTERÍA RESUMEN

FORMA TRADICIONAL DE CÁLCULO DE DESPLAZAMIENTOS Y FUERZAS EN ESTRUCTURAS SIN MAMPOSTERÍA RESUMEN CAPITULO 1 FORMA TRADICIONAL DE CÁLCULO DE DESPLAZAMIENTOS Y FUERZAS EN ESTRUCTURAS SIN MAMPOSTERÍA RESUMEN En la actualdad los métodos de dseño estructural y las consderacones que se realzan prevas al

Más detalles

TRABAJO Y ENERGÍA INTRODUCCIÓN. requiere como varia la fuerza durante el movimiento. entre los conceptos de fuerza y energía mecánica.

TRABAJO Y ENERGÍA INTRODUCCIÓN. requiere como varia la fuerza durante el movimiento. entre los conceptos de fuerza y energía mecánica. TRABAJO Y ENERGÍA INTRODUCCIÓN La aplcacón de las leyes de Newton a problemas en que ntervenen fuerzas varables requere de nuevas herramentas de análss. Estas herramentas conssten en los conceptos de trabajo

Más detalles

Un ejemplo de Análisis Factorial de Correspondencias

Un ejemplo de Análisis Factorial de Correspondencias Estadístca Anàls de Dades (curs 001-00) Un ejemplo de Análss Factoral de Correspondencas Se trata de estudar la estructura de las ventas de una empresa que dstrbuye 10 productos en 8 mercados. Para ello

Más detalles

Grafos. Conceptos básicos

Grafos. Conceptos básicos Grafos Se presenta en este módulo, como lectura complementara a los capítulos de Grafos del texto de clase: una lsta de conceptos que deben ser defndos con precsón por los alumnos, los elementos necesaros

Más detalles

Reconocimiento de Locutor basado en Procesamiento de Voz. ProDiVoz Reconocimiento de Locutor 1

Reconocimiento de Locutor basado en Procesamiento de Voz. ProDiVoz Reconocimiento de Locutor 1 Reconocmento de Locutor basado en Procesamento de Voz ProDVoz Reconocmento de Locutor Introduccón Reconocmento de locutor: Proceso de extraccón automátca de nformacón relatva a la dentdad de la persona

Más detalles

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio. Tema 9 - Estadístca - Matemátcas B 4º E.S.O. 1 TEMA 9 - ESTADÍSTICA 9.1 DOS RAMAS DE LA ESTADÍSTICA 9.1.1 - INTRODUCCIÓN Objetvo: La estadístca tene por objeto el desarrollo de técncas para el conocmento

Más detalles

Cinemática del Brazo articulado PUMA

Cinemática del Brazo articulado PUMA Cnemátca del Brazo artculado PUMA José Cortés Parejo. Enero 8. Estructura del brazo robótco El robot PUMA de la sere es un brazo artculado con artculacones rotatoras que le proporconan grados de lbertad

Más detalles

Capitalización y descuento simple

Capitalización y descuento simple Undad 2 Captalzacón y descuento smple 2.1. Captalzacón smple o nterés smple 2.1.1. Magntudes dervadas 2.2. Intereses antcpados 2.3. Cálculo de los ntereses smples. Métodos abrevados 2.3.1. Método de los

Más detalles

VISIÓN POR COMPUTADOR

VISIÓN POR COMPUTADOR Escuela Poltécnca Superor de Elche VISIÓN POR COMPUTADOR Grado en Electrónca y Automátca Industral PRÁCTICAS TITERE Práctca 4: Segmentacón, Localzacón y Reconocmento de Obetos Departamento de Ingenería

Más detalles

Agrupamiento de puntos de venta en una red de distribución

Agrupamiento de puntos de venta en una red de distribución Agrupamento de puntos de venta en una red de dstrbucón Utlzando el Método de grafos y la Generacón de cortes para su solucón a través del lenguaje de modelacón AMPL. 26/Ago./04 Presenta: Aracel Ramírez

Más detalles

CAPÍTULO 5 MÉTODO DE LA FUNCIÓN ELÍPTICA DE JACOBI

CAPÍTULO 5 MÉTODO DE LA FUNCIÓN ELÍPTICA DE JACOBI CAPÍTULO 5: MÉTODO DE LA FUNCIÓN ELÍPTICA DE JACOBI 57 CAPÍTULO 5 MÉTODO DE LA FUNCIÓN ELÍPTICA DE JACOBI 5. Resumen Se busca solucón a las ecuacones acopladas que descrben los perfles de onda medante

Más detalles

Estimación no lineal del estado y los parámetros

Estimación no lineal del estado y los parámetros Parte III Estmacón no lneal del estado y los parámetros 1. Estmacón recursva El ltro de Kalman extenddo 12 es una técnca muy utlzada para la la estmacón recursva del estado de sstemas no lneales en presenca

Más detalles

Estas medidas serán más significativas cuanto más homogéneos sean los datos y pueden ser engañosas cuando mezclamos poblaciones distintas.

Estas medidas serán más significativas cuanto más homogéneos sean los datos y pueden ser engañosas cuando mezclamos poblaciones distintas. UIDAD 3: Meddas estadístcas Las meddas estadístcas o parámetros estadístcos son valores representatvos de una coleccón de datos y que resumen en unos pocos valores la normacón del total de datos. Estas

Más detalles

APLICACIÓN DEL ANALISIS INDUSTRIAL EN CARTERAS COLECTIVAS DE VALORES

APLICACIÓN DEL ANALISIS INDUSTRIAL EN CARTERAS COLECTIVAS DE VALORES APLICACIÓN DEL ANALISIS INDUSTRIAL EN CARTERAS COLECTIVAS DE VALORES Documento Preparado para la Cámara de Fondos de Inversón Versón 203 Por Rodrgo Matarrta Venegas 23 de Setembre del 204 2 Análss Industral

Más detalles

Optimización de la ecualización del histograma en el procesamiento de imágenes digitales

Optimización de la ecualización del histograma en el procesamiento de imágenes digitales Optmzacón de la ecualzacón del hstograma en el procesamento de mágenes dgtales Roberto Depaol Lus A. Fernández Danel Daz rd-ng@unlm.edu.ar lfernand@unlm.edu.ar ddaz@unlm.edu.ar Departamento de Ingenería

Más detalles

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS. Métodos multivariantes en control estadístico de la calidad

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS. Métodos multivariantes en control estadístico de la calidad UNIVERSIDAD NAIONAL MAYOR DE SAN MAROS FAULTAD DE IENIAS MATEMÁTIAS E.A.P. DE ESTADÍSTIA Métodos multvarantes en control estadístco de la caldad apítulo IV. Gráfcos de control MUSUM TRABAJO MONOGRÁFIO

Más detalles

Simposio de Metrología 25 al 27 de Octubre de 2006

Simposio de Metrología 25 al 27 de Octubre de 2006 Smposo de Metrología 25 al 27 de Octubre de 2006 ESTIMACIÓN DE INCERTIDUMBRE EN LA MEDICIÓN DE ABSORCIÓN DE HUMEDAD EN AISLAMIENTOS Y CUBIERTAS PROTECTORAS DE CONDUCTORES ELÉCTRICOS POR EL MÉTODO ELÉCTRICO

Más detalles