METODOS PARA OBTENER CONOCIMIENTO UTILIZANDO REDES BAYESIANAS Y PROCESOS DE APRENDIZAJE CON ALGORITMOS EVOLUTIVOS.

Tamaño: px
Comenzar la demostración a partir de la página:

Download "METODOS PARA OBTENER CONOCIMIENTO UTILIZANDO REDES BAYESIANAS Y PROCESOS DE APRENDIZAJE CON ALGORITMOS EVOLUTIVOS."

Transcripción

1 METODOS PARA OBTENER CONOCIMIENTO UTILIZANDO REDES BAYESIANAS Y PROCESOS DE APRENDIZAJE CON ALGORITMOS EVOLUTIVOS. Departamento de Lenguajes y Sstemas Informátcos. Memora de Investgacón presentada por D. Francsco Roche Beltrán para superar la fase de nvestgacón del programa de doctorado. Tutor: Dr. D. José Crstóbal Rquelme Santos. Sevlla, Septembre 00

2 INDICE.-.- Introduccón Planteamento y relevanca del problema Aspectos resueltos y por resolver Comparatva de propuestas Árboles de decsón Sstemas basados en reglas Lstas de decsón Redes neuronales Aprendzaje basado en ejemplos Redes bayesanas Conclusones Técncas bayesanas Introduccón Conceptos báscos V. a. dscretas/contnuas Regla de multplcacón Teorema de Bayes Hpótess MAP y ML Clasfcadores bayesanos Clasfcador óptmo Clasfcador nave Dependenca/ndependenca condconal Redes bayesanas Introduccón Obtencón de redes bayesanas Cálculo de la red más probable Cálculo de P(D M para una red bayesana V. a. con sólo dos valores V. a. con n valores Métrca BD y K Búsqueda del mejor modelo Inferenca Proyecto de nvestgacón Introduccón Dscretzacón Caso general Aplcacón para un atrbuto Ajuste de parámetros Test de valdacón cruzada Generacón de la red bayesana Trabajos pendentes... 78

3 7.- Revsón Bblográfca Personas y foros relaconados ANEXO Introduccón Desarrollo del trabajo Ajuste de parámetros

4 .- INTRODUCCIÓN.- 4

5 Con la revolucón dgtal capturar nformacón es fácl y almacenarla es extremadamente barato. Almacenamos datos porque pensamos que son un actvo valoso por sí msmos. Para los centífcos, los datos representan observacones cudadosamente recogdas de algún fenómeno en estudo. En los negocos, los datos guardan nformacones sobre mercados, competdores y clentes. En procesos ndustrales recogen valores sobre el funconamento de determnados procesos. Sn embargo, en general, los datos en bruto raramente son provechosos. Su verdadero valor radca en la posbldad de extraer nformacón útl para la toma de decsones o la exploracón y comprensón de los fenómenos que deron lugar a los datos. Tradconalmente, el análss de estos datos ha sdo efectuado medante técncas estadístcas. No obstante, el ncremento en la cantdad de datos y en el número de parámetros hace necesara la aparcón de nuevas metodologías y herramentas para un tratamento automátco de los regstros depostados en bases de datos. Estas técncas se engloban bajo la etqueta de machne learnng, smultáneamente surge el nombre más comercal de mnería de datos (data mnng. La automatzacón de los procesos de aprendzaje por un área de nvestgacón de la ntelgenca artfcal se conoce como machne learnng (ML o aprendzaje automátco. En aprendzaje supervsado, las técncas de ML buscan descrpcones para las clases ya defndas por el usuaro, y en aprendzaje no supervsado se construye un resumen del fchero de entrenamento como un conjunto de las clases descubertas junto con su descrpcón. Esta búsqueda de descrpcones se realza usando estrategas de búsqueda teratva en el conjunto de todas las descrpcones posbles. Este proceso consste en la formulacón de una hpótess ncal que se verfca medante alguna funcón de caldad. Esta funcón, normalmente basada en técncas estadístcas, calcula la correccón de la hpótess respecto del conjunto de entrenamento. Entonces, la hpótess puede ser aceptada, rechazada o mejorada hasta que se encuentre una hpótess correcta. La mejora de las hpótess durante este proceso puede ser llevada a cabo medante la generalzacón de condcones o la adcón o sustraccón de condcones sobre atrbutos. Un sstema de ML usa un pequeño conjunto de ejemplos de laboratoro cudadosamente selecconados y, algunas veces, tene la habldad de nteractuar con el entorno con el fn de consegur nuevos ejemplos para nvestgar el comportamento bajo condcones partculares. Un sstema de ML tene tres componentes báscos: una representacón o modelo del conocmento aprenddo, una funcón que mda la caldad de ese aprendzaje y un algortmo de búsqueda para dado un modelo y una funcón de caldad encontrar la mejor nstancacón posble. 5

6 VISION GENERAL DATOS Informacón Conocmento Decsón Data Mnng (DM es la búsqueda de relacones y patrones globales que exsten en grandes bases de datos pero que se encuentran "ocultas" entre grandes cantdades de datos. Estas relacones representan un conocmento valoso sobre la base de datos y los objetos de ésta y, s la base de datos es un espejo fel, del mundo real regstrado por la base de datos. Uno de los prncpales problemas del DM es que el número de posbles relacones es muy grande, así que la búsqueda de las correctas por valdacón de cada una de ellas es computaconalmente prohbtvo. Así que se necestarán estrategas de búsqueda ntelgente que son tomadas del área de machne learnng o aprendzaje automátco. En general, las tareas de un proceso de DM pueden ser clasfcadas en dos categorías: descrptvas y predctvas. Las prmeras descrben el conjunto de datos de una manera resumda y concsa y presentan propedades generales e nteresantes de los datos. Por el contraro, las tareas predctvas construyen uno o varos modelos que realzan nferenca sobre el conjunto de entrenamento para ntentar predecr el comportamento de nuevos datos. Un sstema de DM pueden llevar a cabo una o más de las sguentes tareas:. Descrpcón de clases. Medante esta tarea se proporcona un concso y sucnto resumen de una coleccón de datos o caracterzacón y la posbldad de dstngurlos de otros o dscrmnacón. Un ejemplo smple es obtener la meda y la desvacón típca de cada parámetro para cada clase. Un ejemplo más sofstcado lo consttuyen las técncas de vsualzacón en múltples dmensones. 6

7 . Asocacón o descubrmento de relacones o correlacones entre un conjunto de datos. Estas normalmente se expresan en forma de regla mostrando condcones que relaconan valores de los atrbutos y que ocurren frecuentemente entre los datos. Una regla de asocacón tene la forma X Y que debe ser nterpretada como "los datos que satsfacen X probablemente satsfacen Y". 3. Clasfcacón o análss de un conjunto de entrenamento con clase conocda y construye un modelo para cada clase. Un árbol de decsón o un conjunto de reglas de clasfcacón se genera medante un proceso de clasfcacón, que puede usarse para una mejor comprensón de cada clase o para la clasfcacón de futuros datos. 4. Predccón o regresón. Esta tarea proporcona posbles valores para datos desconocdos o ausentes o la dstrbucón de valores de certos atrbutos en un conjunto de objetos, ncluyendo la posbldad de encontrar los atrbutos relevantes o nteresantes para determnados casos. 5. Clusterng o dentfcacón de subconjuntos de objetos que tenen datos smlares entre sí. Un buen método de clusterng es aquel que consgue una baja smlardad ntercluster y una alta smlardad ntra-cluster. 6. Análss de seres temporales: búsqueda de regulardades, secuencas o subsecuencas smlares, perodcdad y tendencas en datos que dependen del tempo. Un proceso de DM consste báscamente en ajustar modelos y/o determnar patrones a partr de unos datos. Todo algortmo de DM tene los msmos tres componentes que un proceso de ML: El modelo con dos factores relevantes: la funcón que se desee desempeñe (v. gr. clasfcacón, clusterng, etc. y la forma (funcón lneal, conjunto de reglas,... El crtero de preferenca o funcón de bondad para ajustar el modelo a los datos. El algortmo de búsqueda para ajustar los parámetros de un modelo partcular a unos datos y una funcón de ajuste. 7

8 .- PLANTEAMIENTO Y RELEVANCIA DEL PROBLEMA.- 8

9 En la fgura se presenta un esquema del sstema. Báscamente se trata de un sstema de flujo de gases que contene azufre en mayor o menor medda. Sometendo a estos gases a los procesos adecuados puede aprovecharse ese azufre para producr ácdo sulfúrco en lugar de dejarlo escapar a la atmósfera, de esta forma se contrbuye a proteger el medo ambente a la vez que se dspone de un producto comercalzable. Fgura : Sstema de produccón de ácdo sulfúrco En el sstema exsten productores y consumdores de gases. El proceso consste en canalzar adecuadamente los gases que generan los productores haca los consumdores de manera que no haya excedente de produccón a la vez que se atenden las necesdades de los consumdores. Los gases producdos son conducdos a la Cámara de Mezcla (CM a partr de la cual se dstrbuyen a los dstntos consumdores según sus necesdades. Como productores tenemos el Horno Flash (HF en donde se produce el cobre y se genera SO y los Convertdores (CV, CV, CV3 y CV4. Como consumdores están las tres plantas de la Fábrca de Ácdo SO 4 H (RTM, RTM y RTM3. Cada uno de los productores y consumdores consttuye un subsstema completo y muy complejo dentro de la empresa. 9

10 Los gases se conducen de un punto a otro a través de soplantes, de forma que se dce que el extremo haca el cual la soplante actúa tene presón, mentras que el extremo contraro tene tro. Es de vtal mportanca que en la cámara de mezcla sempre haya tro, ya que un aumento de presón puede producr que los gases escapen a la atmósfera, lo cual hay que evtar en todo momento. Debdo a la complejdad del sstema y al gran número de parámetros y stuacones que se dan contnuamente hay veces que el sstema no es estable durante un tempo determnado. Durante este tempo es posble que haya un aumento de presón en la cámara de mezcla. Aunque en la actualdad se toman todas las meddas oportunas para evtar que esto ocurra, sería deseable prever o conocer las crcunstancas que provocan que se produzca alguna nestabldad en el tro de la cámara de mezcla. Se ha ntentado resolver el problema, pero lo únco que han realzado realmente es la colocacón de gran cantdad de sensores en la nstalacón y el almacenamento de los datos que se generan, sn haber hecho nngún estudo de estos datos posterormente. Como resultado del funconamento del sstema se dspone de una nmensa base de datos que representa el estado del sstema a lo largo del tempo. Sería deseable saber s a través de un análss de estos datos puede llegarse a alguna conclusón. El estudo propuesto, por tanto, trata de obtener nformacón acerca del comportamento del sstema para averguar las crcunstancas que provocan stuacones de funconamento ncorrecto del sstema. Metodología y plan de trabajo Dado que nos encontramos ante un problema de adquscón de conocmento en bases de datos (KDD, las accones a realzar son las propas de todo proceso de esta índole.. Entendmento del domno de la aplcacón: Incluyendo el conocmento a pror relevante y los objetvos de la aplcacón. En esta fase hay que determnar los objetvos, es decr, defnr lo que se desea obtener y saber con qué datos se cuenta para la consecucón de dchos objetvos. Además hay que estudar las lmtacones dervadas de estos datos dependendo de su caldad, su número, etc.. Creacón del conjunto de datos de entrenamento: Selecconando el subconjunto de varables o ejemplos sobre los que se realzará el descubrmento. En base a los datos con los que se cuenta es necesaro selecconar parte de los msmos con el fn de optmzar las tareas del proceso de aprendzaje. 3. Preprocesado de los datos: La caldad de los datos nfluye en la caldad de los resultados. Hay varos factores que nfluyen en la caldad de los datos, como son los datos erróneos, los datos ausentes, los outlers y otros que hay que corregr: Hay que elmnar el rudo dado por los posbles outlers, decdr sobre el tratamento que se da a los datos ausentes, normalzar los datos, etc. Una vez fnalzada esta fase se 0

11 contaría con un conjunto de datos totalmente preparados para aplcarles las técncas de aprendzaje. 4. Transformacón y reduccón de los datos: Incluyendo la búsqueda de parámetros útles para representar los datos dependendo del objetvo, reduccón del número de varables medante transformacón, etc. 5. Eleccón del método o algortmo: Dependendo de las partculardades del proyecto una vez llegado a esta fase, hay que determnar el método de proceso que va a emplearse (clasfcacón, regresón, clusterng, etc.. Esto llevará a la decsón de utlzar un algortmo de data mnng u otro. 6. Proceso de data mnng: El proceso de data mnng, propamente dcho, consste en la búsqueda de patrones y relacones que exstan en los datos. Este proceso es el que permte extraer nformacón oculta de la nube de datos con la que se contaba. El conocmento extraído vene representado medante árboles de decsón, reglas de asocacón, etc 7. Interpretacón del conocmento extraído: Fnalzado el proceso de data mnng hay que revsar la nformacón obtenda y evaluarla para selecconar la nformacón que sea de nterés y estudar, en base a los resultados, un posble regreso a alguno de los puntos anterores. La evaluacón del aprendzaje puede realzarse medante técncas de vsualzacón o defnendo meddas de nterés (de tpo estadístco, en funcón de su sencllez, etc. 8. Uso del conocmento descuberto: El conocmento extraído en las fases anterores se ncorporará al sstema para verfcar su utldad y tomar decsones en base a los resultados. Dcho conocmento deberá documentarse, revsarse peródcamente, compararlo con el conocmento anteror, etc.

12 3.- ASPECTOS RESUELTOS Y POR RESOLVER.-

13 El proceso de produccón del cobre requere de unos sstemas muy complejos que hacen necesaro el acoplamento de varos subsstemas, cada uno de los cuales se encarga de una fase del proceso productvo. Los subprocesos realzados por estos subsstemas lberan una sere de materales que, en lugar de consttur materal de desecho, pueden servr como subproducto. En varas fases del proceso productvo se generan gases con contendo en azufre, el cual se aprovecha para producr ácdo sulfúrco. Los objetvos que se persguen son: - Identfcar los parámetros que nfluyen en el comportamento del sstema. - Conocer el grado de nfluenca en el sstema de cada uno de los parámetros. - Saber qué respuesta va a tener el sstema ante actuacones sobre los parámetros. - Conocer las causas de los perodos de nestabldad del sstema. - Detectar posbles perturbacones. - Detectar actuacones nnecesaras o perjudcales en el control del sstema, así como descubrr nuevas accones no consderadas. - Obtener reglas de funconamento que permtan realzar un posteror modelo del sstema lo más exacto posble. Con la consecucón de los objetvos la empresa obtendrá: - Una optmzacón del funconamento del sstema de produccón de ácdo sulfúrco. - Un mayor conocmento del sstema que srva de ayuda en una posteror toma de decsones. - Una reduccón de costes de produccón. - Una mayor proteccón del medo ambente. 3

14 4.- COMPARATIVA DE PROPUESTAS.- 4

15 Las prncpales formas de representar el conocmento en machne learnng son las sguentes: 4. Árboles de decsón.- La representacón de un árbol donde los nodos son atrbutos dscretos o condcones sobre atrbutos contnuos, las ramas son los posbles valores de un atrbuto dscreto o verdadero y falso en el caso de condcones; por últmo, las hojas son las clases. La herramenta más popular que genera árboles de decsón es el C4.5[Qunlan 93]. Tambén es de reseñar la herramenta CART[Breman 84]. 4. Sstema basado en reglas.- Una regla es una expresón de la forma: S A entonces B En donde A es un aserto y B puede ser una accón o ben otro aserto. Por ejemplo:. S la bomba falla entonces la presón es baja. Aserto aserto. S la bomba falla entonces chequear el nvel de acete. Aserto accón 3. S hay fallo de potenca entonces la bomba falla. Aserto aserto Un sstema basado en reglas es una lbrería de reglas. Estas reglas reflejan esencalmente las relacones dentro del domno del problema, más ben reflejan el camno para razonar sobre el domno. Cuando tenemos después nformacón concreta del domno, esto se aplca a las reglas y te lleva a conclusones apuntando a accones determnadas. Esto se llama INFERENCIA. Por ejemplo en el caso anteror del domno sabemos ahora que hay fallo de potenca. 5

16 Por la regla 3 nos dce que la bomba falla, y aplcando la regla nos dce que la presón será baja, además la regla nos RECOMIENDA que chequeemos el nvel de acete (accón. Las reglas tambén se pueden usar en dreccón opuesta. Por ejemplo supongamos que sabemos actualmente que la presón es baja, por la regla esto puede ser debdo a que la bomba falla y por la regla 3 te dce que puede ser debdo a un fallo de potenca, y la regla te recomenda chequear el nvel de acete. Un nconvenente que tenen consste cuando los atrbutos son contnuos, es precso en este caso realzar una dscretzacón preva. Normalmente las conexones reflejadas medante reglas no son absolutamente certas, por lo tanto están sujetas a certa ncertdumbre. En estos casos una medda de ncertdumbre hay que añadr a las reglas, tanto a las premsas como a las conclusones. S A (con certdumbre x entonces B (con certdumbre f(x Hay muchos esquemas para tratar la ncertdumbre en un sstema basado en reglas, la más común es la lógca fuzzy. En estos esquemas la ncertdumbre se trata LOCAMENTE, es decr se añade la ncertdumbre a las reglas. Por ejemplo: S C (con certdumbre x entonces B (con certdumbre g(x Supongamos que la evdenca actual te ndca que se produce A con certdumbre a y se produce C con certdumbre c Cuál es el grado de certdumbre de B? Para representar una regla se puede usar una formulacón CNF, o conjuncón de cláusulas que son dsyuncones de condcones sobre los atrbutos, v. gr.: color {rojo, verde} forma {círculo} altura 3 Tambén se pueden formular reglas medante lógca fuzzy (borrosa [Bezdek 8], [Sugeno 93] o utlzando el concepto de conjuntos rough (aproxmado [Pawlak 9]. Las herramentas más conocdas que producen reglas son la famla de algortmos AQ [Mchalsk 87] o los sstemas GIL [Jankow 93] y GABIL [DeJong 93] basados en algortmos genétcos. Tambén utlzan una formulacón de antecedente consecuente denomnadas reglas de asocacón [Agrawal 93]. 6

17 4.3 Lstas de decsón.- La lsta de decsón [Rvest 87] es una representacón del conocmento de la forma: (d, C, (d, C,..., (d n, C n en donde cada d es una descrpcón elemental y cada C j es una clase. La clase de un objeto será C j cuando d j sea la prmera descrpcón cuberta o satsfecha por el objeto. Otra forma de representar una lsta de decsón es una regla de la forma: S d entonces C sno s d... sno s d n entonces C n El sstema CN [Clark 89] es una de las herramentas más conocdas que utlzan lstas de decsón. COGITO [Rquelme 98] utlza tambén esta representacón del conocmento realzando la búsqueda medante un algortmo genétco. 4.4 Redes Neuronales.- Las redes neuronales [McCulloch 43] son una representacón medante un grafo del sstema nervoso de los seres vvos. El grafo se organza en una sere de capas o leyes, formadas cada una por un conjunto de nodos que se relaconan con la capa anteror y posteror recbendo unos valores numércos o mpulsos ponderados. La prmera capa toma los datos del fchero de aprendzaje y la últma capa es denomnada de salda, cuyos nodos adqueren (medante un proceso de aprendzaje dstntos valores para patrones dstntos. En aprendzaje supervsado el modelo más clásco es el perceptrón multcapa [Rosenblatt 58] y en no supervsado las redes autoorganzadas [Kohonen 8]. Todos los nodos de un nvel están conectados a todos los nodos del nvel superor y del nvel nferor. Ahora ben, necesta un entrenamento costoso ya que se deben de encontrar los pesos que tene cada nodo en el sguente nvel, partendo de los ejemplos de entrenamento en donde los valores de entrada y salda son conocdos. De sobra es conocdo que NO obtene reglas, y por lo tanto conocmento sobre la base de datos, sí clasfca pero no sabemos CÓMO. Se puede decr que es un buen sstema, s sólo necesto clasfcar, pero no obtener reglas. 7

18 S las relacones son con certo grado de certdumbre, la red puede dar la hpótess más probable, dado un conjunto de síntomas, en dagnoss médca, sn embargo no podremos obtener el grado de ncertdumbre de la conclusón, y no seremos capaces de obtener cual es la hpótess sguente más probable. 4.5 Aprendzaje basado en ejemplos.- Los sstemas de aprendzaje basados en ejemplos representan el conocmento medante ejemplos representatvos, basándose en smltudes entre los datos. Los algortmos más extenddos son los clasfcadores basados en los vecnos más cercanos [Dasarathy 9]. Habtualmente estas técncas realzan el aprendzaje a partr de una seleccón de los ejemplos que mejor representan a los conceptos exstentes en la base de datos. Es el concepto de edtng de los datos o seleccón de prototpos. 4.6 Redes bayesanas.- Esta técnca se encuentra desarrollada en detalle en el apartado número 5 de esta memora de nvestgacón especalmente en el punto 5.5, descrbendo a contnuacón un resumen de la msma. La dea esencal consste en aprovechar las relacones de dependenca (y por tanto tambén las de ndependenca exstentes entre las varables de un problema antes de especfcar y calcular con los valores numércos de las probabldades [Pearl 86]. Estas relacones se representan a través de modelos gráfcos, habtualmente grafos acíclcos drgdos [Cooper 9] y [Heckermann 95]. Formalmente se defne como red bayesana una trpleta (N,D,P en donde N es un conjunto de varables del domno. D es una DAG (Grafo acíclco drgdo cuyos nodos están etquetados con los elementos de N y los arcos drgdos ndcan relacón de nfluenca y en algunos casos relacón causal. P es una dstrbucón jont sobre N. D reúne la nformacón de que toda varable es ndependente de sus no descendentes dados sus padres (Padres(. 8

19 y n : Esto permte expresar que s una nstanca está formada por los atrbutos y, y,... n P( y,... yn = P( y Padres( y = Esto se conoce como chan-rule. El número de modelos (redes bayesanas dferentes que son posbles, se eleva de manera consderable en funcón del número n de varables a consderar: n * ( n Ya que el número de modelos es realmente grande cuando las varables son muchas, se mpone un método de búsqueda para la eleccón del modelo más probable. 4.7 Conclusones.- El modelo va a tener como funcón prncpal el estudo de la relacón de dependenca de parámetros. Ahora ben la forma adoptada es la red bayesana, los motvos que nfluyen en esta decsón son: El grafo generado por las redes bayesanas representan de forma vsual la relacón de dependenca exstente entre las varables del domno del problema. Las redes bayesanas tratan la ncertdumbre de forma global, por el contraro tanto las reglas de asocacón como las redes neuronales la tratan de forma local. Las redes bayesanas se pueden aplcar a varables no cuantfcables, detalle con el que no puede trabajar la técnca de los vecnos, por ejemplo. Las redes neuronales se utlzan para clasfcar, pero no dan reglas de cómo obtenen esta nformacón. Un prmer nconvenente se centra en que las redes bayesanas trabajan con varables dscretas, pero esta msma stuacón se da con las reglas de asocacón. Un segundo nconvenente resulta del gran coste computaconal al tener que calcular las funcones de dstrbucón de todas las varables, pero lo msmo le ocurre a las redes neuronales cuando tenen que calcular los dstntos pesos en cada nodo. 9

20 5.- TECNICAS BAYESIANAS.- 0

21 5. Introduccón.- En los últmos años los sstemas expertos probablstas han alcanzado un alto grado de desarrollo. Hasta los 80 se había dado por supuesto que la probabldad requería mucha nformacón y unos cálculos demasado complejos para poder resolver problemas reales en los que ntervnesen un gran número de varables. Sn embargo esto cambó a partr de una sere de trabajos entre los que destacan los de [Pearl 986], [Pearl 988], [Jensen 996] y [Laurtzen 988]. La dea esencal fue la de aprovechar las relacones de dependenca (y por tanto tambén las de ndependenca exstentes entre las varables de un problema antes de especfcar y calcular con los valores numércos de las probabldades. Estas relacones se representan a través de modelos gráfcos, habtualmente grafos acíclcos drgdos [Whltaker 990]. La determnacón de las relacones exstentes entre las varables se manfestó desde el prncpo como una cuestón fundamental. En muchas ocasones el problema está ben estructurado y el experto sabe determnar drectamente un modelo gráfco. Sn embargo, es más habtual que no se conozcan, al menos en forma total, las relacones de nfluenca entre los elementos que ntervenen. El objetvo de los algortmos de aprendzaje consste en determnar un modelo gráfco a partr de un conjunto de datos en bruto u observacones realzadas sobre el comportamento del sstema, referencas mportantes son [Cooper 99] y [Heckerman 995]. Exste en la actualdad una gran dversdad de enfoques y métodos de resolucón. Otro detalle mportante consste en que consttuyen una forma de trabajo coherente y efectva para sstemas de soporte a la decsón que deben de funconar con conocmento no seguro (ncertdumbre. S ben un problema que tenen, consste en que tenemos que dscretzar las varables contnuas. Veamos la sguente nformacón: P(enfermo tenga grpe febre>38.5, dolor de cabeza = SI = 0.75 En una red bayesana esto quere decr que s conocemos el valor de los padres de enfermo tene grpe que son febre y dolor de cabeza podemos determnar s el enfermo tene grpe o no, con un grado de ncertdumbre, además el resto de valores de varables no nfluyen en el valor de s tene grpe o no. Todas las varables que aparecen son varables del domno que tratamos y no como en las redes neuronales que los nodos no tenen representacón en el domno.

22 La nformacón anteror podría verse como una regla de decsón: S (febre>38.5 y dolor de cabeza = S entonces enfermo tene grpe (con grado de certdumbre 0.75 Por lo tanto tenen mucha smltud con las reglas de decsón. En un sstema basado en reglas se ntenta modelzar el camno de razonamento de los expertos mentras que en una red bayesana se ntenta modelzar las dependencas exstentes en el domno en sí msmo. En un sstema basado en redes neuronales es mposble ntroducr conocmento a pror en los pesos de los nodos, mentras que utlzando redes bayesanas sí se puede realzar ntroducendo conocmento del experto, con dependencas señaladas entre varables. Respecto al coste computaconal señalar que las redes bayesanas tenen que calcular muchas funcones de dstrbucón de probabldad, pero no más que las redes neuronales que deben de calcular los pesos de los nodos. Además en las redes neuronales la dreccón de la nferenca queda totalmente delmtada, cosa que en las redes bayesanas esto es mucho más flexble. Un punto a favor de las redes bayesanas consste en que se pueden aplcar cuando los atrbutos tenen valores no cuantfcables, más ben no debe de exstr nformacón numérca n de orden. Por ejemplo s consderamos la varable aleatora color de un coche, y etquetamos blanco..0, negro.., azul.. La dstanca que hay del blanco al negro es, y la dstanca que hay del blanco al azul es, pero esta dstanca hubera sdo dferente desde el momento en que asgnáramos las etquetas numércas dferentes al blanco, negro y azul, entonces aplcar técncas como las de los vecnos no tendría sentdo. 5. Conceptos báscos Varables aleatoras dscretas / contnuas.- S lanzamos dos dados sobre una mesa, el espaco muestral E estará consttudo por las 36 parejas: E = { (,, (,, (,3... (6,5, (6,6 }

23 E R F A A 6 A 66 X 0 Probabldad X : E R X es una aplcacón que hace corresponder a cada suceso A j la suma ( + j de los puntos aparecdos. X R A X(E = {,3,4... }. Llamándose a la funcón X varable aleatora, sendo las nversas de las mágenes en R sucesos en E. A cada elemento X(E le asocamos su probabldad. Tenemos así defnda una nueva funcón F de la sguente forma: F( = P(X= = / 36. F(3 = P(X=3 = / F( = P(X= = / 36. Una funcón defnda de esta forma se denomna funcón de dstrbucón, es una funcón suprayectva poseyendo las sguentes propedades:. F(X >= 0, X.. Σ F(X =. Es una funcón que aplca R en R. No decrecente. Contnua a la derecha. Es decr, exste lm F(X = F(a. F(+ =. F(- = 0. x -> a derecha Luego F(x = P{ w : X(w <= x} sendo la funcón de dstrbucón de la varable aleatora X. w X X(w /5 F 3

24 Por ejemplo s w es sacar cara y w es sacar cruz: Cara Cruz 0 ½ X F X(w = 0. X(w =. Luego F(0 = P{ sacar cara} = ½. F( = P{ sacar cara o cruz} =. / 0 x Una varable aleatora se dce que es dscreta s exste un conjunto numerable E (es decr exste una byeccón entre los números naturales y elementos x del conjunto, tal que E R P(x E =. Los puntos que tenen masa de probabldad se denomnan puntos de salto o puntos de ncremento de la funcón de dstrbucón. Por ejemplo en el dbujo de esta págna solo x = 0 y x = tenen masa de probabldad. La funcón de dstrbucón (F de la varable aleatora dscreta será: F(x = P{w - < X(w <= x}, es decr la suma de las probabldades de todos aquellos puntos hasta llegar al x, ncludo. Una varable aleatora se dce que es contnua s la funcón de dstrbucón F(x es absolutamente contnua, es decr s exste una funcón no negatva f(x x R que: x F ( x = f ( t dt La funcón f(x recbe el nombre de funcón de densdad de probabldad. Luego f(x >=0 ya que es no negatva y su ntegral desde - a + vale. En una varable aleatora contnua la probabldad está defnda para ntervalos de puntos y para puntos concretos vale cero. 4

25 5.. Regla de la multplcacón, teorema de la probabldad total y sucesos ndependentes.- Regla de la multplcacón.- Sean A, A... A n sucesos cualesquera, se cumple que P(A A A 3... A n = P(A * P(A A *... * P(A n A n-, A n-..a Teorema de la probabldad total.- Sean los sucesos H, H... H j sucesos dsjuntos y sea el suceso B que cumple B = (B H (B H... representado en la fgura. H H H n B Entonces se cumple que: P(B = [ P(H j * P(B H j ] para todo j Sucesos ndependentes.- Dos sucesos A y B se dce que son ndependentes s y sólo s: P(A B = P(A * P(B. Para el caso de n sucesos A, A... A n se debería cumplr: P(A A A 3... A n = P(A * P(A *... * P(A n Por ejemplo, tengamos cuatro bolas en una bolsa con las sguentes etquetas. 3 3 Se extrae una bola de las cuatro, sea el suceso E en la bola aparece un, el suceso E en la bola aparece un y el suceso E 3 en la bola aparece un 3. P(E = ½. P(E = ½. P(E E = ¼. P(E * P(E = ¼ 5

26 Luego el suceso E y el suceso E son ndependentes. Sn embargo los sucesos E, E y E 3 no son ndependentes, ya que: P(E E E 3 = ¼ P(E * P(E * P(E 3 = / Teorema de Bayes.- Descuberto por Thomas Bayes en 76. Consderemos el sguente expermento: supongamos dos bolsas A y B; la prmera que contene dos bolas blancas y dos negras, y la segunda, dos blancas y una negra. S llamamos X al suceso obtener bola blanca e Y al obtener bola negra, y hacemos una sere de pruebas que constan cada una de dos partes: º sorteo de bolsas; º extraccón al azar de una bola de la bolsa que corresponda. Podemos obtener por ejemplo la sguente sere: Ba, Ba, Nb, Na, Na, Bb, Ba, Na, Nb Expresando la letra mayúscula el color de la bola y la mnúscula s ha sdo de la prmera bolsa(a o de la segunda bolsa(b. La frecuenca (fr será: fr(x = 4/9; fr(a X =3/4; fr(a=6/9; fr(x A=3/6; Vemos en este ejemplo que se cumple la sguente relacón: Luego: P(X A = P(X * P(A X = P(A * P(X A = /3, P(A X = P(A *P(X A / P(X, que es esencalmente la fórmula de Bayes, sempre que está defnda la P(X y sea dstnta de cero. El teorema de Bayes goberna el proceso de nferenca lógca, determnando el grado de confanza que debemos tener, con varas posbles conclusones, basadas en el cuerpo de la evdenca dsponble. Esto es exactamente el proceso de razonamento predctvo. Escala de credbldad

27 P(A E = 0, quere decr que A debe de ser falso s parto de que se cumple E. P(A E =, quere decr que A debe de ser certo s parto de que se cumple E. P(A E = 0.5, quere decr que E no nfluye en A. Cada ejemplo de entrenamento puede ncrementar/decrementar la probabldad estmada de que una hpótess sea correcta, por lo tanto supone una aproxmacón muy flexble de aprendzaje. El conocmento a pror puede ser combnado con los datos observados para determnar la probabldad fnal de cada hpótess. La probabldad a pror se determna asgnando una a cada hpótess ncalmente y consderando la dstrbucón de probabldad en los datos observados para cada hpótess posble. Un nconvenente que tene este tpo de razonamento es que requere conocmento ncal de muchas probabldades, cuando no se conocen es precso estmarlas, así como el posble coste computaconal Hpótess MAP e hpótess ML.- En aprendzaje automátco estamos nteresados en determnar la mejor hpótess de un espaco H, dando los datos observados D. La mejor hpótess es aquélla que sea la más probable, tenendo en cuenta los datos D y cualquer conocmento ncal de las probabldades a pror de varas hpótess dentro de H. El teorema de Bayes proporcona un método para calcular la probabldad de una hpótess basada en su probabldad a pror, la probabldad de observar esos datos D dada la hpótess, y los datos observados por sí msmos. Sea h la hpótess a consderar y D los datos observados. P( h D = P(h * P(D h. P( h D = P(D * P(h D. Es decr: P(h * P(D h = P(D * P(h D. Por lo tanto P ( h D = P( h * P( D h P( D a posteror a pror Factor de correccón P(h es la probabldad a pror de que se cumpla la hpótess h, es decr el conocmento que tengamos de que la hpótess h es correcta. 7

28 P(h D es la probabldad a posteror de que se cumpla la hpótess h una vez conocdos los datos D, reflejando la nfluenca que tenen los datos D observados a dferenca con la probabldad a pror en la que no se tene en cuenta. P(D h es la probabldad de que los datos D sean observados en un mundo en el que la hpótess h es correcta. Por lo tanto P(h D aumenta s se ncrementa P(h y P(D h y se decrementa en el caso de que aumente P(D. Una vez que dsponemos de una fórmula que nos da la probabldad de una hpótess, estamos nteresados en obtener aquella hpótess más probable (maxmum a posteror MAP observados los datos D. h MAP = argmax h P(h D = argmax h [P(h * P(D h / P(D] Ya que P(D es la msma en todas las hpótess, en la obtencón del máxmo podemos ahorrarnos el cálculo de este valor, quedando: h MAP = argmax h P(h * P(D h h MAP es la hpótess más probable, dados los datos observados, P(h D. En muchos casos podemos asumr que cada hpótess en H es equprobable a pror, P(h = P(h j para todo h y h j en el espaco H, por lo tanto en la fórmula anteror podemos suprmr el térmno P(h que es déntco en todas las hpótess. A la fórmula que nos queda se le denomna funcón de máxma verosmltud (maxmum lkelhood, ML, es decr la hpótess que maxmza la probabldad de obtener los datos D partendo de que se cumple esa hpótess, P(D h. h ML = argmax h P(D h Por lo tanto en el maxmum lkelhood no nfluyen las probabldades a pror. LIKELIHOOD (verosmltud.- Probabldad de obtener los datos observados a partr de un modelo. P(D M MAXIMUM LIKELIHOOD.- Aquel modelo que obtene un máxmo de probabldad de obtener los datos observados. argmax m P(D M En algunas ocasones, más que obtener h ML se obtene el logartmo neperano de h ML, ya que maxmzar el logartmo de una funcón maxmza el valor de la propa 8

29 funcón, todos los productos pasan a ser sumas y los exponentes desaparecen, lmtando el caso de desbordamentos en las operacones de cálculo y lo hacen más tratable matemátcamente. h ML = argmax h Ln P(D h Es precso observar que hay que evaluar todas las posbles hpótess exstentes en el espaco H. Consderemos un caso: Posbles hpótess el pacente tene una forma de cáncer. el pacente no tene esa forma de cáncer. Los resultados de una posble prueba dan + o ben -. El conocmento a pror que tenemos nos dce que 8 de cada ml personas tene esa forma de cáncer, 98 de cada 00 personas que tenen esa forma de cáncer que se someten a la prueba dan + y 97 de cada 00 personas que no tenen esa forma de cáncer que se someten a esa prueba dan -. P(cáncer = P(no cáncer= P(+ cáncer = P(- cáncer = 0.0. P(+ no cáncer = P(- cáncer = h MAP. Supongamos que tenemos un nuevo pacente y en el test da valor +, calculamos Hpótess a tene cáncer.- P(cáncer * P(+ cáncer = 0.98 * = Hpótess b no tene cáncer.- P(no cáncer * P(+ no cáncer= 0.03 * 0.99= Luego en este caso la hpótess MAP es NO TIENE CÁNCER. La probabldad real se puede saber ya que la suma de las dos probabldades debe de dar, ya que son las dos hpótess posbles, por lo tanto NO tene cáncer con una probabldad del 79% x x = / = 0.79 Podemos observar que aunque la probabldad a posteror de tener cáncer es muy superor a la probabldad a pror antes del test la conclusón sgue sendo que la hpótess más probable es que no tenga cáncer. Los resultados de la aplcacón de la 9

30 nferenca bayesana dependen de los valores de las probabldades a pror, que deben de estar dsponbles para poder aplcar este método, además con este método las hpótess no son completamente aceptadas o rechazadas, s no que son mas o menos probables, según los datos observados. S las hpótess de partda se consderan dstrbucones gaussanas, obtener el Maxmum Lkelhood (mas ben su logartmo neperano es lo msmo que mnmzar el error cuadrátco medo, que es el exponente de las probabldades cuando son dstrbucones normales. Esta conclusón puede ser dferente s las dstrbucones de partda no son gaussanas. Hay que hacer notar que la hpótess ML no tene por qué ser la msma hpótess MAP, sólo concdrá cuando las probabldades de las hpótess a pror sean déntcas. 5.3 Clasfcadores bayesanos Clasfcador óptmo bayesano.- Supongamos que tenemos tres hpótess h, h y h 3 y las posbles clasfcacones son + y de una nueva nstanca. Veamos un caso, sea la probabldad a posteror: P(h D = 0.4 P(h D = 0.3 P(h 3 D = 0.3 h MAP = argmax h P(h D, por lo tanto la hpótess MAP es la hpótess h, la más probable (0.4 tenendo en cuenta los datos observados. Hasta ahora hemos estudado la búsqueda de la hpótess más probable(map dados los datos observados (de entrenamento, pero nos vamos a centrar en la pregunta de la clasfcacón más probable de una nueva nstanca dados los datos de entrenamento. Supongamos una nueva nstanca, que se clasfca según las hpótess h como + y con h y h 3 como - P(- h = 0 P(+ h = P(- h = P(+ h = 0 P(- h 3 = P(+ h 3 = 0 Así en el ejemplo anteror h es la hpótess MAP y por lo tanto la clasfcacón más probable sería +, ya que P(+ h =. Ahora ben s se consderan todas las hpótess, ponderadas por sus probabldades a posteror, de acuerdo con el teorema de la probabldad total: 30

31 P(v j D = P ( v j h * P( h D h H Sendo v j una posble clasfcacón, y h una de las hpótess dentro del conjunto H de todas las hpótess posbles. La clasfcacón óptma para una nueva nstanca será aquella v j que cumple: arg max v V j h H P ( v h * P( h D Aplcado al ejemplo anteror: v j es + o -, que es la posble clasfcacón. H son las posbles hpótess, h, h y h 3. h H h H j P( + h * P( h D = * * *0.3 = 0. 4 P( h * P( h D = 0 *0.4 + *0.3 + * 0.3 = 0. 6 era +. Por lo tanto la clasfcacón óptma es -, justamente la contrara de la MAP que Cualquer sstema que clasfque nuevas nstancas de acuerdo con la sguente fórmula recbe el nombre de clasfcador óptmo bayesano: arg max v V j h H P ( v h * P( h D j Este método maxmza la probabldad de que una nueva nstanca sea clasfcada correctamente, dados los datos observados D, el espaco completo de hpótess H (h H y las probabldades a pror de las posbles clasfcacones tenendo en cuenta las hpótess (P(v j h Clasfcador nave bayesano (nb.- Supongamos que queremos clasfcar una nueva nstanca formada por varos atrbutos a,a,.. a n. Sea v j una de las clasfcacones dentro del conjunto V de las dstntas clasfcacones posbles. Sabemos que: v MAP = argmax P(v j * P(D v j v j V 3

32 En nuestro caso, v MAP = argmax P(v j * P(a, a,... a n v j v j V Dados los datos de entrenamento se recorren todos estos datos y se recuenta la clasfcacón de cada uno de ellos, obtenendo P(v j para cada clasfcacón posble. El problema surge cuando queremos obtener P(a, a,... a n v j ya que el número de posbles combnacones dferentes de valores para cada atrbuto con todos los demás es muy grande. Por la regla de la multplcacón: P(a, a,... a n v j = P( a n v j * P(a,a,... a n- a n, v j. Ahora ben s suponemos que los atrbutos son ndependentes condconalmente conocdo v j, sabemos que P(a n- a n = P(a n- por lo tanto y generalzando, nos queda la fórmula: P(a, a,... a n v j = P(a v j * P(a v j *... P(a n v j. Quedando la fórmula ncal: v MAP = argmax P(v j * P(a, a,... a n v j. v j V De la sguente manera: v NB = argmax P(v j * P(a v j v j V Las letras NB se utlzan para expresar que se ha utlzado un clasfcador Nave Bayesano, avsando de la premsa fundamental de que los atrbutos son ndependentes condconalmente. Es decr, deben de estmarse los valores P(v j y P(a v j partendo de los datos observados. En el algortmo nave de clasfcacón bayesano no se hace por lo tanto nnguna búsqueda en el espaco de posbles hpótess, sno más ben en el recuento de los datos observados. Un problema surge cuando la P(a v j es cero para algún atrbuto, en cuyo caso fuerza a que la multplcacón sea cero y por lo tanto dará sempre cero para esa hpótess, para evtar este problema se ntroduce la denomnada probabldad m- estmada, cuya fórmula es la sguente: 3

33 P(a v j = (N c + / (N + K sendo N el número de casos totales que tenemos con clasfcacón v j. N c el número de casos en que se da el valor a con clasfcacón v j. K el número de valores dferentes que toma el atrbuto a con clasfcacón vj. 5.4 Dependenca/ ndependenca condconal.- Una varable A y otra B son dce que son dependentes mutuamente, s saber lo que vale A me ayuda a conocer lo que vale B. La dependenca entre A y B se dce que es una dependenca condconal, s A y B son dependentes s sé o no sé valores de otras varables. Por ejemplo: Anmal Tpo de anmal Hábtat S yo sé que el tpo de anmal es mamífero, esta nformacón me ayuda a advnar que hábtat es terra, luego tpo de anmal y hábtat son dependentes mutuamente. Ahora ben, s yo sé que anmal es ballena, esto me ayuda a advnar que hábtat es agua. En este caso saber que tpo de anmal es mamífero no nos ayuda para advnar que hábtat es agua. Es decr, que s yo sé el anmal, la nformacón sobre tpo de anmal no me ayuda a saber el hábtat. Luego tpo de anmal y hábtat no son dependentes mutuamente s yo sé el anmal. 33

34 Mas formalmente dremos : Sean X, Y y Z tres varables aleatoras dscretas, se dce por defncón que X es condconalmente ndependente de Y dada Z, s la dstrbucón de probabldad que goberna X es ndependente del valor de Y conocendo el valor de Z, es decr, s P(X =x Y = y, Z =z = P(X =x Z =z, para todo valor de x, y y z. Por comoddad la defncón anteror se escrbe de la sguente forma: P(X Y, Z = P(X Z. Se puede amplar esta defncón al caso de varas varables aleatoras, por defncón se dce que un conjunto de varables aleatoras X,... X h son condconalmente ndependentes de un conjunto de varables aleatoras Y,... Y m dado el conjunto de valores Z,.. Z n s P(X,... X h Y,... Y m, Z,... Z n = P(X,.. X h Z,... Z n En el clasfcador bayesano sencllo se asume que exste ndependenca condconal entre el atrbuto A y el atrbuto A j de la msma nstanca conocdo el valor de la clasfcacón v. Ejemplo de las cadenas de Markov.- El estado en el tempo t sólo depende del estado en el tempo t P(x =, t x =, t- = 0.3 por ejemplo, luego son probabldades condconadas. 34

35 5.5 Redes bayesanas Introduccón.- La restrccón, para la aplcacón de la técnca del clasfcador bayesano sencllo, de que todos los atrbutos deben de ser ndependentes condconalmente entre sí conocdo el valor de la clasfcacón v j, permte poder realzar la sguente asgnacón. P(a, a,... a n v j = P(a v j * P(a v j *... P(a n v j. Pero es una condcón muy restrctva para poderla aplcar a una gran cantdad de problemas en los que esto no se da, buscando una solucón ntermeda entre el clasfcador bayesano sencllo y el óptmo, surgen las redes bayesanas en las que la ndependenca condconal se exge entre un subconjunto de atrbutos y no entre todos. Las redes bayesanas sguen la línea de ntentar descomponer una dstrbucón de probabldad multvarada en varos productos de funcones de dstrbucón, denomnadas locales. S consderamos un conjunto de varables aleatoras Y = {Y, Y... Y n }, en donde cada varable puede tomar un valor del conjunto de posbles valores V(Y, se defne como espaco jont del conjunto de varables Y al producto cartesano V(Y x V(Y x... x V(Y n. Por lo tanto cada elemento del espaco jont corresponde a una posble asgnacón de los valores de cada tupla de varables Y, Y,... Y n. La funcón de dstrbucón que se forma sobre el espaco jont se denomna dstrbucón jont de probabldad, especfcando una red bayesana la dstrbucón jont de probabldad para un conjunto de varables aleatoras. Hay dos formas de enfocar las dependencas / ndependencas: La vsón objetvsta, que consste en A depende de B o no depende, no dejando nada aleatoro en esta dependenca. La vsón bayesana, se centra en la certdumbre que se tene sobre la dependenca exstente, por ejemplo A depende de B pero 0.9, es decr que A cas seguro que depende de B, según la evdenca. Las probabldades bayesanas manejan probabldades de estados, por ejemplo que P( mantenmento =caro =, sgnfca que estamos seguros de que la varable preco de mantenmento está en el estado caro, tenendo en cuenta que según se vaya ncorporando la evdenca estos valores se van a r modfcando. (ESTO ES precsamente el corazón del razonamento bayesano. 35

36 Veamos un ejemplo de red bayesana: C A H B J I Una red bayesana tene dos componentes prncpales: cualtatvo y cuanttatvo. En el campo cualtatvo tenemos un grafo acíclco drgdo en el que cada nodo corresponde a un atrbuto (varable, y arcos drgdos mplcando que toda varable es condconalmente ndependente de todos sus no descendentes en la red sempre que se conozcan los valores de sus nmedatos predecesores (padres. Una varable Z es descendente de otra varable Y, s en el grafo exste un camno drgdo desde Y a Z, por ejemplo en el grafo expuesto I es descendente de A. En el campo cuanttatvo cada nodo tene asocada la dstrbucón de probabldad de esa varable tenendo en cuenta sus padres en el grafo. Por ejemplo para el nodo I, tendremos P(I B,H. Cada varable tene un conjunto de posbles valores llamado espaco de estados que consste de mutuamente exclusvos y exhaustvos valores de las varables. 36

37 La probabldad jont de cualquer elemento sería: n P( y,... yn = P( y Padres( y = Esto se conoce como chan-rule. Padres (y son las varables predecesoras nmedatas de la varable y en la red, precsamente P(y padres(y son los valores que se almacenan en el nodo que corresponde a la varable y. Una defncón formal de una red bayesana sería: Una trpleta (N,D,P en donde N es un conjunto de varables del domno. D es una DAG (Grafo acíclco drgdo cuyos nodos están etquetados con los elementos de N y los arcos drgdos ndcan relacón de nfluenca y en algunos casos relacón causal. P es una dstrbucón jont sobre N. Veamos el caso de la Base de datos de coches (UCI REPOSITORY. Varables de cada tupla: Puertas(, 3, 4, 5 o más. Personas(, 4, más de 4. Segurdad (baja, meda, alta. Maletero ( grande, medano, pequeño. Preco compra(muy alto, alto, medo, bajo. Coste mantenmento (muy alto, alto, medo, bajo. Grado de satsfaccón ( muy bueno, bueno, satsfecho, nsatsfecho. Generada la red bayesana se obtene la red que fgura en la págna sguente, de dcha red se puede nferr que conocdo el preco de compra del vehículo y el coste de mantenmento se puede dar perfectamente la funcón de dstrbucón del grado de satsfaccón del clente, ya que el resto de varables no nfluyen en la satsfaccón, es decr son condconalmente ndependentes. 37

38 Compra Manten. Puertas Satsfaccón Maletero Segurdad Personas Por la regla de la multplcacón: P(Compra=muy cara, Mantenmento=caro, puertas =4, satsfaccón =buena, maletero=grande, segurdad=alta, personas=4 = P(Compra = muy cara * P(mantenmento=caro compra = muy cara * P(puertas=4 compra= muy cara, mantenmento=caro * P(satsf = buena compra =Muy cara, manten=caro,puertas=4 * P(malet=grande satsf = buena, compra =Muy cara, manten=caro,puertas=4 * P(segu=alta malet=grande, satsf = buena, compra =Muy cara, manten=caro,puertas=4 * P(personas=4 segu=alta, malet=grande, satsf = buena, compra =Muy cara, manten=caro,puertas=4 = P(compra=muy cara * P(mant=caro * P(puertas=4 * P(sats=buena compra=muy cara, mant=caro * P(malet=grande sats=buena * P(segu=alta malet=grande, satf=buena * P(personas=4 satsf=buena, segu=alta Observando la red P(mant=caro compra= muy cara = P(mant = caro, es decr mant y compra son ndependentes condconalmente. P(satsf = buena compra =Muy cara, manten=caro,puertas=4 = P(sats=buena compra=muy cara, mant=caro, luego conocdos los valores del preco de compra y del 38

39 preco de mantenmento en la varable grado de satsfaccón no nfluye el número de puertas, es decr satsfaccón y número de puertas son ndependentes condconalmente. Y así se podría r razonando sobre las conclusones del grafo Obtencón de redes bayesanas.- Para construr una red bayesana (modelo es precso defnr las varables en prmer lugar, a contnuacón obtener la estructura de la red y fnalmente obtener las dstrbucones de probabldad locales. Hay dstntos enfoques para obtener la estructura de la red bayesana, ben porque la red se conoce de antemano o ben porque se nfere de los datos de entrenamento, y por otro lado s todas las varables que ntervenen en la red son observables o ben s hay algunas que no lo son. Cas todas las técncas que se proponen trabajan con la técnca del gradente [Rusell 995], en cualquera de los casos supone sempre la obtencón del Maxmum Lkelhood(ML. Recordamos que: MAXIMUM LIKELIHOOD.- Aquel modelo que obtene un máxmo de probabldad de obtener los datos observados. argmax M P(D M El número de modelos (redes bayesanas dferentes que son posbles, se eleva de manera consderable en funcón del número de varables a consderar, se obtene: Para una varable sólo un modelo. Para dos varables son dos modelos. Para tres varables se obtenen 8 modelos posbles. Para cuatro varables se obtenen 64 modelos, y s contnuamos así podemos obtener como conclusón que el número de posbles canddatos a modelos como red bayesana sería: n * ( n Ya que el número de modelos es realmente grande cuando las varables son muchas, se mpone un método de búsqueda para la eleccón del mejor modelo ya que es un problema NP-Hard demostrado en [Chckerng 995]. 39

Tema 4: Variables aleatorias

Tema 4: Variables aleatorias Estadístca 46 Tema 4: Varables aleatoras El concepto de varable aleatora surge de la necesdad de hacer más manejables matemátcamente los resultados de los expermentos aleatoros, que en muchos casos son

Más detalles

Problemas donde intervienen dos o más variables numéricas

Problemas donde intervienen dos o más variables numéricas Análss de Regresón y Correlacón Lneal Problemas donde ntervenen dos o más varables numércas Estudaremos el tpo de relacones que exsten entre ellas, y de que forma se asocan Ejemplos: La presón de una masa

Más detalles

Métodos específicos de generación de diversas distribuciones discretas

Métodos específicos de generación de diversas distribuciones discretas Tema 3 Métodos específcos de generacón de dversas dstrbucones dscretas 3.1. Dstrbucón de Bernoull Sea X B(p). La funcón de probabldad puntual de X es: P (X = 1) = p P (X = 0) = 1 p Utlzando el método de

Más detalles

3. VARIABLES ALEATORIAS.

3. VARIABLES ALEATORIAS. 3. VARIABLES ALEATORIAS. Una varable aleatora es una varable que toma valores numércos determnados por el resultado de un epermento aleatoro (no hay que confundr la varable aleatora con sus posbles valores)

Más detalles

Modelos triangular y parabólico

Modelos triangular y parabólico Modelos trangular y parabólco ClassPad 0 Prof. Jean-Perre Marcallou INTRODUCCIÓN La calculadora CASIO ClassPad 0 dspone de la Aplcacón Prncpal para realzar los cálculos correspondentes a los modelos trangular

Más detalles

CARTAS DE CONTROL. Han sido difundidas exitosamente en varios países dentro de una amplia variedad de situaciones para el control del proceso.

CARTAS DE CONTROL. Han sido difundidas exitosamente en varios países dentro de una amplia variedad de situaciones para el control del proceso. CARTAS DE CONTROL Las cartas de control son la herramenta más poderosa para analzar la varacón en la mayoría de los procesos. Han sdo dfunddas extosamente en varos países dentro de una ampla varedad de

Más detalles

INTRODUCCIÓN. Técnicas estadísticas

INTRODUCCIÓN. Técnicas estadísticas Tema : Estadístca Descrptva Undmensonal ITRODUCCIÓ Fenómeno determnsta: al repetrlo en déntcas condcones se obtene el msmo resultado. (Ejemplo: lómetros recorrdos en un ntervalo de tempo a una velocdad

Más detalles

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos.

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos. ESTADÍSTICA I. Recuerda: Poblacón: Es el conjunto de todos los elementos que cumplen una determnada propedad, que llamamos carácter estadístco. Los elementos de la poblacón se llaman ndvduos. Muestra:

Más detalles

Dicha tabla adopta la forma del diagrama de árbol del dibujo. En éste, a cada uno de los sucesos A y A c se les ha asociado los sucesos B y B c.

Dicha tabla adopta la forma del diagrama de árbol del dibujo. En éste, a cada uno de los sucesos A y A c se les ha asociado los sucesos B y B c. Estadístca robablístca 6. Tablas de contngenca y dagramas de árbol. En los problemas de probabldad y en especal en los de probabldad condconada, resulta nteresante y práctco organzar la nformacón en una

Más detalles

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio. Tema 9 - Estadístca - Matemátcas B 4º E.S.O. 1 TEMA 9 - ESTADÍSTICA 9.1 DOS RAMAS DE LA ESTADÍSTICA 9.1.1 - INTRODUCCIÓN La estadístca tene por objeto el desarrollo de técncas para el conocmento numérco

Más detalles

UNA FORMA GRÁFICA DE ENSEÑANZA: APLICACIÓN AL DUOPOLIO DE. Dpto. de Métodos Cuantitativos e Informáticos. Universidad Politécnica de Cartagena.

UNA FORMA GRÁFICA DE ENSEÑANZA: APLICACIÓN AL DUOPOLIO DE. Dpto. de Métodos Cuantitativos e Informáticos. Universidad Politécnica de Cartagena. UNA FORMA GRÁFICA DE ENSEÑANZA: APLICACIÓN AL DUOPOLIO DE COURNOT. Autores: García Córdoba, José Antono; josea.garca@upct.es Ruz Marín, Manuel; manuel.ruz@upct.es Sánchez García, Juan Francsco; jf.sanchez@upct.es

Más detalles

Apéndice A: Metodología para la evaluación del modelo de pronóstico meteorológico

Apéndice A: Metodología para la evaluación del modelo de pronóstico meteorológico Apéndce A: Metodología para la evaluacón del modelo de pronóstco meteorológco Apéndce A: Metodología para la evaluacón del modelo de pronóstco meteorológco Tabla de contendos Ap.A Apéndce A: Metodología

Más detalles

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1 Tema 8 - Estadístca - Matemátcas CCSSI 1º Bachllerato 1 TEMA 8 - ESTADÍSTICA 8.1 NOCIONES GENERALES DE ESTADÍSTICA 8.1.1 INTRODUCCIÓN Objetvo: La estadístca tene por objeto el desarrollo de técncas para

Más detalles

1. Lección 7 - Rentas - Valoración (Continuación)

1. Lección 7 - Rentas - Valoración (Continuación) Apuntes: Matemátcas Fnanceras 1. Leccón 7 - Rentas - Valoracón (Contnuacón) 1.1. Valoracón de Rentas: Constantes y Dferdas 1.1.1. Renta Temporal y Pospagable En este caso, el orgen de la renta es un momento

Más detalles

Reconciliación de datos experimentales. MI5022 Análisis y simulación de procesos mineralúgicos

Reconciliación de datos experimentales. MI5022 Análisis y simulación de procesos mineralúgicos Reconclacón de datos expermentales MI5022 Análss y smulacón de procesos mneralúgcos Balances Balances en una celda de flotacón En torno a una celda de flotacón (o un crcuto) se pueden escrbr los sguentes

Más detalles

2.2 TASA INTERNA DE RETORNO (TIR). Flujo de Caja Netos en el Tiempo

2.2 TASA INTERNA DE RETORNO (TIR). Flujo de Caja Netos en el Tiempo Evaluacón Económca de Proyectos de Inversón 1 ANTECEDENTES GENERALES. La evaluacón se podría defnr, smplemente, como el proceso en el cual se determna el mérto, valor o sgnfcanca de un proyecto. Este proceso

Más detalles

4. PROBABILIDAD CONDICIONAL

4. PROBABILIDAD CONDICIONAL . ROBBILIDD CONDICIONL La probabldad de que ocurra un evento B cuando se sabe que ha ocurrdo algún otro evento se denomna robabldad Condconal, Se denota como (B/) y se lee como la probabldad de que ocurra

Más detalles

Relaciones entre variables

Relaciones entre variables Relacones entre varables Las técncas de regresón permten hacer predccones sobre los valores de certa varable Y (dependente), a partr de los de otra (ndependente), entre las que se ntuye que exste una relacón.

Más detalles

Muestra: son datos de corte transversal correspondientes a 120 familias españolas.

Muestra: son datos de corte transversal correspondientes a 120 familias españolas. Capítulo II: El Modelo Lneal Clásco - Estmacón Aplcacones Informátcas 3. APLICACIONES INFORMÁTICAS Fchero : cp.wf (modelo de regresón smple) Seres: : consumo famlar mensual en mles de pesetas RENTA: renta

Más detalles

Tema 1.3_A La media y la desviación estándar

Tema 1.3_A La media y la desviación estándar Curso 0-03 Grado en Físca Herramentas Computaconales Tema.3_A La meda y la desvacón estándar Dónde estudar el tema.3_a: Capítulo 4. J.R. Taylor, Error Analyss. Unv. cence Books, ausalto, Calforna 997.

Más detalles

EXPERIMENTACIÓN COMERCIAL(I)

EXPERIMENTACIÓN COMERCIAL(I) EXPERIMENTACIÓN COMERCIAL(I) En un expermento comercal el nvestgador modfca algún factor (denomnado varable explcatva o ndependente) para observar el efecto de esta modfcacón sobre otro factor (denomnado

Más detalles

Fugacidad. Mezcla de gases ideales

Fugacidad. Mezcla de gases ideales Termodnámca del equlbro Fugacdad. Mezcla de gases deales rofesor: Alí Gabrel Lara 1. Fugacdad 1.1. Fugacdad para gases Antes de abarcar el caso de mezclas de gases, debemos conocer como podemos relaconar

Más detalles

Vida Util, características de la Fiabilidad e Inviabilidad y distribuciones teóricas en el terreno de la fiabilidad

Vida Util, características de la Fiabilidad e Inviabilidad y distribuciones teóricas en el terreno de la fiabilidad Vda Utl, característcas de la Fabldad e Invabldad y dstrbucones teórcas en el terreno de la fabldad Realzado por: Mgter. Leandro D. Torres Vda Utl Este índce se refere a una vda útl meda nomnal y se puede

Más detalles

EL MÉTODO DE DIFERENCIAS FINITAS POR GUILLERMO HERNÁNDEZ GARCÍA

EL MÉTODO DE DIFERENCIAS FINITAS POR GUILLERMO HERNÁNDEZ GARCÍA EL MÉTODO DE DIFERENCIAS FINITAS POR GUILLERMO HERNÁNDEZ GARCÍA . El Método de Dferencas Fntas El Método consste en una aproxmacón de las dervadas parcales por expresones algebracas con los valores de

Más detalles

Econometría. Ayudantía # 01, Conceptos Generales, Modelo de Regresión. Profesor: Carlos R. Pitta 1

Econometría. Ayudantía # 01, Conceptos Generales, Modelo de Regresión. Profesor: Carlos R. Pitta 1 Escuela de Ingenería Comercal Ayudantía # 01, Conceptos Generales, Modelo de Regresón Profesor: Carlos R. Ptta 1 1 cptta@spm.uach.cl Escuela de Ingenería Comercal Ayudantía 01 Parte 01: Comentes Señale

Más detalles

En un mercado hay dos consumidores con las siguientes funciones de utilidad:

En un mercado hay dos consumidores con las siguientes funciones de utilidad: En un mercado hay dos consumdores con las sguentes funcones de utldad: U ( + y, y = ln( + U ( = + y con a >,, y a ln( + donde, =,, es la cantdad del ben consumda por el ndvduo, y es la cantdad de renta

Más detalles

CÁLCULO DE INCERTIDUMBRE EN MEDIDAS FÍSICAS: MEDIDA DE UNA MASA

CÁLCULO DE INCERTIDUMBRE EN MEDIDAS FÍSICAS: MEDIDA DE UNA MASA CÁLCULO DE INCERTIDUMBRE EN MEDIDAS FÍSICAS: MEDIDA DE UNA MASA Alca Maroto, Rcard Boqué, Jord Ru, F. Xaver Rus Departamento de Químca Analítca y Químca Orgánca Unverstat Rovra Vrgl. Pl. Imperal Tàrraco,

Más detalles

TEMA 8: PRÉSTAMOS ÍNDICE

TEMA 8: PRÉSTAMOS ÍNDICE TEM 8: PRÉSTMOS ÍNDICE 1. CONCEPTO DE PRÉSTMO: SISTEMS DE MORTIZCIÓN DE PRÉSTMOS... 1 2. NOMENCLTUR PR PRÉSTMOS DE MORTIZCIÓN FRCCIOND... 3 3. CUDRO DE MORTIZCIÓN GENERL... 3 4. MORTIZCIÓN DE PRÉSTMO MEDINTE

Más detalles

12-16 de Noviembre de 2012. Francisco Javier Burgos Fernández

12-16 de Noviembre de 2012. Francisco Javier Burgos Fernández MEMORIA DE LA ESTANCIA CON EL GRUPO DE VISIÓN Y COLOR DEL INSTITUTO UNIVERSITARIO DE FÍSICA APLICADA A LAS CIENCIAS TECNOLÓGICAS. UNIVERSIDAD DE ALICANTE. 1-16 de Novembre de 01 Francsco Javer Burgos Fernández

Más detalles

Modelos unifactoriales de efectos aleatorizados

Modelos unifactoriales de efectos aleatorizados Capítulo 4 Modelos unfactorales de efectos aleatorzados En el modelo de efectos aleatoros, los nveles del factor son una muestra aleatora de una poblacón de nveles. Este modelo surge ante la necesdad de

Más detalles

OPERACIONES ARMONIZACION DE CRITERIOS EN CALCULO DE PRECIOS Y RENDIMIENTOS

OPERACIONES ARMONIZACION DE CRITERIOS EN CALCULO DE PRECIOS Y RENDIMIENTOS P L V S V LT R A BANCO DE ESPAÑA OPERACIONES Gestón de la Informacón ARMONIZACION DE CRITERIOS EN CALCULO DE PRECIOS Y RENDIMIENTOS El proceso de ntegracón fnancera dervado de la Unón Monetara exge la

Más detalles

VARIABLE ALEATORIA DISCRETA. DISTRIBUCIÓN BINOMIAL.

VARIABLE ALEATORIA DISCRETA. DISTRIBUCIÓN BINOMIAL. VARIABLE ALEATORIA DISCRETA. DISTRIBUCIÓN BINOMIAL. Concepto de varable aleatora. Se llama varable aleatora a toda aplcacón que asoca a cada elemento del espaco muestral de un expermento, un número real.

Más detalles

Cálculo y EstadísTICa. Primer Semestre.

Cálculo y EstadísTICa. Primer Semestre. Cálculo y EstadísTICa. Prmer Semestre. EstadísTICa Curso Prmero Graduado en Geomátca y Topografía Escuela Técnca Superor de Ingeneros en Topografía, Geodesa y Cartografía. Unversdad Poltécnca de Madrd

Más detalles

EJERCICIO 1 1. VERDADERO 2. VERDADERO (Esta afirmación no es cierta en el caso del modelo general). 3. En el modelo lineal general

EJERCICIO 1 1. VERDADERO 2. VERDADERO (Esta afirmación no es cierta en el caso del modelo general). 3. En el modelo lineal general PRÁCTICA 6: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN EJERCICIO. VERDADERO. VERDADERO (Esta afrmacón no es certa en el caso del modelo general. 3. En el modelo lneal general Y =X β + ε, explcar la forma que

Más detalles

Capitalización y descuento simple

Capitalización y descuento simple Undad 2 Captalzacón y descuento smple 2.1. Captalzacón smple o nterés smple 2.1.1. Magntudes dervadas 2.2. Intereses antcpados 2.3. Cálculo de los ntereses smples. Métodos abrevados 2.3.1. Método de los

Más detalles

Descripción de una variable

Descripción de una variable Descrpcón de una varable Tema. Defncones fundamentales. Tabla de frecuencas. Datos agrupados. Meddas de poscón Meddas de tendenca central: meda, medana, moda Ignaco Cascos Depto. Estadístca, Unversdad

Más detalles

Visión moderna del modelo de transporte clásico

Visión moderna del modelo de transporte clásico Vsón moderna del modelo de transporte clásco Zonfcacón y Red Estratégca Datos del Año Base Datos de Planfcacón Para el Año de Dseño Base de Datos año base futuro Generacón de Vajes Demanda Dstrbucón y

Más detalles

ENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 2011 INSTITUTO NACIONAL DE ESTADÍSTICAS

ENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 2011 INSTITUTO NACIONAL DE ESTADÍSTICAS METODOLOGÍA ENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 0 INSTITUTO NACIONAL DE ESTADÍSTICAS 03 ÍNDICE I. METODOLOGÍA ENCUESTA ESTRUCTURAL DE TRANSPORTE INTERURBANO DE PASAJEROS POR CARRETERA.

Más detalles

TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE

TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE LECTURA OBLIGATORIA Regresón Lneal Múltple. En Ral, A. y Varela, J. (008). Estadístca Práctca para la Investgacón en Cencas de la Salud. Coruña: Netbblo.

Más detalles

Estimación del consumo del consumo diario de gas a partir de lecturas periódicas de medidores

Estimación del consumo del consumo diario de gas a partir de lecturas periódicas de medidores Estmacón del consumo del consumo daro de gas a partr de lecturas peródcas de meddores S.Gl, 1, A. Fazzn, 3 y R. Preto 1 1 Gerenca de Dstrbucón del ENARGAS, Supacha 636- (18) CABA- Argentna Escuela de Cenca

Más detalles

UNIVERSIDAD CARLOS III DE MADRID Ingeniería Informática Examen de Investigación Operativa 21 de enero de 2009

UNIVERSIDAD CARLOS III DE MADRID Ingeniería Informática Examen de Investigación Operativa 21 de enero de 2009 UNIVERSIDAD CARLOS III DE MADRID Ingenería Informátca Examen de Investgacón Operatva 2 de enero de 2009 PROBLEMA. (3 puntos) En Murca, junto al río Segura, exsten tres plantas ndustrales: P, P2 y P3. Todas

Más detalles

APLICACIÓN DEL ANALISIS INDUSTRIAL EN CARTERAS COLECTIVAS DE VALORES

APLICACIÓN DEL ANALISIS INDUSTRIAL EN CARTERAS COLECTIVAS DE VALORES APLICACIÓN DEL ANALISIS INDUSTRIAL EN CARTERAS COLECTIVAS DE VALORES Documento Preparado para la Cámara de Fondos de Inversón Versón 203 Por Rodrgo Matarrta Venegas 23 de Setembre del 204 2 Análss Industral

Más detalles

Efectos fijos o aleatorios: test de especificación

Efectos fijos o aleatorios: test de especificación Cómo car?: Montero. R (2011): Efectos fjos o aleatoros: test de especfcacón. Documentos de Trabajo en Economía Aplcada. Unversdad de Granada. España Efectos fjos o aleatoros: test de especfcacón Roberto

Más detalles

Medidas de centralización

Medidas de centralización 1 Meddas de centralzacón Meda Datos no agrupados = x X = n = 0 Datos agrupados = x X = n = 0 Medana Ordenamos la varable de menor a mayor. Calculamos la columna de la frecuenca relatva acumulada F. Buscamos

Más detalles

TEMA 4 Variables aleatorias discretas Esperanza y varianza

TEMA 4 Variables aleatorias discretas Esperanza y varianza Métodos Estadístcos para la Ingenería Curso007/08 Felpe Ramírez Ingenería Técnca Químca Industral TEMA 4 Varables aleatoras dscretas Esperanza y varanza La Probabldad es la verdadera guía de la vda. Ccerón

Más detalles

IES Menéndez Tolosa (La Línea) Física y Química - 1º Bach - Gráficas

IES Menéndez Tolosa (La Línea) Física y Química - 1º Bach - Gráficas IES Menéndez Tolosa (La Línea) Físca y Químca - 1º Bach - Gráfcas 1 Indca qué tpo de relacón exste entre las magntudes representadas en la sguente gráfca: La gráfca es una línea recta que no pasa por el

Más detalles

REGRESION LINEAL SIMPLE

REGRESION LINEAL SIMPLE REGREION LINEAL IMPLE Jorge Galbat Resco e dspone de una mustra de observacones formadas por pares de varables: (x 1, y 1 ) (x, y ).. (x n, y n ) A través de esta muestra, se desea estudar la relacón exstente

Más detalles

MATEMÁTICAS para estudiantes de primer curso de facultades y escuelas técnicas

MATEMÁTICAS para estudiantes de primer curso de facultades y escuelas técnicas Unversdad de Cádz Departamento de Matemátcas MATEMÁTICAS para estudantes de prmer curso de facultades y escuelas técncas Tema 13 Dstrbucones bdmensonales. Regresón y correlacón lneal Elaborado por la Profesora

Más detalles

PROBABILIDAD Y ESTADÍSTICA

PROBABILIDAD Y ESTADÍSTICA PROBABILIDAD Y ESTADÍSTICA 1. S A es un suceso de probabldad 0.3, la probabldad de su suceso contraro es: a) 0. b) 1.0 c) 0.7 (Convocatora juno 006. Eamen tpo H) S A es un suceso, la probabldad de su suceso

Más detalles

LECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION

LECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION Unversdad Católca Los Ángeles de Chmbote LECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION 1. DEFINICION: Las meddas estadístcas

Más detalles

TRABAJO 1: Variables Estadísticas Unidimensionales (Tema 1).

TRABAJO 1: Variables Estadísticas Unidimensionales (Tema 1). TRABAJO 1: Varables Estadístcas Undmensonales (Tema 1). Técncas Cuanttatvas I. Curso 2016/2017. APELLIDOS: NOMBRE: GRADO: GRUPO: DNI (o NIE): A: B: C: D: En los enuncados de los ejerccos que sguen aparecen

Más detalles

GANTT, PERT y CPM INDICE

GANTT, PERT y CPM INDICE GANTT, PERT y CPM INDICE 1 Antecedentes hstórcos...2 2 Conceptos báscos: actvdad y suceso...2 3 Prelacones entre actvdades...3 4 Cuadro de prelacones y matrz de encadenamento...3 5 Construccón del grafo...4

Más detalles

EJERCICIOS RESUELTOS TEMA 2

EJERCICIOS RESUELTOS TEMA 2 EJERCICIOS RESUELTOS TEMA.1. La Moda, para el grupo de Varones de la Tabla 1, es: A) 4,5; B) 17; C) 60.. Con los datos de la Tabla 1, la meda en para las Mujeres es: A) gual a la meda para los Varones;

Más detalles

Correlación y regresión lineal simple

Correlación y regresión lineal simple . Regresón lneal smple Correlacón y regresón lneal smple. Introduccón La correlacón entre dos varables ( e Y) se refere a la relacón exstente entre ellas de tal manera que a determnados valores de se asocan

Más detalles

CAPITULO 3.- ANÁLISIS CONJUNTO DE DOS VARIABLES. 3.1 Presentación de los datos. Tablas de doble entrada.

CAPITULO 3.- ANÁLISIS CONJUNTO DE DOS VARIABLES. 3.1 Presentación de los datos. Tablas de doble entrada. Introduccón a la Estadístca Empresaral Capítulo - Análss conjunto de dos varables Jesús ánchez Fernández CAPITULO - AÁLII COJUTO DE DO VARIABLE Presentacón de los datos Tablas de doble entrada En el capítulo

Más detalles

Maestría en Administración. Medidas Descriptivas. Formulario e Interpretación. Dr. Francisco Javier Cruz Ariza

Maestría en Administración. Medidas Descriptivas. Formulario e Interpretación. Dr. Francisco Javier Cruz Ariza Maestría en Admnstracón Meddas Descrptvas Formularo e Interpretacón Dr. Francsco Javer Cruz Arza A contnuacón mostramos el foco de atencón de las dstntas meddas que abordaremos en el presente manual. El

Más detalles

REGRESION Y CORRELACION

REGRESION Y CORRELACION nav Estadístca (complementos) 1 REGRESION Y CORRELACION Fórmulas báscas en la regresón lneal smple Como ejemplo de análss de regresón, descrbremos el caso de Pzzería Armand, cadena de restaurantes de comda

Más detalles

Media es la suma de todas las observaciones dividida por el tamaño de la muestra.

Media es la suma de todas las observaciones dividida por el tamaño de la muestra. Estadístcos Los estadístcos son valores calculados con los datos de una varable cuanttatva y que mden alguna de las característcas de la dstrbucón muestral. Las prncpales característcas son: tendenca central,

Más detalles

Teoría de Modelos y Simulación Enrique Eduardo Tarifa Facultad de Ingeniería - Universidad Nacional de Jujuy. Generación de Números Aleatorios

Teoría de Modelos y Simulación Enrique Eduardo Tarifa Facultad de Ingeniería - Universidad Nacional de Jujuy. Generación de Números Aleatorios Teoría de Modelos y Smulacón Enrque Eduardo Tarfa Facultad de Ingenería - Unversdad Naconal de Jujuy Generacón de Números Aleatoros Introduccón Este capítulo trata sobre la generacón de números aleatoros.

Más detalles

Organización y resumen de datos cuantitativos

Organización y resumen de datos cuantitativos Organzacón y resumen de datos cuanttatvos Contendos Organzacón de datos cuanttatvos: dagrama de tallos y hojas, tablas de frecuencas. Hstogramas. Polígonos. Ojvas ORGANIZACIÓN Y RESUMEN DE DATOS CUANTITATIVOS

Más detalles

Tema 1: Análisis de datos unidimensionales

Tema 1: Análisis de datos unidimensionales Tema : Análss de datos undmensonales. Varables estadístcas undmensonales. Representacones gráfcas.. Característcas de las dstrbucones de frecuencas undmensonales.. Varables estadístcas undmensonales. Representacones

Más detalles

CESMA BUSINESS SCHOOL

CESMA BUSINESS SCHOOL CESMA BUSINESS SCHOOL MATEMÁTICAS FINANCIERAS. TEMA 4 RENTAS y MÉTODOS DE AMORTIZACIÓN Javer Blbao García 1 1.- Introduccón Defncón: Conjunto de captales con vencmentos equdstantes de tempo. Para que exsta

Más detalles

Economía de la Empresa: Financiación

Economía de la Empresa: Financiación Economía de la Empresa: Fnancacón Francsco Pérez Hernández Departamento de Fnancacón e Investgacón de la Unversdad Autónoma de Madrd Objetvo del curso: Dentro del contexto de Economía de la Empresa, se

Más detalles

Regresión Lineal Simple y Correlación

Regresión Lineal Simple y Correlación 4 Regresón Lneal Smple y Correlacón 4.1. Fundamentos teórcos 4.1.1. Regresón La regresón es la parte de la estadístca que trata de determnar la posble relacón entre una varable numérca, que suele llamarse

Más detalles

Vectores VECTORES 1.- Magnitudes Escalares y Magnitudes Vectoriales. Las Magnitudes Escalares: Las Magnitudes Vectoriales:

Vectores VECTORES 1.- Magnitudes Escalares y Magnitudes Vectoriales. Las Magnitudes Escalares: Las Magnitudes Vectoriales: VECTOES 1.- Magntudes Escalares y Magntudes Vectorales. Las Magntudes Escalares: son aquellas que quedan defndas úncamente por su valor numérco (escalar) y su undad correspondente, Eemplo de magntudes

Más detalles

INSTITUTO DE FÍSICA FACULTAD DE INGENIERÍA

INSTITUTO DE FÍSICA FACULTAD DE INGENIERÍA INSTITUTO DE FÍSICA FACULTAD DE INGENIERÍA LABORATORIO 1-008 PRACTICA 4: LEYES DE LOS GASES 1. OBJETIVOS ) Comprobacón expermental de las leyes de los gases. En este caso nos vamos a concentrar en el estudo

Más detalles

Investigación y Técnicas de Mercado. Previsión de Ventas TÉCNICAS CUANTITATIVAS ELEMENTALES DE PREVISIÓN UNIVARIANTE. (IV): Ajustes de Tendencia

Investigación y Técnicas de Mercado. Previsión de Ventas TÉCNICAS CUANTITATIVAS ELEMENTALES DE PREVISIÓN UNIVARIANTE. (IV): Ajustes de Tendencia Investgacón y Técncas de Mercado Prevsón de Ventas TÉCNICAS CUANTITATIVAS ELEMENTALES DE PREVISIÓN UNIVARIANTE. (IV): s de Tendenca Profesor: Ramón Mahía Curso 00-003 I.- Introduccón Hasta el momento,

Más detalles

PARÁMETROS DE UNA DISTRIBUCIÓN DE PROBABILIDAD DISCRETA Media aritmética: μ = x

PARÁMETROS DE UNA DISTRIBUCIÓN DE PROBABILIDAD DISCRETA Media aritmética: μ = x Dstrbucones de Probabldad dscretas-bn1b DISTRIBUIONES DISRETAS DE PROBABILIDAD Dstrbucones dscretas son aquellas en las que la varable sólo puede tomar valores aslados. Ejemplo: lanzar una moneda ( valores:

Más detalles

LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA

LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA. LA MEDIANA: Es una medda de tendenca central que dvde al total de n observacones debdamente ordenadas

Más detalles

CAPÍTULO 3 METODOLOGÍA. En el siguiente capítulo se presenta al inicio, definiciones de algunos conceptos actuariales

CAPÍTULO 3 METODOLOGÍA. En el siguiente capítulo se presenta al inicio, definiciones de algunos conceptos actuariales CAPÍTULO 3 METODOLOGÍA En el sguente capítulo se presenta al nco, defncones de algunos conceptos actuarales que se utlzan para la elaboracón de las bases técncas del Producto de Salud al gual que la metodología

Más detalles

De factores fijos. Mixto. Con interacción Sin interacción. No equilibrado. Jerarquizado

De factores fijos. Mixto. Con interacción Sin interacción. No equilibrado. Jerarquizado Análss de la varanza con dos factores. Introduccón Hasta ahora se ha vsto el modelo de análss de la varanza con un factor que es una varable cualtatva cuyas categorías srven para clasfcar las meddas de

Más detalles

Variable aleatoria: definiciones básicas

Variable aleatoria: definiciones básicas Varable aleatora: defncones báscas Varable Aleatora Hasta ahora hemos dscutdo eventos elementales y sus probabldades asocadas [eventos dscretos] Consdere ahora la dea de asgnarle un valor al resultado

Más detalles

FUNDAMENTOS QUIMICOS DE LA INGENIERIA

FUNDAMENTOS QUIMICOS DE LA INGENIERIA FUNDAMENTOS QUIMICOS DE LA INGENIERIA (BLOQUE DE INGENIERIA QUIMICA) GUION DE PRACTICAS DE LABORATORIO ANTONIO DURÁN SEGOVIA JOSÉ MARÍA MONTEAGUDO MARTÍNEZ INDICE PRACTICA PAGINA BALANCE MACROSCÓPICO DE

Más detalles

Convertidores Digital-Analógico y Analógico-Digital

Convertidores Digital-Analógico y Analógico-Digital Convertdores Dgtal-Analógco y Analógco-Dgtal Conversón Dgtal-Analógca y Analógca-Dgtal Con estos crcutos se trata de consegur una relacón bunívoca entre una señal analógca y una dgtal o vceversa. Las magntudes

Más detalles

TEMA 5. EL SISTEMA DE PRODUCCIÓN DE LA EMPRESA (I) CONTENIDO

TEMA 5. EL SISTEMA DE PRODUCCIÓN DE LA EMPRESA (I) CONTENIDO Págna de 4 TEMA 5. EL SISTEMA DE PRODUCCIÓN DE LA EMPRESA (I) CONTENIDO INTRODUCCIÓN... 2 2 CLASIFICACIÓN DE LAS ACTIVIDADES PRODUCTIVAS... 4 3 FUNCIÓN DE PRODUCCIÓN... 3 4 CLASIFICACIÓN DE LOS PROCESOS

Más detalles

CAPÍTULO 5 REGRESIÓN CON VARIABLES CUALITATIVAS

CAPÍTULO 5 REGRESIÓN CON VARIABLES CUALITATIVAS CAPÍTULO 5 REGRESIÓN CON VARIABLES CUALITATIVAS Edgar Acuña Fernández Departamento de Matemátcas Unversdad de Puerto Rco Recnto Unverstaro de Mayagüez Edgar Acuña Analss de Regreson Regresón con varables

Más detalles

PRÁCTICA 16: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN

PRÁCTICA 16: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN PRÁCTICA 6: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN EJERCICIO. VERDADERO. VERDADERO (Esta afrmacón no es certa en el caso del modelo general). 3. En el modelo lneal general Y = X b + e, explcar la forma

Más detalles

La adopción y uso de las TICs en las Microempresas Chilenas

La adopción y uso de las TICs en las Microempresas Chilenas Subdreccón Técnca Depto. Investgacón y Desarrollo Estadístco Subdreccón de Operacones Depto. Comerco y Servcos INFORME METODOLÓGICO DISEÑO MUESTRAL La adopcón y uso de las TICs en las Mcroempresas Clenas

Más detalles

Tema 1: Estadística Descriptiva Unidimensional Unidad 2: Medidas de Posición, Dispersión y de Forma

Tema 1: Estadística Descriptiva Unidimensional Unidad 2: Medidas de Posición, Dispersión y de Forma Estadístca Tema 1: Estadístca Descrptva Undmensonal Undad 2: Meddas de Poscón, Dspersón y de Forma Área de Estadístca e Investgacón Operatva Lceso J. Rodríguez-Aragón Septembre 2010 Contendos...............................................................

Más detalles

Continua: Corriente cuyo valor es siempre constante (no varía con el tiempo). Se denota como c.c.

Continua: Corriente cuyo valor es siempre constante (no varía con el tiempo). Se denota como c.c. .. TIPOS DE CORRIENTES Y DE ELEMENTOS DE CIRCUITOS Contnua: Corrente cuyo valor es sempre constante (no varía con el tempo). Se denota como c.c. t Alterna: Corrente que varía snusodalmente en el tempo.

Más detalles

Optimización no lineal

Optimización no lineal Optmzacón no lneal José María Ferrer Caja Unversdad Pontfca Comllas Planteamento general mn f( x) x g ( x) 0 = 1,..., m f, g : n R R La teoría se desarrolla para problemas de mnmzacón, los problemas de

Más detalles

XII. Uso de la Estimación de la Distribución de Probabilidad para Muestras Pequeñas y de la Simulación en la Inferencia de Carteras de Seguros.

XII. Uso de la Estimación de la Distribución de Probabilidad para Muestras Pequeñas y de la Simulación en la Inferencia de Carteras de Seguros. Uso de la Estmacón de la Dstrbucón de Probabldad para Muestras Pequeñas y de la Smulacón en la Inferenca de Carteras de Seguros. Trabajo presentado para el XII Premo de Investgacón sobre Seguros y Fanzas

Más detalles

TÉCNICAS AUXILIARES DE LABORATORIO

TÉCNICAS AUXILIARES DE LABORATORIO TÉCNICAS AUXILIARES DE LABORATORIO I.- ERRORES 1.- Introduccón Todas las meddas epermentales venen afectadas de una mprecsón nherente al proceso de medda. Puesto que en éste se trata, báscamente, de comparar

Más detalles

Condiciones Generales TestQual 2013

Condiciones Generales TestQual 2013 Condcones Generales TestQual 2013 Ejerccos TestQual 2013: En el presente documento se descrben las Condcones Generales de aplcacón en los Programas de Intercomparacón de TestQual. Con la solctud de uno

Más detalles

TEMA 6 AMPLIFICADORES OPERACIONALES

TEMA 6 AMPLIFICADORES OPERACIONALES Tema 6 Amplfcadores peraconales ev 4 TEMA 6 AMPLIFICADES PEACINALES Profesores: Germán llalba Madrd Mguel A. Zamora Izquerdo Tema 6 Amplfcadores peraconales ev 4 CNTENID Introduccón El amplfcador dferencal

Más detalles

LECTURA N 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) TEMA 14: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION

LECTURA N 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) TEMA 14: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION Unversdad Católca Los Ángeles de Chmbote LECTURA N 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) TEMA 4: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION. DEFINICION Las meddas estadístcas son meddas de resumen

Más detalles

Perturbación de los valores propios simples de matrices de polinomios dependientes diferenciablemente de parámetros

Perturbación de los valores propios simples de matrices de polinomios dependientes diferenciablemente de parámetros Perturbacón de los valores propos smples de matrces de polnomos dependentes dferencablemente de parámetros M Isabel García-Planas 1, Sona Tarragona 2 1 Dpt de Matemàtca Aplcada I, Unverstat Poltècnca de

Más detalles

Reconocimiento de Imágenes Empleando Redes de Regresión General y la Técnica TVS

Reconocimiento de Imágenes Empleando Redes de Regresión General y la Técnica TVS Reconocmento de Imágenes Empleando Redes de Regresón General y la Técnca TVS Rcardo García-Herrera & Waltero Wolfgang Mayol-Cuevas Laboratoro de INvestgacón para el Desarrollo Académco Depto. Ingenería

Más detalles

Consideremos un sólido rígido sometido a un sistema de fuerzas en equilibrío, es decir

Consideremos un sólido rígido sometido a un sistema de fuerzas en equilibrío, es decir 1. PRINIPIO E TRJOS VIRTULES El prncpo de los trabajos rtuales, en su ertente de desplazamentos rtuales, fue ntroducdo por John ernoull en 1717. La obtencón del msmo dera de la formulacón débl (o ntegral)

Más detalles

Análisis de Weibull. StatFolio de Muestra: Weibull analysis.sgp

Análisis de Weibull. StatFolio de Muestra: Weibull analysis.sgp Análss de Webull Resumen El procedmento del Análss de Webull está dseñado para ajustar una dstrbucón de Webull a un conjunto de n observacones. Es comúnmente usado para analzar datos representando tempos

Más detalles

Análisis Matemático en la Economía: Optimización y Programación. Augusto Rufasto

Análisis Matemático en la Economía: Optimización y Programación. Augusto Rufasto Análss Matemátco en la Economía: Optmzacón y Programacón arufast@yahoo.com-rufasto@lycos.com www.geoctes.com/arufast-http://rufasto.trpod.com La optmzacón y la programacón están en el corazón del problema

Más detalles

TERMODINÁMICA DEL EQUILIBRIO CAPÍTULO V. EQUILIBRIO DE REACCIÓN QUÍMICA

TERMODINÁMICA DEL EQUILIBRIO CAPÍTULO V. EQUILIBRIO DE REACCIÓN QUÍMICA Ing. Federco G. Salazar Termodnámca del Equlbro TERMODINÁMICA DEL EQUILIBRIO CAPÍTULO V. EQUILIBRIO DE REACCIÓN QUÍMICA Contendo 1. Conversón y Coordenada de Reaccón. 2. Ecuacones Independentes y Regla

Más detalles

Unidad I. 1. 1. Definición de reacción de combustión. 1. 2. Clasificación de combustibles

Unidad I. 1. 1. Definición de reacción de combustión. 1. 2. Clasificación de combustibles 2 Undad I.. Defncón de reaccón de combustón La reaccón de combustón se basa en la reaccón químca exotérmca de una sustanca (o una mezcla de ellas) denomnada combustble, con el oxígeno. Como consecuenca

Más detalles

PRECIOS MEDIOS ANUALES DE LAS TIERRAS DE USO AGRARIO (METODOLOGÍA)

PRECIOS MEDIOS ANUALES DE LAS TIERRAS DE USO AGRARIO (METODOLOGÍA) SECREARÍA ENERAL ÉCNICA MINISERIO DE ARICULURA, ALIMENACIÓN Y MEDIO AMBIENE SUBDIRECCIÓN ENERAL DE ESADÍSICA PRECIOS MEDIOS ANUALES DE LAS IERRAS DE USO ARARIO (MEODOLOÍA) OBJEIVO: Desde 1983 el Mnstero

Más detalles

Introducción al riesgo de crédito

Introducción al riesgo de crédito Introduccón al resgo de crédto Estrella Perott Investgador Senor Bolsa de Comerco de Rosaro eperott@bcr.com.ar. Introduccón El resgo credtco es el resgo de una pérdda económca como consecuenca de la falta

Más detalles

Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis

Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis Tema. Estadístcos unvarados: tendenca central, varabldad, asmetría y curtoss 1. MEDIDA DE TEDECIA CETRAL La meda artmétca La medana La moda Comparacón entre las meddas de tendenca central. MEDIDA DE VARIACIÓ

Más detalles

Análisis de Sistemas Multiniveles de Inventario con demanda determinística

Análisis de Sistemas Multiniveles de Inventario con demanda determinística 7 Congreso Naconal de Estadístca e Investgacón Operatva Lleda, 8- de abrl de 00 Análss de Sstemas Multnveles de Inventaro con demanda determnístca B. Abdul-Jalbar, J. Gutérrez, J. Scla Departamento de

Más detalles

Trabajo Especial 2: Cadenas de Markov y modelo PageRank

Trabajo Especial 2: Cadenas de Markov y modelo PageRank Trabajo Especal 2: Cadenas de Markov y modelo PageRank FaMAF, UNC Mayo 2015 1. Conceptos prelmnares Sea G = (V, E, A) un grafo drgdo, con V = {1, 2,..., n} un conjunto (contable) de vértces o nodos y E

Más detalles

1.- Objetivo Alcance Metodología...3

1.- Objetivo Alcance Metodología...3 PROCEDIMIENTO DO PARA EL CÁLCULO DEL FACTOR DE DESEMPEÑO DEL CONTROL DE FRECUENCIA (FECF) EN EL SIC DIRECCIÓN DE OPERACIÓN ÍNDICE 1.- Objetvo...3 2.- Alcance...3 3.- Metodología...3 3.1.- Cálculo de la

Más detalles

PROBLEMAS DE ELECTRÓNICA ANALÓGICA (Diodos)

PROBLEMAS DE ELECTRÓNICA ANALÓGICA (Diodos) PROBLEMAS DE ELECTRÓNCA ANALÓGCA (Dodos) Escuela Poltécnca Superor Profesor. Darío García Rodríguez . En el crcuto de la fgura los dodos son deales, calcular la ntensdad que crcula por la fuente V en funcón

Más detalles