3. Análisis de Factores

Tamaño: px
Comenzar la demostración a partir de la página:

Download "3. Análisis de Factores"

Transcripción

1 3. Análss de Factores 3.. Introduccón y objetvos. El análss de factores es un procedmento estadístco que crea un nuevo conjunto de varables no correlaconadas entre sí, llamadas factores subyacentes o factores comunes, con la esperanza de que estas nuevas varables proporconen una mejor comprensón de los datos. Uno de los objetvos báscos del análss de factores es determnar s las p varables respuesta exhben patrones de relacón entre sí, de tal manera que las varables se puedan dvdr en m grupos, y que cada grupo conste de varables altamente correlaconadas entre sí, pero bajamente correlaconadas con varables de otros grupos. Los OBJETIVOS del análss de factores son: ) Determnar s exste un conjunto más pequeño de varables no correlaconadas que explquen las relacones que exsten entre las varables orgnales. ) Determnar el número de varables (dferentes) subyacentes. 3) Interpretar estas nuevas varables. 4) Evaluar a los ndvduos del conjunto de datos sobre estas nuevas varables. 5) Usar estas nuevas varables en análss estadístcos posterores. 35

2 3.. Modelo de factores ortogonales. Sea X un v.a. de dmensón p, con meda y matrz de varanzascovaranzas. El modelo general de análss de factores supone que exsten m factores subyacentes, denotados por F,F,...,F m, tales que Los supuestos del modelo son: ) Los F tenen meda cero y varanza, para =,...,m y además están no correlaconados. ) Los j tenen meda cero y varanza j, para j=,...,p. ) F y j son ndependentes para =,...,m y j=,...,p. NOTACIÓN MATRICIAL: El modelo se puede expresar como donde,, X F, (7.) Λ Λ Λ Λ,, y Λ Λ Λ Λ Λ Λ En forma matrcal los supuestos quedan como: ) F ( 0, I ), ) ( 0, ), en donde = dag(,,..., p ), y ) F y son ndependentes. 36

3 INTERPRETACIONES: Las nuevas varables F son llamadas factores subyacentes o factores comunes. Los térmnos j son llamados factores específcos y descrben la varacón resdual específca a la varable X j. La cantdad j es llamada varanza resdual específca de la varable X j. Los coefcentes j son llamados pesos de la j-ésma varable en el -ésmo factor. De hecho, CovX, F. j j COVARIANZA: El modelo (7.) mplca que por lo tanto, Var(X) Var( F ),. (7.) OBSERVACIONES: S exsten y de modo que la relacón (7.) se satsfaga, entonces los factores comunes explcan con exacttud la covaranza entre las varables orgnales. La varanza de X j se puede dvdr de la sguente manera: Algunas covaranzas son: Var(X j ) = Comunaldad + Varanza específca Cov X, X j j m jm 37

4 NO UNICIDAD de los factores. S m >, la matrz de pesos de los factores no es únca, es decr, s exsten y que satsfacen (7.), entonces TT TT, * * donde T es una matrz ortogonal,.e., tambén satsfacen (7.). TT I. Por lo tanto * T y Tomando ventaja de la no uncdad de la matrz de pesos, se pueden obtener dstntas matrces rotadas * T, para dstntas matrces ortogonales T, de tal manera que alguna de ellas produzca unos factores son una nterpretacón adecuada. SOLUCIONES de la ecuacón (7.). Una solucón ncal se puede obtener resolvendo el sstema de ecuacones numércamente. Dos de los métodos más comunes son: Método de factores prncpales y Método de máxma verosmltud (s suponemos una dstrbucón normal para F y ). MÉTODOS DE ROTACIÓN. La dea de los métodos de rotacón es que se tengan factores fácl de nterpretar. Para ello, el objetvo es que las varables orgnales no tengan peso alto en más de un factor. El método más común es el VARIMAX. CUÁNTOS factores son necesaros?. Recuerda que el número de factores comunes o subyacentes es un número fjo que, en prncpo, se determna a- pror. Una posble eleccón ncal sería tomar a m como el número de componentes sgnfcatvas en un análss de componentes prncpales, o 38

5 tomar el número de cúmulos resultantes de un análss de cúmulos de varables usando como dstancas una funcón de la correlacón. MARCADORES de los factores. S los factores resultantes del análss de factores se van a usar posterormente, es necesaro calcular el valor o marcador de cada factor para cada ndvduo. Para cada ndvduo se tene, x F, en donde la matrz de pesos se estma y las cantdades son no observables y por lo tanto no se conocen. Exsten dos métodos prncpalmente, el método de Bartlett o de mínmos cuadrados y el método de Thompson o de regresón Cometaros y notas fnales. DIFERENCIAS entre un análss de componentes prncpales (ACP) y un análss de factores (AF). ) El ACP produce una transformacón ortogonal de las varables y no depende de un modelo subyacente, mentras que el AF sí depende de un modelo estadístco. ) En el ACP el objetvo es explcar la varanza de las varables orgnales, mentras que en el AF el objetvo es explcar la estructura de covaranza (correlacón) entre las varables. NOTA : El AF crea un nuevo conjunto de varables no correlaconadas a partr de un conjunto de varables correlaconadas, por lo que s las varables orgnales son no correlaconadas entonces no tene sentdo aplcar un AF. 39

6 NOTA : Algunos estadístcos creen que el análss de factores no es una técnca estadístca válda y útl, esto se debe a la no uncdad de sus resultados y a la subjetvdad relaconada con sus numerosos aspectos (determnacón del número de factores, nterpretacón de los factores, etc.). NOTA 3: La presentacón de las deas de AF supone explcar la matrz de varanzas y covaranzas, pero en la práctca este tpo de análss se hace sobre la matrz de varanzas y covaranzas de las varables estandarzadas, es decr, sobre la matrz de correlacones de las varables orgnales. R: factanal, rotate. 40

7 4. Análss de correspondencas OBJETIVO: Procedmento gráfco para representar asocacones en una tabla de frecuencas o conteos. Para la descrpcón del método nos concentraremos en una tabla de frecuencas de dos varables categórcas o tabla de contngenca. El número de renglones corresponde al número de categorías de la prmer varable y el número de columnas al número de categorías de la segunda varable. S la tabla de contngenca tene I renglones y J columnas, entonces la gráfca producda por el análss de correspondencas contene dos conjuntos de puntos: un conjunto de I puntos correspondente a los renglones y otro conjunto de J puntos correspondente a las columnas. La poscón de los puntos refleja asocacones. INTERPRETACIÓN de una gráfca de correspondencas: o Los puntos correspondentes a los renglones que se encuentran cercanos entre sí, ndcan categorías de la prmer varable que tenen perfles smlares (en sus dstrbucones condconales a lo largo de las columnas). o Smlarmente, puntos correspondentes a las columnas cercanos entre sí ndcan categorías de la segunda varable con perfles smlares (en sus dstrbucones condconales a lo largo de los renglones). o Fnalmente, puntos renglones cercanos a puntos columna representan combnacones que ocurren más frecuentemente que lo que se esperaría con un modelo de ndependenca (entre las dos varables categórcas). 4

8 La salda usual de un análss de correspondencas ncluye dos cosas: () la mejor representacón bdmensonal de los datos, junto con las coordenadas de cada uno de los puntos, y () una medda de la cantdad de nformacón representada en cada dmensón, llamada nerca. 4.. Otro repaso de matrces Descomposcón en valor sngular: Sea A una matrz de números reales de dmensón m. Entonces exste una matrz ortogonal U de dmensón m m y una matrz ortogonal V de dmensón, tal que A UV, donde la matrz, de dmensón m, tene elementos 0 en la entrada (,),,,,mn(m,) y ceros en las demás entradas. Las constantes postvas son llamadas valores sngulares de A. RESULTADO: Aproxmacón de una matrz A por otra matrz B de menor rango. Sea A una matrz de números reales de dmensón m, con m y descomposcón en valor sngular Entonces A UV. Sea s Rango(A). B s u v Es la aproxmacón de mínmos cuadrados de A de rango s. Es decr, la matrz B mnmza tr m A BA B a j bj j 4

9 Sobre todas las matrces de dmensón m de rango no mayor a s. El valor mínmo, o error de aproxmacón, es s. 4.. Desarrollo algebraco del análss de correspondencas Sea X x j una matrz de dmensón I J que representa una tabla de contngenca, es decr, x j frecuenca de ocurrencas de la categoría de la varable uno y de la categoría j de la varable dos. Supongamos que I J y que X es de rango completo,.e., Rango(X)J. Sea n el total de las frecuencas en la matrz o tabla de contngenca X. ALGUNAS DEFINICIONES: o Defnmos a P n como la matrz de proporcones tal que P p j con para,,i y j,,j. X x j pj n, A la matrz P se le conoce como matrz de correspondencas. 43

10 o Defnmos los totales renglón y columna de P como los vectores R y C respectvamente, tal que R r,, y C c,, r I J r y c p j j I j p j c J, donde o Sean D r y D c matrces dagonales de dmensones I I y J J respectvamente, tales que D r dagr,, r y D dagc,, c I c. J El objetvo del análss de correspondencas consste en encontrar una matrz Pˆ pˆ j de menor rango que P que la aproxme en mínmos cuadrados ponderados. Es decr, Pˆ debe mnmzar I J j p j pˆ r c j j. Se puede demostrar que la aproxmacón Pˆ, de rango K, de P está dada por K D / u D / v Pˆ RC, donde los son los valores sngulares y u, de dmensón I, y v, de dmensón J, son los correspondentes vectores sngulares de la matrz D / r / P RC D de dmensón I J. c r c / Sean F D r D r U y G D c D c V dos matrces defndas con los / elementos del párrafo anteror, entonces la gráfca de correspondencas o mapa smétrco se construye al grafcar las dos prmeras columnas de la 44

11 matrz F como coordenadas de los puntos renglón y las dos prmeras columnas de la matrz G como coordenadas de los puntos columna. INERCIA: La nerca es una medda de la varacón en una tabla de contngenca y se defne como: Inerca I J j p j r c r c j j J Interpretacón: La gráfca de correspondencas corresponde a la aproxmacón de rango de la matrz P. Entonces, la proporcón J Se puede nterpretar como el porcentaje de la varacón total de la tabla explcada por la gráfca de correspondencas. R: corresp. 45

12 5. Análss de conglomerados o grupos OBJETIVO: Dvdr a los ndvduos de una base de datos en grupos, llamados cúmulos (clusters), de tal manera que los ndvduos de un msmo cúmulo tengan característcas semejantes con respecto a las varables meddas. 5.. Meddas de smlardad y dsmlardad. Para hacer un análss de cúmulos es necesaro medr de alguna manera la smlardad o dsmlardad entre dos observacones multvaradas. TIPOS DE DISTANCIAS: Exsten varas formas de medr la smlardad o dsmlardad entre observacones. Las dstancas (dsmlardades) más comunes son 3. Sean x y x j dos observacones multvaradas. ) Dstanca eucldana. Es la norma del vector de dferencas de las dos observacones, d j x x x x / x x x x. j j ) Dstanca eucldana estandarzada. Es la norma del vector de dferencas de las dos observacones estandarzadas, d j j z z z z /, j donde z y z j son las observacones estandarzadas. Esta dstanca es la más usada. 3) Dstanca de Mahalanobs. Es una dstanca eucldana ponderada por la matrz de varanzas y covaranzas, j p jp 46

13 d j x x x x / j j. Nota: S las característcas de un ndvduo no se pueden representar medante varables (contnuas), es posble medar las smlardades entre ndvduos medante la presenca o ausenca de certa característca (varables bnaras). 5.. Métodos gráfcos útles. Exsten varos algortmos para formar cúmulos. De hecho, algortmos dferentes pueden producr dstntas agrupacones. Más aún, el análss de cúmulos puede detectar grupos que no exstan en la realdad. Una forma de evaluar los resultados de los métodos de agrupacón, es medante métodos gráfcos. DIAGRAMAS DE DISPERSIÓN. Cuando se tenen úncamente dos varables de nterés (p = ), un dagrama de dspersón entre ellas permtría vsualzar posbles agrupacones entre los ndvduos. GRÁFICAS DE COMPONENTES PRINCIPALES. Cuando el número de varables de nterés es mayor a dos (p > ), se puede mplementar un análss de componentes prncpales. S la proporcón de la varabldad explcada por las dos prmeras componentes es sgnfcatva ( 80%) se puede realzar un dagrama de dspersón de los marcadores de las dos prmeras componentes y vsualzar la posble exstenca de cúmulos. 47

14 NOTA: S el número de varables es grande (p > 0), es más recomendable realzar prmero un análss de componentes prncpales y posterormente aplcar las técncas de análss de cúmulos a las prmeras r componentes, que aplcar drectamente un análss de cúmulos a las varables orgnales. PRECAUCIÓN!: Los marcadores de las componentes prncpales nunca deben estandarzarse. Esto es porque los marcadores estandarzados no reflejan de manera realsta las dstancas entre ndvduos. DIAGRAMA DE ANDREWS. Este tpo de gráfcas, aplcadas sobre las varables orgnales, son muy útles para dentfcar cúmulos y para valdar los resultados de un análss de cúmulos. Los ndvduos en el msmo cúmulo deben de tener gráfcas de Andrews smlares. OTROS TIPOS DE DIAGRAMAS. Otros métodos gráfcos como los dagramas de dspersón trdmensonales, dagrama de burbujas, las caras de Chernoff y los dagramas de estrellas son útles para valdar un análss de cúmulos. Sn embargo, las caras de Chernoff y los dagramas de estrellas perden sencllez e nterpretacón cuando el número de varables aumenta Métodos para realzar análss de cúmulos. TIPOS DE MÉTODOS. Exsten dos tpos de métodos para realzar un análss de cúmulos: Métodos jerárqucos y métodos no jerárqucos. 48

15 MÉTODOS JERÁRQUICOS: Este tpo de métodos consste en una sere de unones o una sere de dvsones sucesvas. Los resultados de estos métodos se muestran en un dagrama bdmensonal llamado dendrograma (dendrogram). ) Métodos de unones. Se nca tomando a cada ndvduo como un cúmulo, los cúmulos (ndvduos) más smlares se agrupan entre sí y así sucesvamente hasta que la dsmlardad entre dstntos cúmulos va decrecendo. Eventualmente, todos los ndvduos quedan agrupados en un solo cúmulo. Los métodos de aglomeracón más comunes son: a. Método del vecno más cercano (lga senclla). b. Método del vecno más lejano (lga completa). c. Método de la dstanca promedo (lga promedo). d. Método de la varanza mínma de Ward. ) Métodos de dvsones. Estos métodos trabajas en sentdo opuesto a los anterores. Se nca tomando a todos los ndvduos en un solo cúmulo. Este cúmulo únco se dvde en dos subcúmulos de tal manera que los ndvduos en uno de los subcúmulos se encuentran lejos de los ndvduos en el otro subcúmulo. El proceso se contnua hasta que hay el msmo número de cúmulos que ndvduos. MÉTODOS NO JERÁRQUICOS: Este tpo de métodos consste producr un número fjo de cúmulos, dgamos K. El número K puede estar preestablecdo o puede ser obtendo como parte del proceso. Este tpo de métodos puede ncar con una partcón ncal de ndvduos en cúmulos o 49

16 una seleccón ncal de puntos semlla que van a formar el centrode de los cúmulos. El método más común es: a. Método de K-medas. NOTA: Los métodos no jerárqucos requeren de menos trabajo computaconal, por lo que pueden aplcarse a bases de datos más grandes que los métodos jerárqucos. ALGORITMO GENERAL PARA EL MÉTODO JERÁRQUICO DE UNIONES. Supongamos que el número total de ndvduos a agrupar es n.. Empeza con n cúmulos, cada uno contenendo a un solo ndvduo.. Calcula la dstanca entre cada uno de los cúmulos y determna los cúmulos con dstanca mínma, dgamos U y V (cuya dstanca se denota como d UV ). 3. Une los cúmulos U y V y nombra al nuevo cúmulo (UV). Calcula de nuevo las dstancas entre este nuevo cúmulo y los demás cúmulos. 4. Repte los pasos y 3 un total de n- veces,.e. hasta que todos los ndvduos pertenezcan al msmo cúmulo. Regstra los cúmulos que se van unendo y las dstancas a las que la unón ocurre. DEFINICIÓN DE LAS DISTANCIAS entre cúmulos: Para el Paso : D en la Seccón 5.. d j, donde d j es cualquera de las dstanca defndas 50

17 Para el Paso 3: Supongamos que los cúmulos (ndvduos) con menor dstanca fueron U y V y se uneron para formar el cúmulo (UV). La dstanca entre el nuevo cúmulo (UV) y otro cúmulo W es: a. Método del vecno más cercano: La dstanca entre cúmulos se defne como la dstanca entre los dos elementos (uno de cada cúmulo) que están más cercanos,.e., d. ( UV)W mn d UW, d VW b. Método del vecno más lejano: La dstanca entre cúmulos se defne como la dstanca entre los dos elementos (uno de cada cúmulo) que están más lejanos,.e., d. ( UV)W max d UW, d VW Este método asegura que todos los elementos de un cúmulo están dentro de una dstanca máxma uno del otro. c. Método de la dstanca promedo. La dstanca entre cúmulos se defne como el promedo de todas las dstancas entre dos elementos (uno de cada cúmulo),.e., d (UV)W d UW dvw. Método de la varanza mínma de Ward. D d j, donde d j es una dstanca medda en térmnos de la varanza muestral de la unón de los cúmulos y j. Es decr, 5

18 d j ~ (j) n n n n j j x x (j) Igual que en los tres métodos anterores, los cúmulos U y V se unen s su dstanca (varanza muestral de la unón) es la más pequeña de todas. MÉTODO DE K-MEDIAS (NO JERÁRQUICO). Este algortmo asgna cada ndvduo al cúmulo que tenga el centrode más cercano. En general, el algortmo se puede representar por los sguentes pasos:. Partconar al conjunto de ndvduos en K cúmulos ncales y calcula el centrode (meda) de cada cúmulo.. Calcula la dstanca (eucldana) de cada ndvduo a cada uno de los K centrodes. Reasgna cada ndvduo al cúmulo cuya dstanca al centrode sea la menor. 3. Repte el Paso hasta que nngún ndvduo sea reasgnado a un cúmulo nuevo. COMETARIOS FINALES: El número de cúmulos óptmo se determna vsualzando el dendrograma y determnando una dstanca para la cual los grupos están ben dferencados. 5

19 El método del vecno más cercano tende a maxmzar la dstanca entre los cúmulos, producendo un menor número de cúmulos que los demás métodos. En cambo, el método del vecno más lejano tende a mnmzar las dstancas dentro de cada cúmulo, por lo que produce un número más grande de cúmulos que los demás métodos. Estas propedades se pueden vsualzar cortando los dendrogramas a una msma dstanca. El método de K-medas es muy crtcado porque fja de antemano el número K de cúmulos. La agrupacón perfecta no es tan senclla de obtener, por lo que es recomendable ntentar con más de un método. S varos métodos dan resultados semejantes, entonces se puede suponer que exste una agrupacón natural de los ndvduos. Es mportante realzar una evaluacón gráfca de los métodos de análss de cúmulos. 53

20 Nota. Los métodos jerárqucos se pueden usar para formar cúmulos de varables, usando como medda de dstanca uno menos el valor absoluto de la correlacón muestral entre ellas. R: hclust, means Escalamento multdmensonal DEFINICIÓN: El escalamento multdmensonal es una técnca que permte mapear (convertr, copar) en un espaco de menos dmensones las dstancas orgnales entre ndvduos que se encuentran en un espaco de muchas dmensones. UTILIDAD: Resulta de mucha utldad mapear dstancas de un espaco de muchas dmensones a un espaco de dmensón, ya que en este caso los ndvduos se pueden representar en una gráfca de dos dmensones y se puede aprecar vsualmente la cercanía a lejanía entre ellos. En general, la dea del escalamento multdmensonal es representar las dstancas entre ndvduos que orgnalmente se encuentran en un espaco p-dmensonal a un espaco q-dmensonal, donde q < p. Por sencllez, se acostumbra usar q =. La técnca de escalamento multdmensonal se puede ver como una técnca que nos permte hacer un análss de cúmulos gráfcamente. 54

21 EXPLICACIÓN DEL ALGORITMO BÁSICO: Calcular las dstancas reales (D j ) en el espaco p-dmensonal entre los ndvduos y j. La forma usual de calcular la dstanca es medante la dstanca eucldana estandarzada,.e., D j z z z z /, para j=,,...,n. Cuántas dstancas hay que calcular?. m = j j n n(n ). Ordenar las dstancas en orden ascendente donde, D D D j j m jm D j es la dstanca entre los dos puntos más cercanos, D j la dstanca entre los sguentes dos puntos más cercanos y fnalmente, D m j m la dstanca entre los dos puntos más lejanos. La dea es encontrar un conjunto de m puntos en un espaco q-dmensonal, cuyas dstancas d preserven el orden de las dstancas en el espaco j orgnal,.e., d d d (6.) j j m jm Nota: Lo más mportante es el orden entre las nuevas dstancas, no las magntudes de las dstancas. La forma de obtener la nueva confguracón de los puntos en un espaco de q dmensones es medante un proceso teratvo. 55

22 ) Determna una confguracón ncal de puntos en q dmensones. Calcula las dstancas entre puntos (q) d j y encuentra las cantdades (q) dˆ j que satsfacen la condcón (6.) y mnmzan la funcón de Estrés defnda como: Estrés (q) j d (q) j (q) d j j dˆ (q) j ) Para (q) dˆ j fjos, encontrar una nueva confguracón de puntos que mnmcen la funcón de Estrés y regresar al Paso. 3) Repetr los pasos y hasta que se alcance un mínmo valor de la funcón de Estrés. Evaluacón del escalamento q-dmensonal: Estrés Ajuste 0% Pobre 0% Regular 5% Bueno.5% Excelente 0% Perfecto R: cmdscale. 56

23 6. Análss dscrmnante 6.. Introduccón y objetvos. El análss dscrmnante es tambén conocdo como análss de clasfcacón. Suponga que se tenen varas poblacones de las cuales fueron tomadas observacones. Suponga además que se tene una nueva observacón que provene de una de estas poblacones, pero no se sabe cuál. El OBJETIVO básco del análss dscrmnante es producr una regla o un esquema de clasfcacón que nos permta predecr la poblacón más probable de la cual provene la nueva observacón. EJEMPLO: Un anestesólogo necesta determnar s un anestésco es seguro para una persona que están operando del corazón. Con base en certas característcas del pacente como edad, sexo, presón sanguínea, peso, etc., el anestesólogo tomar una decsón. Cuál sería la probabldad de equvocarse? Se puede decr que el análss dscrmnante es semejante al análss de regresón en el sentdo de que una varable respuesta es explcada por varas varables explcatvas. La dferenca sería que en el análss de regresón la varable respuesta es contnua, en cambo en el análss dscrmnante la varable respuesta es dscreta. 57

24 6.. Análss dscrmnante para dos poblacones normales. DESCRIPCIÓN del problema. Sean y dos poblacones. Cada poblacón está caracterzada por las varables X N y X N respectvamente, donde X X,, X p p, p,, para =,. Sea x F un nuevo vector de observacones que se sabe provene de o de. La dea es encontrar una regla de decsón para predecr de cuál de las dos poblacones es más probable que provenga x F. SOLUCIONES al problema. Exsten 4 reglas propuestas para soluconar el problema. Regla de verosmltud: donde L x;, poblacón evaluada en x. x;, Lx;, x;, Lx;,, s L RD (x),, s L es la funcón de verosmltud para la -ésma Regla de la funcón dscrmnante lneal: Cuando dos poblacones normales multvaradas tenen matrces de varanzas-covaranzas guales ( = = ), la regla de verosmltud se smplfca a,, s b x c 0 RD (x),, s b x c 0 58

25 llamada funcón dscrmnante lneal de x. donde b y c. La funcón b x es Regla de la dstanca de Mahalanobs: Cuando dos poblacones normales multvaradas tenen matrces de varanzas-covaranzas guales, la regla de verosmltud tambén es equvalente a,, s d d RD 3(x),, s d d donde d x x, para =,. La cantdad d es una medda de la dstanca entre x y la meda de la -ésma poblacón. Regla de la probabldad posteror: Cuando las matrces de varanza-covaranzas son guales, una regla de decsón sería,, s P RD (x), s P x P x x P x 4, donde P d x e e e es llamada probabldad posteror de la poblacón dado x, para =,. En realdad la probabldad posteror no es una probabldad verdadera porque no se está consderando nngún evento aleatoro. La aleatoredad provene de tomar la decsón correcta. Por ejemplo, la decsón no se d d 59

26 tomaría con tanta confanza s P x y P x x y P x P., que s NOTA : Las 4 reglas dscrmnantes anterores son equvalentes cuando las matrces de varanzas-covaranzas son guales en las dos poblacones. Es decr, las cuatro reglas asgnarán a un nuevo ndvduo al msmo grupo. REGLAS DISCRIMINANTES MUESTRALES. S no se conoce el valor poblaconal de,,, y, estos parámetros se pueden estmar medante los estmadores nsesgados correspondentes ˆ, ˆ, ˆ y ˆ y proceder de gual manera. S se cree que las matrces de varanzascovaranzas poblaconales son guales, entonces una estmacón combnada de la matrz común sería, n ˆ n ˆ ˆ, n n en donde n y n son los tamaños de las muestras de y. PROBABILIDADES DE CLASIFICACIÓN ERRÓNEA. Cuando se realza un análss dscrmnante, es necesaro determnar o estmar la probabldad de que la regla de clasfcacón clasfque erróneamente a un nuevo ndvduo. Lo deal sería que este valor fuera cercano a cero. Exsten 3 formas de estmar esta probabldad. Estmador de resusttucón: Consste en aplcar la regla dscrmnante a los msmos datos con los que se construyó la msma regla y determnar la proporcón de ndvduos clasfcados erróneamente. 60

27 Estmador con una muestra de prueba: Consste en dvdr a la muestra en dos subconjuntos de observacones. El prmer subconjunto llamado muestra de prueba servrá para construr la regla de clasfcacón. Esta regla se aplca al segundo subconjunto de observacones y se determna la proporcón de ndvduos mal clasfcados. Estmador de valdacón cruzada: Este método consste en lo sguente: Elmne la prmera observacón de los datos, construya una regla dscrmnante basada en los datos restantes, use esta regla para clasfcar la prmera observacón y observe s ésta fue clasfcada correctamente o no. Reemplace la prmer observacón al conjunto de datos y elmne la segunda y haga lo msmo que con la prmera observacón y así sucesvamente con todas las observacones. Fnalmente cuente cuántas observacones fueron clasfcadas erróneamente y dvídalas entre el número total de observacones. NOTA : Exsten reglas dscrmnantes generales para dos poblacones que toman en cuenta que las consecuencas (costos) de clasfcar erróneamente a un ndvduo de una poblacón u otra son dferentes. R: dscrm, factor Análss dscrmnante para varas poblacones. FUNCIONES DISCRIMINANTES CANÓNICAS. Este método tambén es conocdo como análss dscrmnante de Fsher. La dea es crear funcones 6

28 dscrmnantes como combnacones lneales de las varables, de tal manera que contengan la mayor cantdad de nformacón posble. Descrpcón del problema. Sean,..., m m poblacones defndas por el vector de varables X con meda y matrz de varanzas-covaranzas (las m poblacones tenen matrces de varanzas-covaranzas guales). Suponga que se tene además una muestra de tamaño n de cada poblacón. Solucón del problema. Sean donde B n ˆ ˆ ˆ ˆ y x ˆ x ˆ m n m ˆ n ˆ y n m n m n W,. La matrz B es llamada matrz de varanzas muestrales entre poblacones y W es llamada matrz de varanzas dentro de las poblacones (muestras). La dea es encontrar el vector b que maxmce b Bb. b Wb Se puede demostrar que el vector que maxmza el cocente anteror es el prmer egenvector a correspondente al prmer egenvalor de la matrz (W - B). Un vector ortogonal al anteror que maxmza el cocente anteror es el segundo egenvector a correspondente al segundo egenvalor de la matrz (W - B) y así sucesvamente. El número máxmo de egenvalores es mn(p,m-). 6

29 Regla dscrmnante. S se usa úncamente la prmer funcón canónca, se calcula d b x b ˆ, para =,,...,m y se asgna x a la poblacón cuyo valor d sea el más pequeño. S se usan las prmeras dos funcones canóncas, se calcula d b x b ˆ b x b ˆ poblacón cuyo valor d sea el más pequeño., para =,,...,m y se asgna x a la R: lda. ÁRBOLES DE CLASIFICACIÓN (CART). La dea es construr un árbol de clasfcacón de tal manera que los nodos (puntos) termnales del árbol defnan una clase. Las ramas se bfurcan con la respuesta afrmatva o negatva a preguntas formadas a partr de las varables orgnales. La construccón de un árbol está determnada por 3 elementos: ) La seleccón de las partcones ) Las decsones para declarar a un nodo como termnal o segur partendo 3) La asgnacón de una clase a cada nodo termnal La dea fundamental para selecconar una partcón está basada en la dea de que una partcón descendente debe ser más pura que una partcón ascendente. La seleccón de las partcones se basa en preguntas del tpo: 63

30 XA? o p j a j X j A? La dea es selecconar la partcón (pregunta) que maxmce la pureza de la partcón resultante. R: tree. 64

FE DE ERRATAS Y AÑADIDOS AL LIBRO FUNDAMENTOS DE LAS TÉCNICAS MULTIVARIANTES (Ximénez & San Martín, 2004)

FE DE ERRATAS Y AÑADIDOS AL LIBRO FUNDAMENTOS DE LAS TÉCNICAS MULTIVARIANTES (Ximénez & San Martín, 2004) FE DE ERRATAS Y AÑADIDOS AL LIBRO FUNDAMENTOS DE LAS TÉCNICAS MULTIVARIANTES (Xménez & San Martín, 004) Capítulo. Nocones báscas de álgebra de matrces Fe de erratas.. Cálculo de la transpuesta de una matrz

Más detalles

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso CURSO ITERACIOAL: COSTRUCCIÓ DE ESCEARIOS ECOÓMICOS ECOOMETRÍA AVAZADA Instructor: Horaco Catalán Alonso Modelo de Regresón Lneal Smple El modelo de regresón lneal representa un marco metodológco, que

Más detalles

Figura 1

Figura 1 5 Regresón Lneal Smple 5. Introduccón 90 En muchos problemas centífcos nteresa hallar la relacón entre una varable (Y), llamada varable de respuesta, ó varable de salda, ó varable dependente y un conjunto

Más detalles

Extracción de Atributos. Dr. Jesús Ariel Carrasco Ochoa Oficina 8311

Extracción de Atributos. Dr. Jesús Ariel Carrasco Ochoa Oficina 8311 Extraccón de Atrbutos Dr. Jesús Arel Carrasco Ochoa arel@naoep.mx Ofcna 8311 Contendo Introduccón PCA LDA Escalamento multdmensonal Programacón genétca Autoencoders Extraccón de atrbutos Objetvo Preprocesamento

Más detalles

Problemas donde intervienen dos o más variables numéricas

Problemas donde intervienen dos o más variables numéricas Análss de Regresón y Correlacón Lneal Problemas donde ntervenen dos o más varables numércas Estudaremos el tpo de relacones que exsten entre ellas, y de que forma se asocan Ejemplos: La presón de una masa

Más detalles

Aspectos fundamentales en el análisis de asociación

Aspectos fundamentales en el análisis de asociación Carrera: Ingenería de Almentos Perodo: BR01 Docente: Lc. María V. León Asgnatura: Estadístca II Seccón A Análss de Regresón y Correlacón Lneal Smple Poblacones bvarantes Una poblacón b-varante contene

Más detalles

Modelos lineales Regresión simple y múl3ple

Modelos lineales Regresión simple y múl3ple Modelos lneales Regresón smple y múl3ple Dept. of Marne Scence and Appled Bology Jose Jacobo Zubcoff Modelos de Regresón Smple Que tpo de relacón exste entre varables Predccón de valores a partr de una

Más detalles

Medidas de Variabilidad

Medidas de Variabilidad Meddas de Varabldad Una medda de varabldad es un ndcador del grado de dspersón de un conjunto de observacones de una varable, en torno a la meda o centro físco de la msma. S la dspersón es poca, entonces

Más detalles

Instituto Tecnológico Superior del Sur del Estado de Yucatán EGRESIÓN LINEAL REGRESI. 10 kg. 10 cm

Instituto Tecnológico Superior del Sur del Estado de Yucatán EGRESIÓN LINEAL REGRESI. 10 kg. 10 cm Insttuto Tecnológco Superor del Sur del Estado de Yucatán REGRESI EGRESIÓN LINEAL 100 90 80 70 60 10 kg. 50 40 10 cm. 30 140 150 160 170 180 190 200 Objetvo de la undad Insttuto Tecnológco Superor del

Más detalles

Estadísticos muéstrales

Estadísticos muéstrales Estadístcos muéstrales Hemos estudado dferentes meddas numércas correspondentes a conjuntos de datos, entre otras, estudamos la meda, la desvacón estándar etc. Ahora vamos a dstngur entre meddas numércas

Más detalles

Para dos variables x1 y x2, se tiene el espacio B 2 el que puede considerarse definido por: {0, 1}X{0, 1} = {(00), (01), (10), (11)}

Para dos variables x1 y x2, se tiene el espacio B 2 el que puede considerarse definido por: {0, 1}X{0, 1} = {(00), (01), (10), (11)} Capítulo 4 1 N-cubos 4.1. Representacón de una funcón booleana en el espaco B n. Los n-cubos representan a las funcones booleanas, en espacos n-dmensonales dscretos, como un subconjunto de los vértces

Más detalles

ANEXO A: Método de Interpolación de Cokriging Colocado

ANEXO A: Método de Interpolación de Cokriging Colocado ANEXO A: Método de Interpolacón de Corgng Colocado A. Conceptos Báscos de Geoestadístca Multvarada La estmacón conunta de varables aleatoras regonalzadas, más comúnmente conocda como Corgng (Krgng Conunto),

Más detalles

Tema 6. Estadística descriptiva bivariable con variables numéricas

Tema 6. Estadística descriptiva bivariable con variables numéricas Clase 6 Tema 6. Estadístca descrptva bvarable con varables numércas Estadístca bvarable: tpos de relacón Relacón entre varables cuanttatvas Para dentfcar las característcas de una relacón entre dos varables

Más detalles

Reconocimiento de Locutor basado en Procesamiento de Voz. ProDiVoz Reconocimiento de Locutor 1

Reconocimiento de Locutor basado en Procesamiento de Voz. ProDiVoz Reconocimiento de Locutor 1 Reconocmento de Locutor basado en Procesamento de Voz ProDVoz Reconocmento de Locutor Introduccón Reconocmento de locutor: Proceso de extraccón automátca de nformacón relatva a la dentdad de la persona

Más detalles

Capítulo 2: ANALISIS EXPLORATORIO de DATOS Estadística Computacional 1º Semestre 2003

Capítulo 2: ANALISIS EXPLORATORIO de DATOS Estadística Computacional 1º Semestre 2003 Unversdad Técnca Federco Santa María Departamento de Informátca ILI-80 Capítulo : ANALISIS EXPLORATORIO de DATOS Estadístca Computaconal º Semestre 003 Profesor :Héctor Allende Págna : www.nf.utfsm.cl/~hallende

Más detalles

CAPÍTULO 4 MARCO TEÓRICO

CAPÍTULO 4 MARCO TEÓRICO CAPÍTULO 4 MARCO TEÓRICO Cabe menconar que durante el proceso de medcón, la precsón y la exacttud de cualquer magntud físca está lmtada. Esta lmtacón se debe a que las medcones físcas sempre contenen errores.

Más detalles

17/02/2015. Ángel Serrano Sánchez de León

17/02/2015. Ángel Serrano Sánchez de León Ángel Serrano Sánchez de León 1 Índce Introduccón Varables estadístcas Dstrbucones esde frecuencas c Introduccón a la representacón gráfca de datos Meddas de tendenca central: meda (artmétca, geométrca,

Más detalles

Minería de Datos (MD) estadística

Minería de Datos (MD) estadística Mnería de datos Tema 3: Métodos Báscos: Algortmos Mnería de Datos (MD) estadístca Por qué una aproxmacón estadístca en la MD? La utlzacón de característcas para representar una entdad provoca una pérdda

Más detalles

Relaciones entre variables

Relaciones entre variables Relacones entre varables Las técncas de regresón permten hacer predccones sobre los valores de certa varable Y (dependente), a partr de los de otra (ndependente), entre las que se ntuye que exste una relacón.

Más detalles

Problema: Existe relación entre el estado nutricional y el rendimiento académico de estudiantes de enseñanza básica?

Problema: Existe relación entre el estado nutricional y el rendimiento académico de estudiantes de enseñanza básica? Relacones entre varables cualtatvas Problema: xste relacón entre el estado nutrconal y el rendmento académco de estudantes de enseñanza básca? stado Nutrconal Malo Regular Bueno TOTAL Bajo 13 95 3 55 Rendmento

Más detalles

( ) MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO ( mas ) y Y. N n. S y. MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO ( mas )

( ) MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO ( mas ) y Y. N n. S y. MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO ( mas ) MUETREO ALEATORIO IMPLE I Este esquema de muestreo es el más usado cuando se tene un marco de muestreo que especfque la manera de dentfcar cada undad en la poblacón. Además no se tene conocmento a pror

Más detalles

A. Una pregunta muy particular que se puede hacer a una distribución de datos es de qué magnitud es es la heterogeneidad que se observa.

A. Una pregunta muy particular que se puede hacer a una distribución de datos es de qué magnitud es es la heterogeneidad que se observa. MEDIDA DE DIPERIÓ A. Una pregunta muy partcular que se puede hacer a una dstrbucón de datos es de qué magntud es es la heterogenedad que se observa. FICHA º 18 Las meddas de dspersón generalmente acompañan

Más detalles

Slide 1. Slide 2 Organización y Resumen de Datos. Slide 3. Universidad Diego Portales. Tablas de Frecuencia. Estadística I

Slide 1. Slide 2 Organización y Resumen de Datos. Slide 3. Universidad Diego Portales. Tablas de Frecuencia. Estadística I Slde 1 Unversdad Dego Portales Estadístca I Seccón II: Dstrbucones de Frecuenca y Representacón Gráfca Sgla: EST2500 Nombre Asgnatura: Estadístca I Slde 2 Organzacón y Resumen de Datos Como recordará,

Más detalles

Muestra: son datos de corte transversal correspondientes a 120 familias españolas.

Muestra: son datos de corte transversal correspondientes a 120 familias españolas. Capítulo II: El Modelo Lneal Clásco - Estmacón Aplcacones Informátcas 3. APLICACIONES INFORMÁTICAS Fchero : cp.wf (modelo de regresón smple) Seres: : consumo famlar mensual en mles de pesetas RENTA: renta

Más detalles

Probabilidad Grupo 23 Semestre Segundo examen parcial

Probabilidad Grupo 23 Semestre Segundo examen parcial Probabldad Grupo 3 Semestre 015- Segundo examen parcal La tabla sguente presenta 0 postulados, algunos de los cuales son verdaderos y otros son falsos. Analza detendamente cada postulado y elge tu respuesta

Más detalles

Tema 1: Estadística Descriptiva Unidimensional

Tema 1: Estadística Descriptiva Unidimensional Fenómeno determnsta: al repetrlo en déntcas condcones se obtene el msmo resultado. Fenómeno aleatoro: no es posble predecr el resultado. La estadístca se ocupa de aquellos fenómenos no determnstas donde

Más detalles

Tema 1:Descripción de una variable. Tema 1:Descripción de una variable. 1.1 El método estadístico. 1.1 El método estadístico. Describir el problema

Tema 1:Descripción de una variable. Tema 1:Descripción de una variable. 1.1 El método estadístico. 1.1 El método estadístico. Describir el problema Tema :Descrpcón de una varable Tema :Descrpcón de una varable. El método estadístco. Descrpcón de conjuntos de datos Dstrbucones de frecuencas. Representacón gráfca Dagrama de barras Hstograma. Meddas

Más detalles

Ejemplo: Consumo - Ingreso. Ingreso. Consumo. Población 60 familias

Ejemplo: Consumo - Ingreso. Ingreso. Consumo. Población 60 familias Ejemplo: Consumo - Ingreso Ingreso Consumo Poblacón 60 famlas ( YX ) P = x [ YX ] E = x Línea de regresón poblaconal 80 60 Meda Condconal 40 20 00 [ X = 200] EY o o o o [ X = 200] EY 80 o o o 60 o 40 8

Más detalles

Inferencia en Regresión Lineal Simple

Inferencia en Regresión Lineal Simple Inferenca en Regresón Lneal Smple Modelo de regresón lneal smple: Se tenen n observacones de una varable explcatva x y de una varable respuesta y, ( x, y)(, x, y),...,( x n, y n ) el modelo estadístco

Más detalles

TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE

TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE LECTURA OBLIGATORIA Regresón Lneal Múltple. En Ral, A. y Varela, J. (008). Estadístca Práctca para la Investgacón en Cencas de la Salud. Coruña: Netbblo.

Más detalles

EJERCICIO 1 1. VERDADERO 2. VERDADERO (Esta afirmación no es cierta en el caso del modelo general). 3. En el modelo lineal general

EJERCICIO 1 1. VERDADERO 2. VERDADERO (Esta afirmación no es cierta en el caso del modelo general). 3. En el modelo lineal general PRÁCTICA 6: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN EJERCICIO. VERDADERO. VERDADERO (Esta afrmacón no es certa en el caso del modelo general. 3. En el modelo lneal general Y =X β + ε, explcar la forma que

Más detalles

para cualquier a y b, entonces f(x) es la función de densidad de probabilidad de la variable aleatoria continua X.

para cualquier a y b, entonces f(x) es la función de densidad de probabilidad de la variable aleatoria continua X. Conceptos de Probabldad A contnuacón se presenta una revsón no ehaustva y a manera ntroductora de conceptos báscos de la teoría de probabldades. Un estudo proundo y ormal de estos se puede hacer en Mood

Más detalles

COLEGIO INGLÉS MEDIDAS DE DISPERSIÓN

COLEGIO INGLÉS MEDIDAS DE DISPERSIÓN COLEGIO IGLÉS DEPARTAMETO IVEL: CUARTO MEDIO PSU. UIDAD: ESTADISTICA 3 PROFESOR: ATALIA MORALES A. ROLADO SAEZ M. MIGUEL GUTIÉRREZ S. JAVIER FRIGERIO B. MEDIDAS DE DISPERSIÓ Las meddas de dspersón dan

Más detalles

Estimación no lineal del estado y los parámetros

Estimación no lineal del estado y los parámetros Parte III Estmacón no lneal del estado y los parámetros 1. Estmacón recursva El ltro de Kalman extenddo 12 es una técnca muy utlzada para la la estmacón recursva del estado de sstemas no lneales en presenca

Más detalles

ESTADISTÍCA. 1. Población, muestra e individuo. 2. Variables estadísticas. 3. El proceso que se sigue en estadística

ESTADISTÍCA. 1. Población, muestra e individuo. 2. Variables estadísticas. 3. El proceso que se sigue en estadística ESTADISTÍCA. Poblacón, muestra e ndvduo Las característcas de una dstrbucón se pueden estudar drectamente sobre la poblacón o se pueden nferr a partr de l estudo de una muestra. Poblacón estadístca es

Más detalles

Tema 2: El modelo clásico de regresión

Tema 2: El modelo clásico de regresión CURSO 010/011 Tema : El modelo clásco de regresón Aránzazu de Juan Fernández ECONOMETRÍA I ESQUEMA DEL TEMA Presentacón del modelo Hpótess del modelo Estmacón MCO Propedades algebracas de los estmadores

Más detalles

TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE

TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE LECTURA OBLIGATORIA Regresón Lneal Múltple. En Ral, A. y Varela, J. (008). Estadístca Práctca para la Investgacón en Cencas de la Salud. Coruña: Netbblo.

Más detalles

ENUNCIADOS DE LOS EJERCICIOS PROPUESTOS EN 2011 EN MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES. 3 y

ENUNCIADOS DE LOS EJERCICIOS PROPUESTOS EN 2011 EN MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES. 3 y ENUNCADOS DE LOS EJERCCOS PROPUESTOS EN 011 EN MATEMÁTCAS APLCADAS A LAS CENCAS SOCALES. EJERCCO 1 a (5 puntos Raconalce las epresones y. 7 b (5 puntos Halle el conjunto de solucones de la necuacón EJERCCO

Más detalles

Análisis de la varianza de un factor

Análisis de la varianza de un factor Análss de la varanza de un factor El test t de muestras se aplca cuando se queren comparar las medas de dos poblacones con dstrbucones normales con varanzas guales y se observan muestras ndependentes para

Más detalles

Reconciliación de datos experimentales. MI5022 Análisis y simulación de procesos mineralúgicos

Reconciliación de datos experimentales. MI5022 Análisis y simulación de procesos mineralúgicos Reconclacón de datos expermentales MI5022 Análss y smulacón de procesos mneralúgcos Balances Balances en una celda de flotacón En torno a una celda de flotacón (o un crcuto) se pueden escrbr los sguentes

Más detalles

INTRODUCCIÓN. Técnicas estadísticas

INTRODUCCIÓN. Técnicas estadísticas Tema : Estadístca Descrptva Undmensonal ITRODUCCIÓ Fenómeno determnsta: al repetrlo en déntcas condcones se obtene el msmo resultado. (Ejemplo: lómetros recorrdos en un ntervalo de tempo a una velocdad

Más detalles

MUESTREO EN POBLACIONES FINITAS

MUESTREO EN POBLACIONES FINITAS MUESTREO EN POBLACIONES FINITAS Antono Morllas A.Morllas: Muestreo 1 MUESTREO EN POBLACIONES FINITAS 1. Conceptos estadístcos báscos. Etapas en el muestreo 3. Tpos de error 4. Métodos de muestreo 5. Tamaño

Más detalles

Curso Práctico de Bioestadística Con Herramientas De Excel

Curso Práctico de Bioestadística Con Herramientas De Excel Curso Práctco de Boestadístca Con Herramentas De Excel Fabrzo Marcllo Morla MBA barcllo@gmal.com (593-9) 419439 Otras Publcacones del msmo autor en Repostoro ESPOL Fabrzo Marcllo Morla Guayaqul, 1966.

Más detalles

DISTRIBUCIONES BIDIMENSIONALES

DISTRIBUCIONES BIDIMENSIONALES Matemátcas 1º CT 1 DISTRIBUCIONES BIDIMENSIONALES PROBLEMAS RESUELTOS 1. a) Asoca las rectas de regresón: y = +16, y = 1 e y = 0,5 + 5 a las nubes de puntos sguentes: b) Asgna los coefcentes de correlacón

Más detalles

Espacios de Búsqueda en un Árbol Binario para Resolver Problemas de Optimización Discreta

Espacios de Búsqueda en un Árbol Binario para Resolver Problemas de Optimización Discreta Espacos de Búsueda en un Árbol Bnaro para Resolver Problemas de Optmzacón Dscreta María Elena Gómez-Torres J. Crspín Zavala-Díaz Marco Antono Cruz- Chávez 3 Insttuto Tecnológco de Zacatepec Calzada Insttuto

Más detalles

Capítulo 2: Introducción al método de los Elementos Finitos 2. CAPÍTULO 2 INTRODUCCIÓN AL MÉTODO DE LOS ELEMENTOS FINITOS

Capítulo 2: Introducción al método de los Elementos Finitos 2. CAPÍTULO 2 INTRODUCCIÓN AL MÉTODO DE LOS ELEMENTOS FINITOS Capítulo 2: Introduccón al método de los Elementos Fntos 2. CAPÍTULO 2 ITRODUCCIÓ AL MÉTODO DE LOS ELEMETOS FIITOS 2.. ITRODUCCIÓ Vrtualmente cada fenómeno en la naturaleza, sea bológco, geológco o mecánco

Más detalles

Introducción a la Física. Medidas y Errores

Introducción a la Física. Medidas y Errores Departamento de Físca Unversdad de Jaén Introduccón a la Físca Meddas y Errores J.A.Moleón 1 1- Introduccón La Físca y otras cencas persguen la descrpcón cualtatva y cuanttatva de los fenómenos que ocurren

Más detalles

16/02/2015. Ángel Serrano Sánchez de León

16/02/2015. Ángel Serrano Sánchez de León Ángel Serrano Sánchez de León Índce Introduccón Varables estadístcas Dstrbucones de frecuencas Introduccón a la representacón gráfca de datos Meddas de tendenca central: meda (artmétca, geométrca, armónca,

Más detalles

OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls

OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls Redes de Neuronas: Preparacón de datos para el aprendzaje y meddas de evaluacón 1. Preparacón de datos Característcas de los datos

Más detalles

MAGNITUD: propiedad o cualidad física susceptible de ser medida y cuantificada. Ejemplos: longitud, superficie, volumen, tiempo, velocidad, etc.

MAGNITUD: propiedad o cualidad física susceptible de ser medida y cuantificada. Ejemplos: longitud, superficie, volumen, tiempo, velocidad, etc. TEMA. INSTRUMENTOS FÍSICO-MATEMÁTICOS.. SISTEMAS DE MAGNITUDES Y UNIDADES. CONVERSIÓN DE UNIDADES. MAGNITUD: propedad o cualdad físca susceptble de ser medda y cuantfcada. Ejemplos: longtud, superfce,

Más detalles

Cinemática del Brazo articulado PUMA

Cinemática del Brazo articulado PUMA Cnemátca del Brazo artculado PUMA José Cortés Parejo. Enero 8. Estructura del brazo robótco El robot PUMA de la sere es un brazo artculado con artculacones rotatoras que le proporconan grados de lbertad

Más detalles

Tema 4: Variables aleatorias

Tema 4: Variables aleatorias Estadístca 46 Tema 4: Varables aleatoras El concepto de varable aleatora surge de la necesdad de hacer más manejables matemátcamente los resultados de los expermentos aleatoros, que en muchos casos son

Más detalles

LECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION

LECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION Unversdad Católca Los Ángeles de Chmbote LECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION 1. DEFINICION: Las meddas estadístcas

Más detalles

Población 1. Población 1. Población 2. Población 2. Población 1. Población 1. Población 2. Población 2. Frecuencia. Frecuencia

Población 1. Población 1. Población 2. Población 2. Población 1. Población 1. Población 2. Población 2. Frecuencia. Frecuencia MAT-3 Estadístca I Tema : Meddas de Dspersón Facltador: Félx Rondón, MS Insttuto Especalzado de Estudos Superores Loyola Introduccón Las meddas de tendenca central son ndcadores estadístcos que resumen

Más detalles

Medidas de centralización

Medidas de centralización 1 Meddas de centralzacón Meda Datos no agrupados = x X = n = 0 Datos agrupados = x X = n = 0 Medana Ordenamos la varable de menor a mayor. Calculamos la columna de la frecuenca relatva acumulada F. Buscamos

Más detalles

5. Análisis de cúmulos

5. Análisis de cúmulos 5. Análisis de cúmulos OBJETIVO: Dividir a los individuos de una base de datos en grupos, llamados cúmulos (clusters), de tal manera que los individuos de un mismo cúmulo tengan características semejantes

Más detalles

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS. Métodos multivariantes en control estadístico de la calidad

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS. Métodos multivariantes en control estadístico de la calidad UNIVERSIDAD NAIONAL MAYOR DE SAN MAROS FAULTAD DE IENIAS MATEMÁTIAS E.A.P. DE ESTADÍSTIA Métodos multvarantes en control estadístco de la caldad apítulo IV. Gráfcos de control MUSUM TRABAJO MONOGRÁFIO

Más detalles

CAPÍTULO IV. MEDICIÓN. De acuerdo con Székely (2005), existe dentro del período información

CAPÍTULO IV. MEDICIÓN. De acuerdo con Székely (2005), existe dentro del período información IV. Base de Datos CAPÍTULO IV. MEDICIÓN De acuerdo con Székely (2005), exste dentro del período 950-2004 nformacón representatva a nvel naconal que en algún momento se ha utlzado para medr la pobreza.

Más detalles

OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls. Examen Final

OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls. Examen Final OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls Examen Fnal Pregunta ( punto) Responda brevemente a las sguentes preguntas: a) Cuál es el obetvo en el aprendzae del Perceptron

Más detalles

Jesús García Herrero CLASIFICADORES BAYESIANOS

Jesús García Herrero CLASIFICADORES BAYESIANOS Jesús García Herrero CLASIFICADORES BAYESIANOS En esta clase se presentan los algortmos Análss de Datos para abordar tareas de aprendzaje de modelos predctvos. Se partcularzan las técncas estadístcas vstas

Más detalles

CAPITULO 3º SOLUCIÓN ECUACIÓN DE ESTADO- 01. Ing. Diego A. Patiño G. M.Sc, Ph.D.

CAPITULO 3º SOLUCIÓN ECUACIÓN DE ESTADO- 01. Ing. Diego A. Patiño G. M.Sc, Ph.D. CAPITULO 3º SOLUCIÓN ECUACIÓN DE ESTADO- 0 Ing. Dego A. Patño G. M.Sc, Ph.D. Solucón de la Ecuacón de Estado Solucón de Ecuacones de Estado Estaconaras: Para el caso estaconaro (nvarante en el tempo),

Más detalles

1 EY ( ) o de E( Y u ) que hace que g E ( Y ) sea lineal. Por ejemplo,

1 EY ( ) o de E( Y u ) que hace que g E ( Y ) sea lineal. Por ejemplo, Modelos lneales generalzados En los modelos no lneales (tanto en su formulacón con coefcentes fjos o coefcentes aleatoros) que hemos vsto hasta ahora, exsten algunos que se denomnan lnealzables : son modelos

Más detalles

PyE_ EF2_TIPO1_

PyE_ EF2_TIPO1_ UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉICO FACULTAD DE INGENIERÍA DIVISIÓN DE CIENCIAS BÁSICAS COORDINACIÓN DE CIENCIAS APLICADAS DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA SEGUNDO EAMEN FINAL RESOLUCIÓN SEMESTRE

Más detalles

H 0 : La distribución poblacional es uniforme H 1 : La distribución poblacional no es uniforme

H 0 : La distribución poblacional es uniforme H 1 : La distribución poblacional no es uniforme Una hpótess estadístca es una afrmacón con respecto a una característca que se desconoce de una poblacón de nterés. En la seccón anteror tratamos los casos dscretos, es decr, en forma exclusva el valor

Más detalles

UNIDAD 12: Distribuciones bidimensionales. Correlación y regresión

UNIDAD 12: Distribuciones bidimensionales. Correlación y regresión Matemátcas aplcadas a las Cencas Socales UNIDAD 1: Dstrbucones bdmensonales. Correlacón regresón ACTIVIDADES-PÁG. 68 1. La meda la desvacón típca son: 1,866 0,065. Los jugadores que se encuentran por encma

Más detalles

6 Minimización del riesgo empírico

6 Minimización del riesgo empírico 6 Mnmzacón del resgo empírco Los algortmos de vectores soporte consttuyen una de las nnovacones crucales en la nvestgacón sobre Aprendzaje Computaconal en la década de los 990. Consttuyen la crstalzacón

Más detalles

AJUSTE DE LA CURVA DE PROBABILIDAD DEL ESCURRIMIENTO MEDIO HIPERANUAL ANUAL SEGÚN LA TEORÍA S B JOHNSON.

AJUSTE DE LA CURVA DE PROBABILIDAD DEL ESCURRIMIENTO MEDIO HIPERANUAL ANUAL SEGÚN LA TEORÍA S B JOHNSON. AJUSTE DE LA CURVA DE PROBABILIDAD DEL ESCURRIMIENTO MEDIO HIPERANUAL ANUAL SEGÚN LA TEORÍA S B JOHNSON. Revsta Voluntad Hdráulca No. 57, 98. Págnas 58-64 RESUMEN Se nforma sobre el desarrollo del método

Más detalles

3 - VARIABLES ALEATORIAS

3 - VARIABLES ALEATORIAS arte Varables aleatoras rof. María B. ntarell - VARIABLES ALEATORIAS.- Generaldades En muchas stuacones epermentales se quere asgnar un número real a cada uno de los elementos del espaco muestral. Al descrbr

Más detalles

Un estimado de intervalo o intervalo de confianza ( IC

Un estimado de intervalo o intervalo de confianza ( IC Un estmado puntual, por ser un sólo número, no proporcona por sí msmo nformacón alguna sobre la precsón y confabldad de la estmacón. Debdo a la varabldad que pueda exstr en la muestra, nunca se tendrá

Más detalles

SEMANA 13. CLASE 14. MARTES 20/09/16

SEMANA 13. CLASE 14. MARTES 20/09/16 SEMAA 3. CLASE. MARTES 20/09/6. Defncones de nterés.. Estadístca descrptva. Es la parte de la Estadístca que se encarga de reunr nformacón cuanttatva concernente a ndvduos, grupos, seres de hechos, etc..2.

Más detalles

Introducción. Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna. Fernando Pérez Nava

Introducción. Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna. Fernando Pérez Nava Reconocmento de Patrones Introduccón Tema : Reconocmento Estadístco de Patrones Por qué una aproxmacón estadístca en el RP? La utlzacón de característcas para representar una entdad provoca una pérdda

Más detalles

2. EL TENSOR DE TENSIONES. Supongamos un cuerpo sometido a fuerzas externas en equilibrio y un punto P en su interior.

2. EL TENSOR DE TENSIONES. Supongamos un cuerpo sometido a fuerzas externas en equilibrio y un punto P en su interior. . EL TENSOR DE TENSIONES Como se explcó prevamente, el estado tensonal en un punto nteror de un cuerpo queda defndo por 9 componentes, correspondentes a componentes por cada una de las tensones nternas

Más detalles

Estas medidas serán más significativas cuanto más homogéneos sean los datos y pueden ser engañosas cuando mezclamos poblaciones distintas.

Estas medidas serán más significativas cuanto más homogéneos sean los datos y pueden ser engañosas cuando mezclamos poblaciones distintas. UIDAD 3: Meddas estadístcas Las meddas estadístcas o parámetros estadístcos son valores representatvos de una coleccón de datos y que resumen en unos pocos valores la normacón del total de datos. Estas

Más detalles

Prueba de Evaluación Continua

Prueba de Evaluación Continua Estadístca Descrptva y Regresón y Correlacón Prueba de Evaluacón Contnua 1-III-18 1.- Dada la varable x y la nueva varable y=a+bx, ndcar (demostrándolo) la expresón exstente entre las respectvas medas

Más detalles

La representación Denavit-Hartenberg

La representación Denavit-Hartenberg La representacón Denavt-Hartenberg José Cortés Parejo. Marzo 8 Se trata de un procedmeto sstemátco para descrbr la estructura cnemátca de una cadena artculada consttuda por artculacones con. un solo grado

Más detalles

EXPERIMENTACIÓN COMERCIAL(I)

EXPERIMENTACIÓN COMERCIAL(I) EXPERIMENTACIÓN COMERCIAL(I) En un expermento comercal el nvestgador modfca algún factor (denomnado varable explcatva o ndependente) para observar el efecto de esta modfcacón sobre otro factor (denomnado

Más detalles

Regresión de Datos de Vida

Regresión de Datos de Vida Regresón de Datos de Vda Resumen El procedmento Regresón de Datos de Vda está dseñado para ajustar un modelo estadístco paramétrco relaconado con tempos de falla a una o más varables predctoras. Los predctores

Más detalles

EDO: Ecuación Diferencial Ordinaria Soluciones numéricas. Jorge Eduardo Ortiz Triviño

EDO: Ecuación Diferencial Ordinaria Soluciones numéricas. Jorge Eduardo Ortiz Triviño EDO: Ecuacón Dferencal Ordnara Solucones numércas Jorge Eduardo Ortz Trvño Organzacón general Errores en los cálculos numércos Raíces de ecuacones no-lneales Sstemas de ecuacones lneales Interpolacón ajuste

Más detalles

PRÁCTICA 16: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN

PRÁCTICA 16: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN PRÁCTICA 6: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN EJERCICIO. VERDADERO. VERDADERO (Esta afrmacón no es certa en el caso del modelo general). 3. En el modelo lneal general Y = X b + e, explcar la forma

Más detalles

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos.

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos. ESTADÍSTICA I. Recuerda: Poblacón: Es el conjunto de todos los elementos que cumplen una determnada propedad, que llamamos carácter estadístco. Los elementos de la poblacón se llaman ndvduos. Muestra:

Más detalles

CAPÍTULO 1: VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES

CAPÍTULO 1: VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES CAÍTULO : VARIABLES ALEATORIAS SUS DISTRIBUCIONES En este capítulo el alumno debe abordar el conocmento de un mportante concepto el de VARIABLE ALEATORIA tpos de varables aleatoras cómo se dstrbue la funcón

Más detalles

Método de reponderación aplicado en la EPA

Método de reponderación aplicado en la EPA Método de reponderacón aplcado en la EPA La Encuesta de Poblacón Actva (EPA), como cualquer otra encuesta a hogares, puede tener dstorsones en las estmacones que produce, debdo a una sere de causas lgadas

Más detalles

Universidad Simón Bolívar Conversión de Energía Eléctrica - Prof. José Manuel Aller

Universidad Simón Bolívar Conversión de Energía Eléctrica - Prof. José Manuel Aller Unversdad Smón Bolívar Conversón de Energía Eléctrca Prof José anuel Aller 41 Defncones báscas En este capítulo se estuda el comportamento de los crcutos acoplados magnétcamente, fjos en el espaco El medo

Más detalles

EJERCICIOS: Tema 3. Los ejercicios señalados con.r se consideran de conocimientos previos necesarios para la comprensión del tema 3.

EJERCICIOS: Tema 3. Los ejercicios señalados con.r se consideran de conocimientos previos necesarios para la comprensión del tema 3. EJERCICIOS: Tema 3 Los ejerccos señalados con.r se consderan de conocmentos prevos necesaros para la comprensón del tema 3. Ejercco 1.R Dos bblotecas con el msmo fondo bblográfco especalzado ofrecen las

Más detalles

TEMA 1.- CONCEPTOS BÁSICOS

TEMA 1.- CONCEPTOS BÁSICOS TEMA 1.- CONCEPTOS BÁSICOS 1.1.- Cuestones tpo test 1.- En las encuestas personales puede codfcarse, por ejemplo, con un cero las que son contestadas por una mujer y con un uno las que lo son por un varón.

Más detalles

ESTADÍSTICA BIDIMENSIONAL ÍNDICE GENERAL

ESTADÍSTICA BIDIMENSIONAL ÍNDICE GENERAL ESTADÍSTICA BIDIMESIOAL ÍDICE GEERAL 1.-Varable Estadístca Bdmensonal. Tablas de frecuenca... 1.1.- Concepto de varable estadístca bdmensonal. Eemplos.... 1..-Tablas bdmensonales de frecuencas. Tablas

Más detalles

REGRESION LINEAL SIMPLE

REGRESION LINEAL SIMPLE REGREION LINEAL IMPLE Jorge Galbat Resco e dspone de una mustra de observacones formadas por pares de varables: (x 1, y 1 ) (x, y ).. (x n, y n ) A través de esta muestra, se desea estudar la relacón exstente

Más detalles

PUBLICACIONES DE 4º CURSO

PUBLICACIONES DE 4º CURSO PUBLICACIONES DE 4º CURSO Grado: DERECHO-ADE Asgnatura: ECONOMERÍA Grupos: Únco ema: ESQUEMA EMA Profesores: Inmaculada Vllanúa Departamento de ANÁLISIS ECONÓMICO Curso Académco 04/5 ema : El Modelo Lneal

Más detalles

Modelo Lineal Múltiple. Clase 03. Profesor: Carlos R. Pitta. ICPM050, Econometría. Universidad Austral de Chile Escuela de Ingeniería Comercial

Modelo Lineal Múltiple. Clase 03. Profesor: Carlos R. Pitta. ICPM050, Econometría. Universidad Austral de Chile Escuela de Ingeniería Comercial Unversdad Austral de Chle Escuela de Ingenería Comercal ICPM050, Econometría Clase 03 Modelo Lneal Múltple Profesor: Carlos R. Ptta Econometría, Prof. Carlos R. Ptta, Unversdad Austral de Chle. Análss

Más detalles

Tema 9: Otros temas de aplicación

Tema 9: Otros temas de aplicación Tema 9: Otros temas de aplcacón. Introduccón Exsten muchos elementos nteresantes y aplcacones del Matlab que no se han comentado a lo largo de los temas. Se nvta al lector a que nvestgue sobre ellos según

Más detalles

Tema 3: Procedimientos de Constrastación y Selección de Modelos

Tema 3: Procedimientos de Constrastación y Selección de Modelos Tema 3: Procedmentos de Constrastacón y Seleccón de Modelos TEMA 3: PROCEDIMIENTOS DE CONTRASTACIÓN Y SELECCIÓN DE MODELOS 3) Introduccón a los Modelos con Restrccones Estmacón Restrngda 3) Contrastes

Más detalles

LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA

LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA. LA MEDIANA: Es una medda de tendenca central que dvde al total de n observacones debdamente ordenadas

Más detalles

Maestría en Administración. Medidas Descriptivas. Formulario e Interpretación. Dr. Francisco Javier Cruz Ariza

Maestría en Administración. Medidas Descriptivas. Formulario e Interpretación. Dr. Francisco Javier Cruz Ariza Maestría en Admnstracón Meddas Descrptvas Formularo e Interpretacón Dr. Francsco Javer Cruz Arza A contnuacón mostramos el foco de atencón de las dstntas meddas que abordaremos en el presente manual. El

Más detalles

1. Notación y tabulación

1. Notación y tabulación Tema 2: Descrpcón Unvarante. otacón y tabulacón 2. Descrpcón gráfca 3. Descrpcón numérca. Momentos estadístcos. Meddas de poscón. Meddas de dspersón v. Varable tpfcada v. Meddas de forma v. Meddas de concentracón

Más detalles

Variables Aleatorias

Variables Aleatorias Varables Aleatoras VARIABLES ALEATORIAS. Varable aleatora. Tpos.... Dstrbucón de probabldad asocada a una varable aleatora dscreta... 4. Funcón de dstrbucón. Propedades... 5 4. Funcón de densdad... 7 5.

Más detalles

Nos interesa asignar probabilidades a valores numéricos obtenidos a partir de fenómenos aleatorios, es decir a variables aleatorias.

Nos interesa asignar probabilidades a valores numéricos obtenidos a partir de fenómenos aleatorios, es decir a variables aleatorias. Estadístca (Q) Dana M. Kelmansky 5 Varables Aleatoras Nos nteresa asgnar probabldades a valores numércos obtendos a partr de fenómenos aleatoros, es decr a varables aleatoras. Por ejemplo, calcular la

Más detalles

Operadores por Regiones

Operadores por Regiones Operadores por Regones Fltros por Regones Los fltros por regones ntentan determnar el cambo de valor de un píxel consderando los valores de sus vecnos I[-1,-1] I[-1] I[+1,-1] I[-1, I[ I[+1, I[-1,+1] I[+1]

Más detalles

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 17 de Mayo de :00 horas

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 17 de Mayo de :00 horas EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 7 de Mayo de 08 9:00 horas Prmer Apelldo: Nombre: DNI: Teléfono: Segundo Apelldo: Grupo y Grado: Profesor(a): e-mal: Pregunta A B C En Blanco

Más detalles

Resolución. Instrucciones: Leer detenidamente los siete enunciados y resolver seis de los siete problemas propuestos.

Resolución. Instrucciones: Leer detenidamente los siete enunciados y resolver seis de los siete problemas propuestos. UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉICO FACULTAD DE INGENIERÍA DIVISIÓN DE CIENCIAS BÁSICAS COORDINACIÓN DE CIENCIAS APLICADAS DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA SEGUNDO EAMEN FINAL SEMESTRE 04

Más detalles

Análisis de la varianza de un factor

Análisis de la varianza de un factor Análss de la varanza de un factor El test t de muestras se aplca cuando se queren comparar las medas de dos poblacones con dstrbucones normales con varanzas guales y se observan muestras ndependentes para

Más detalles