Minería de Datos. Clasificación Supervisada. Dr. Edgar Acuña Departamento de Ciencias Matemáticas Universidad de Puerto Rico-Mayaguez
|
|
- Mercedes Alvarado Cordero
- hace 6 años
- Vistas:
Transcripción
1 Minería de Datos Clasificación Suervisada Dr. Edgar Acuña Deartamento de Ciencias Matemáticas Universidad de Puerto Rico-Mayaguez Website: math.urm.edu/~edgar 1
2 El roblema de clasificacion suervisada Muesttra de entrenamiento L P r e d i c t o r s X 1 X X M y El clasificador C(x,L) La clase estimada de x* y*=c(x*,l) Clase
3 Clasificacion Suervisada un roceso de dos etaas. Construccion del modelo: Se asume que cada objeto ertenece a una clase redefinida, segun es definido en la columna de clases. El modelo es reresentado or reglas de clasificacion, arboles de decision, o formulas matematicas. Uso del modelo, ara clasificar futuros objetos. Estimar la recision del modelo La columna de clases de los objetos de la muestra de rueba es comarado con las clases redichas or el modelo. La muestra de rueba debe ser indeendiente de la muestra de entrenamiento de lo contrario uede ocurrir sobreajuste. La tasa de recision es el orcentaje de objetos de la muestra de rueba que son correctamente clasificadas or el modelo. 3
4 Clasificacion Suervisada vs. Regresion Clasificacion Suervisada: Predice valores categoricos que reresentan clases. Construye un modelo basado en la muestra de entrenamiento y lo usa ara clasificar nuevos datos. Regresion: Modela funciones de valores continuos. Predice nuevos valores o valores faltantes. Alicaciones mas comunes Arobacion de credito Para detectar osibles mercados de un roducto. En diagnosticos medicos. 4
5 Metodos de clasificacion suervisada 1. Analisis Discriminante Lineal.. Metodos No Lineales: Discriminacion Cuadratica, Regresion Logistica, Projection Pursuit. 3. Naive Bayes y Redes Bayesianas 4. Clasificadores basados en reglas 5. Arboles de Decision. 6. K vecinos mas cercanos. 7. Clasificadores basados en estimacion de densidad or kernel. Clasificadores que usan mezclas Gausianas. 8. Redes Neurales: El ercetron de multicaas, Funciones bases radiales, maas auto-organizantes de Kohonen. 9. Maquinas de soorte vectorial. 5
6 Analisis Discriminante Lineal Considerar la siguiente muestra de entrenamiento con atributos y dos clases Y X 1 X X 1 X 11 X 1. X 1 1 X 1 X X X 1n1 X n1 X n1 X 1,n1+1 X,n1+1 X,n1+1 X 1,n1+ X,n1+ X,n X 1,n1+n X,n1+n X,n1+n 6
7 Analisis discriminante lineal x Sea el vector de medias de los atributos en clase 1, y sea l x 1 el vector de medias corresondente ara la clase. Considerar que μ 1 y μ son los vectores de media de las resectivas clases oblacionales. Asumir que ambas oblaciones tienen la misma matriz de covarianza, i.e. Σ 1 =Σ =Σ. Esta es conocida como la roiedad de homocedasticidad. Por ahora, no necesitamos asumir que el vector aleatorio de redictoras x=(x1,..x) esta normalmente distribuido. Discriminacion lineal esta basado en el siguiente hecho: una instancia (objeto) x es asignado a la clase C1 si D(x, C1)<D(x,C) (.1) donde D(x,Ci)=(x-μ i ) Σ -1 (x-μ i ), for i=1,, reresenta el cuadrado de de la distancia squared Mahalanobis de x al centro de la clase C i. 7
8 Analisis discriminante lineal (cont) La exresion (.1) uede ser escrita como ( 1 μ1 μ)' Σ [ x (1/ )( μ1 + μ )] > 0 (.) Usando la muestra de entrenamiento, μ i uede ser estimada or y x i y Σ es estimada or S, la matriz de covarianza combinada, la cual es calculada or ( n1 1) S1 + ( n 1) S S = n + n 1 donde, S1 y S reresentan las matrices de covarianza muestrales del vector de redictoras en cada clase. Luego, la version muestral de (.) esta dada or 1 X X )' S [ x (1/ )(X + X )] 0 (.3) ( 1 1 > El lado izquierdo de la exresion (.3) es llamado la funcion discriminante lineal. 8
9 Ejemlo: Notas en un curso En una clase de Estadística Alicada I consistente de 3 estudiantes, se toman la siguientes variables E1: Nota del estudiante en el examen 1 (0-100) E: Nota del estudiante en el examen (0-100) PF: Promedio Final del estudiante en la clase (0-100) Nota: Asume los valores P: si el estudiante asa la clase y F si fracasa en la clase. Los rimeros 5 datos son: E1 E PF Nota Se quiere redecir la Nota de un estudiante que tomará la clase en un róximo semestre, bajo las mismas condiciones actuales (mismo rofesor, mismo texto, estudiantes de similar nivel en la clase, etc). 9
10 Ejemlo(cont) > #Hallando las medias de E1 y E en ambos gruos > med=aly(eje1dis[eje1dis[,4]=="",1:],,mean) > med E1 E > medf=aly(eje1dis[eje1dis[,4]=="f",1:],,mean) > medf E1 E > #Hallando las matrices de covarianzas en ambos gruos > cov1 E1 E E E > cov E1 E E E
11 Ejemlo(cont) > #Calculando los coeficientes de la funcion discriminante > covcomb=((nasan-1)*cov1+(nfracasan-1)*cov)/(nasan+nfracasan- ) > coeflda<-(med-medf)%*%solve(covcomb) > coeflda E1 E [1,] > #Calculando el termino indeendiente > indlda<-0.5*(med-medf)%*%solve(covcomb)%*%(med+medf) > indlda [,1] [1,]
12 Analisis discriminante Lineal ara datos de examenes E E E < f f f f E E > f f f f E1 1
13 LDA(Fisher, 1936) Fisher obtuvo la funcion discriminante lineal de la ecuacion (.3) ero siguiendo otro camino. El trato de encontrar una combinacion lineal de los atributos x s que seare las clases C1 y C lo mas osible asumiendo que hay homogeneidad de matrices de covariancias (Σ1=Σ=Σ). Mas esecificamente, si y=d'x, entonces, la distancia cuadrada entre las medias de y en cada clase dividida or la varianza de y esta dado or ( d ' μ 1 d d ' ' Σ d μ ) (.4). Esra razon es maximizada cuando d=σ -1 (μ 1 -μ ). Este resultado es obtenido alicando la desigualdad de Cauchy-Schwartz (ver Rao, C. R. Linear Statistical Inference and its alications,. 60). 13
14 LDA (cont) El numerador es llamado la suma of cuadrados entre gruos (BSS), y el denominador es llamado la suma of cuadrados dentro de gruos (WSS). Un estimado del valor d es S -1 ( x1 x ). Fisher asigno un objecto x a la clase C1 si y=d x=( )' S -1 1 x1 x x esta mas cerca a y1 = (x1 x)'s x1 que a y. El unto medio entre y 1 y y es 1 ( x1 x)'s (x1 + x) Notar que y es mas cerca a y y 1 si y> 1 + y, esto da la ecuacion (.3). 14
15 Tests for homogeneity of covariance matrices(homocedasticity) The most well know test for cheking homocedasticity (homogeneity of covariance matrices) is the Bartlett test. This test is a modification of the likelihood ratio test, however it is subject to the assumtion of multivariate normal distribution. It makes use of a Chi-Square distribution. Bartlett est is available in SAS. The Mardia test is one of several test to check multivariate normality. Other alternative is to extent the Levene s test for comaring the variance of several univariate oulations. Some statistcal ackages like SPSS use the Box M test to check homocedasticity).
16 Mardia s test for multivariate Normality (1970) Consideremos que x j (j=1,.n) reresentan las observaciones en la muestra de entrenamiento corresondiente a una clase articular C. Si se consideran variables redictoras entonces cada xj es un vector columna -dimensional. Deseamos robar que el vector aleatorio X=(X1,..X) se distribuye en forma normal multivariada en C. Mardia basa su rueba en las medidas de asimetría y kurtosis, cuyas estimaciones basadas en la muestra de entrenamiento están definidas como : y 1 {( n n = x )' ( )} j x S xk x n j= 1 k= 1 b b resectivamente. 1 {( n 1 = x j x)' S ( x j x) } n j= 1
17 Mardia s test (cont) Si la hiótesis nula Ho: x es normal multivariada en la clase C es cierta entonces se uede mostrar que ara n grande ( n/6) b 1 ~ d con d=(/6)(+1)(+) grados de libertad, y χ [ b ( + )]/ (8/ n) ( + ) ~ N(01, ) La rueba de Hawkins (Technometrics, 1981) ermite robar simultáneamente normalidad multivariada y homocedasticidad. No aarece en ningún rograma estadístico.
18 Examle:Bua > mardia(bua,1) mard1= value for m3= 0 mard= value for m4= 0 There is not statistical evidence for normality > mardia(bua,) mard1= value for m3= 0 mard= value for m4= 0 There is not statistical evidence for normality
19 Clasificacion suervisada desde un unto de vista Bayesiano Suonga que conocemos de antemano la robabilidad ariori π i (i=1,, G) de que un objeto ertenezca a la clase C i. Si no se conoce informacion adicional entonces un objeto cualquiera sera clasificado como erteneciente a la clase C i si π i > π j ara i=1,,..g, j i (3.1) Sin embargo, usualmente alguna informacion adicional es conocida, tal como un vector x de mediciones hechas en el objeto a ser clasificado. En este caso, comaramos la robabilidad de ertenecer a cada clase ara un objeto con vector de mediciones x, y el objeto es clasificado como de clase Ci si P(C i /x)>p(c j /x) ara todo j i (3.) Esta regla de decision es llamada la Regla de minimo error. Esto es equivalente a escribir, i=argmax k P(C k /x) ara todo k en 1,.G. 19
20 Clasificacion Bayesiana Las robabilidades P(C i /x) son llamadas robabilidades osteriores. Desafortunadamente, estas robabilidades raras veces son conocidas y deben ser estimadas. Esto ocurre en regresion logistica, clasificadores or vecinos mas cercanos, y redes neurales. Una formulacion mas conveniente de la regla anterior uede ser obtenida alicando el teorema de Bayes, que afirma que P( C i / x) = f ( x / Ci ) π i f ( x) (3.3) donde, f(x/ C i ), es la densidad condicional de la clase C i.por lo tanto un objeto sera clasificado en la clase C i si f ( x / C ) π > f ( x/ C ) π (3.4) i i j j ara todo i j. Esto es, i=argmax k f(x/c k )π k 0
21 Si las densidades condicionales de clase, f(x/ C i ) son conocidas entonces el roblema de clasificacion esta resuelto exlicitamente, como ocurre en el analisis discriminante lineal y cuadratico. Pero frecuentemente las f(x/ C i ) no son conocidas y ellas deben ser estimadas usando la muestra de entrenamiento. Este es el caso de los clasificadores k-nn, los clasificadores basados en estimacion de densidad or kernel y en aquellos basados en mezclas gaussianas. 1
22 Analisis discriminante lineal como un clasificador Bayesiano Suongamos que tenemos dos clases C 1 y C que siguen una distribucion normal multivariada, N(u 1,Σ 1 ) y N(u,Σ ) resectivamente y que además tienen igual matriz de covarianza Σ 1 =Σ =Σ. Luego la ecuacion (3.4) uede ser escrita como ex[ 1/ ( x u ex[ 1/ ( x u 1 )' Σ )' Σ 1 1 ( x u ( x u 1 ) ) > π π 1 (3.5) Tomando logaritmos en ambos lados se obtiene 1/ [( x u 1 )' Σ 1 ( x u 1 ) ( x u )' Σ 1 π ( x u)] > Ln( ) π 1 (3.6)
23 Desues de algunas simlificaciones resulta (u 1 -u )'Σ -1 (x-1/(u 1 +u ))> Ln( ) (3.7) Si estimamos los arametros oblacionales, esta desigualdad es similar a la que aarece en (.), exceto or el termino del lado derecho. Si ademas consideramos que las robabilidades a riori son iguales (π 1 =π ) entonces si se obtendria la misma exresion (.). π π 1 3
24 Ejemlo(cont) > # LDA con riors iguales > lda1<-lda(nota~e1+e,eje1dis,rior=c(.5,.5)) > lda1 > lda1=redict(lda1,eje1dis[,-c(3,4)])$class > error1=sum(lda1!=eje1dis[,4]) > error1 [1] 4 > #LDA con riors onderadas > lda<-lda(nota~e1+e,eje1dis) Prior robabilities of grous: f > lda=redict(lda,eje1dis[,-c(3,4)])$class > error=sum(lda!=eje1dis[,4]) > error [1] 4
25 LDA ara mas de dos clases Para G clases, el LDA asigna un objecto con vector de atributos x a la clase i tal que i=argmax k x' k S 1 1 x ( 1/ ) x' S x + Ln( πk) Para todo k en 1,, G. Al igual que antes el lado derecho, llamada funcion discriminante, es estimada usando la muestra de entrenamiento. k k 5
26 Ejemlo: El conjunto de datos Vehicle Library(MASS) ldaveh=lda(vehicle[,1:18],vehicle[,19]) redict(ldaveh)$osterior redict(ldaveh)$class # Estimating the error rate mean(vehicle[,19]!=redict(ldaveh)$class [1] Es estimado que 0.1% de las instancias estan mal clasificadas. 6
27 La tasa de error de mala clasificacion Dado un clasificador d, su taza de error de mala clasificacion R(d) es la robabilidad de que d clasifique incorrectamente un objeto de una muestra (muestra de rueba) obtenida osteriormente a la muestra de entrenamiento. Tambien es llamado el error verdadero. Es un valor desconocido que necesita ser estimado. 7
28 Metodos ara estimar la taza de error de mala clasificacion i) Error or resubstitution or error aarente. (Smith, 1947). Este es simlemente la roorcion de instancias en la muestra de entrenamiento que son incorrectamente clasificadas or la regla de clasificacion. En general es un estimador demasiado otimista y uede conducir a conclusiones erroneas cuando el numero de instancias no es demasidado grande comarado con el numero de atributos. Este estimador tiene un sesgo grande. ii) Estimacion dejando uno afuera (LOO). (Lachenbruch, 1965). En este caso una instancia es omitida de la muestra de entrenamiento. Luego, el clasificador es construido y se obtiene la rediccion ara la instancia omitida. Se registra si la instancia fue correcta o incorrectamente clasificada. El roceso es reetido ara todas las instancias y la estimacion del error de mala clasificacion sera la roorcion de instancias clasificadas inconrrectamente. Este estimador tiene oco sesgo ero su varianza tiende a ser grande. 8
29 Examles of LOO > ldaexa=lda(eje1dis[,1:],eje1dis[,4],cv=true) > mean(eje1dis[,4]!=ldaexa$class) [1] > ldaveh=lda(vehicle[,1:18],vehicle[,19],cv=true) > mean(vehicle[,19]!=ldaveh$class) [1]
30 Metodos ara estimar la tasa de error de mala clasificacion iii) Validacion cruzada. (Stone, 1974) En este caso la muestra de entrenamiento es dividida al azar en v artes (v=10 es lo mas usado). Luego, el clasificador es construido usando todas las artes menos una. La arte omitida es considerada como la muestra de rueba y se hallan las redicciones de cada una de sus instancias. La tasa de error de mala clasificacion CV es hallada sumando el numero de malas classificaciones en cada arte y dividiendo el total or el numero de instancias en la muestra de entrenamiento. El estimado CV tiene oco sesgo ero una alta variabilidad. Para reducir dicha variabilidad se reite la estimacion varias veces. La estimacion de la varianza del estimador CV es un hard roblem (Bengio and Grandvalet, 004). 30
31 Ejemlo: crossval(eje1dis,method="lda",reet=0) [1] crossval(vehicle,method= lda,reet=10) [1] iv) El metodo de retencion. Aqui se extrae al azar un orcentaje de los datos (70%) y es considerado como la muestra de entrenamiento y los restantes datos son considerados como la muestra de rueba. El clasificador es evaluado en la muestra de rueba. El exerimento es reetido varias veces y luego se romedia la tasa de error en las muestras de rueba. v) Bootstraing. (Efron, 1983). En este metodo se generan de la muestra de entrenamiento varias muestras con reemlazo. Las que luego se usan ara construir el clasificador. La idea es reducir el sesgo del error aarente. Es casi insesgado ero tiene una varianza grande. Su costo comutational es alto. Existen varias variantes de este metodo. 31
La distribución de probabilidad de la variable aleatoria (v. a). Bernoulli, está dada por:
Distribución Bernoulli Una rueba o exerimento Bernoulli tiene uno de dos resultados mutuamente excluyentes, que generalmente se denotan S (éxito) y F (fracaso). Por ejemlo, al seleccionar un objeto ara
Más detalles7. DISTRIBUCIOES DISCRETAS DE PROBABILIDAD
7. DISTRIBUCIOES DISCRETAS DE PROBABILIDAD La Distribución Binomial Esta distribución fue elaborada or Jacobo Bernoulli y es alicable a un gran número de roblemas de carácter económico y en numerosas alicaciones
Más detallesUNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS. Fracciones continuas, ecuación de Pell y unidades en el anillo de enteros de los cuerpos cuadráticos
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS FACULTAD DE CIENCIAS MATEMÁTICAS EAP DE MATEMÁTICA PURA Fracciones continuas, ecuación de Pell y unidades en el anillo de enteros de los cueros cuadráticos Caítulo
Más detallesTema 2: Análisis Discriminante
Tema 2: Análisis Discriminante P 1 P 2 Problema de clasificación: Ténemos observaciones que corresponden a 2 grupos P_1, P_2. Si nos dan uno nuevo x_0 a que grupo pertenece? Guión 1. Motivación 2. Clasificación
Más detallesECONOMETRÍA II Prof.: Begoña Álvarez TEMA 1 INTRODUCCIÓN. Estimación por máxima verosimilitud y conceptos de teoría asintótica
ECONOMETRÍA II Prof.: Begoña Álvarez 2007-2008 TEMA 1 INTRODUCCIÓN Estimación por máxima verosimilitud y conceptos de teoría asintótica 1. ESTIMACIÓN POR MÁXIMA VEROSIMILITUD (MAXIMUM LIKELIHOOD) La estimación
Más detallesMODELO DE RESPUESTAS Objetivos 2, 3, 4, 5, 6, 7, Y 8.
UNIVERSIDAD NACIONAL ABIERTA ESTADÍSTICA GENERAL 745) VICERRECTORADO ACADÉMICO INTEGRAL ÁREA DE MATEMÁTICA Fecha: 17/ 01 /009 MODELO DE RESPUESTAS Objetivos, 3, 4, 5, 6, 7, Y 8. OBJ. 1 PTA 1 Una compañía
Más detallesEstadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR
Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación Facultad de Ciencias Sociales, UdelaR Índice 1. Repaso: estimadores y estimaciones. Propiedades de los estimadores. 2. Estimación puntual.
Más detalles( ) DISTRIBUCIÓN UNIFORME (o rectangular) 1 b a. para x > b DISTRIBUCIÓN DE CAUCHY. x ) DISTRIBUCIÓN EXPONENCIAL. α α 2 DISTRIBUCIÓN DE LAPLACE
Estudiamos algunos ejemplos de distribuciones de variables aleatorias continuas. De ellas merecen especial mención las derivadas de la distribución normal (χ, t de Student y F de Snedecor), por su importancia
Más detallesTema 5. Muestreo y distribuciones muestrales
1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras aleatorias simples. Distribución de la media muestral: Esperanza y varianza. Distribución exacta en el caso normal. Distribución
Más detallesPROBLEMAS DE LÍMITES Y CONTINUIDAD (MÉTODOS ALGEBRAICOS) lím. lím. Las descomposiciones factoriales se hacen dividiendo sucesivamente por x + 2.
PROBLEMAS DE LÍMITES Y CONTINUIDAD MÉTODOS ALGEBRAICOS) Cálculo de ites or métodos algebraicos Resuelve los siguientes ites: a) 8 b) 8 c) a) ) ) 6) ) 8 Se reite el roceso) ) ) ) ) Las descomosiciones factoriales
Más detallesTeorema Central del Límite (1)
Teorema Central del Límite (1) Definición. Cualquier cantidad calculada a partir de las observaciones de una muestra se llama estadístico. La distribución de los valores que puede tomar un estadístico
Más detallesCapítulo 8. Análisis Discriminante
Capítulo 8 Análisis Discriminante Técnica de clasificación donde el objetivo es obtener una función capaz de clasificar a un nuevo individuo a partir del conocimiento de los valores de ciertas variables
Más detallesDISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIONES DE PROBABILIDAD Ejercicios rouestos 1. Los datos originales a menudo necesitan ser codificados (transformados) ara facilitar el cálculo. Qué consecuencias tienen en el cálculo de la media
Más detallesAgro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos
Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,
Más detallesANALISIS DE FRECUENCIA EN HIDROLOGIA
ANALISIS DE FRECUENCIA EN HIDROLOGIA Luis F. Carvajal Julián D. Rojo Universidad Nacional de Colombia Facultad de Minas Escuela de Geociencias y Medio Ambiente Introducción 1. Los eventos hidrológicos
Más detallesMATEMÁTICAS BÁSICAS UNIVERSIDAD NACIONAL DE COLOMBIA - SEDE MEDELLÍN CLASE # 12
MATEMÁTICAS BÁSICAS UNIVERSIDAD NACIONAL DE COLOMBIA - SEDE MEDELLÍN CLASE # Ecuaciones Una ecuación es la a rmación de que dos exresiones algebraicas son iguales. Los siguientes son ejemlos de ecuaciones:
Más detallesDepartamento de Ingeniería Matemática- Universidad de Chile
Ingeniería Matemática FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS UNIVERSIDAD DE CHILE Álgebra Lineal 08-4 Matrices elementales SEMANA 2: MATRICES Como veremos la resolución de sistemas de ecuaciones via
Más detallesPRÁCTICA I. Ejercicios Teóricos
PRÁCTICA I TEORÍA DE LA DECISIÓN BAYESIANA Ejercicios Teóricos Ejercicio. En el caso de dos categorías, en la regla de decisión de Bayes el error condicional está dado por la ecuación (7). Incluso si las
Más detallesMuestreo de variables aleatorias
Estadística II Universidad de Salamanca Curso 2011/2012 Outline 1 Introducción 2 Distribución de la muestra 3 4 5 Distribuciones de la media y la varianza en poblaciones normales Introducción Tiene como
Más detallesResumen teórico de los principales conceptos estadísticos
Temas de Estadística Práctica Antonio Roldán Martínez Proyecto http://www.hojamat.es/ Muestreo aleatorio simple Resumen teórico Resumen teórico de los principales conceptos estadísticos Muestreo aleatorio
Más detallesT2. El modelo lineal simple
T2. El modelo lineal simple Ana J. López y Rigoberto Pérez Dpto Economía Aplicada. Universidad de Oviedo Curso 2010-2011 Curso 2010-2011 1 / 40 Índice 1 Planteamiento e hipótesis básicas 2 Estimación de
Más detallesEconometría II Grado en finanzas y contabilidad
Econometría II Grado en finanzas y contabilidad Variables aleatorias y procesos estocásticos. La FAC y el correlograma Profesora: Dolores García Martos E-mail:mdgmarto@est-econ.uc3m.es Este documento es
Más detallesNÚMEROS RACIONALES Q
NÚMEROS RACIONALES Q Es el número ue se uede exresar como el cociente de dos números enteros, es decir, en forma de fracción 0. El conjunto se uede reresentar Q {, Z 0} {..., 2, 2, 1, 0, 1 8, 2 7, 1,...
Más detallesConceptos del contraste de hipótesis
Análisis de datos y gestión veterinaria Contraste de hipótesis Departamento de Producción Animal Facultad de Veterinaria Universidad de Córdoba Córdoba, 14 de Diciembre de 211 Conceptos del contraste de
Más detallesUnidad 5. Aplicaciones de las derivadas. Objetivos. Al terminar la unidad, el alumno:
Unidad 5 Alicaciones de las derivadas Objetivos Al terminar la unidad, el alumno: Resolverá roblemas de ingreso utilizando el ingreso marginal. Resolverá roblemas de costos utilizando el costo marginal
Más detallesClasificación de desastres y emergencias con representación bipolar del conocimiento
Clasificación de desastres y emergencias con reresentación biolar del conocimiento J. Tinguaro Rodríguez, Begoña Vitoriano, Javier Montero Deartamento de Estadística e Investigación Oerativa Universidad
Más detalles( ) = = ( ) ( ) 1 = La probabilidad de que no ocurra ninguno de los dos es la probabilidad de la intersección de los complementarios ó contrarios.
CUESTONES. Sean y B dos sucesos con (0,5, (B0, y ( B0,. Calcular las siguientes robabilidades (, (, ( B, (. B B B B ( ( B 0' B B 0' ( B ( B ( B ( B ( B B ( B B ( B B 0' 0'5 + 0' 0' 7 B B B ( ( B ( B (
Más detallesPronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple
Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple Temas Modelo de regresión lineal múltiple Estimaciones de Mínimos Cuadrados Ordinarios (MCO); estimación puntual y predicción
Más detallesUPR Departamento de Ciencias Matemáticas RUM MATE 3171 Primer Examen Parcial 21 de octubre de 2010
UPR Deartamento de Ciencias Matemáticas RUM MATE 37 Primer Eamen Parcial de octubre de 00 Nombre: # Estudiante: Profesor: Sección: Instrucciones: Lea cada regunta minuciosamente. No se ermite el uso de
Más detalles478 Índice alfabético
Índice alfabético Símbolos A, suceso contrario de A, 187 A B, diferencia de los sucesos A y B, 188 A/B, suceso A condicionado por el suceso B, 194 A B, intersección de los sucesos A y B, 188 A B, unión
Más detallesConceptos Básicos de Inferencia
Conceptos Básicos de Inferencia Álvaro José Flórez 1 Escuela de Ingeniería Industrial y Estadística Facultad de Ingenierías Febrero - Junio 2012 Inferencia Estadística Cuando obtenemos una muestra, conocemos
Más detalles2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...
Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................
Más detallesRegresión Lineal Múltiple
Universidad Nacional Agraria La Molina 2011-2 Efectos de Diagnósticos de Dos predictores X 1 y X 2 son exactamente colineales si existe una relación lineal tal que C 1 X 1 + C 2 X 2 = C 0 para algunas
Más detallesMétodos Estadísticos de la Ingeniería Tema 7: Momentos de Variables Aleatorias Grupo B
Métodos Estadísticos de la Ingeniería Tema 7: Momentos de Variables Aleatorias Grupo B Área de Estadística e Investigación Operativa Licesio J. Rodríguez-Aragón Marzo 2010 Contenidos...............................................................
Más detalles1. LÍMITE DE UNA FUNCIÓN REAL
CORPORACION UNIFICADA NACIONAL DE EDUCACION SUPERIOR CUN DEPARTAMENTO DE CIENCIAS BASICAS PROGRAMA: INGENIERIAS DE SISTEMAS Y CIENCIAS ADMINISTRATIVAS ACTIVIDAD ACADEMICA: CÁLCULO DIFERENCIAL DOCENTE:
Más detallesANÁLISIS DISCRIMINANTE (AD)
discrim_predictivo.doc 30//05 vgg ANÁLISIS DISCRIMINANTE (AD) Regresión con respuesta categórica Y Cómo depende Y de las variables X, X,... X p? cualitativa cuantitativas Planteamiento Predictivo del AD:
Más detalles2. EL DISEÑO UNIFACTORIAL (COMPARACION DE TRATAMIENTOS)
2. EL DISEÑO UNIFACTORIAL (COMPARACION DE TRATAMIENTOS) La idea principal en este capitulo es el inicio a planear los diseño experimentales y su correspondiente análisis estadístico. En este caso iniciaremos
Más detallesPRINCIPALES DISTRIBUCIONES DISCRETAS
PRINCIPALES DISTRIBUCIONES DISCRETAS Objetivos generales del tema En este tema definiremos y discutiremos diversas e imortantes distribuciones discretas, es decir, funciones masa de robabilidad o funciones
Más detallesPROCESOS DE MARKOV. Definiciones en los Procesos de Markov de Primer Orden:
ROCESOS DE MARKOV rinciio de Markov: Cuando una robabilidad condicional deende únicamente del suceso inmediatamente anterior, cumle con el rinciio de Markov de rimer Orden, es decir. X ( t ) j X () K,
Más detallesTeoría de la decisión
1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia
Más detallesFormulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico
Formulario. Estadística Administrativa Módulo 1. Introducción al análisis estadístico Histogramas El número de intervalos de clase, k, se elige de tal forma que el valor 2 k sea menor (pero el valor más
Más detallesCAPITULO 4. ECUACIONES DIFERENCIALES DE PRIMER ORDEN Introducción
CAPITULO 4. ECUACIONES DIFERENCIALES DE PRIMER ORDEN 4.. Introducción Se denomina ecuación diferencial ordinaria a toda ecuación en la que aarecen una o varias derivadas de una función. Cuando las derivada
Más detallesAPRENDIZAJE PROBABILÍSTICO NAIVE BAYES
1 APRENDIZAJE PROBABILÍSTICO NAIVE BAYES Bases de Datos Masivas 9 de Noviembre de 2016 2 Razonamiento Probabilístico Es una herramienta de aprendizaje estadístico. Se trata de razonar en un contexto incierto;
Más detallesUnidad IV: Distribuciones muestrales
Unidad IV: Distribuciones muestrales 4.1 Función de probabilidad En teoría de la probabilidad, una función de probabilidad (también denominada función de masa de probabilidad) es una función que asocia
Más detallesUniversidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia
Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Estudio de Caso: Estudio Morfología Coeficiente de Correlación Considere el archivo Estudio Morfología.sav.
Más detallesMétodos Estadísticos Multivariados
Métodos Estadísticos Multivariados Victor Muñiz ITESM Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre 2011 1 / 20 Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre
Más detallesTRAZADO DE DIAGRAMA POLAR Y APLICACIÓN DE CRITERIO DE NYQUIST
TRAZADO DE DIAGRAMA POLAR Y APLICACIÓN DE CRIRIO DE NYQUIST. TRAZADO DE DIAGRAMA POLAR. La función de transferencia P, tendrá el formato dado or la siguiente exresión generalizada: P ± m m P A P + A P
Más detallesEstadísticas Pueden ser
Principios Básicos Para iniciar en el curso de Diseño de experimentos, es necesario tener algunos conceptos claros en la parte de probabilidad y estadística. A continuación se presentan los conceptos más
Más detallesIntroducción a la Estadística Aplicada en la Química
Detalle de los Cursos de Postgrado y Especialización en Estadística propuestos para 2015 1/5 Introducción a la Estadística Aplicada en la Química FECHAS: 20/04 al 24/04 de 2015 HORARIO: Diario de 10:00
Más detallesEVALUACIÓN DEL MÉTODO DE MURPHY PARA LA INTERPRETACIÓN DE SEÑALES EN LA CARTA T 2 MULTIVARIADA
EVALUACIÓN DEL MÉTODO DE MURPHY PARA LA INTERPRETACIÓN DE SEÑALES EN LA CARTA T 2 MULTIVARIADA Hector Fabian Lopez Casas 1 hectorfl86@hotmail.com 1 Estudiante de Matematicas Con Enfasis en Estadistica,
Más detallesAnálisis de datos Categóricos
Introducción a los Modelos Lineales Generalizados Universidad Nacional Agraria La Molina 2016-1 Introducción Modelos Lineales Generalizados Introducción Componentes Estimación En los capítulos anteriores
Más detallesEL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD)
EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD) Fortino Vela Peón fvela@correo.xoc.uam.mx FVela-0 Objetivo Introducir las ideas básicas del principio de máxima verosimilitud. Problema Considere el experimento
Más detallesTema 8. Fundamentos de Análisis discriminante
Máster en Técnicas Estadísticas Análisis Multivariante. Año 2008 2009. Profesor: César Sánchez Sellero. Tema 8. Fundamentos de Análisis discriminante 8.1. Introducción. Empezamos deniendo el problema discriminante.
Más detallesCurso de Probabilidad y Estadística
Curso de Probabilidad y Estadística Distribuciones de Probabilidad Dr. José Antonio Camarena Ibarrola camarena@umich.mx Universidad Michoacana de San Nicolás de Hidalgo Facultad de Ingeniería Eléctrica
Más detallesPLAN DE TRABAJO 9 Período 3/09/07 al 28/09/07
PLAN DE TRABAJO 9 Período 3/09/07 al 28/09/07 TEMAS A ESTUDIAR En esta guía nos dedicaremos a estudiar el tema de Estimación por intervalo y comenzaremos a estudiar las pruebas de hipótesis paramétricas.
Más detallesviii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos
Contenido Acerca de los autores.............................. Prefacio.... xvii CAPÍTULO 1 Introducción... 1 Introducción.............................................. 1 1.1 Ideas de la estadística.........................................
Más detallesAnova unifactorial Grados de Biología y Biología sanitaria
Anova unifactorial Grados de Biología y Biología sanitaria M. Marvá e-mail: marcos.marva@uah.es Unidad docente de Matemáticas, Universidad de Alcalá 29 de noviembre de 2015 El problema Analizaremos la
Más detallesÍNDICE CAPÍTULO 1. INTRODUCCIÓN
ÍNDICE CAPÍTULO 1. INTRODUCCIÓN 1.1. OBJETO DE LA ESTADÍSTICA... 17 1.2. POBLACIONES... 18 1.3. VARIABLES ALEATORIAS... 19 1.3.1. Concepto... 19 1.3.2. Variables discretas y variables continuas... 20 1.3.3.
Más detallesAnálisis de la varianza
Análisis de la varianza José Gabriel Palomo Sánchez gabriel.palomo@upm.es E.U.A.T. U.P.M. Julio de 2011 I 1 Introducción 1 Comparación de medias 2 El pricipio de aleatorización 2 El problema de un factor
Más detallesÍndice general. Pág. N. 1. Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN. Diseño. Población. Muestra. Individuo (Observación, Caso, Sujeto) Variables
Pág. N. 1 Índice general Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN 1.1 Diseño 1.2 Descriptiva 1.3 Inferencia Diseño Población Muestra Individuo (Observación, Caso, Sujeto) Variables Ejercicios de Población
Más detallesMATERIA: ESTADÍSTICA EJEMPLOS DE POSIBLES PREGUNTAS DE EXAMEN. a. Cuáles son las escalas en que pueden estar los datos en un análisis estadístico.
MATERIA: ESTADÍSTICA EJEMPLOS DE POSIBLES PREGUNTAS DE EXAMEN 1. Conteste las preguntas siguientes: a. Cuáles son las escalas en que pueden estar los datos en un análisis estadístico. 1. 2. 3. 4. b. En
Más detallesVariables aleatorias
Distribuciones continuas Se dice que una variable aleatoria X tiene una distribución continua, o que X es una variable continua, si existe una función no negativa f, definida sobre los números reales,
Más detallesAplicaciones de apoyo al diagnóstico médico. Identificación de objetos amigos y enemigos. Identificación de zonas afectadas por un desastre natural.
Capítulo 5 Evaluación En muchas ocasiones requerimos hacer una evaluación muy precisa de nuestros algoritmos de aprendizaje computacional porque los vamos a utilizar en algún tipo de aplicación que así
Más detallesAnálisis de la varianza ANOVA
Estadística Básica. Mayo 2004 1 Análisis de la varianza ANOVA Francisco Montes Departament d Estadística i I. O. Universitat de València http://www.uv.es/~montes Estadística Básica. Mayo 2004 2 Comparación
Más detallesCAPITULO ANÁLISIS ESTADÍSTICO MULTIVARIADO /1/ /2/ En el presente capítulo se realiza el análisis estadístico multivariado de los
112 CAPITULO 5 5.- ANÁLISIS ESTADÍSTICO MULTIVARIADO /1/ /2/ 5.1. Introducción En el presente capítulo se realiza el análisis estadístico multivariado de los datos obtenidos en censo correspondientes a
Más detallesTÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD
TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD Contrastes de hipótesis paramétricos para una y varias muestras: contrastes sobre la media, varianza y una proporción. Contrastes sobre la diferencia
Más detallesINDICE. Prólogo a la Segunda Edición
INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.
Más detallesEstimaciones puntuales. Estadística II
Estimaciones puntuales Estadística II Estimación Podemos hacer dos tipos de estimaciones concernientes a una población: una estimación puntual y una estimación de intervalo. Una estimación puntual es un
Más detallesCUERPO TÉCNICO, OPCION ESTADISTICA
CUERPO TÉCNICO, OPCION ESTADISTICA ESTADÍSTICA TEÓRICA BÁSICA TEMA 1. Fenómenos aleatorios. Conceptos de probabilidad. Axiomas. Teoremas de probabilidad. Sucesos independientes. Teorema de Bayes. TEMA
Más detallesLA ESTADÍSTICA APLICADA AL ANÁLISIS ECONÓMICO. Introducción 1
LA ESTADÍSTICA APLICADA AL ANÁLISIS ECONÓMICO ÍNDICE CONCEPTO Página Introducción 1 I Generalidades... 3 I.1 Definiciones de Estadística... 4 I.2 Diferentes clases de Estadística... 8 II La Estadística
Más detallesESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M.
1 Introducción ESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M. En este capítulo, vamos a abordar la Estimación Puntual, que es uno de los tres grandes conjuntos de técnicas que
Más detallesJUNIO Bloque A
Selectividad Junio 009 JUNIO 009 Bloque A 1.- Estudia el siguiente sistema en función del parámetro a. Resuélvelo siempre que sea posible, dejando las soluciones en función de parámetros si fuera necesario.
Más detalles1 Tema 4: Variable Aleatoria Bidimensional y n-dimensional
1 Tema 4: Variable Aleatoria Bidimensional y n-dimensional 4.1. Variable aleatoria bidimensional Las Variables Aleatorias Bidimensionales o N-Dimensionales surgen cuando es necesario trabajar en espacios
Más detallesRegresión Logística. Introducción
Introducción En este tema estudiaremos cómo construir y analizar un modelo de regresión que retende reresentar la deendencia lineal de una variable resuesta con dos categorías (dicotómica) resecto a otras
Más detallesINTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)
TEMA Nº 7 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD OBJETIVOS DE APRENDIZAJE: Conocer las características de la distribución normal como distribución de probabilidad de una variable y la aproximación de
Más detallesTeorema de Bayes(6) Nos interesan las probabilidades a posteriori o probabilidades originales de las partes p i :
Teorema de Bayes(5) 75 Gráficamente, tenemos un suceso A en un espacio muestral particionado. Conocemos las probabilidades a priori o probabilidades de las partes sabiendo que ocurrió A: Teorema de Bayes(6)
Más detallesINDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica
INDICE 1. Qué es la Estadística? 1 Introducción 2 Qué significa estadística? 2 Por qué se estudia la estadística? 4 Tipos de estadística 5 Estadística descriptiva 5 Estadística inferencial 6 Tipos de variables
Más detallesMATEMÁTICAS BÁSICAS UNIVERSIDAD NACIONAL DE COLOMBIA - SEDE MEDELLÍN CLASE #28
MATEMÁTICAS BÁSICAS UNIVERSIDAD NACIONAL DE COLOMBIA - SEDE MEDELLÍN CLASE #8 Identidades Trigonométricas Una identidad es una ecuación que es válida ara todos los valores de las variables ara los cuales
Más detallesTema 6. Variables aleatorias continuas
Tema 6. Variables aleatorias continuas Resumen del tema 6.1. Definición de variable aleatoria continua Identificación de una variable aleatoria continua X: es preciso conocer su función de densidad, f(x),
Más detallesINFERENCIA ESTADISTICA
1 INFERENCIA ESTADISTICA Es una rama de la Estadística que se ocupa de los procedimientos que nos permiten analizar y extraer conclusiones de una población a partir de los datos de una muestra aleatoria,
Más detallesPruebas de Hipótesis Multiples
Pruebas de Hipótesis Multiples Cuando queremos hacer comparaciones de mas de dos poblaciones, una alternativa es comparar todos los grupos a la vez con el método de Análisis de Varianza (ANOVA) H o : µ
Más detallesUniversidad Rafael Belloso Chacín (URBE) Cátedra: Fundamentos de Estadística y Simulación Básica Semestre Profesor: Jaime Soto
Universidad Rafael Belloso Chacín (URBE) Cátedra: Fundamentos de Estadística y Simulación Básica Semestre 2011-1 Profesor: Jaime Soto PRUEBA DE HIPÓTESIS Ejemplo El jefe de la Biblioteca de la URBE manifiesta
Más detallesDiplomado en Estadística Aplicada
Diplomado en Estadística Aplicada Con el propósito de mejorar las habilidades para la toma de decisiones, la División de Estudios de Posgrado de la Facultad de Economía ha conjuntado a profesores con especialidad
Más detallesDistribuciones Probabilísticas. Curso de Estadística TAE,2005 J.J. Gómez Cadenas
Distribuciones Probabilísticas Curso de Estadística TAE,005 J.J. Gómez Cadenas Distribución Binomial Considerar N observaciones independientes tales que: El resultado de cada experimento es acierto o fallo
Más detallesDistribuciones de probabilidad bidimensionales o conjuntas
Distribuciones de probabilidad bidimensionales o conjuntas Si disponemos de dos variables aleatorias podemos definir distribuciones bidimensionales de forma semejante al caso unidimensional. Para el caso
Más detallesEL MÉTODO KERNEL DE EQUATING Y SU CONTRAPARTE BAYESIANA NO PARAMÉTRICA: UN ESTUDIO DE COMPARACIÓN BAJO EL DISEÑO DE GRUPOS EQUIVALENTES
EL MÉTODO KERNEL DE EQUATING Y SU CONTRAPARTE BAYESIANA NO PARAMÉTRICA: UN ESTUDIO DE COMPARACIÓN BAJO EL DISEÑO DE GRUPOS EQUIVALENTES Constanza Rojo Alfaro 1, Jorge González Burgos 2 1 Dto de Estadística,
Más detallesDepartamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.
TEMA 13 REGRESIÓN LOGÍSTICA Es un tipo de análisis de regresión en el que la variable dependiente no es continua, sino dicotómica, mientras que las variables independientes pueden ser cuantitativas o cualitativas.
Más detallesANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.
ANEXO 1. CONCEPTOS BÁSICOS Este anexo contiene información que complementa el entendimiento de la tesis presentada. Aquí se exponen técnicas de cálculo que son utilizados en los procedimientos de los modelos
Más detallesSe permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado.
NORMAS El examen consta de dos partes: 0.0.1. Diez Cuestiones: ( tiempo: 60 minutos) No se permite ningún tipo de material (libros, apuntes, calculadoras,...). No se permite abandonar el aula una vez repartido
Más detallesDistribuciones de probabilidad
Distribuciones de probabilidad Prof, Dr. Jose Jacobo Zubcoff Departamento de Ciencias del Mar y Biología Aplicada Inferencia estadística: Parte de la estadística que estudia grandes colectivos a partir
Más detallesCONTRASTE DE HIPÓTESIS
CONTRASTE DE HIPÓTESIS Antonio Morillas A. Morillas: Contraste de hipótesis 1 CONTRASTE DE HIPÓTESIS 1. Introducción 2. Conceptos básicos 3. Región crítica óptima i. Teorema de Neyman-Pearson ii. Región
Más detallesAnálisis de Estructuras Espaciales Persistentes. Desempleo Departamental en Argentina.
Análisis de Estructuras Espaciales Persistentes. Desempleo Departamental en Argentina. Marcos Herrera 1 1 CONICET IELDE - Universidad Nacional de Salta (Argentina) Seminario de Investigación Nº 27 8 de
Más detallesEl Movimiento Browniano en la modelización del par EUR/USD
MÁSTER UNIVERSITARIO EN DIRECCIÓN FINANCIERA Y FISCAL TESINA FIN DE MÁSTER El Movimiento Browniano en la modelización del par EUR/USD Autor: José Vicente González Cervera Directores: Dr. Juan Carlos Cortés
Más detallesAnálisis de Componentes de la Varianza
Análisis de Componentes de la Varianza Resumen El procedimiento de Análisis de Componentes de Varianza está diseñado para estimar la contribución de múltiples factores a la variabilidad de una variable
Más detallesESTADISTICA APLICADA: PROGRAMA
Pág. 1 de 5 ESTADISTICA APLICADA: PROGRAMA a) OBJETIVOS Y BLOQUE 1: Teoría de Probabilidades 1.1 Comprender la naturaleza de los experimentos aleatorios y la estructura de los espacios de probabilidades,
Más detalles6 Variables aleatorias independientes
6 Variables aleatorias independientes Edgar Acuna ESMA 4 Edgar Acuna Dos variables aleatorias son independientes si para todo a b P[
Más detallesCap. 5 : Distribuciones muestrales
Cap. 5 : Distribuciones muestrales Alexandre Blondin Massé Departamento de Informática y Matematica Université du Québec à Chicoutimi 18 de junio del 2015 Modelado de sistemas aleatorios Ingeniería de
Más detallesMétodo de cuadrados mínimos
REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,
Más detallesANÁLISIS DISCRIMINANTE
DEFINICIÓN: Cómo técnica de análisis de dependencia: Pone en marcha un modelo de causalidad en el que la variable endógena es una variable NO MÉTRICA y las independientes métricas. Cómo técnica de análisis
Más detallesANOVA. Análisis de la Varianza. Univariante Efectos fijos Muestras independientes
ANOVA Análisis de la Varianza Univariante Efectos fijos Muestras independientes De la t a la F En el test de la t de Student para muestras independientes, aprendimos como usar la distribución t para contrastar
Más detalles