Evaluando las Hipótesis Inductivas. Tomás Arredondo Vidal 8/9/2011
|
|
- Luis Miguel Naranjo Duarte
- hace 8 años
- Vistas:
Transcripción
1 Evaluando las Hipótesis Inductivas Tomás Arredondo Vidal 8/9/2011
2 Evaluando las Hipótesis Inductivas Contenidos Estimando la Precisión Comparando Hipótesis Comparando Algoritmos de Clasificación
3 Evaluando las Hipótesis Inductivas La precisión (accuracy) de la hipótesis h sobre los datos de entrenamiento esta sesgada dado que h fue construida para calzar esos datos (e.g. bias en la estimación y posible sobreajuste). La precisión debe ser evaluada en un conjunto de pruebas independiente (generalmente disjunto) de los datos de entrenamiento. Mientras mayor es el conjunto de prueba, mejor la precisión medida y menor es la varianza observada en distintos conjuntos de prueba. Definición: X es un conjunto de posibles instancias (e.g. el conjunto de todas las personas con varios atributos como edad, ocupacion, veces que han esquiado,...) sobre la cual se puede definir una función objetivo f: X -> {0, 1} (e.g. las personas que van a comprar esquís este año). X se puede encontrar con distintas frecuencias dada una distribución D de probabilidades (e.g. D puede asignar mayor probabilidad a los de 19 años que a la gente de 100 años).
4 Error de Muestra vs Error Verdadero Definición: El error de muestra (sample error) de la hipótesis h con respecto a la función objetivo f( ) dado una muestra S es error S ( h)= 1 n x S δ ( f ( x),h( x )) δ ( f ( x ),h( x ))=1 si f ( x ) h( x ), 0 de otra forma. Definición: El error verdadero (true error) es el error de la hipótesis h con respecto a la función objetivo f( ) dado la distribución D. Es la probabilidad que h mis-clasifique una instancia elegida de acuerdo a D. [ f ( x ) h ( x)]
5 Relación con la Distribución Binomial Como es que la desviación entre el error de muestreo y el error verdadero depende del tamaño de la muestra? La respuesta tiene que ver con que cuando medimos el error de la muestra S estamos haciendo un experimento aleatorio con un resultado aleatorio. Tomemos una muestra S i de n instancias independientes de la distribución D y midamos el error Si (h). Si repetimos este experimento k veces {S i : S 1, S 2.,..., S k } esperaríamos distintos números de errores cada vez. Decimos que error Si (h) es una variable aleatoria y si graficamos un histograma mostrando la frecuencia de obtener cada posible valor de error a medida que k creciera esta distribución seria una Binomial.
6 Relación con la Distribución Binomial (cont) Ej: En la distribución Binomial la probabilidad de observar r caras (X = r ) en una muestra de n tiros independientes de una moneda, cuando la probabilidad de sacar cara en un tiro individual es p esta dada por: n! P( X=r )=P(r )= r!(n r )! pr (1 p ) n r Estimar p de una muestra aleatoria es equivalente a estimar error D (h) al probar la hipótesis h en una muestra aleatoria S i. Un tiro de la moneda corresponde a sacar una muestra de D y determinar si esta mal clasificada por h. La probabilidad p corresponde a error D (h), r corresponde al numero de misclasificaciones y r / n a error Si (h). error D (h)=p error Si (h )= r n (1)
7 Relación con la Distribución Binomial (cont) Si una variable aleatoria X sigue una distribución Binomial entonces: La probabilidad Pr (X = r) = P(r) El promedio (mean) de X es E(X) = Σx i Pr(X=x i ) = np La varianza de X, Var(X) es Var(X) = E[(X-E[X]) 2 ] = np(1 p) La desviación std de X, σ X es P(r )= n! r!(n r )! pr (1 p) n r σ X = Var(X) 1/2 = (np(1 p)) 1/2 n=40, p=0.3
8 Bias y Varianza en el Estimador Se puede considerar error S (h) como un estimador del error verdadero error D (h). Definición: El sesgo de estimación (estimation bias) de un estimador Y para un parámetro arbitrario p es estimation Bias = E[ Y ] - p error S (h) = E(r / n) = p indica un estimador sin sesgo (unbiased) Definición: La desviación std de error S (h) dado nuestro estimador de p con r errores en n muestras (constante) es σ errors ( h) = σ r n = p(1 p) error S (h)(1 error S (h)) n n Dada la posible elección entre distintos estimadores es mejor uno sin estimation bias y con la varianza mas pequeña. (2)
9 La Distribución Normal como Aproximación error S (h) es el porcentaje de ejemplos en un conjunto de prueba S muestreada independientemente de tamaño n que son clasificados erróneamente por h. error D (h) es el error verdadero para la distribución general de datos D (la que se puede esperar cuando se aplica la hipótesis a ejemplos futuros). Cuando n es al menos 30, el teorema del limite central (Central Limit Theorem) garantiza que la distribución de error S (h) para una muestra aleatoria S va a ser aproximada de manera cercana por una distribución Normal (Gausiana). P(error S(h)) error D (h) error S (h)
10 La Distribución Normal como Aproximación (cont) Teorema: Teorema del limite central. Considerando un conjunto de variables aleatorias independientes (Y i ), idénticamente distribuidas gobernadas por una distribución arbitraria con promedio µ y varianza finita σ 2. Se define el promedio de muestra como: n Ȳ n =(1/n ) i=1 A medida que n ->, independiente de la distribución que gobierna las variables aleatorias subyacentes Y i, esta muestra se acerca a una distribución Normal con: Y i Ȳ n =μ Ȳ n =σ /n
11 Intervalos de Confianza Lo que se quiere saber es error D (h) de la hipótesis porque este es el error que se puede esperar cuando se aplica la hipótesis a ejemplos futuros... Pero lo único que podemos medir es error S (h) para los datos que tenemos disponibles... La pregunta entonces es: Cuan buena es la estimación de error D (h) dada por error S (h)?
12 Intervalos de Confianza Si una variable aleatoria Y obedece una distribución Normal con promedio µ y una desviación std σ entonces el valor medido de Y va a estar en el siguiente intervalo un N% del tiempo y N = µ ± z N σ (3) Int. conf. N%: 50% 68% 80% 90% 95% 98% 99% Const. z N : Ej: una Normal con µ = 0, σ = 1 Con un 80% de confianza el valor de la la variable aleatoria Y va a estar entre [-1.28, 1.28]. Con 90% de confianza Y va a estar en el intervalo [-, 1.28].
13 Intervalos de Confianza Asumiendo que: la muestra S contiene n ejemplos independientes, independientes de h y de acuerdo a la distribución D, n 30, h comete r errores sobre estas n muestras (error S (h) = r / n). Bajo estas condiciones la estadística nos permite decir que: el valor mas probable de error D (h) es el error promedio error S (h), el verdadero error con una probabilidad N% esta en el intervalo: poniendo (1) y (2) -> (3): error D,N ( h)=error S (h )±z N error S (h )(1 error S (h)) n La constante z N da la distancia desde la media en desviaciones std en cualquiera de las dos direcciones.
14 Evaluando las Hipótesis Inductivas Contenidos Estimando la Precisión Comparando Hipótesis Comparando Algoritmos de Clasificación
15 Comparando Dos Hipótesis Aprendidas Cuando se evalúan dos hipótesis distintas, su ordenamiento observado con respecto a precisión puede o no reflejar el orden de sus precisiones individuales reales. Se asume que h 1 es probado en el set S 1 de tamaño n 1 h 2 es probado en un conjunto S 2 de tamaño n 2 P(error S(h)) error S1 (h 1 ) error S2 (h 2 ) error S (h) Se observa h 1 mas precisa que h 2
16 Comparando Dos Hipótesis Aprendidas Cuando se evalúan dos hipótesis distintas, su ordenamiento observado con respecto a precisión puede o no reflejar el orden de sus precisiones individuales reales. Se asume que h 1 es probado en el set S 1 de tamaño n 1 h 2 es probado en un conjunto S 2 de tamaño n 2 P(error S(h)) error S1 (h 1 ) error S2 (h 2 ) error S (h) Se observa h 1 menos precisa que h 2
17 Pruebas Estadísticas de Hipótesis Como determinar si la probabilidad que una diferencia observada empíricamente entre dos variables es aleatoria sin diferencias estadísticas subyacentes? Como determinar lo significativo de dos promedios calculados de dos muestras distintas bajo distintas condiciones? Es común usar la hipótesis nula, que es la probabilidad de que ambas muestras fueron sacadas de la misma distribución subyacente. Por convención científica rechazamos la hipótesis nula y decimos que la diferencia es estadísticamente significativa si la probabilidad de la hipótesis nula es menor que el 5% (p < 0.05) o alternativamente podemos aceptar que la diferencia esta dada por una causa subyacente con confianza de (1 p).
18 Tests de uno o dos lados Tests usando un lado (one sided tests) asumen que uno espera una diferencia en una dirección (e.g. A es mejor que B) y que la diferencia es consistente con esa suposición Tests de dos lados no asumen una diferencia en una u otra dirección. Tests de dos lados (i.e. two-sided tests) son mas conservativos dado que requieren una mayor diferencia para concluir que la diferencia es significativa.
19 Test Z-Score para Comparar Hipótesis Aprendidas Se asume que h 1 es probado en un test set S 1 de tamaño n 1 y h 2 en un test set S 2 de tamaño n 2. Se calcula la diferencia entre la precisión de h 1 y h 2 : d= error S1 (h 1 ) error S2 (h 2 ) Se calcula la desviación estándar de la estimación muestreada de la diferencia: = σ error S 1 (h 1 ) (1 error S1 ( h 1 )) d + error S 2 ( h 2 ) (1 error S2 ( h 2 )) n 1 n 2 Se calcula el z-score de la diferencia (viene de (3)): z= d σ d
20 Test Z-Score para Comparar Hipótesis Aprendidas (cont) Se determina la confianza de la diferencia al buscar la confianza mas alta C, para el z-score calculado usando una tabla. confidence level 50% 68% 80% 90% 95% 98% 99% z-score Esto da la confianza para un test de dos lados (twotailed test), para un test de un lado incremente la confianza una mitad hacia 100%. C ' =(100 (100 C ) 2 )
21 Ejemplo 1 Z-Score Test Asumir que probamos dos hipótesis en sets de prueba de tamaño 100 y se observa: error S1 (h 1 )=0.20 error S2 ( h 2 )=0.30 d= error S1 (h 1 ) error S2 (h 2 ) = =0.1 σ d = error S 1 ( h 1 ) (1 error S1 (h 1 )) n 1 + error S 2 (h 2 ) (1 error S2 (h 2 )) n 2 = 0.2 (1 0. 2) 100 z= d = 0.1 = σ d (1 0. 3) + = Confianza para z-test de dos colas: 90% Confianza para z-test de una cola: (100 (100 90)/2) = 95%
22 Ejemplo 2 Z-Score Test Asumir que probamos dos hipótesis en sets de prueba de tamaño 100 y se observa: error S1 (h 1 )=0.20 error S2 ( h 2 )=0.25 d= error S1 (h 1 ) error S2 (h 2 ) = =0.05 σ d = error S 1 ( h 1 ) (1 error S1 (h 1 )) n 1 + error S 2 (h 2 ) (1 error S2 (h 2 )) n 2 = 0.2 (1 0. 2) (1 0.25) = z= d = =0.848 σ d Confianza para test de dos colas: 50% Confianza para test de una cola: (100 (100 50)/2) = 75%
23 Suposiciones del Test Z-Score Hipótesis pueden ser probadas en distintos sets de prueba. Si se usa el mismo set de prueba se podrían justificar conclusiones mas fuertes. Sets de prueba deben tener por lo menos 30 ejemplos elegidos independientes. Hipótesis son construidas desde sets de entrenamiento independientes. Solo compara dos hipótesis especificas independiente de los métodos usados para construirlos. No compara los métodos de aprendizaje subyacentes en general.
24 Evaluando las Hipótesis Inductivas Contenidos Estimando la Precisión Comparando Hipótesis Comparando Algoritmos de Clasificación
25 Comparando Algoritmos de Aprendizaje Comparando la precisión promedio de hipótesis producidas por dos métodos distintos de aprendizaje es mas difícil dado que se debe promediar sobre múltiples casos de entrenamiento. Idealmente queremos medir: E S D (error D ( L A ( S )) error D ( L B ( S))) en el cual L X (S) representa la hipótesis aprendida por el método L X usando los datos S. Para estimar precisamente esto necesitamos promediar sobre múltiples sets independientes de entrenamiento y prueba. Dado que los datos etiquetados son limitados, generalmente se debe promediar usando múltiples divisiones de los datos de entrenamiento y prueba.
26 Validación Cruzada K-Fold Aleatoriamente dividir datos D en k dsets disjuntos de igual tamaño P 1 P k For i from 1 to k do: Usar P i de test set y el resto como sets de entrenamiento S i = (D P i ) h A = L A (S i ) h B = L B (S i ) δ i = error Pi (h A ) error Pi (h B ) Retornar el error promedio de la diferencia: k δ= 1 k i= 1 δ i
27 Validación Cruzada K-Fold (cont) Cada set se usa como set de prueba una vez y como set de entrenamiento k 1 veces. Todo los sets de prueba son independientes pero los sets de entrenamiento se sobrelapan. Mediciones de precisión de hipótesis se generan para [(k 1)/k] D datos de entrenamiento. Método standard es 10-fold. Si k es bajo, no hay suficiente numero de sets de entrenamiento/test; si k es alto, el test set es pequeño, la varianza en el test es alto y el tiempo de ejecución se incrementa. Si k = D, método de validacion cruzada se llama deja-unoafuera (leave-one-out).
28 Test de Relevancia (significance tests) Típicamente si k<30, no son suficientes muestras para un z test. Se puede usar un t-test apareado (paired), que puede determinar diferencias mas pequeñas dado que los sets de entrenamiento/prueba son los mismos para ambas hipótesis siendo comparadas. Puede usarse un (Student s) t-test, que es mas preciso cuando el numero de muestras es bajo. Los tests z y t asumen que las muestras son independientes.no es asi para validación cruzada k-fold: Conjuntos de prueba son independientes Conjuntos de entrenamiento no son independientes Otros tests estadísticos han sido propuestos (e.g. McNemar s test) A pesar de que ningún test es perfecto, cuando los datos son limitados y no hay muestras independientes, algunos tests que consideran varianzas son deseables.
29 Ejemplo de Resultados Experimentales Cual experimento provee mejor evidencia que el sistema A es mejor que B? Experimento 1 Experimento 2 Syst. A Syst. B Diff Syst. A Syst. B Diff Trial 1 87% 82% +5% Trial 1 90% 82% +8% Trail 2 83% 78% +5% Trail 2 93% 76% +17% Trial 3 88% 83% +5% Trial 3 80% 85% 5% Trial 4 82% 77% +5% Trial 4 85% 75% +10% Trial 5 85% 80% +5% Trial 5 77% 82% 5% Average 85% 80% +5% Average 85% 80% +5%
30 Curvas de Aprendizaje Grafico precisión vs tamaño de set de entrenamiento. La máxima precisión (Bayes Optimal) se ha logrado o podría mejorar con mas ejemplos? La mayoría de métodos (i.e. learners) eventualmente convergen al optimo de Bayes dado suficientes ejemplos de entrenamiento. 100% Test Accuracy Bayes optimal Random guessing # Training examples
31 Validación Cruzada de Aprendizaje Divide data in k partitions of equal size For trial i = 1 to k do: Use partition i for testing and the union of the other partitions for training. For each desired point p on the learning curve do: For each learning system L Train L on the first p examples of the training set and record training time, training accuracy, and learned concept complexity. Test L on the test set, recording testing time and test accuracy. Compute average for each performance statistic across k trials. Plot curves for any desired performance statistic versus training set size. Use a paired t-test to determine significance of any differences between any two systems for a given training set size.
32 Curvas de Ruido Graficar precisión versus el nivel de ruido para determinar la resistencia relativa a datos de entrenamiento ruidosos. Artificialmente se agrega ruido en las categorías o características al remplazar alguna fracción de estos con valores aleatorios. 100% Test Accuracy % noise added
33 Conclusiones de Evaluación Experimental Una buena metodología experimental es clave para poder evaluar métodos experimentales de aprendizaje. Es importante probar en una variedad de problemas para demostrar una utilidad para una variedad de problemas. Probar en 20 o + sets de datos es común. Variedad de fuentes de datos disponibles: UCI Machine Learning Repository KDD Cup (large data sets for data mining) CoNLL Shared Task (natural language problems) Datos de problemas reales son preferidos a datos artificiales.
34 Evaluando las Hipótesis Referencias: [1] Mitchel, T., Machine Learning, McGraw Hill, 1997 [2] Mooney, R., Machine Learning Slides, University of Texas
ESTIMACIÓN. puntual y por intervalo
ESTIMACIÓN puntual y por intervalo ( ) Podemos conocer el comportamiento del ser humano? Podemos usar la información contenida en la muestra para tratar de adivinar algún aspecto de la población bajo estudio
Más detallesEduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS
ANÁLISIS DE DATOS Hoy día vamos a hablar de algunas medidas de resumen de datos: cómo resumir cuando tenemos una serie de datos numéricos, generalmente en variables intervalares. Cuando nosotros tenemos
Más detallesEstimación. Intervalos de Confianza para la Media y para las Proporciones
Estimación. Intervalos de Confianza para la Media y para las Proporciones Algunas secciones han sido tomadas de: Apuntes de Estadística Inferencial Instituto Tecnológico de Chiuhuahua Estimación El objetivo
Más detallesCapítulo 7: Distribuciones muestrales
Capítulo 7: Distribuciones muestrales Recordemos: Parámetro es una medida de resumen numérica que se calcularía usando todas las unidades de la población. Es un número fijo. Generalmente no lo conocemos.
Más detallesPRÁCTICA 4. Ingeniería Técnica Industrial (2º) - Mecánica.
PRÁCTICA 4. Ingeniería Técnica Industrial (2º) - Mecánica. Profesores: Javier Faulín y Francisco Ballestín 1. Introducción. El objetivo de esta parte es obtener resultados sobre contrastes de hipótesis
Más detallesHipótesis Alternativa: Afirmación sobre las posibles alternativas que se tienen a la afirmación hecha en la hipótesis nula.
PRUEBA DE HIPÓTESIS Introducción (10 min) En el mundo de las finanzas, la administración y la economía tan importante como saber hacer y entender a cabalidad las estimaciones que nos ayudaran a la toma
Más detallesTests de hipótesis estadísticas
Tests de hipótesis estadísticas Test de hipótesis sobre la media de una población. Introducción con un ejemplo. Los tests de hipótesis estadísticas se emplean para muchos problemas, en particular para
Más detallesSolución ESTADÍSTICA. Prueba de evaluación contínua 2 - PEC2
Semestre set04 - feb05 Módulos 11-17 Prueba de evaluación contínua 2 - PEC2 Solución Presentación i objetivos Enunciados: descripción teórica de la práctica a realizar Materiales Criterios de evaluación
Más detallesPruebas de. Hipótesis
Pruebas de ipótesis Pruebas de ipótesis Otra manera de hacer inferencia es haciendo una afirmación acerca del valor que el parámetro de la población bajo estudio puede tomar. Esta afirmación puede estar
Más detallesT.1 CONVERGENCIA Y TEOREMAS LÍMITE
T.1 CONVERGENCIA Y TEOREMAS LÍMITE 1. CONVERGENCIA DE SUCESIONES DE VARIABLES ALEATORIA CONVERGENCIA CASI-SEGURA CONVERGENCIA EN PROBABILIDAD CONVERGENCIA EN MEDIA CUADRÁTICA CONVERGENCIA EN LEY ( O DISTRIBUCIÓN)
Más detallesCiudad de Guatemala, 2013
Ciudad de Guatemala, 2013 1 Clase 5 Muestreo y tamaño de muestra D i e g o A y c i n e n a diegoaa@ufm.edu Universidad Francisco Marroquín 2 Clases (Profesores) H o r a r i o Actividades en Grupo (Todos)
Más detallesCurso Práctico de Bioestadística Con Herramientas De Excel
Curso Práctico de Bioestadística Con Herramientas De Excel Fabrizio Marcillo Morla MBA barcillo@gmail.com (593-9) 4194239 Fabrizio Marcillo Morla Guayaquil, 1966. BSc. Acuicultura. (ESPOL 1991). Magister
Más detallesCurso: Métodos de Monte Carlo Unidad 2, Sesión 6: Integración por Monte Carlo
Curso: Métodos de Monte Carlo Unidad 2, Sesión 6: Integración por Monte Carlo Departamento de Investigación Operativa Instituto de Computación, Facultad de Ingeniería Universidad de la República, Montevideo,
Más detallesInferencia Estadística
Felipe José Bravo Márquez 11 de noviembre de 2013 Para realizar conclusiones sobre una población, generalmente no es factible reunir todos los datos de ésta. Debemos realizar conclusiones razonables respecto
Más detalles7.- PRUEBA DE HIPOTESIS
7.- PRUEBA DE HIPOTEI 7.1. INTRODUCCIÓN La estadística inferencial es el proceso de usar la información de una muestra para describir el estado de una población. in embargo es frecuente que usemos la información
Más detallesTema 2: Estimación puntual
Tema 2: Estimación puntual 1 (basado en el material de A. Jach (http://www.est.uc3m.es/ajach/) y A. Alonso (http://www.est.uc3m.es/amalonso/)) Planteamiento del problema: estimador y estimación Insesgadez
Más detallesBiometría Clase 8 Pruebas de hipótesis para una muestra. Adriana Pérez 1
Biometría Clase 8 Pruebas de hipótesis para una muestra Adriana Pérez 1 Qué es una prueba de hipótesis? Es un proceso para determinar la validez de una aseveración hecha sobre la población basándose en
Más detallesTema 12: Contrastes Paramétricos
Tema 1 Tema 1: Contrastes Paramétricos Presentación y Objetivos. Se comienza este tema introduciendo la terminología y conceptos característicos de los contrastes de hipótesis, típicamente a través de
Más detallesANÁLISIS DE DATOS NO NUMERICOS
ANÁLISIS DE DATOS NO NUMERICOS ESCALAS DE MEDIDA CATEGORICAS Jorge Galbiati Riesco Los datos categóricos son datos que provienen de resultados de experimentos en que sus resultados se miden en escalas
Más detallesTest ( o Prueba ) de Hipótesis
Test de Hipótesis 1 Test ( o Prueba ) de Hipótesis Ejemplo: Una muestra de 36 datos tiene una media igual a 4.64 Qué puede deducirse acerca de la población de donde fue tomada? Se necesita contestar a
Más detallesPRUEBAS DE HIPÓTESIS
PRUEBAS DE HIPÓTESIS Muchos problemas de ingeniería, ciencia, y administración, requieren que se tome una decisión entre aceptar o rechazar una proposición sobre algún parámetro. Esta proposición recibe
Más detallesESTIMACION DE INTERVALOS DE CONFIANZA
pag 3. Prohibida su reproducción ESTIMACION DE INTERVALOS DE CONFIANZA Una muestra permite realizar estimaciones puntuales de los parámetros de la población. Utilizando las propiedades de las distribuciones
Más detalles1 Introducción a contrastes de hipótesis
Inferencia Estadística II Teoría, handout 1 1 Introducción a contrastes de hipótesis En este curso vamos a aprender a usar los datos para cuestionar la validez de ciertas afirmaciones teóricas. Los fenómenos
Más detallesINFERENCIA ESTADISTICA: CONTRASTE DE HIPÓTESIS
UNIVERSIDAD CENTROCCIDENTAL LISANDRO ALVARADO DECANATO DE MEDICINA DEPARTAMENTO DE MEDICINA PREVENTIVA Y SOCIAL SECCIÓN DE EPIDEMIOLOGÍA-BIOESTADÍSTICA INFERENCIA ESTADISTICA: CONTRASTE DE HIPÓTESIS Objetivo:
Más detallesERRORES CONCEPTUALES DE ESTADÍSTICA EN ESTUDIANTES
ERRORES CONCEPTUALES DE ESTADÍSTICA EN ESTUDIANTES DE BÁSICA PRIMARIA EN LA CIUDAD DE PEREIRA José R. Bedoya Universidad Tecnológica de Pereira Pereira, Colombia La formación estadística en la ciudadanía,
Más detallesEJERCICIOS RESUMEN. Aplicación: INFERENCIA ESTADÍSTICA. Nota técnica preparada por: Mayte Zaragoza Benítez Fecha: 13 de mayo de 2013
Aplicación: INFERENCIA ESTADÍSTICA EJERCICIOS RESUMEN Nota técnica preparada por: Mayte Zaragoza Benítez Fecha: 13 de mayo de 2013 Página1 DESCRIP Ejercicio 1 Los siguientes son los números de cambios
Más detallesSESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas
SESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA PROF. Esther González Sánchez Departamento de Informática y Sistemas Facultad de Informática Universidad de Las Palmas de Gran Canaria
Más detallesUNIVERSIDAD DE ATACAMA
UNIVERSIDAD DE ATACAMA FACULTAD DE INGENIERÍA / DEPARTAMENTO DE MATEMÁTICA ESTADÍSTICA Y PROBABILIDAD GUÍA DE TRABAJO 2 Profesor: Hugo S. Salinas. Primer Semestre 2010 1. La dureza Rockwell de un metal
Más detallesUNIVERSIDADES DE ANDALUCÍA PRUEBA DE ACCESO A LA UNIVERSIDAD OPCIÓN A
OPCIÓN A (3 puntos) Una imprenta local edita periódicos y revistas. Para cada periódico necesita un cartucho de tinta negra y otro de color, y para cada revista uno de tinta negra y dos de color. Si sólo
Más detallesLA MEDIDA Y SUS ERRORES
LA MEDIDA Y SUS ERRORES Magnitud, unidad y medida. Magnitud es todo aquello que se puede medir y que se puede representar por un número. Para obtener el número que representa a la magnitud debemos escoger
Más detallesRelación de problemas: Variables aleatorias
Estadística y modelización. Ingeniero Técnico en Diseño Industrial. Relación de problemas: Variables aleatorias 1. Se lanza tres veces una moneda y se observa el número de caras. (a) Calcula la distribución
Más detallesUniversidad del CEMA Prof. José P Dapena Métodos Cuantitativos V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA. 5.1 Introducción
V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA 5.1 Introducción En este capítulo nos ocuparemos de la estimación de caracteristicas de la población a partir de datos. Las caracteristicas poblacionales
Más detallesLección 24: Lenguaje algebraico y sustituciones
LECCIÓN Lección : Lenguaje algebraico y sustituciones En lecciones anteriores usted ya trabajó con ecuaciones. Las ecuaciones expresan una igualdad entre ciertas relaciones numéricas en las que se desconoce
Más detalles"CONTRASTES DE HIPÓTESIS" 4.4 Parte básica
76 "CONTRASTES DE HIPÓTESIS" 4.4 Parte básica 77 4.4.1 Introducción a los contrastes de hipótesis La Inferencia Estadística consta de dos partes: Estimación y Contrastes de Hipótesis. La primera se ha
Más detallesCadenas de Markov y Perron-Frobenius
Cadenas de Markov y Perron-Frobenius Pablo Lessa 10 de octubre de 2014 1. Cadenas de Markov En 1996 Larry Page y Sergey Brin, en ese momento en Stanford, inventaron una manera de asignar un ranking de
Más detallesTest de hipótesis. Si H0 es cierta el estadístico. sigue una distribución t de Student con n grados de libertad: s n
Un diseño experimental que se utiliza muy a menudo es el de un grupo control y uno de tratamiento. En el caso de que los datos sean cuantitativos y sigan una distribución normal, la hipótesis de interés
Más detallesINFERENCIA ESTADÍSTICA: CONTRASTE DE HIPÓTESIS
INFERENCIA ESTADÍSTICA: CONTRASTE DE HIPÓTESIS Página 311 REFLEXIONA Y RESUELVE Máuina empauetadora El fabricante de una máuina empauetadora afirma ue, si se regula para ue empauete palés con 100 kg, los
Más detallesTema 1. Inferencia estadística para una población
Tema 1. Inferencia estadística para una población Contenidos Inferencia estadística Estimadores puntuales Estimación de la media y la varianza de una población Estimación de la media de la población mediante
Más detallesTema 5. Variables aleatorias discretas
Tema 5. Variables aleatorias discretas Resumen del tema 5.1. Definición de variable aleatoria discreta 5.1.1. Variables aleatorias Una variable aleatoria es una función que asigna un número a cada suceso
Más detallesUNIVERSIDAD DE ATACAMA
UNIVERSIDAD DE ATACAMA FACULTAD DE INGENIERÍA / DEPARTAMENTO DE MATEMÁTICA ESTADÍSTICA Y PROBABILIDADES PAUTA DE CORRECCIÓN: PRUEBA PARCIAL N o 2 Profesor: Hugo S. Salinas. Primer Semestre 20. El gerente
Más detallesTema 1: Test de Distribuciones de Probabilidad
Tema 1: Test de Distribuciones de Probabilidad 1.- Una compañía de seguros tiene 1000 asegurados en el ramo de accidentes. Si la el modelo mejor para el número de siniestros en un año es: a) Normal (5;,3).
Más detallesAnálisis estadístico. Tema 1 de Biología NS Diploma BI Curso 2013-2015
Análisis estadístico Tema 1 de Biología NS Diploma BI Curso 2013-2015 Antes de comenzar Sobre qué crees que trata esta unidad? - Escríbelo es un post-it amarillo. Pregunta guía Cómo podemos saber si dos
Más detallesTEMA 5. MUESTREO PARA LA ACEPTACIÓN.
TEMA 5. MUESTREO PARA LA ACEPTACIÓN. Introducción. Planes de muestreo por atributos simple, doble, múltiple y rectificativos Dodge-Romig, Norma militar 1000STD-105D. Pautas a seguir para el cambio de rigor
Más detallesMATEMÁTICAS CON LA HOJA DE CÁLCULO
MATEMÁTICAS CON LA HOJA DE CÁLCULO Podemos dar a esta aplicación un uso práctico en el aula de Matemáticas en varios sentidos: Como potente calculadora: sucesiones, límites, tablas estadísticas, parámetros
Más detallesGrado en Ingeniería. Estadística. Tema 3
Grado en Ingeniería Asignatura: Estadística Tema 3. Control Estadístico de Procesos (SPC) Control Estadístico de Procesos (SPC) Introducción Variabilidad de un proceso de fabricación Causas asignables
Más detallesCAPITULO 4 JUSTIFICACION DEL ESTUDIO. En este capítulo se presenta la justificación del estudio, supuestos y limitaciones de
CAPITULO 4 JUSTIFICACION DEL ESTUDIO En este capítulo se presenta la justificación del estudio, supuestos y limitaciones de estudios previos y los alcances que justifican el presente estudio. 4.1. Justificación.
Más detallesSelectividad Septiembre 2009 SEPTIEMBRE 2009. Opción A
SEPTIEMBRE 2009 Opción A 1.- Como cada año, el inicio del curso académico, una tienda de material escolar prepara una oferta de 600 cuadernos, 500 carpetas y 400 bolígrafos para los alumnos de un IES,
Más detallesSistemas de Generación de Energía Eléctrica HIDROLOGÍA BÁSICA. Universidad Tecnológica De Pereira
2010 Sistemas de Generación de Energía Eléctrica HIDROLOGÍA BÁSICA Universidad Tecnológica De Pereira Conceptos Básicos de Hidrología La hidrología es una ciencia clave en el estudio de los sistemas de
Más detallesSelectividad Septiembre 2013 OPCIÓN B
Pruebas de Acceso a las Universidades de Castilla y León ATEÁTICAS APLICADAS A LAS CIENCIAS SOCIALES EJERCICIO Nº páginas Tablas OPTATIVIDAD: EL ALUNO DEBERÁ ESCOGER UNA DE LAS DOS OPCIONES Y DESARROLLAR
Más detallesAnálisis y cuantificación del Riesgo
Análisis y cuantificación del Riesgo 1 Qué es el análisis del Riesgo? 2. Métodos M de Análisis de riesgos 3. Método M de Montecarlo 4. Modelo de Análisis de Riesgos 5. Qué pasos de deben seguir para el
Más detallesPROBLEMAS ADICIONALES RESUELTOS SOBRE VARIABLES ALETORIAS
PROBLEMAS ADICIONALES RESUELTOS SOBRE VARIABLES ALETORIAS Grupos P y P (Prof. Ledesma) Problemas. Variables aleatorias..- Sea la v.a. X que toma los valores - y con probabilidades, y, respectivamente y
Más detallesDiagnosis y Crítica del modelo -Ajuste de distribuciones con Statgraphics-
Diagnosis y Crítica del modelo -Ajuste de distribuciones con Statgraphics- 1. Introducción Ficheros de datos: TiempoaccesoWeb.sf3 ; AlumnosIndustriales.sf3 El objetivo de esta práctica es asignar un modelo
Más detalles35 Facultad de Ciencias Universidad de Los Andes Mérida-Venezuela. Potencial Eléctrico
q 1 q 2 Prof. Félix Aguirre 35 Energía Electrostática Potencial Eléctrico La interacción electrostática es representada muy bien a través de la ley de Coulomb, esto es: mediante fuerzas. Existen, sin embargo,
Más detallesESTADÍSTICA SEMANA 4
ESTADÍSTICA SEMANA 4 ÍNDICE MEDIDAS DE DISPERSIÓN... 3 APRENDIZAJES ESPERADOS... 3 DEfinición de Medida de dispersión... 3 Rango o Recorrido... 3 Varianza Muestral (S 2 )... 3 CÁLCULO DE LA VARIANZA...
Más detallesII. ANÁLISIS DE SISTEMAS DE MEDICIÓN
II. ANÁLISIS DE SISTEMAS DE MEDICIÓN INTRODUCCIÓN Siempre que registramos o medimos los resultados de un proceso nos encontramos con cierta variación en los datos obtenidos. Esta variación puede provenir
Más detallesCURSO INSTALACION E IMPLEMENTACION ALOJA SOFTWARE HOTEL MODULO 02: Datos Adicionales de configuración [1]
MODULO 02: Datos Adicionales de configuración [1] Monedas circulantes El software permite recibir múltiples clases de monedas en sus cobros. Para esto debemos definir las monedas circulantes que podemos
Más detallesInferencia Estadística
EYP14 Estadística para Construcción Civil 1 Inferencia Estadística El campo de la inferencia estadística está formado por los métodos utilizados para tomar decisiones o para obtener conclusiones sobre
Más detallesLic. Arnaldo Martínez Mercado
(VALIDEZ Y CONFIABILIDAD) Lic. VALIDEZ Lo primero que tenemos que preguntarnos es a qué se refiere la validez? De qué disciplina proviene el concepto de validez? VALIDEZ La validez, es un concepto propio
Más detallesPRUEBAS NO PARAMÉTRICAS
PRUEBAS NO PARAMÉTRICAS 1. PRUEBAS DE NORMALIDAD Para evaluar la normalidad de un conjunto de datos tenemos el Test de Kolmogorov- Smirnov y el test de Shapiro-Wilks La opción NNPLOT del SPSS permite la
Más detallesExplicación de la tarea 3 Felipe Guerra
Explicación de la tarea 3 Felipe Guerra 1. Una ruleta legal tiene los números del 1 al 15. Este problema corresponde a una variable aleatoria discreta. La lectura de la semana menciona lo siguiente: La
Más detallesIndicaciones específicas para los análisis estadísticos.
Tutorial básico de PSPP: Vídeo 1: Describe la interfaz del programa, explicando en qué consiste la vista de datos y la vista de variables. Vídeo 2: Muestra cómo crear una base de datos, comenzando por
Más detallesProbabilidades y Estadística (Computación) Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires Ana M. Bianco y Elena J.
Generación de Números Aleatorios Números elegidos al azar son útiles en diversas aplicaciones, entre las cuáles podemos mencionar: Simulación o métodos de Monte Carlo: se simula un proceso natural en forma
Más detallesModificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere.
UNIVERSIDAD DE CARABOBO FACULTAD DE CIENCIA Y TECNOLOGÍA DIRECCION DE EXTENSION COORDINACION DE PASANTIAS Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere. Pasante:
Más detallesPROBLEMAS RESUELTOS DE OPTIMIZACIÓN
Problemas de optimiación Ejercicio PROBLEMAS RESUELTOS DE OPTIMIZACIÓN Un banco lana al mercado un plan de inversión cua rentabilidad R(, en euros, viene dada en función de la cantidad invertida, en euros,
Más detallesDistribuciones discretas. Distribución Binomial
Boletín: Distribuciones de Probabilidad IES de MOS Métodos estadísticos y numéricos Distribuciones discretas. Distribución Binomial 1. Una urna contiene 3 bolas blancas, 1 bola negra y 2 bolas azules.
Más detallesVariables aleatorias continuas
Variables aleatorias continuas Hemos definido que una variable aleatoria X es discreta si I X es un conjunto finito o infinito numerable. En la práctica las variables aleatorias discretas sirven como modelos
Más detallesUna vez conocido el manejo básico, antes de venir al Laboratorio a manejarlo, puedes practicar con un osciloscopio virtual en el enlace
PRACTICA 3. EL OSCILOSCOPIO ANALOGICO 1. INTRODUCCION. El Osciloscopio es un voltímetro que nos permite representar en su pantalla valores de tensión durante un intervalo de tiempo. Es decir, nos permite
Más detallesMATEMÁTICAS CCSS JUNIO 2010 (COMÚN MODELO5) SELECTIVIDAD ANDALUCÍA
IES Fco Ayala de Granada Junio de 010 (General Modelo 5) Soluciones Germán-Jesús Rubio Luna MATEMÁTICAS CCSS JUNIO 010 (COMÚN MODELO5) SELECTIVIDAD ANDALUCÍA OPCIÓN A EJERCICIO 1 Sea el recinto definido
Más detallesANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS
ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS 1) INTRODUCCIÓN El análisis de varianza es una técnica que se puede utilizar para decidir si las medias de dos o más poblaciones son iguales. La prueba se
Más detallesLección 22: Probabilidad (definición clásica)
LECCIÓN 22 Lección 22: Probabilidad (definición clásica) Empezaremos esta lección haciendo un breve resumen de la lección 2 del libro de primer grado. Los fenómenos determinísticos son aquellos en los
Más detalles1.1. Introducción y conceptos básicos
Tema 1 Variables estadísticas Contenido 1.1. Introducción y conceptos básicos.................. 1 1.2. Tipos de variables estadísticas................... 2 1.3. Distribuciones de frecuencias....................
Más detallesComparación de medias
12 Comparación de medias Irene Moral Peláez 12.1. Introducción Cuando se desea comprobar si los valores de una característica que es posible cuantificar (como podría ser la edad o la cifra de tensión arterial,
Más detallesPrograma para el Mejoramiento de la Enseñanza de la Matemática en ANEP Proyecto: Análisis, Reflexión y Producción. Fracciones
Fracciones. Las fracciones y los números Racionales Las fracciones se utilizan cotidianamente en contextos relacionados con la medida, el reparto o como forma de relacionar dos cantidades. Tenemos entonces
Más detallesLABORATORIO Nº 2 GUÍA PARA REALIZAR FORMULAS EN EXCEL
OBJETIVO Mejorar el nivel de comprensión y el manejo de las destrezas del estudiante para utilizar formulas en Microsoft Excel 2010. 1) DEFINICIÓN Una fórmula de Excel es un código especial que introducimos
Más detallesPráctica 5. Contrastes paramétricos en una población
Práctica 5. Contrastes paramétricos en una población 1. Contrastes sobre la media El contraste de hipótesis sobre una media sirve para tomar decisiones acerca del verdadero valor poblacional de la media
Más detalles290 SOBRE LAS FORMAS DE SEGUNDO GRADO.
290 SOBRE LAS FORMAS DE SEGUNDO GRADO. Sobre el númerodeclasesambiguas. 257. Entre todas las clases en un orden dado con determinante dado, las clases ambiguas especialmente demandan un tratamiento mayor,
Más detallesMÓDULO 2 CURVAS INTENSIDAD DURACIÓN FRECUENCIA
MÓDULO 2 CURVAS INTENSIDAD DURACIÓN FRECUENCIA Autores: Dr. Ing. Roberto Pizarro T. Ing. Juan Pablo Flores V. Ing. Claudia Sangüesa P. Ing. Enzo Martínez A. 1. INTRODUCCIÓN El estudiar las precipitaciones
Más detalles3º Grado Educación Infantil Bilingüe Números. Método Singapur y F. Bravo E R
MATEMÁTICAS PARA EDUCACIÓN INFANTIL N Enseñamos y aprendemos llos números:: Método Siingapur y Fernández Bravo,, Porr Clarra Garrcí ía,, Marrtta Gonzzál lezz y Crri isstti ina Lattorrrre.. Ú M E R O S
Más detallesAutómatas Finitos. Leopoldo Altamirano, Eduardo Morales. Verano, 2011 INAOE. Introducción a. Autómatas. Definición formal de un. Finito Determinístico
los s s s s Leopoldo Altamirano, Eduardo Morales INAOE Verano, 2011 (INAOE) Verano, 2011 1 / 60 Contenido los s s 1 los s 2 3 4 s 5 (INAOE) Verano, 2011 2 / 60 los s los s los s s : Conjunto de estados
Más detallesMedidas de tendencia central o de posición: situación de los valores alrededor
Tema 10: Medidas de posición y dispersión Una vez agrupados los datos en distribuciones de frecuencias, se calculan unos valores que sintetizan la información. Estudiaremos dos grandes secciones: Medidas
Más detallesUnidad: Representación gráfica del movimiento
Unidad: Representación gráfica del movimiento Aplicando y repasando el concepto de rapidez Esta primera actividad repasa el concepto de rapidez definido anteriormente. Posición Esta actividad introduce
Más detallesUniversidad Diego Portales Facultad de Economía y Empresa
Suponga que, conversando con su cuate, surge la idea de hacer una apuesta simple. Cada uno escoge decir cara ó sello. Se lanza una moneda al aire, y si sale cara, quien dijo sello le paga a quien dijo
Más detallesDeterminación de primas de acuerdo al Apetito de riesgo de la Compañía por medio de simulaciones
Determinación de primas de acuerdo al Apetito de riesgo de la Compañía por medio de simulaciones Introducción Las Compañías aseguradoras determinan sus precios basadas en modelos y en información histórica
Más detallesMétodos estadísticos y numéricos Contraste de hipótesis pag. 1 PROBLEMAS RESUELTOS DE CONTRASTE DE HIPÓTESIS
Métodos estadísticos y numéricos Contraste de hipótesis pag. 1 PROBLEMA REUELTO DE CONTRATE DE HIPÓTEI 1 Un investigador quiere contrastar si el peso medio de ciertas hortalizas está en los 1,9 Kg. que
Más detallesProcesos Críticos en el Desarrollo de Software
Metodología Procesos Críticos en el Desarrollo de Software Pablo Straub AgileShift Imagine una organización de desarrollo de software que consistentemente cumple los compromisos con sus clientes. Imagine
Más detallesGRAFICOS DE CONTROL DATOS TIPO VARIABLES
GRAFICOS DE CONTROL DATOS TIPO VARIABLES PROCESO Maquinaria Métodos Materias Primas Proceso Producto Mano de Obra Condiciones Ambientales VARIACIÓN Fundamentalmente, las cinco fuentes más importantes de
Más detallesPRÁCTICA N 2 SISTEMAS DE NUMERACIÓN
PRÁCTICA N 2 SISTEMAS DE NUMERACIÓN Ejercicio 1. Diseñar una planilla EXCEL que tome como dato de entrada un número entero y devuelva la representación en base 2. Testearla con los números 23, 245, 673,
Más detalles5. Experimentos y Resultados
Experimentos y Resultados 52 5. Experimentos y Resultados Después de haber entrenado los modelos acústicos y los modelos del lenguaje para el reconocimiento de voz de niños, estas fuentes de conocimiento
Más detallesCurso Comparabilidad de resultados
Curso Comparabilidad de resultados Director: Gabriel A. Migliarino. Docente: Evangelina Hernández. Agenda Introducción. n. Protocolos iniciales de comparación de métodos. m * EP9-A2. CLSI. * Comparación
Más detallesGeneración de Números Pseudo-Aleatorios
Números Aleatorios Son un ingrediente básico en la simulación de sistemas Los paquetes de simulación generan números aleatorios para simular eventos de tiempo u otras variables aleatorias Una secuencia
Más detallesColegio Alexander von Humboldt - Lima. Tema: La enseñanza de la matemática está en un proceso de cambio
Refo 07 2004 15 al 19 de noviembre 2004 Colegio Alexander von Humboldt - Lima Tema: La enseñanza de la matemática está en un proceso de cambio La enseñanza de la matemática debe tener dos objetivos principales:
Más detallesClase 9 -Carga anual equivalente (CAE) TIR Comparación entre alternativas
Clase 9 -Carga anual equivalente (CAE) TIR Comparación entre alternativas Carolina Rojas G. Universidad Diego Portales Facultad de Ingeniería Industrial Caraga anual equivalente (CAE) Comparación de alternativas
Más detallesAnálisis de Resultados
Análisis de Resultados Encuesta Web OnLine Buses: www.encuesta-webonlinebuses.tk Grupo10 1 Datos Generales Técnica: Encuesta Web Medio: Google Forms Unidad de muestreo: Usuarios y potenciales usuarios
Más detallesNÚMEROS NATURALES Y NÚMEROS ENTEROS
NÚMEROS NATURALES Y NÚMEROS ENTEROS Los números naturales surgen como respuesta a la necesidad de nuestros antepasados de contar los elementos de un conjunto (por ejemplo los animales de un rebaño) y de
Más detallesaplicado al Experiencia La gestión de un servicio y, por ende, la
EN PORTADA 6 Sigma aplicado al Experiencia En este artículo vamos a dar una visión más particular sobre la aplicabilidad de 6 Sigma al sector Servicios. Existe abundante literatura al respecto, pero sobre
Más detallesTema 6: Ecuaciones e inecuaciones.
Tema 6: Ecuaciones e inecuaciones. Ejercicio 1. Encontrar, tanteando, alguna solución de cada una de las siguientes ecuaciones: 3 a) + 5 = 69 Probamos para =,3,4,... = = 3 3 = 4 4 3 3 3 + 5 = 13. + 5 =
Más detallesPRUEBAS DE ACCESO A LA UNIVERSIDAD PARA ALUMNOS DE BACHILLERATO LOGSE Septiembre 2008
UNIVERSIDAD DE MURCIA REGIÓN DE MURCIA CONSEJERÍA DE EDUCACIÓN, CIENCIA E INVESTIGACIÓN UNIVERSIDAD POLITÉCNICA DE CARTAGENA PRUEBAS DE ACCESO A LA UNIVERSIDAD PARA ALUMNOS DE BACHILLERATO LOGSE Septiembre
Más detallesNaive Bayes Multinomial para Clasificación de Texto Usando un Esquema de Pesado por Clases
Naive Bayes Multinomial para Clasificación de Texto Usando un Esquema de Pesado por Clases Emmanuel Anguiano-Hernández Abril 29, 2009 Abstract Tratando de mejorar el desempeño de un clasificador Naive
Más detalles1. Introducción a la estadística 2. Estadística descriptiva: resumen numérico y gráfico de datos 3. Estadística inferencial: estimación de parámetros
TEMA 0: INTRODUCCIÓN Y REPASO 1. Introducción a la estadística 2. Estadística descriptiva: resumen numérico y gráfico de datos 3. Estadística inferencial: estimación de parámetros desconocidos 4. Comparación
Más detalles