Clasificación Automática del Sentido de los Mensajes en Twitter: Comparando Entrenamiento específico y contextual.

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Clasificación Automática del Sentido de los Mensajes en Twitter: Comparando Entrenamiento específico y contextual."

Transcripción

1 1 Clasificación Automática del Sentido de los Mensajes en Twitter: Comparando Entrenamiento específico y contextual. Felipe Oliva Escuela de Ingeniería Informática de la Pontificia Universidad Católica de Valparaíso Valparaíso, Chile felipe.oliva.v@hotmail.com Resumen Las redes sociales en la actualidad juegan un papel importante en la vida de las personas y de la sociedad, Twitter es una red social que permite enviar y compartir mensajes cortos de un máximo de 14 caracteres. Este artículo estudia el comportamiento de las representaciones y clasificadores en distintos escenarios para marcas de empresas de retail. Se proponen diferentes formas de representar los textos y algoritmos clasificadores para observar el desempeño de la clasificación automática según el sentido de los mensajes de Twitter. Se concluye que el entrenamiento con mensajes del contexto permite clasificar menos mensajes de temas específicos. Rodrigo Alfaro Escuela de Ingeniería Informática de la Pontificia Universidad Católica de Valparaíso Valparaíso, Chile. rodrigo.alfaro@ucv.cl realiza para cada marca independientemente. La tercera hipótesis habla sobre la clasificación de una marca por sentido serviría para clasificar otra marca dentro de la misma industria. Finalmente, la última hipótesis hace relación sobre la representación, ver si ésta influye en la precisión de la clasificación. Todas estas hipótesis se esquematizan en la figura 1. Keywords Sentido, Representación, Clasificación Automática de Textos, Twitter. I. INTRODUCCIÓN La minería de opinión y la clasificación automática han ido trabajando de la mano en los últimos años, mostrando buenos resultados [1]. El análisis se realiza sobre textos completos, como también sobre pequeñas oraciones, por lo que la red social Twitter es una buena elección, ya que permite a los usuarios escribir mensajes con un máximo de 14 caracteres. En el aprendizaje supervisado la clasificación automática requiere de mensajes clasificados manualmente. Cuando es necesario clasificar mensajes de temas de los cuales no se tienen mensajes clasificados manualmente se puede probar el desempeño del clasificador entrenándolo con mensajes del mismo contexto del tema. Para este caso, se prueba si clasificar mensajes de una marca con entrenamiento de mensajes de la industria entrega resultados similares al del entrenamiento de la misma marca. Las hipótesis que se plantean son 4 en total, donde se desea conocer la mejor forma que se pueden utilizar los datos para obtener buenos resultados en la clasificación automática, por lo que la primera hipótesis es que si se clasifican marcas de un determinado rubro, como el retail, sirve para clasificar marcas que se encuentren dentro del mismo rubro. La segunda hipótesis consiste en que la clasificación es mejor que la anterior si se Fig. 1. Escenarios para las Hipótesis. En este trabajo se propone estudiar el sentido dicotómico, Positivo y Negativo, así como también en tres sentidos, Positivo, Negativo y Neutro, todos ellos en mensajes de la red social Twitter pertenecientes a las menciones de dos marcas de empresas del retail: Falabella y Ripley. Se proponen 5 representaciones para los mensajes y se experimenta con tres clasificadores: Näive Bayes, Máquinas de Soporte Vectorial y Árboles de Decisión.

2 2 II. PROBLEMA La necesidad de saber qué es lo que la gente piensa u opina ha sido tema de investigación durante mucho tiempo, en especial sobre la toma de decisiones de las empresas, por lo cual el conocer si lo que se está diciendo sobre una determinada marca es positivo o negativo es de gran importancia. La forma en que se representan los mensajes que se escriben en Twitter influye en el desempeño y/o comportamiento [2] y pueden significar diferencias en el rendimiento de los clasificadores. En consideración al gran volumen de mensajes y la necesidad de analizarlos, es que el uso de máquinas de aprendizaje es fundamental para que la clasificación se realice de manera automática. Es por eso que se desea realizar una comparación de rendimiento de los diferentes algoritmos (SVM, Naive Bayes y Árboles de Decisión), para así poder definir cuál de estos presenta mejores resultados y se desenvuelve mejor en un problema de clasificación de mensajes cortos, como es el caso de los mensajes en las redes de microblogging. III. ANÁLISIS DE SENTIMIENTOS El Análisis de Sentimientos ha sido abordado desde diferentes perspectivas, como análisis de subjetividad, minería de opinión, y extracción de evaluación, con algunas conexiones con la informática afectiva (reconocimiento computacional y la expresión de la emoción) [1]. Este campo por lo general estudia los elementos subjetivos, definidos como "expresiones lingüísticas de los estados particulares en contexto"[3]. Estas suelen ser palabras sueltas, frases u oraciones. A veces, los documentos enteros son estudiados como una unidad de sentimiento, pero es generalmente aceptado que el sentimiento reside en pequeñas unidades lingüísticas [4]. IV. PROPUESTA La propuesta consiste en comparar el desempeño de diferentes clasificadores automáticos que son alimentados con diferentes representaciones de mensajes de Twitter. Esto en diferentes escenarios de entrenamiento (training) y de pruebas (testing). Para ello se plantean las 4 hipótesis ya mencionadas para llevarlo a cabo. Las representaciones que se utilizan son: A. N-gramas Esta representación consiste en la separación de las palabras de las oraciones para su posterior clasificación, en primer lugar, los Unigramas es la frase como tal, cada palabra separada de la siguiente. Los Bigramas se conforman por pares de palabras que pertenecen a la frase, por ejemplo, Un día hermoso, se transforma en los pares Un-día día-hermoso. Finalmente, los Trigramas es la frase dividida en tríos de palabras, por ejemplo, Hay un día soleado afuera, se transforma en Hay-un-día un-día-soleado día-soleado-afuera. B. TF-IDF Esta representación es la más utilizada para la clasificación de textos, en donde la primera sección TF corresponde al valor de la frecuencia del término normalizado, multiplicado por IDF, que corresponde a la frecuencia inversa del término en la colección completa N., = En donde corresponde al número de documentos que contienen al término t, D i corresponde a un documento i, t j un término j y f ij es la frecuencia del t j en el D i [5]. C. TF-RFL Corresponde a la relevancia de la frecuencia de una categoría (etiqueta), el cual es una representación propuesta por [6], la que constituye una nueva representación para el problema de múltiples categorías, que puede ser utilizado en problemas multi-clase. = 2+, max (1,$%(,&' ( )) + En donde $%(,&' ( ) es el número promedio de documentos que contienen el término t para cada documento clasificado en categorías diferentes a l, f td es la frecuencia del término en el documento, conocido como TF, a t,l es el número de documentos en la clase l que contienen el término t y, es el número de documentos que contienen el término t en todas las demás categorías diferentes a l. Para la fase de clasificación se utilizarán los siguientes: A. Näive Bayes Éste consiste en estimar la probabilidad que un objeto de cada clase se encuentre en un valor discreto dentro de un vector variable X, luego se utiliza el teorema de Bayes para producir la clasificación [5]. B. Máquinas de Soporte Vectorial (SVM) Se encuentra basado sobre la Minimización del Riesgo Estructural (SRM), el cual es un principio de la teoría del aprendizaje computacional [5].

3 3 En términos geométricos, el problema que resuelve las SVM (Support Vector Machine) es identificar una frontera de decisión linear entre dos clases, a través de una línea que los separe, maximizando la distancia de los objetos al hiperplano. C. Árboles de Decisión Los árboles de decisión se construyen desde un grupo de datos de entrenamiento usando el concepto de entropía de información. Los datos de entrenamiento se consideran S=s1, s2, de datos ya clasificados, cada uno si = x1, x2, es un vector, donde x i representan los atributos o características de los datos. Luego los datos de entrenamiento son aumentados con un vector C=c1, c2,, donde c i representa la clase a la cual pertenecen. En cada nodo que posee el árbol se escoge un atributo de los datos que discrimina de mejor manera el conjunto, dividiéndolo así en subconjuntos pertenecientes a una clase u otra, de esta forma, una vez entrenado los datos se procede a clasificar los nuevos datos a partir de las decisiones que tenga que ir tomando en cada nodo, llegando así a determinar a qué clase debe pertenecer. V. EXPERIMENTOS En esta sección se presentan la descripción del conjunto de datos utilizado y como fueron realizadas las pruebas. A. Conjunto de Datos El conjunto de datos utilizados en este trabajo se encuentra compuesto por 18 mensajes clasificados de forma manual. mensajes. El conjunto de datos se encuentra dividido en 3 tweets positivos, 3 negativos y 3 neutros pertenecientes a la empresa Falabella, en igual cantidad también los hay para la empresa Ripley, logrando un total de 1 mensajes cuando se utilizan dos sentidos (positivo y negativo) y 18 mensajes cuando se utilizan tres sentidos (positivo, negativo y neutro). B. Representación Se utilizan las ya mencionadas, Unigramas, Bigramas, Trigramas, TF-IDF y TF-RFL. C. Clasificación La clasificación se realizará mediante la herramienta WEKA y se utilizarán los algoritmos de Naive Bayes, SVM y J48 que es una implementación de los Árboles de Decisión. VI. RESULTADOS Para evaluar los resultados se utilizó tres métricas de rendimiento: la precisión, el recall y el valor F 1, se mostrarán los resultados obtenidos por F 1 ya que proporciona la medida más global de entre los tres anteriores. A. Hipótesis 1 Primero se consideran los resultados para probar la hipótesis 1, sobre clasificar para marcas de una industria sirve para ellas mismas. Los tweets se encuentran en su totalidad en idioma español y pertenecen a las marcas de retail: Falabella y Ripley, son menciones tomadas entre Octubre de 13 y Enero de 14. El conjunto de mensajes fue recuperado y proporcionado por la empresa Analitic S.A. Para el proceso de clasificación, como se hace en algunos corpus, participan varias personas para evitar un juicio sesgado al momento de decidir la categoría a a cual debía pertenecer un mensaje. Para este caso participaron 5 personas y se optó por tomar los mensajes que poseían un 8% y 1% de concordancia por la categoría clasificada. Dentro de las personas encargadas de clasificar se encontraba uno de los autores y con ello se iba supervisando el trabajo. Para el pre-procesamiento se eliminaron stopwords y algunas palabras que no servían para la clasificación como es el caso de los RT s que aparecen en los Fig. 2. F 1 de los clasificadores para las 5 representaciones utilizando dos sentidos para la hipótesis 1. Se puede observar en la figura 2 que para la representación de TF-RFL se logran los mejores resultados, todos sobre el 9%, destacando en este caso J48 quien obtiene un 98% de F 1 total. Las demás representaciones mediante SVM bordean el 8%

4 4 mostrando uniformidad en su desempeño en sus distintas representaciones Fig. 4. F 1 de los clasificadores para las 5 representaciones utilizando dos sentidos sólo para Falabella. Fig. 3. F 1 de los clasificadores para las 5 representaciones utilizando tres sentidos para la hipótesis 1. Al agregar un tercer sentido, los clasificadores tienden a bajar el desempeño como se puede observar en la figura 3, todos disminuyen alrededor de un 1% en comparación a la prueba realizada sólo usando sentidos positivos y negativos. Nuevamente el mayor desempeño se logra utilizando TF-RFL, logrando en sus 3 clasificaciones un valor que supera el 8%, en las demás representaciones se aprecia que es la SVM quien logra los mejores resultados, siempre cercanos al 65% - 7%. J48 es quien presenta las mayores variaciones según la representación que se obtiene, ya que va desde el 47.7% obtenido por los trigramas, hasta el 9.9% obtenido por TF-RFL, augurando que la representación si es importante según el algoritmo para clasificar que se vaya a utilizar. De las dos figuras, 2 y 3, se puede concluir que la Hipótesis 1 es correcta, clasificar para la industria o rubro sirve para clasificar las marcas de aquella industria, en este caso clasificar mensajes de Falabella y Ripley como conjunto de entrenamiento sirven para probar aquellas marcas y dan buenos resultados, tanto en dos o tres sentidos y utilizando la representación de TF-RFL se logran valores por sobre el 9%. B. Hipótesis 2 A continuación se presentan los resultados obtenidos para probar la Hipótesis 2, en ésta se prueban las marcas de manera independiente, es decir Falabella por si sola y Ripley por si sola. Los resultados que se muestran en la figura 4 representan al valor F 1 obtenida al clasificar una marca de manera independiente, en este caso Falabella, los valores son similares a la hipótesis 1, por lo cual no existiría en primera instancia un real diferencia entre ambos escenarios, sin embargo cabe destacar que nuevamente la representación de TF-RFL muestra los mejores resultados con resultados sobre el 92% Fig. 5. F 1 de los clasificadores para las 5 representaciones utilizando dos sentidos sólo para Ripley. En el escenario de Ripley con dos sentidos, como se aprecia en la figura 5, TF-RFL muestra excelentes resultados, logrando un 96.1% con Naive Bayes y logrando un 99.5% mediante J48. El valor F 1 obtenido para el caso de Ripley es ligeramente mayor a los obtenidos por la clasificación de la primera hipótesis. Los resultados anteriores pertenecían a la configuración de dos sentidos, por lo que a continuación se muestran los valores obtenidos para tres sentidos.

5 Fig. 6. F 1 de los clasificadores para las 5 representaciones utilizando tres sentidos sólo para Falabella. Como se puede apreciar en la figura 6, al igual que la clasificación obtenida de la primera hipótesis los valores no poseen demasiada variación para Falabella, las primera cuatro representaciones bordean el 5% - 7%, mientras que TF-RFL logra valores cercanos al 9% Fig. 8. F 1 de los clasificadores para las 5 representaciones utilizando dos sentidos entrenando con Falabella y testeando con Ripley. Los valores disminuyen considerablemente en este caso con dos sentidos, en donde el promedio se encuentra en el 65% para todas las representaciones y los distintos clasificadores, por lo que si se compara con los escenarios anteriores se encuentra bastante por debajo. Esto se puede apreciar en la figura Fig. 7. F 1 de los clasificadores para las 5 representaciones utilizando tres sentidos sólo para Ripley. Finalmente en la figura 7, se muestran los resultados obtenidos para tres sentidos en la marca Ripley, estos obtienen resultados similares a la primera hipótesis, SVM se comporta bien en las primeras 4 representaciones, mientras que para TF-RFL, J48 obtiene el mejor desempeño con un 93.8%. Por lo que se puede concluir para la Hipótesis 2 es que también es correcta, clasificar para una marca específica suele ser mejor que el caso general de clasificar para toda la industria. C. Hipótesis 3 Luego se presentará la tercera hipótesis, la cual busca demostrar si clasificar para una marca se puede utilizar en otra dentro de la misma industria. Fig. 9. F 1 de los clasificadores para las 5 representaciones utilizando tres sentidos entrenando con Falabella y testeando con Ripley. Para el caso de tres sentidos, el panorama empeora, ya que solo se obtienen valores entre 32%-5% para F 1, por lo cual se descarta esta posibilidad de clasificación. A continuación en las figuras 1 y 11, presentan el caso a la inversa, es decir entrenar con datos de Ripley y testear con mensajes de Falabella. Para el caso de dos sentidos presentan una mayor uniformidad en los valores de F 1, cercanos al 55%-65%, sin embargo, si se comparan con los otros escenarios, estos valores son bajos. El primer caso corresponde al proceso de entrenar con datos de Falabella y testearlos con datos de Ripley.

6 6 F1 / HIPOTESIS 1 F1 / HIPOTESIS 2 F1 / HIPOTESIS 3 NB SVM J48 NB SVM J48 NB SVM J48 NB SVM J48 NB SVM J48 PROMEDIO UNIGRAMAS 71,6 82, ,9 77,9 68,1 75,7 81,3 73,8 63,6 61,3 63, ,1 7,29 BIGRAMAS 69,1 8,9 62,3 7,7 75,5 63,9 74, , ,4 52,4 62,8 66,5 62,1 67,43 TRIGRAMAS 7,9 78,7 56, ,7 55,4 68,4 82,2 7,4 6,5 63,6 51,4 63,3 66,7 59,9 65,61 TF-IDF 71,6 82,6 68,6 71,9 77,9 68,1 75,8 81,2 73,8 63,5 61,3 63,5 65, ,1 7,25 TF-RFL 94,8 91, ,6 92,1 95,1 96,1 89,2 99,5 57,2 65,5 57,3 72,5 65,8 7,8 82,76 Fig. 1. F 1 de los clasificadores para las 5 representaciones utilizando dos sentidos entrenando con Ripley y testeando con Falabella Tabla 1. Valores de F 1 para los clasificadores en sus distintas representaciones la tabla 1 se muestran los resultados obtenidos cuando se prueban con dos sentidos. Se aprecian claras diferencias entre unos y otros, tanto por separado como en su promedio, en donde se ve claramente que la representación de TF-RFL obtiene los mejores valores y por ende el mejor desempeño, sin embargo para lograr apreciar con mayor claridad la veracidad de la hipótesis se realizó un test estadístico utilizando la prueba t-student entre las distintas representaciones, ellas se ven reflejadas en la tabla 2. U B T TF-IDF TF-RFL U, ,352978, , B, , ,1276 T,36816,3973 TF-IDF,15737 TF-RFL Tabla 2. Prueba para dos colas con T-Student para las representaciones Fig. 11. F 1 de los clasificadores para las 5 representaciones utilizando dos sentidos entrenando con Ripley y testeando con Falabella. Al igual que el caso inverso de tres sentidos, los valores obtenidos son bajos y no merecen ser considerados para clasificación. Para el caso de la hipótesis tres, podemos decir que no es conveniente y no obtiene buenos resultados el clasificar para una determinada marca y utilizarla para otra, por lo que este escenario se descarta, al menos para las representaciones y clasificadores utilizados. D. Hipótesis 4 La Hipótesis 4 plantea el modo de representar los mensajes de texto importa para el clasificador que se utilice, para ello se muestra los valores F 1 obtenidos para los distintos clasificadores y representaciones. En Como se aprecia en la tabla 2, las pruebas estadísticas concluyen que las diferentes representaciones obtienen desempeños diferentes estadísticamente significativos. Con esto se puede concluir que la representación si influye en el desempeño de los clasificadores. VII. CONCLUSIONES Y TRABAJO FUTURO El trabajo presentado en este artículo describe la problemática en torno a la clasificación de los mensajes de Twitter por sentido y cómo representar los mensajes para probar los distintos escenarios que se plantearon. La clasificación manual previa permite evaluar la clasificación automática. La etapa de pre-procesamiento, al igual que en el proceso de minería de datos, forma un papel principal para la obtención de buenos resultados. Transformar los mensajes, realizar limpieza a los datos, convertirlos para que el clasificador entienda el texto es un punto fundamental.

7 7 Con respecto a los resultados y las hipótesis se puede concluir que, para el primer escenario los valores obtenidos mediante la representación de TF-RFL logra muy buenos resultados, siempre por sobre el 9%, mientras que si se quiere optar por otra representación se debe preferir como algoritmo clasificador a las SVM, ya que predominan con los mejores resultados. Por ello es que la primera hipótesis se logra demostrar, clasificar para una industria sirve para las marcas que la componen y además se obtienen buenos resultados. Sobre la segunda hipótesis, se obtienen también buenos resultados, por lo que clasificar para una marca en particular sirve para clasificar aquella misma marca a futuro, mostrando una leve mejoría en desempeño que el primer escenario. Acerca de la tercera hipótesis, se mostró que con las representaciones y algoritmos utilizados no se obtienen buenos resultados, por lo que no es recomendable utilizar este escenario. Y finalmente, sobre la cuarta y última hipótesis, sobre la importancia y relevancia de la representación se puede decir que es verdadera, ya que influye en el desempeño de los clasificadores, según el algoritmo que se utilice, existirá una representación que más se le acomode y obtenga mejores resultados. A modo general se opta por elegir a TF-RFL como representación de los mensajes y a SVM como clasificador. Como trabajo futuro se puede abordar la tercera hipótesis y buscar nuevas formas de representaciones o algoritmos que permitan obtener mejores resultados. REFERENCIAS [1] Pang B. and Lee L.Opinion mining and sentiment analysis. Foundation and Trends in Information Retrieval, 2(1-2): [2] Fink, E, Automatic Evaluation and Selection of Problem-Solving Methods: Theory and Experiments (4). Computer Science Department. Paper 6. [3] Wiebe, J. M., Wilson, T., Bruce, R., Bell, M., and Martin, M. (4). Learning subjective language. Computational Linguistics, 3: [4] Turney, P. D. and Littman, M. L. (3). Measuring praise and criticism: Inference of semantic orientation from association. ACM Transactions on Information Systems (TOIS), 21(4): [5] Holts A., Riquelme C., Alfaro R. (1), Automated Text Binary Classification using Machine Learning Approach. XXIX International Conference of the Chilean Computer Science Society. [6] Alfaro R., Allende H. (1), Text Representation in Multi-label Classification: Two New Input Representations 1th International Conference on Adaptive and Natural Computing Algorithms (ICANNGA'11).

Clasificador Jerárquico de Imágenes utilizando Naive Bayes

Clasificador Jerárquico de Imágenes utilizando Naive Bayes Clasificador Jerárquico de Imágenes utilizando Naive Bayes Hernandez Torres Julio Noe, Marin Castro Maribel Angelica Instituto Nacional de Astrofísica Óptica y Electrónica {julio.hernandez.t, mmarinc}

Más detalles

Aprendizaje Automatizado

Aprendizaje Automatizado Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto

Más detalles

Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO

Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO 2 Objetivo El objetivo principal de las técnicas de clasificación supervisada es obtener un modelo clasificatorio válido para permitir tratar

Más detalles

Detección de subjetividad en noticias en línea publicadas en español utilizando clasificadores probabilísticos

Detección de subjetividad en noticias en línea publicadas en español utilizando clasificadores probabilísticos Detección de subjetividad en noticias en línea publicadas en español utilizando clasificadores probabilísticos Noé Alejandro Castro-Sánchez 1, Sadher Abelardo Vázquez-Cámara 1 y Grigori Sidorov 2 1 Centro

Más detalles

Micro y Macroeconomía

Micro y Macroeconomía Micro y Macroeconomía 1 Sesión No. 6 Nombre: Teoría del consumidor Contextualización: La microeconomía como herramienta de análisis nos permite el poder comprender el comportamiento de las personas en

Más detalles

Grado: 9 UoL_3: Extrayendo información de nuestro entorno: el análisis de tablas y gráficos. LO_4: Construcción del concepto de función Recurso:

Grado: 9 UoL_3: Extrayendo información de nuestro entorno: el análisis de tablas y gráficos. LO_4: Construcción del concepto de función Recurso: Grado 10 Matematicas - Unidad 1 Reconozcamos otras características de la función. Título del objeto Clasificación de funciones relacionados (Pre clase) Grado: 9 UoL_3: Extrayendo información de nuestro

Más detalles

FÍSICA Y QUÍMICA 3º ESO. OBJETIVOS, CONTENIDOS Y CRITERIOS DE EVALUACIÓN 1ª Evaluación: Unidad 1. La medida y el método científico.

FÍSICA Y QUÍMICA 3º ESO. OBJETIVOS, CONTENIDOS Y CRITERIOS DE EVALUACIÓN 1ª Evaluación: Unidad 1. La medida y el método científico. FÍSICA Y QUÍMICA 3º ESO. OBJETIVOS, CONTENIDOS Y CRITERIOS DE EVALUACIÓN 1ª Evaluación: Unidad 1. La medida y el método científico. OBJETIVOS 1. Reconocer las etapas del trabajo científico y elaborar informes

Más detalles

UNIVERSIDAD AUTÓNOMA DE QUERÉTARO FACULTAD DE INGENIERÍA. práctica, Total: 85 Horas a la semana: 5 teoría: 4 prácticas: 1 Créditos:

UNIVERSIDAD AUTÓNOMA DE QUERÉTARO FACULTAD DE INGENIERÍA. práctica, Total: 85 Horas a la semana: 5 teoría: 4 prácticas: 1 Créditos: UNIVERSIDAD AUTÓNOMA DE QUERÉTARO FACULTAD DE INGENIERÍA Probabilidad y Estadística 18/01/10 Clave: 214 Semestre: 1 Duración del curso: semanas: 17 horas: 68 de teoría y 17 de práctica, Total: 85 Horas

Más detalles

Tema 9: Contraste de hipótesis.

Tema 9: Contraste de hipótesis. Estadística 84 Tema 9: Contraste de hipótesis. 9.1 Introducción. El objetivo de este tema es proporcionar métodos que permiten decidir si una hipótesis estadística debe o no ser rechazada, en base a los

Más detalles

6.4. APLICACIÓN DE REDES NEURONALES EN EL CÁLCULO DE LA TASA DE CONTORNEAMIENTOS Velocidad de retorno del rayo con distribución uniforme

6.4. APLICACIÓN DE REDES NEURONALES EN EL CÁLCULO DE LA TASA DE CONTORNEAMIENTOS Velocidad de retorno del rayo con distribución uniforme Aplicación de redes neuronales en el cálculo de sobretensiones y tasa de contorneamientos 233 6.4. APLICACIÓN DE REDES NEURONALES EN EL CÁLCULO DE LA TASA DE CONTORNEAMIENTOS 6.4.1. Introducción Como ya

Más detalles

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA MODELO DE REGRESIÓN LOGÍSTICA Introducción A grandes rasgos, el objetivo de la regresión logística se puede describir de la siguiente forma: Supongamos que los individuos de una población pueden clasificarse

Más detalles

UNIDAD 8: SUCESIONES Y SERIES

UNIDAD 8: SUCESIONES Y SERIES UNIDAD 8: SUCESIONES Y SERIES Llegamos a la última unidad de la asignatura correspondiente a Sucesiones y Series, recuerde mantener la motivación hasta el final, el tema que vamos a tratar aquí es de especial

Más detalles

Introducción a la unidad 4:

Introducción a la unidad 4: Introducción a la unidad 4: Valor actual neto, tasa interna de retorno INACAP Virtual Introducción a la Unidad 4 Matemática financiera 2 ÍNDICE DE CONTENIDOS ÍNDICE DE CONTENIDOS... 3 INTRODUCCIÓN... 4

Más detalles

Bloque 1. Contenidos comunes. (Total: 3 sesiones)

Bloque 1. Contenidos comunes. (Total: 3 sesiones) 4º E.S.O. OPCIÓN A 1.1.1 Contenidos 1.1.1.1 Bloque 1. Contenidos comunes. (Total: 3 sesiones) Planificación y utilización de procesos de razonamiento y estrategias de resolución de problemas, tales como

Más detalles

ESTADISTICA. Tradicionalmente la aplicación del término estadística se ha utilizado en tres ámbitos:

ESTADISTICA. Tradicionalmente la aplicación del término estadística se ha utilizado en tres ámbitos: ESTADISTICA Tradicionalmente la aplicación del término estadística se ha utilizado en tres ámbitos: a) Estadística como enumeración de datos. b) Estadística como descripción, es decir, a través de un análisis

Más detalles

Modelos Para la Toma de Decisiones

Modelos Para la Toma de Decisiones Modelos Para la Toma de Decisiones 1 Sesión No. 7 Nombre: Introducción a la probabilidad. Primera parte. Contextualización Nos introducimos en un nuevo tema que es trascendental considerar en el estudio

Más detalles

Los medios de comunicación masiva hoy en día son de vital importancia para la

Los medios de comunicación masiva hoy en día son de vital importancia para la Introducción Los medios de comunicación masiva hoy en día son de vital importancia para la sociedad ya que éstos son los que proporcionan casi el cien por ciento de la información que sucede en el mundo.

Más detalles

Fase 2. Estudio de mercado: ESTADÍSTICA

Fase 2. Estudio de mercado: ESTADÍSTICA 1. CONCEPTO DE ESTADÍSTICA. ESTADÍSTICA DESCRIPTIVA 2. 3. TABLA DE FRECUENCIAS 4. REPRESENTACIONES GRÁFICAS 5. TIPOS DE MEDIDAS: A. MEDIDAS DE POSICIÓN B. MEDIDAS DE DISPERSIÓN C. MEDIDAS DE FORMA 1 1.

Más detalles

Complejidad computacional (Análisis de Algoritmos)

Complejidad computacional (Análisis de Algoritmos) Definición. Complejidad computacional (Análisis de Algoritmos) Es la rama de las ciencias de la computación que estudia, de manera teórica, la optimización de los recursos requeridos durante la ejecución

Más detalles

Metodología de la Investigación [DII-711] Capítulo 7: Selección de la Muestra

Metodología de la Investigación [DII-711] Capítulo 7: Selección de la Muestra Metodología de la Investigación [DII-711] Capítulo 7: Selección de la Muestra Dr. Ricardo Soto [ricardo.soto@ucv.cl] [http://www.inf.ucv.cl/ rsoto] Escuela de Ingeniería Informática Pontificia Universidad

Más detalles

Capítulo 8. Análisis Discriminante

Capítulo 8. Análisis Discriminante Capítulo 8 Análisis Discriminante Técnica de clasificación donde el objetivo es obtener una función capaz de clasificar a un nuevo individuo a partir del conocimiento de los valores de ciertas variables

Más detalles

Universidad de Puerto Rico Recinto de Río Piedras Departamento de Biología

Universidad de Puerto Rico Recinto de Río Piedras Departamento de Biología Universidad de Puerto Rico Recinto de Río Piedras Departamento de Biología Laboratorio de Genética Biol 3350 Incidencia de moscas con tumores melanóticos en dos cepas de Drosophila melanogaster; tu (1)

Más detalles

Formulación del problema de la ruta más corta en programación lineal

Formulación del problema de la ruta más corta en programación lineal Formulación del problema de la ruta más corta en programación lineal En esta sección se describen dos formulaciones de programación lineal para el problema de la ruta más corta. Las formulaciones son generales,

Más detalles

Curso de Estadística Unidad de Medidas Descriptivas. Lección 7: Medidas de Posición para Datos Crudos

Curso de Estadística Unidad de Medidas Descriptivas. Lección 7: Medidas de Posición para Datos Crudos 1 Curso de Estadística Unidad de Medidas Descriptivas Lección 7: Medidas de Posición para s Crudos Creado por: Dra. Noemí L. Ruiz Limardo, EdD 010 Derechos de Autor Objetivos 1. Definir las medidas de

Más detalles

CLASIFICACIÓN DE LA IMAGEN. Escuela de Ingeniería Civil y Geomática Francisco Luis Hernández Torres

CLASIFICACIÓN DE LA IMAGEN. Escuela de Ingeniería Civil y Geomática Francisco Luis Hernández Torres CLASIFICACIÓN DE LA IMAGEN TÉCNICA QUE PERMITE LA IDENTIFICACIÓN DE LOS DIFERENTES OBJETOS O GRUPOS PRESENTES EN UNA IMAGEN MULTI-ESPECTRAL. MÉTODO NO SUPERVISADO MÉTODO SUPERVISADO El Desarrollo De Las

Más detalles

Desambigüación del sentido de las palabras (WSD)

Desambigüación del sentido de las palabras (WSD) Desambigüación del sentido de las palabras (WSD) Miguel A. Alonso Departamento de Computación, Facultad de Informática, Universidade da Coruña 1 / 18 Índice 1 Introducción 2 Evaluación 3 Enfoques basados

Más detalles

LECTURA 01: LA ESTADÍSTICA. TÉRMINOS DE ESTADÍSTICA. RECOLECCIÓN DE DATOS TEMA 1: LA ESTADISTICA: DEFINICION Y CLASIFICACION

LECTURA 01: LA ESTADÍSTICA. TÉRMINOS DE ESTADÍSTICA. RECOLECCIÓN DE DATOS TEMA 1: LA ESTADISTICA: DEFINICION Y CLASIFICACION LECTURA 01: LA ESTADÍSTICA. TÉRMINOS DE ESTADÍSTICA. RECOLECCIÓN DE DATOS TEMA 1: LA ESTADISTICA: DEFINICION Y CLASIFICACION 1. DEFINICION La estadística es una ciencia que proporciona un conjunto métodos

Más detalles

CAPÍTULO I. INTRODUCCIÓN. Cuando se requiere obtener información de una población, y se desean obtener los mejores

CAPÍTULO I. INTRODUCCIÓN. Cuando se requiere obtener información de una población, y se desean obtener los mejores CAPÍTULO I. INTRODUCCIÓN I.1 Breve Descripción Cuando se requiere obtener información de una población, y se desean obtener los mejores y más completos resultados, el censo es una opción para dar una respuesta

Más detalles

Fundamentos de Estadística y Simulación Básica

Fundamentos de Estadística y Simulación Básica Fundamentos de Estadística y Simulación Básica TEMA 2 Estadística Descriptiva Clasificación de Variables Escalas de Medición Gráficos Tabla de frecuencias Medidas de Tendencia Central Medidas de Dispersión

Más detalles

CRITERIOS DE SELECCIÓN DE MODELOS

CRITERIOS DE SELECCIÓN DE MODELOS Inteligencia artificial y reconocimiento de patrones CRITERIOS DE SELECCIÓN DE MODELOS 1 Criterios para elegir un modelo Dos decisiones fundamentales: El tipo de modelo (árboles de decisión, redes neuronales,

Más detalles

Comparativa de Aproximaciones a SVM Semisupervisado Multiclase para Clasificación de Páginas Web

Comparativa de Aproximaciones a SVM Semisupervisado Multiclase para Clasificación de Páginas Web Comparativa de Aproximaciones a SVM Semisupervisado Multiclase para Clasificación de Páginas Web A Comparison of Approaches to Semi-supervised Multiclass SVM for Web Page Classification Arkaitz Zubiaga,

Más detalles

CONCLUSIONES Y RECOMENDACIONES

CONCLUSIONES Y RECOMENDACIONES CONCLUSIONES Y RECOMENDACIONES Se muestran a continuación las principales conclusiones y recomendaciones encontradas después de terminar la investigación, primero se presentan las de los estudiantes (clientes

Más detalles

INFORME SECTOR. AIDO ARTES GRÁFICAS. Análisis de ciclo de vida de libros impresos

INFORME SECTOR.  AIDO ARTES GRÁFICAS. Análisis de ciclo de vida de libros impresos 2011 INFORME SECTOR www.ecodisseny.net Análisis de ciclo de vida de libros impresos INDICE 1. INTRODUCCIÓN 2. ANÁLISIS DE CICLO DE VIDA 3. ANÁLISIS DE CICLO DE VIDA DEL LIBRO 2 1. INTRODUCCIÓN El cálculo

Más detalles

METODOLOGÍA DE MUESTREO PARA REPORTE DE TENDENCIAS 4o BÁSICO Y 2o MEDIO SIMCE 2010

METODOLOGÍA DE MUESTREO PARA REPORTE DE TENDENCIAS 4o BÁSICO Y 2o MEDIO SIMCE 2010 METODOLOGÍA DE MUESTREO PARA REPORTE DE TENDENCIAS 4o BÁSICO Y 2o MEDIO SIMCE 2010 SIMCE Unidad de Currículum y Evaluación Ministerio de Educación 2011 Índice 1. Antecedentes Generales 1 2. Metodología

Más detalles

PROYECCIÓN DE LA EVOLUCIÓN DE LAS EMISIONES DE GASES DE EFECTO INVERNADERO EN EL SECTOR ENERGÍA AÑOS

PROYECCIÓN DE LA EVOLUCIÓN DE LAS EMISIONES DE GASES DE EFECTO INVERNADERO EN EL SECTOR ENERGÍA AÑOS PROYECCIÓN DE LA EVOLUCIÓN DE LAS EMISIONES DE GASES DE EFECTO INVERNADERO EN EL SECTOR ENERGÍA AÑOS 2 225 NOTA: ESTE ESTUDIO CORRESPONDE A UN ANÁLISIS ESPECÍFICO Y NO REPRESENTA CIFRAS OFICIALES. RESUMEN

Más detalles

UNIDAD 12.- Estadística. Tablas y gráficos (tema12 del libro)

UNIDAD 12.- Estadística. Tablas y gráficos (tema12 del libro) UNIDAD 12.- Estadística. Tablas y gráficos (tema12 del libro) 1. ESTADÍSTICA: CLASES Y CONCEPTOS BÁSICOS En sus orígenes históricos, la Estadística estuvo ligada a cuestiones de Estado (recuentos, censos,

Más detalles

Proyecto 6. Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial.

Proyecto 6. Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial. Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial. Funcionamiento: Se realiza un test en cada nodo interno del árbol, a medida que

Más detalles

GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill.

GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill. GLOSARIO ESTADÍSTICO Fuente: Murray R. Spiegel, Estadística, McGraw Hill. CONCEPTOS Y DEFINICIONES ESPECIALES Es el estudio científico de los métodos para recoger, organizar, resumir y analizar los datos

Más detalles

Estudio sobre la problemática en los enunciados de los problemas de programación

Estudio sobre la problemática en los enunciados de los problemas de programación Estudio sobre la problemática en los enunciados de los problemas de programación Área de conocimiento: Programación de computadoras-computación Educativa Autores: M. en C. Isaías Pérez Pérez -ICBI -UAEH

Más detalles

UNIDAD 4: FUNCIONES POLINOMIALES Y RACIONALES

UNIDAD 4: FUNCIONES POLINOMIALES Y RACIONALES UNIDAD 4: FUNCIONES POLINOMIALES Y RACIONALES En la Sección anterior se abordó contenidos relacionados con las funciones y gráficas, continuamos aprendiendo más sobre funciones; en la presente unidad abordaremos

Más detalles

5. Cuáles son las actividades primarias de la producción de software

5. Cuáles son las actividades primarias de la producción de software 1. La clasificación de los recursos humanos son dos: - Personal con experiencia - Personal nuevo sin experiencia (novatos) 2. Cual son las ventajas y desventajas sobre esta clasificación Las ventajas es

Más detalles

Detectando la prioridad de contenidos generados en Twitter por medio de n-gramas de palabras

Detectando la prioridad de contenidos generados en Twitter por medio de n-gramas de palabras Detectando la prioridad de contenidos generados en Twitter por medio de n-gramas de palabras Gerardo García-Rodríguez, Gabriela Ramírez-de-la-Rosa, Esaú Villatoro-Tello, Héctor Jiménez-Salazar Departamento

Más detalles

LECTURA 01: LA ESTADÍSTICA. TÉRMINOS DE ESTADÍSTICA. RECOLECCIÓN DE DATOS TEMA 1: LA ESTADISTICA Y CLASIFICACION

LECTURA 01: LA ESTADÍSTICA. TÉRMINOS DE ESTADÍSTICA. RECOLECCIÓN DE DATOS TEMA 1: LA ESTADISTICA Y CLASIFICACION LECTURA 01: LA ESTADÍSTICA. TÉRMINOS DE ESTADÍSTICA. RECOLECCIÓN DE DATOS TEMA 1: LA ESTADISTICA Y CLASIFICACION 1. LA ESTADÍSTICA La estadística es una ciencia que proporciona un conjunto métodos y técnicas

Más detalles

BLOQUE IV. CLASIFICACIÓN

BLOQUE IV. CLASIFICACIÓN BLOQUE IV. CLASIFICACIÓN CAPÍTULO 11 Clasificación de mínima distancia. IV. 11.1 Pasos para realizar la clasificación. Es necesario comentar que se trata de una clasificación muy básica, que, en este caso,

Más detalles

VAPA Alcance y Secuencia: Baile Las Normas Nacionales de Artes en Danza. Grado Dos

VAPA Alcance y Secuencia: Baile Las Normas Nacionales de Artes en Danza. Grado Dos VAPA Alcance y Secuencia: Baile Las Normas Nacionales de Artes en Danza Grado Dos Creación 1.1 Componente de proceso: Explorar Ancla estándar: Generar y conceptualizar ideas artísticas y trabajo. Entendimiento

Más detalles

En la figura 1 se observan los cambios de polaridad (positivo y negativo) y las variaciones en amplitud de una onda de ca.

En la figura 1 se observan los cambios de polaridad (positivo y negativo) y las variaciones en amplitud de una onda de ca. Página 1 de 7 TENSION ALTERNA En la figura 1 se observan los cambios de polaridad (positivo y negativo) y las variaciones en amplitud de una onda de ca. Puede definirse un voltaje alterno como el que varía

Más detalles

INVESTIGACIÓN DE MERCADOS

INVESTIGACIÓN DE MERCADOS INVESTIGACIÓN DE MERCADOS LIC. EN ADMINISTRACIÓN DE EMPRESAS 1 Sesión No. 10 Nombre: Tamaño de la Muestra Contextualización Continuando el tema de muestreo, revisaremos ahora el cálculo de la muestra y

Más detalles

Fundamentos de Bases de Datos Facultad de Ciencias UNAM

Fundamentos de Bases de Datos Facultad de Ciencias UNAM Desarrollo Fundamentos de Bases de Datos Facultad de Ciencias UNAM M.I. Gerardo Avilés Rosas gar@ciencias.unam.mx Laboratorio: L en C.C. Erick Orlando Matla Cruz ematla@ciencias.unam.mx Práctica 03 En

Más detalles

Capítulo 4. Lógica matemática. Continuar

Capítulo 4. Lógica matemática. Continuar Capítulo 4. Lógica matemática Continuar Introducción La lógica estudia la forma del razonamiento, es una disciplina que por medio de reglas y técnicas determina si un teorema es falso o verdadero, además

Más detalles

Modelos de Inventarios

Modelos de Inventarios Modelos de Inventarios 1. Qué significa PERT? Program Evaluation Review Technique Técnica de Revisión de Evaluación de Programa 2. Qué significa las siglas C.E.P Cantidad Económica de Pedidos 3. Para qué

Más detalles

Unidad Temática 3: Probabilidad y Variables Aleatorias

Unidad Temática 3: Probabilidad y Variables Aleatorias Unidad Temática 3: Probabilidad y Variables Aleatorias 1) Qué entiende por probabilidad? Cómo lo relaciona con los Sistemas de Comunicaciones? Probabilidad - Definiciones Experimento aleatorio: Un experimento

Más detalles

Contabilidad Gerencial. SESIÓN 3: Reglas de Presentación de la Información Financiera

Contabilidad Gerencial. SESIÓN 3: Reglas de Presentación de la Información Financiera Contabilidad Gerencial SESIÓN 3: Reglas de Presentación de la Contextualización Para qué crees que sirven los estados financieros? El fin de la contabilidad es presentar información la cual se utiliza

Más detalles

3. ANÁLISIS DE DATOS DE PRECIPITACIÓN.

3. ANÁLISIS DE DATOS DE PRECIPITACIÓN. 3. ANÁLISIS DE DATOS DE PRECIPITACIÓN. Teniendo en cuenta que la mayoría de procesos estadísticos se comportan de forma totalmente aleatoria, es decir, un evento dado no está influenciado por los demás,

Más detalles

UNIDAD DIDACTICA. Esta unidad es el punto de partida para la correcta asimilación de las posteriores unidades didácticas del módulo.

UNIDAD DIDACTICA. Esta unidad es el punto de partida para la correcta asimilación de las posteriores unidades didácticas del módulo. UNIDAD DIDACTICA TÍTULO: INTRODUCCIÓN A LA PROGRAMACIÓN. INTRODUCCIÓN E IMPORTANCIA: La importancia de esta unidad didáctica estriba en la familiarización del alumno con la metodología requerida para la

Más detalles

Tema 15: Combinación de clasificadores

Tema 15: Combinación de clasificadores Tema 15: Combinación de clasificadores p. 1/21 Tema 15: Combinación de clasificadores Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial

Más detalles

UNIDAD 6: ECUACIONES OBJETIVOS

UNIDAD 6: ECUACIONES OBJETIVOS UNIDAD 6: ECUACIONES Conocer los conceptos de ecuación, así como la terminología asociada. Identificar y clasificar los distintos tipos de ecuaciones polinómicas en función de su grado y número de incógnitas.

Más detalles

c). Conceptos. Son los grupos o conceptos que se enlistan en las filas de la izquierda de la tabla

c). Conceptos. Son los grupos o conceptos que se enlistan en las filas de la izquierda de la tabla Tema 5. Tablas estadísticas Como ya se había establecido en el tema anterior sobre el uso de las tablas estadísticas, éstas son medios que utiliza la estadística descriptiva o deductiva para la presentación

Más detalles

de 1 a 3 15 Desarrollo de ideas y precisión proposi Conclusión de 0 a 1 de 1 a 3

de 1 a 3 15 Desarrollo de ideas y precisión proposi Conclusión de 0 a 1 de 1 a 3 Resultados de la aplicación de la Expresión Escrita (EXPRESC) a la generación 16/Primavera de la División de Ciencias Sociales y Humanidades (DCSH), Unidad Cuajimalpa. La EXPRESC evalúa la expresión escrita

Más detalles

CAPITULO III METODOLOGÍA

CAPITULO III METODOLOGÍA CAPITULO III METODOLOGÍA 3.1 Tipo de investigación El tipo de investigación a utilizar es la investigativa experimental ya que se realizará una intervención en el campo mismo donde se presenta el problema,

Más detalles

Programa Construye T Guía para utilizar las Fichas de Actividades Construye T en el AULA

Programa Construye T Guía para utilizar las Fichas de Actividades Construye T en el AULA Programa Construye T 2015-2016 Guía para utilizar las Fichas de Actividades Construye T en el AULA El objetivo de esta Guía es orientar a los docentes de planteles beneficiarios del Programa Construye

Más detalles

Procesamiento de Texto y Modelo Vectorial

Procesamiento de Texto y Modelo Vectorial Felipe Bravo Márquez 6 de noviembre de 2013 Motivación Cómo recupera un buscador como Google o Yahoo! documentos relevantes a partir de una consulta enviada? Cómo puede procesar una empresa los reclamos

Más detalles

Técnicas de validación y experimentación

Técnicas de validación y experimentación Técnicas de validación y experimentación Clase nro 11 Introducción Todo modelo debe ser testeado para asegurarnos que es confiable, no tiene errores y que es aceptado por aquellos que lo van a usar. Luego

Más detalles

LA JUSTIFICACIÓN Y LOS ANTECEDENTES DE LA INVESTIGACIÓN

LA JUSTIFICACIÓN Y LOS ANTECEDENTES DE LA INVESTIGACIÓN LA JUSTIFICACIÓN Y LOS ANTECEDENTES DE LA INVESTIGACIÓN La investigación es un proceso que se inicia con el planteamiento de un problema que requiere solución, y para encontrarla el investigador tiene

Más detalles

ANEXO 1. CALIBRADO DE LOS SENSORES.

ANEXO 1. CALIBRADO DE LOS SENSORES. ANEXO 1. CALIBRADO DE LOS SENSORES. Las resistencias dependientes de la luz (LDR) varían su resistencia en función de la luz que reciben. Un incremento de la luz que reciben produce una disminución de

Más detalles

White paper Un método para hacer corresponder entre candidatos y un puesto de trabajo Posiciones basadas en un modelado predictivo Presentado por:

White paper Un método para hacer corresponder entre candidatos y un puesto de trabajo Posiciones basadas en un modelado predictivo Presentado por: White paper Un método para hacer corresponder entre candidatos y un puesto de trabajo Posiciones basadas en un modelado predictivo Presentado por: Introducción Si pregunta a dos directores de recursos

Más detalles

DESCRIPCIÓN ESPECÍFICA NÚCLEO: COMERCIO Y SERVICIOS SUBSECTOR: INFORMÁTICA

DESCRIPCIÓN ESPECÍFICA NÚCLEO: COMERCIO Y SERVICIOS SUBSECTOR: INFORMÁTICA DESCRIPCIÓN ESPECÍFICA NÚCLEO: COMERCIO Y SERVICIOS SUBSECTOR: INFORMÁTICA Nombre del Módulo: PROGRAMACIÓN EN JAVASCRIPT Código: CSTI0087 total: 51 Horas Objetivo General: Crear contenido web basado en

Más detalles

Detección del lenguaje figurativo e ironía en textos cortos

Detección del lenguaje figurativo e ironía en textos cortos Detección del lenguaje figurativo e ironía en textos cortos Patricia Espinoza, Darnes Vilariño, Mireya Tovar, and Beatríz Beltrán Benemérita Universidad Autónoma de Puebla, Facultad de Ciencias de la Computación,

Más detalles

Métodos Predictivos en Minería de Datos

Métodos Predictivos en Minería de Datos Métodos Predictivos en Minería de Datos Tutor: El curso será impartido por Dr. Oldemar Rodríguez graduado de la Universidad de París IX y con un postdoctorado de la Universidad de Stanford. Duración: Cuatro

Más detalles

Cómo se hace la Prueba t a mano?

Cómo se hace la Prueba t a mano? Cómo se hace la Prueba t a mano? Sujeto Grupo Grupo Grupo Grupo 33 089 74 5476 84 7056 75 565 3 94 8836 75 565 4 5 704 76 5776 5 4 6 76 5776 6 9 8 76 5776 7 4 78 6084 8 65 45 79 64 9 86 7396 80 6400 0

Más detalles

CONSEJOS PARA PUBLICAR ARTÍCULOS CIENTÍFICOS

CONSEJOS PARA PUBLICAR ARTÍCULOS CIENTÍFICOS CONSEJOS PARA PUBLICAR ARTÍCULOS CIENTÍFICOS Un artículo científico es: Es un informe escrito y publicado que describe los resultados originales de investigación, debe ser escrito y publicado de cierta

Más detalles

ANÁLISIS DE DATOS DE LOS ENTORNOS VIRTUALES DE APRENDIZAJE, USANDO TÉCNICAS DE MINERÍA DE DATOS.

ANÁLISIS DE DATOS DE LOS ENTORNOS VIRTUALES DE APRENDIZAJE, USANDO TÉCNICAS DE MINERÍA DE DATOS. ANÁLISIS DE DATOS DE LOS ENTORNOS VIRTUALES DE APRENDIZAJE, USANDO TÉCNICAS DE MINERÍA DE DATOS. Bernabé Ortega, Rodrigo Aguilar, Viviana Quevedo Facultad de Sistemas Mercantiles, Universidad Autónoma

Más detalles

TEMA 2 FRACCIONES MATEMÁTICAS 2º ESO

TEMA 2 FRACCIONES MATEMÁTICAS 2º ESO TEMA 2 FRACCIONES Criterios De Evaluación de la Unidad 1 Utilizar de forma adecuada las fracciones para recibir y producir información en actividades relacionadas con la vida cotidiana. 2 Leer, escribir,

Más detalles

CONSTRUCCIÓN DIDÁCTICA DE LOS NÚMEROS ENTEROS DESDE LA TEORÍA LOS MODOS DE PENSAMIENTO.

CONSTRUCCIÓN DIDÁCTICA DE LOS NÚMEROS ENTEROS DESDE LA TEORÍA LOS MODOS DE PENSAMIENTO. CONSTRUCCIÓN DIDÁCTICA DE LOS NÚMEROS ENTEROS DESDE LA TEORÍA LOS MODOS DE PENSAMIENTO. Bonilla Barraza,D. Parraguez González,M. Pontificia Universidad Católica de Valparaíso (Chile) danielabonillab@gmail.com,

Más detalles

ANEXO 2 RADIOGRAFÍA A LA DEMANDA DE ELECTRICIDAD EN CHILE

ANEXO 2 RADIOGRAFÍA A LA DEMANDA DE ELECTRICIDAD EN CHILE ANEXO 2 RADIOGRAFÍA A LA DEMANDA DE ELECTRICIDAD EN CHILE 1 INTRODUCCIÓN En el ejercicio de escenarios que se presenta en el informe resulta clave llevar a cabo una proyección de la demanda por consumo

Más detalles

UML (Lenguaje de Modelado Unificado) y Diagramas de Casos de Uso

UML (Lenguaje de Modelado Unificado) y Diagramas de Casos de Uso UML (Lenguaje de Modelado Unificado) y Diagramas de Casos de Uso Los sistemas orientados a objetos describen las entidades como objetos. Los objetos son parte de un concepto general denominado clases.

Más detalles

M ÉTODO DE MUESTREO DE GEOSINTÉTICOS PARA ENSAYOS I.N.V. E

M ÉTODO DE MUESTREO DE GEOSINTÉTICOS PARA ENSAYOS I.N.V. E M ÉTODO DE MUESTREO DE GEOSINTÉTICOS PARA ENSAYOS I.N.V. E 908 07 1. OBJETO 1.1 Esta práctica cubre dos procedimientos para el muestreo de geosintéticos para ser ensayados. Se requiere que las instrucciones

Más detalles

Panamá Factores asociados TERCE

Panamá Factores asociados TERCE Panamá Factores asociados TERCE a) Desempeño de los estudiantes La tabla 1 expone los resultados de Panamá en las pruebas TERCE y su comparación con el rendimiento promedio regional. Como se muestra, Panamá

Más detalles

GRAFICOS DE CONTROL DATOS TIPO VARIABLES

GRAFICOS DE CONTROL DATOS TIPO VARIABLES GRAFICOS DE CONTROL DATOS TIPO VARIABLES OBJETIVO DEL LABORATORIO El objetivo del presente laboratorio es que el estudiante conozca y que sea capaz de seleccionar y utilizar gráficos de control, para realizar

Más detalles

Tipos de gráficos disponibles

Tipos de gráficos disponibles Tipos de gráficos disponibles Microsoft Office Excel admite muchos tipos de gráficos para ayudarle a mostrar datos de forma comprensible para su audiencia. Cuando crea un gráfico o cambia el tipo de uno

Más detalles

Nuevas Tecnologías aplicadas a las Finanzas. Especializaciones. 1. Ingeniería Lingüística. Un nuevo mercado. Presentación del curso:

Nuevas Tecnologías aplicadas a las Finanzas. Especializaciones. 1. Ingeniería Lingüística. Un nuevo mercado. Presentación del curso: 1. Ingeniería Lingüística. Un nuevo mercado Presentación del curso: Ingeniería Lingüística: Un nuevo mercado Conoce, de la mano de uno de los principales expertos internacionales, un mercado emergente

Más detalles

CLASIFICACIÓN DE LAS CIENCIAS

CLASIFICACIÓN DE LAS CIENCIAS LECCIÓN Nº 13 CLASIFICACIÓN DE LAS CIENCIAS OBJETIVO ESPECÍFICO: Reconocer la clasificación de las ciencias de las ciencias. PROPÓSITO: Los alumnos reconocerán el ordenamiento de las ciencias. 1.-CRITERIOS

Más detalles

Presentación de Bolivia

Presentación de Bolivia Taller sobre Encuestas de Opinión n Empresarial Presentación de Bolivia Jaime Pérez INE - Bolivia CEPAL, Santiago de Chile 1 y 2 de diciembre de 2003 http://www.eclac.cl/deype Armonización Antecedentes

Más detalles

importantes actividades agrícolas presenten el cuerpo del estado de resultados un análisis

importantes actividades agrícolas presenten el cuerpo del estado de resultados un análisis importantes actividades agrícolas presenten el cuerpo del estado de resultados un análisis de los ingresos y gastos empleados para determinar el resultado de actividades operativas empleando una clasificación

Más detalles

Tema 4. Probabilidad Condicionada

Tema 4. Probabilidad Condicionada Tema 4. Probabilidad Condicionada Presentación y Objetivos. En este tema se dan reglas para actualizar una probabilidad determinada en situaciones en las que se dispone de información adicional. Para ello

Más detalles

13. Utilizar la fórmula del término general y de la suma de n términos consecutivos

13. Utilizar la fórmula del término general y de la suma de n términos consecutivos Contenidos mínimos 3º ESO. 1. Contenidos. Bloque I: Aritmética y álgebra. 1. Utilizar las reglas de jerarquía de paréntesis y operaciones, para efectuar cálculos con números racionales, expresados en forma

Más detalles

Estudio de viabilidad económica de la implantación de tecnología CNC en un taller metalmecánico.

Estudio de viabilidad económica de la implantación de tecnología CNC en un taller metalmecánico. Estudio de viabilidad económica de la implantación de tecnología CNC en un taller metalmecánico. Resumen Autora: Sonia Boza Rodríguez Titulación: Grado en Ingeniería en Organización Industrial Escuela

Más detalles

MAPA CONCEPTUAL. PDF created with pdffactory trial version

MAPA CONCEPTUAL. PDF created with pdffactory trial version MAPA CONCEPTUAL Mapa conceptual es una técnica usada para la representación gráfica de los saberes y el conocimiento. Es una herramienta de asociación, interrelación, discriminación, descripción y ejemplificación

Más detalles

Guía de Problemas. CINEMÁTICA de la MARCHA. Introducción

Guía de Problemas. CINEMÁTICA de la MARCHA. Introducción Guía de Problemas CINEMÁICA de la MARCHA Introducción La Cinemática es una rama de la Mecánica que estudia el movimiento sin tomar en cuenta las fuerzas que lo originan. Para la descripción cinemática

Más detalles

Algebra lineal y conjuntos convexos

Algebra lineal y conjuntos convexos Apéndice A Algebra lineal y conjuntos convexos El método simplex que se describirá en el Tema 2 es de naturaleza algebraica y consiste en calcular soluciones de sistemas de ecuaciones lineales y determinar

Más detalles

INSTITUCION EDUCATIVA LA PRESENTACION

INSTITUCION EDUCATIVA LA PRESENTACION INSTITUCION EDUCATIVA LA PRESENTACION Nombre de la alumna: Área: MATEMATICAS Asignatura: Matemáticas Docente: Luis López Zuleta Tipo de Guía: Conceptual PERIODO GRADO FECHA DURACION DOS 7º 25 de abril

Más detalles

Representación de números enteros: el convenio exceso Z

Representación de números enteros: el convenio exceso Z Representación de números enteros: el convenio exceso Z Apellidos, nombre Martí Campoy, Antonio (amarti@disca.upv.es) Departamento Centro Informàtica de Sistemes i Computadors Escola Tècnica Superior d

Más detalles

Ing. Eduardo Cruz Romero w w w. tics-tlapa. c o m

Ing. Eduardo Cruz Romero w w w. tics-tlapa. c o m Ing. Eduardo Cruz Romero eduar14_cr@hotmail.com w w w. tics-tlapa. c o m La estadística es tan vieja como la historia registrada. En la antigüedad los egipcios hacían censos de las personas y de los bienes

Más detalles

Mapas de Puntos. Cartografía a Temática Cuantitativa. Cartografía de superficie

Mapas de Puntos. Cartografía a Temática Cuantitativa. Cartografía de superficie Cartografía a Temática Cuantitativa Cartografía de superficie En la cartografía a temática tica cuantitativa existe el concepto de superficie estadística. stica. La superficie estadística stica es una

Más detalles

Las Campañas Multisensoriales: una nueva tendencia publicitaria

Las Campañas Multisensoriales: una nueva tendencia publicitaria Las Campañas Multisensoriales: una nueva tendencia publicitaria Las discursividades y la complementariedad de medios María Victoria Bortolazzo Resumen Técnico En el presente trabajo de Investigación Proyectual

Más detalles

Mapa conceptual (concepto)

Mapa conceptual (concepto) Los Mapas Conceptuales Mónica Henao Cálad, Ph.D. 1 1 Mapa conceptual (concepto) Recurso esquemático y gráfico para representar el conocimiento Representación de relaciones significativas entre conceptos

Más detalles

Unidad 1: Espacio de Probabilidad

Unidad 1: Espacio de Probabilidad Unidad 1: Espacio de Probabilidad 1.1 Espacios de Probabilidad. (1) Breve introducción histórica de las probabilidades (2) Diferencial entre modelos matemáticos deterministicos y probabilísticos (3) Identificar

Más detalles

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) Curso Académico: 2015-2016 Programa: Centro: Universidad: Máster Universitario en Ingeniería Informática Escuela Politécnica Superior

Más detalles

Construcción de Conjuntos B 2 [2] Finitos

Construcción de Conjuntos B 2 [2] Finitos Construcción de Conjuntos B [] Finitos Gladis J. Escobar Carlos A. Trujillo S. Oscar H. Zemanate Resumen Un conjunto de enteros positivos A se llama un conjunto B [g] si, para todo entero positivo s, la

Más detalles

ACTIVIDAD: Control de Lectura # 1: Benchmarking para Competir con Ventaja Por: Roberto J. Boxwell. MATERIA: Ingeniería de Software.

ACTIVIDAD: Control de Lectura # 1: Benchmarking para Competir con Ventaja Por: Roberto J. Boxwell. MATERIA: Ingeniería de Software. UNIVERSIDAD DON BOSCO FACULTAD DE INGENIERIA ESCUELA DE COMPUTACION CICLO II/2008 ACTIVIDAD: Control de Lectura # 1: Benchmarking para Competir con Ventaja Por: Roberto J. Boxwell MATERIA: Ingeniería de

Más detalles

SISTEMAS INFORMÁTICOS PROGRAMACION I - Contenidos Analíticos Ing. Alejandro Guzmán M. TEMA 2. Diseño de Algoritmos

SISTEMAS INFORMÁTICOS PROGRAMACION I - Contenidos Analíticos Ing. Alejandro Guzmán M. TEMA 2. Diseño de Algoritmos TEMA 2 Diseño de Algoritmos 7 2. DISEÑO DE ALGORITMOS 2.1. Concepto de Algoritmo En matemáticas, ciencias de la computación y disciplinas relacionadas, un algoritmo (del griego y latín, dixit algorithmus

Más detalles