DANIEL. Directora: SEDE MEDELLÍN

Tamaño: px
Comenzar la demostración a partir de la página:

Download "DANIEL. Directora: SEDE MEDELLÍN"

Transcripción

1 MINERÍA DE DATOS EN EL PAQUETE RATTLE DEL LENGUAJE R. DANIEL TUTTLE OSPINA Trabajo de Grado para optar el título de Ingeniero de Sistemas e Informática Directora: Claudia Jiménez Ramírez Escuela de Sistemas UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MEDELLÍN FACULTAD DE MINAS

2 TABLA DE CONTENIDO 1. Introducción 2. La minería de datos 3. Instalación de Rattle 4. Cargando datos 5. Explorando los datos 6. Transformando los datos 7. Análisis de clúster 8. Análisis de asociación 9. Creando modelos 10. Evaluando modelos 11. Revisando el registro 12. Propuestas y conclusiones

3 1. Introducción R es un lenguaje y un entorno diseñado para análisis estadístico. Fue desarrollado por Robert Gentleman y Ross Ihaka del Departamento de Estadística de la Universidad de Auckland en R se distribuye bajo la licencia GNU GPL y está disponible para los sistemas operativos Windows, Macintosh, Unix y GNU/Linux. R provee una gran variedad de técnicas gráficas y estadísticas como: modelos lineales y no lineales, pruebas estadísticas clásicas, análisis de series temporales, clasificación, agrupación entre otras [1]. Rattle (del inglés, R Analytical Tool to Learn Easily) es un paquete de software libre desarrollado por Togaware que proporciona una interfaz gráfica basada en Gnome para la minería de datos desarrollada en el lenguaje de programación R. Este paquete proporciona una interfaz intuitiva que guía con facilidad a través de los pasos básicos de la minería de datos y nos ilustra el código de R que se utiliza para lograr nuestro estudio sobre los datos [2]. Hoy en día Rattle es utilizado por un gran número de empresas gubernamentales y comerciales alrededor del mundo. También es usado con fines educativos donde ha sido la principal herramienta usada en universidades como Harbin Institute of Technology, Shenzhen Graduate School, y por la Universidad Nacional de Australia [2]. Este trabajo tiene como objetivo ser una guía que apoye el proceso de aprendizaje del curso Técnicas en Aprendizaje Estadístico, la cual trata de dar a conocer una herramienta que puede ser útil para que los estudiantes pongan en práctica todos los conocimientos adquiridos en el curso. En este caso Rattle y el lenguaje R tienen la ventaja de ser un producto de software libre lo cual facilita el acceso por parte del docente y los estudiantes a esta herramienta que potencializa el conocimiento impartido en el curso.

4 2. La minería de datos La minería de datos es un conjunto de técnicas y tecnologías que permiten analizar grandes colecciones de datos con el fin de encontrar información implícita en éstos, tales como tendencias o reglas que ayuden a entender y expliquen el comportamiento de los datos analizados. La Estadística y la Inteligencia Artificial son la base de la minería de datos y las que permiten la comprensión de los datos.[9] La minería de datos es utilizada con el fin de: Descubrir patrones, relaciones o tendencias en los datos. Describir fenómenos. Obtener resúmenes. Analizar agrupaciones. Realizar predicciones y clasificaciones.[10] Un estudio de minería de datos está compuesto principalmente por 4 etapas: 1. Determinación de objetivos: se plantean los objetivos y hasta donde se quiere llegar con un estudio. 2. Preprocesamiento de los datos: Se seleccionan los datos que son influyentes en el modelo, se limpian y se transforman las variables que sean necesarias con el fin de generar un modelo. Esta es la etapa que demanda más tiempo y la más importante de un estudio ya que de la calidad de los datos depende la calidad del modelo. 3. Determinación del modelo: por medio de la Estadística y medios visuales se analizan los datos con el fin de conocerlos y tener una idea del comportamiento de estos. Luego según los objetivos planteados en la primera etapa y la tarea que debe realizarse se escoge el tipo de modelo que se ajusta a las necesidades y cumple con los requerimientos establecidos. 4. Análisis de los resultados: se verifica la coherencia de los datos y se comparan con los resultados arrojados por los análisis estadísticos. Se determina si el modelo aporta nuevo conocimiento y cumple las expectativas.[9]

5 3. Instalación del paquete Rattle R es un software libre el cual se puede descargar del sitio Web project.org/. Luego de descargarlo e instalarlo se procede a descargar e instalar el paquete Rattle el cual se estudiará en este trabajo. En la Figura 1 se observa la interfaz de R y la opción que se debe ingresar para descargar el paquete Rattle. Figura 1. Instalación Paquetes Luego de seleccionar la opción Instalar paquetes aparece una lista de sitios de descarga (mirrors), donde se encuentran disponibles los paquetes instalables en R. La idea es seleccionar la ubicación más cercana a su localización con el fin de que la descarga de los paquetes sea más eficiente. Después de seleccionar la ubicación del servidor, se listan los paquetes disponibles para descargar, en este caso se busca y se selecciona Rattle. Cuando finalice la descarga en la consola de R se digitan los siguientes comandos con el fin de iniciar Rattle: Library (rattle) // Este comando carga el paquete en memoria. Rattle() // Con esta función se ejecuta y abre lainterfaz gráfica de Rattle.

6 Tras la ejecución de estos comandos se obtiene el resultado mostrado en la Figura 2, que informa la necesidad de descargar otroo paquete llamado RGtk2 para mostrar la interfaz gráfica del usuario. Al final pregunta que si se desea instalar este paquete ahora y ya que el objetivo es utilizar Rattle se escribe la palabra yes. Figura 2. Instalando Paquete RGtk2. Luego de responder si a la anterior pregunta se despliega otra ventana (Figura 3) preguntando algo similar, para instalar este paquete seleccionamos la opción Install GTK+ y luego se presiona OK. Figura 3. Instalación GTK+. Tras la descarga se inicia el instalador de estee paquete, en el proceso de instalaciónn se seleccionan las opciones recomendadas por éste. Cuando finalice la instalación se debe reiniciar R ya que el paquete que se instaló anteriormente lo requería (simplemente se cierra el programa R y se vuelve a abrir). Luego de reiniciar R se ejecutan de nuevo los comandos que se digitaron anteriormente: library (rattle) y rattle(). Durante la ejecución de Rattle pueden aparecer ventanas como la que se muestra a continuación en la Figura 4, informado que se requieren otros paquetes con el fin de que Rattle funcione adecuadamente.

7 Figura 4. Ejemplo de paquete requerido por Rattle. 4. Cargando los datos La información se pueden encontrar en diversos formatos y R brinda la posibilidad de importar datos en muchas de sus formas. Para cargar los datos en la pestaña Datos la cual se puede observar en la Figura 5, se ofrecen las diferentes opciones para realizarr esto. Figura 5. Interfaz para cargar los datos.

8 Dentro de las opciones que ofrece Rattle se tiene: Hoja de cálculo: en la cual se pueden cargar archivos CSV (comma separated values). En este tipo de archivo las columnas que corresponden a cada variable se separan por medio de comas y en algunos casos por punto y coma. ARFF (Attribute Relation File Format): es esencialmente un CSV con un encabezado que describe los metadatos. Este tipo de formato fue desarrollado para trabajar con WEKA. ODBC (Open Database Connectivity): es un estándar desarrollado para acceder a la información almacenada en una base de datos. R permite conexión con las siguientes bases de datos MS/Excel, MS/Access, SQL Server, Oracle, IBM DB2, Teradata, MySQL, Postgres, and SQLite. Conjunto de datos R: esta opción permite cargar datos en Rattle que hayan sido cargados en R. Archivo de datos R: Rattle brinda la posibilidad de cargar archivos nativos de R los cuales por lo general tienen la extensión RDATA. Estos archivos pueden contener varios conjuntos de datos. Librería: en esta opción se tiene acceso a varios conjuntos de datos disponibles en R.[3] Para cargar los datos simplemente se selecciona el tipo de formato que se desea importar, luego se indica la ubicación del archivo y por último se presiona el botón Execute en la parte superior izquierda de la interfaz o simplemente se presiona la tecla F2. En el caso de la bases de datos se especifica el DSN (data source Name). A continuación, se cargarán los datos con los que se trabajará en el resto del documento. Es un archivo CSV el cual contiene la información de un censo realizado es Estados Unidos. Figura 6. Cargando archivo cenus.csv.

9 Figura 7. Opciones de la interfaz. Luego de seleccionar el archivo con los datos, se procede a indicar por cual carácter están separadas las columnas del archivo y cual estamos utilizando como separador decimal. Se activa la opción encabezado para indicar que la primera fila del archivo tiene los nombres de las columnas y en caso de no activar esta opción se crearán nombres al azar. En el cuadro verde de la Figura 7 se resalta la opción de partir los datos, en caso de querer dividir la muestra, se activa el checkbox partición y en la casilla de la derecha se especifican los tamaños de las particiones. La partición por defecto es 70/15/15 lo que significa que el 70% de los datos se utilizan para entrenamiento, 15% para validación y 15% para prueba. También existe la opción de dividir la muestra en solo dos: entrenamiento y validación, simplemente especificando los dos porcentajes 70/30. En la opción semilla se puede indicar el número que será utilizado para generar números aleatorios, donde diferentes semillas generan distintas particiones. Después de ajustar las preferencias se procede a presionar el botón Excecute en la parte superior. El comando que se ejecuta en R para cargar los datos es el siguiente: crs$dataset < read.csv("file:///c:/users/daniel/desktop/recortes/census.csv", sep=";", na.strings=c(".", "NA", "", "?"), strip.white=true, encoding="utf 8")

10 Cuando se cargan los datos, en la parte inferior de Rattle se muestra cada una de las variables que se tenían en el archivo (ver Figura 8). Además se indica el tipo de cada variable el cual puede ser categórico o numérico, el número de elementos faltantes y el número de niveles en cada una. Rattle selecciona también la variable de destino, la cual será la que se cruzará con la demás. Rattle analiza cada variable y las que tengan menos de 5 valores únicos se convierten en candidatas para ser la variable de destino. La lista de candidatas se ordena a partir de la última variable y luego se busca la primera que cumpla con la condiciones para ser candidata. Por lo general la última variable es la de destino. Figura 8. Variables del archivo cargado. Los botones Ver y Editar ubicados a la derecha de la semilla permiten visualizar y editar el archivo. Existe la posibilidad de ignorar las variables que se deseen ya que puede darse el caso en el que éstas no posean información relevante para el análisis. Esto se hace seleccionando la variable y luego presionando el botón rojo de ignorar. Si se desea indicar que una variable es de tipo ID se puede hacer simplemente activando la opción Ident de ésta. Siempre que se realicen cambios sobre las variables se debe presionar de nuevo el botón Execute. En la calculadora de peso se puede ingresar una fórmula con el fin de asignarle un peso a cada observación.

11 5. Explorando los datos Una vez cargados los datos y definidos los roles de las variables, se procede a explorar los datos con el fin de conocer más sobre éstos y comprender un poco su comportamiento. Para comenzar con el análisis se selecciona la pestaña Explorar (ver Figura 9). Rattle provee las siguientes opciones: Suma: Presenta un resumen de las variables donde se encuentran estadísticas como la mediana, media, moda y muchas otras. Distribuciones: Se pueden realizar gráficos como histogramas, cajas y bigotes, mosaico entre otros. Correlación: Se realiza un estudio de independencia entre las variables numéricas. Componentes principales: Ofrece información sobre la importancia de las variables para explicar la variación que se encuentra en el conjunto de datos. Interactivo: Ofrece una visualización gráfica de los datos de una manera dinámica. Figura 9. Opciones de la pestaña explorar. Luego de esta pequeña introducción se procederá a realizar el análisis exploratorio de los datos cargados en el punto anterior. Se mostrarán las opciones mencionadas anteriormente. Suma Dentro de esta opción se encuentran diferentes tipos de estadísticos e información que ayudarán a entender un poco sobre los datos. Se procederá entonces a mostrar cada una de la información arrojada por las diferentes opciones dentro del Tipo Suma. Suma A continuación se muestra el resultado obtenido tras ejecutar la opción Suma.

12 Figura 10. Información acerca de las variables. En la primera parte del resultado (ver Figura 10) se observa cada una de las variables donde la columna NAs indica el número de faltantes para cada variable y la columna Levels indica el número de niveles para las variables categóricas. Luego más abajo se observa una tabla con las variables categóricas y sus respectivos niveles (Figura 11).

13 Figura 11. Valores de las variables categóricas. Ya en la última parte del resultado arrojado aparecen ciertas estadísticas de cada variable, en el caso de las numéricas se tiene el valor máximo, el valor mínimo, la media, la mediana y los valores del primer y tercer cuartil (ver Figura 12). Para el caso de las categóricas se muestra la frecuencia para algunos de los niveles. En el caso de tener variables con valores faltantes éstos también se muestran.

14 Figura 12. Última parte del resultado arrojado por la opción Suma.

15 Describir Ahora se analizará otra opción de las 6 que ofrece el Tipo Suma, se seleccionará la opción Describir seguido de Execute. Debido a la longitud de las variables no se presentarán todas. Figura 13. Resultados de la opción Describir. Dependiendo del tipo de variable se observará diferente información sobre la variable. Para las categóricas se tendrá una tabla con la frecuencia relativa y la absoluta. Para las numéricas se muestra la media, los valores más altos y bajos y los valores de los 7 percentiles. Cuando se tienen variables numéricas con pocos niveles aparece la tabla de frecuencias y los 7 percentiles. Todo esto se puede observar en la Figura 13.

16 Básicos Esta opción muestra un buen número de estadísticas para las variables numéricas dentro de las cuales las más importantes son: el número de observaciones, numero de faltantes, valor mínimo, valor máximo, primer y tercer cuartil, media, mediana, la suma de los valores, error estándar de la media, varianza, desviación estándar, asimetría y curtosis (ver Figura 14). Figura 14. Resultado de la opción Básicos.

17 Curtosis En esta opción Rattle arroja el coeficiente de curtosis para cada una de las variables numéricas. Este coeficiente indica la forma de la distribución de los datos con respecto a la distribución normal. Si el coeficiente es menor que 0, es una distribución Platicúrtica es decir que la distribución es más plana o achatada que la normal. Si es igual a 0, es una distribución Mesocúrtica lo que indica que los datos tienen una distribución normal. Y si es mayor que 0 ó Leptocúrtica la distribución de los datos es más apuntada que la normal. Figura 15. Curtosis de las variables numéricas. Analizando las variables de la Figura 15 se observa que salario, ganancias y pérdidas leptocurticas y están demasiado alejadas de tener una distribución normal. son Sesgo El sesgo indica cual cola de la distribución es la más larga. Si el valor es positivo la cola de la derecha es más larga. En caso de ser negativo la cola de la izquierda es más larga y en caso de ser cero se dice que los datos no tienen sesgo. En la Figura 16 se muestra el resultado tras ejecutar la opción Sesgo lo que significa que hay simetría en la distribución de los datos. Figura 16. Sesgo de las variables numéricas.

18 Valores faltantes Figura 17. Tabla de valores faltantes. En la Figura 17 se aprecia la tabla que arroja Rattle para indicar los valores faltantes en cada una de las variables. El recuadro verde indica el número de valores faltantes en cada columna. Un cero debajo de una variable indica que ésta tiene valores faltantes y el número de valores lo da la primera columna, por ejemplo en la columna ganancias el primer cero indica que tiene 148 valores faltantes. El recuadro azul representa la suma de cada fila, los primeros valores indican cuantos ceros hay por fila, y el último valor da el total de valores faltantes en la muestra de datos. Por lo general la primera fila da el número de registros que no tienen valores faltantes, en este caso La segunda se observa que hay 7 registros que les falta el valor en la columna trabajo, en la tercera fila hay 148 registros que no tienen valor en ganancias y en la penúltima existen 27 registros con datos faltantes en país_nac, empleado_en y trabajo.[3] Tabulación cruzada Esta opción nos permite cruzar la variable de destino que seleccionamos al cargar los datos, con las demás variables categóricas. En este caso se muestra en la Figura 18 la variable empleado_en cruzada con la variable MAYOR50K.

19

20 Figura 18. Resultados tabulación cruzada.

21 Distribuciones Ahora se analizará la opción Distribuciones Figura 19. Interfaz Distribuciones. En la interfaz de distribuciones (ver Figura 19) se separan las variables, las numéricas en la parte superior y las categóricas en la inferior. Para las numéricas están disponibles los siguientes diagramas: cajas y bigotes, histograma, distribución acumulada y el de Benford. Para las categóricas los diagramas de barras, puntos y mosaico. También se observa cierta información sobre las variables como el valor mínimo, la mediana, la media y el valor máximo para las numéricas, y para las categóricas el número de niveles. En la parte superior se puede escoger cuantos diagramas se desean por página y configurar algunas opciones para el diagrama de Benford.

22 Correlación El análisis de correlación indica que tan relacionadas son dos variables, este análisis solo es para variables numéricas. Hay tres métodos disponibles para hallar la correlación: Pearson, Spearman, Kendall. En este caso se utilizará el de Pearson y se activará la opción Organizado para que organice las variables según la fortaleza de correlación. El resultado se muestra a continuación en la Figura 20. Figura 20. Resultado análisis correlación. Si el coeficiente es igual a 1 existe una correlación positiva perfecta, es decir hay una relación directa entre las variables, cuando una de ellas aumenta la otra también lo hace en proporción constante. Si 0 < coeficiente < 1, existe una correlación positiva. Si es igual a cero, no existe relación lineal. Si 1 < coeficiente < 0, existe una correlación negativa. Si es igual a 1, existe una correlación negativa perfecta, es decir hay una relación inversa entre las variables, cuando una de ellas aumenta la otra disminuye en proporción constante. El resultado del análisis de correlación también viene acompañado de una gráfica, la cual se muestra a continuación en la Figura 21.

23 Figura 21. Gráfico de correlación. El grado de correlación se interpreta según la forma y el color de los elementos en la gráfica. Si el elemento es un círculo perfecto no hay correlación entre las variables. Cada variable está perfectamente correlacionada con ella misma, la perfecta correlación se representa con una línea diagonal. El color rojo indica correlación negativa, el azul positiva y entre más intenso sea el color es mayor la correlación. [3] Rattle también brinda la opción analizar la correlación entre las variables que tienen valores faltantes, para esto de activa la opción Explorar faltantes seguido de presionar el botón Execute.

24 Figura 22. Análisis de correlación entre las variables que posee valores faltantes. En este análisis solo participan las variables que tienen valores faltantes y como se observa en la Figura 22 también aparecen variables categóricas, de igual forma aparece el coeficiente de correlación. Se observa también información de los datos faltantes tales como la cantidad y el porcentaje de cada variable. Tambien se acompaña con un gráfico el cual se muestra a continuación en la Figura 23.

25 Figura 23. Gráfico de correlación entre las variables que poseen valores faltantes. En este grafico se observa que hay un alto grado de correlación entre empleado_en y trabajo, esto quiere decir que en general cuando hay un dato faltante en trabajo también lo hay en empleado_en. Por ultimo también existe la opción de realizar un análisis de correlación jerárquico, para esto se activa la opción jerárquico, esto despliega el gráfico el cual se observa a continuación.

26 Figura 24. Gráfico de correlación jerárquico.

27 6. Transformando los Datos La transformación de los datos es un proceso en el cual se preparan los datos que van a ser estudiados median la minería de datos, por lo tanto el tipo de transformación que se haga depende de la técnica que se vaya a utilizar. [4] Rattle ofrece 4 tipos de transformación los cuales se detallan a continuación: Cambiar escala: dentro de esta opción se pueden realizar diferentes cambios de escala. Recentralizar: centra los datos alrededor de cero, es decir transforma los datos de modo que la media sea 0 y la desviación estándar sea 1. Este término corresponde a normalizar. Escala [0 1]: normaliza los datos en una escala de 0 a 1. Mediana/MAD: cambia la escala de forma que la mediana sea 0 y la desviación absoluta de la mediana sea 1, es una versión más robusta que recentralizar. Registro natural: cambia la escala de los datos por medio de una transformación de logaritmo natural. Matriz: esta transformación es solo para variables numéricas, la variable seleccionada es tratada como una matriz dividiendo cada valor de la matriz por la suma de todos los elementos de la matriz. Intervalo: organiza los valores de la variable dentro de rangos. Figura 25. Interfaz para cambiar la escala de los datos.

28 Atribuir: proporciona diferentes métodos para reemplazar los datos faltantes. Se debe tener cuidado al momento de tratar los datos faltantes ya que se pueden cambiar las distribuciones de las variables y así generar modelos poco adecuados. La traducción correcta de esta opción es imputación. Cero/faltante: Se reemplaza los datos numéricos con 0 y los categóricos con la palabra faltante. Media: reemplaza los valores faltantes con la media. Mediana: llena los datos faltantes con la mediana. Modo: se utiliza la moda para llenar los datos faltantes. Constante: reemplaza los valores faltantes de cierta variable por un valor especificado. Figura 26. Interfaz para manejar los datos faltantes. Recode: se realizan transformaciones sobres las variables, ya sea de su tipo o de su ubicación. Cuantilos (la traducción correcta es cuantiles): divide la variable numérica en categorías con aproximadamente el mismo número de observaciones en cada una de ellas. Kmeans: se utiliza el método Kmeans para basándose en la distancia entre los elementos. dividir la variable numérica en grupos Del mismo ancho: crea grupos del mismo ancho de acuerdo al número de grupos que se le ingrese.

29 Variable indicador: convierte una variable categórica en una colección de variables indicadoras, en donde cada una de estas variables es un nivel de la variable categórica. Para cada observación solo una de estas nuevas variables tendrá el valor de 1 y el resto serán 0. El 1 corresponde al valor actual de la variable categórica original. Unir categorías: Combina múltiples variables categóricas en una sola. Como categórico: Convierte variables numéricas a categóricas Como numérico: Convierte una categórica en una numérica reemplazando cada nivel por el índice numérico del nivel. [3] Figura 27. Interfaz que permite cambiar de tipo las variables. Limpiar: Permite eliminar variables u observaciones. Borrar ignorados: Borra las variables a las que se les haya asignado el rol de ignorar. Borrar seleccionados: Borra las variables que se seleccionen en la lista de abajo. Borrar Faltantes: Borra las variables que contengan valores faltantes. Borrar objs con faltantes: Borra toda observación que contenga valores faltantes.

30 Figura 28. Interfaz para la limpieza de los datos. 7. Análisis de clúster Lo que se busca con este análisis es encontrar agrupaciones dentro de los datos con el fin de observar diferencias o similitudes que contribuyan al entendimiento de los datos. [5]. Por el momento Rattle brinda la posibilidad de realizar el análisis de clústeres mediante dos métodos los cuales solo funcionan con variables numéricas: KMeans: es un método de capa única, el cual divide las observaciones en k grupos, donde k es el número de grupos en los que se desea dividir la muestra. [5] Figura 29. Interfaz para el análisis de clúster con KMeans. En la interfaz se observa el campo Numero de clústers en el cual se indica el número de grupos en el que se dividirán las observaciones, el campo Semilla se ingresa un valor numérico a partir del cual se generarán valores aleatorios y un checkbox Repetir Clústers el cual en caso de estar activado ejecuta el algoritmo KMeans tantas veces como lo indique el numero en el campo Ejecuciones.

31 Luego de correr el algoritmo KMeans Rattle arroja los siguientes resultados (ver figura 30): Figura 30. Resultados del algoritmo KMeans. En esta imagen se observa la cantidad de elementos para cada clúster, la media de cada variable y los centros de cada clúster para las variables. Si se desea más información sobre el análisis el botón Estadísticas se obtiene información como: la entropía, el diámetro, la matriz de separación y mucha más información la cual puede ser de gran utilidad al momento de estudiar los datos. Por otra parte si se quiere una representación gráfica los botones Diagrama de datos y Diagrama discriminante brindan esta posibilidad. Jerárquico: los datos se dividen en subcategorías que se van dividiendo en otras Hasta que se clasifiquen todos los objetos, a diferencia del KMeans no es necesario ingresar el número de grupos de antemano. Figura 31. Interfaz para clúster jerárquico.

32 Para realizar el análisis jerárquico de los datos Rattle permite seleccionar el tipo de distancia que se requiere siendo la euclidiana la predeterminada y también existe la posibilidad de escoger el método de aglomeración el cual Ward es el predeterminado. El campo Número de procesadores hace referencia al número de subprocesos que se ejecutarán paralelamente. [6] Luego de oprimir Execute se tienen las tres mismas opciones: Estadisticas, Diagrama de datos, Diagrama discriminante explicadas anteriormente y además se tiene la opción Dendograma la cual hace una representación gráfica de los datos en forma de árbol y según el Número de clústers se señalan en el dendograma tantos grupos como lo indique el valor de este campo. 8. Análisis de Asociaciones Este análisis busca encontrar relaciones entre la diversas variable de la muestra de datos lo que es muy útil al momento de realizar clasificaciones y predicciones. Rattle brinda una interfaz muy sencilla para realizar el análisis de asociación, en la pestaña Asociada se encuentran las opciones disponibles para realizar dicho análisis. Esta es una interfaz muy sencilla de pocas opciones, donde aparece el checkbox Cestas el cual si se activa ejecuta un análisis de la canasta de mercado, en el cual solo existen dos columnas: una con el ID de la canasta y otra con el nombre del producto. El botón Diagrama de frecuencia presenta un gráfico con los elementos más comunes y usando el valor del soporte. En las opciones Apoyo y Confianza se ingresan el valor mínimo de aceptación para una regla de asociación, es decir solo se elegirán las reglas que tengan un apoyo y una confianza igual o mayor que los valores ingresados en estos campos. Y el botón Mostrar reglas simplemente las muestra, se debe tener en cuenta que los dos botones de esta interfaz solo funcionan después de haber oprimido el botón Execute. La interfaz para este análisis se muestra a continuación en la figura 32. Figura 32. Interfaz para encontrar reglas de asociación. A continuación se mostrarán los resultados arrojados por Rattle con un apoyo y una confianza mínima de 0.5. En la primera parte se muestra un resumen sobre las reglas, donde se observa el número de reglas que en este caso son 20 y luego se muestran diversas estadísticas sobre el soporte o apoyo, la confianza y la elevación (confianza de la regla dividida el soporte de la parte

33 derecha de la regla) [8]. En la segunda parte Rattle nos muestra información sobre la ejecución del algoritmo aprori, la cual no se tratará ya que no presenta información relevante. Figura 33. Resultado arrojado por el algoritmo aprioiri. Al dar click en Mostrar reglas éstas se muestran de la siguiente forma: Figura 34. Reglas de asociación encontradas. Cada regla tiene su soporte, confianza y elevación (lift).

34 9. Creando Modelos Esta es sin duda la parte de mayor importancia en un análisis de minería de datos ya que es donde se construye el modelo que representara el comportamiento de la muestra estudiada y es a partir de este modelo donde se pueden realizar clasificaciones, predicciones y estimaciones. Rattle ofrece la posibilidad de construir una gran variedad de modelos, a continuación se detallarán cada uno de estos y en qué consisten. Árbol: el árbol de decisión es uno de los modelos más comunes en la minería de datos y esto se debe a su facilidad de interpretación. Este modelo funciona para datos numéricos como categóricos. El algoritmo utilizado es rpart el cual es comparable con CART y el ID3/C4. Figura 35. Interfaz para crear un árbol de decisión. Al momento de generar el modelo se pueden ajustar ciertas opciones con el fin de que el modelo se adapte a lo que se desea. El primer cuadro de texto que se observa es División mínima este campo especifica el número mínimo de observaciones que deben existir en un nodo antes de que se realice la división. Cubo mínimo indica el mínimo de observaciones que debe haber en cada hoja del árbol. Profundidad máxima es el número máximo de niveles permitidos en el árbol. Complejidad es un parámetro utilizado para controlar el tamaño del árbol y para seleccionar el tamaño óptimo, si el costo de agregar otra variable al nodo de decisión supera el valor de este parámetro se detiene la construcción del árbol. Previos establece la probabilidad previa para cada clase con el fin de amplificar una clase importante asignándole una mayor probabilidad previa, en caso de tener tres clases se ingresarían las probabilidades de la siguiente forma: 0.3,0.4,0.3. Matriz de pérdida esta es usada para ponderar de diferente forma los errores de clasificación por ejemplo: 0,10,1,0 (TN,FN,FP,TP) esto indica que un FN (false negative) es 10 veces menos deseado que un FP (false positive). Por el último el checkbox Incluir faltantes en caso de activarlo se utilizarán variables suplentes en caso de que hayan valores faltantes. Luego de dar click en Execute podemos ver el árbol gráficamente y las reglas que se generaron. [3] Bosque: este es un modelo donde se crean varios árboles de decisiones, este modelo se usa cuando se tiene bases de datos muy grandes y un gran número de variables de entrada. Cada árbol es construido con un subconjunto de datos aleatorio. El algoritmo utilizado es randomforest el cual no trabaja con variables nominales de más de 32 niveles.

El Programa estadístico R

El Programa estadístico R El Programa estadístico R R es un lenguaje y entorno que permite realizar manipulación de datos, cálculos y gráficos estadísticos, bajo la modalidad de software libre y puede ser instalado en distintos

Más detalles

Práctica 2 ESTADÍSTICA DESCRIPTIVA

Práctica 2 ESTADÍSTICA DESCRIPTIVA Práctica 2. Estadística descriptiva 1 Práctica 2 ESTADÍSTICA DESCRIPTIVA Objetivos: En esta práctica utilizaremos el paquete SPSS para calcular estadísticos descriptivos de una muestra. Se representarán

Más detalles

CURSO MINERÍA DE DATOS AVANZADO

CURSO MINERÍA DE DATOS AVANZADO CURSO MINERÍA DE DATOS AVANZADO La minería de datos (en inglés, Data Mining) se define como la extracción de información implícita, previamente desconocida y potencialmente útil, a partir de datos. En

Más detalles

Clase 2: Estadística

Clase 2: Estadística Clase 2: Estadística Los datos Todo conjunto de datos tiene al menos dos características principales: CENTRO Y DISPERSIÓN Los gráficos de barra, histogramas, de puntos, entre otros, nos dan cierta idea

Más detalles

Statgraphics Centurión

Statgraphics Centurión Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 1 Statgraphics Centurión I.- Nociones básicas El paquete Statgraphics Centurión es un programa para el análisis estadístico que

Más detalles

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso 2008-2009

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso 2008-2009 Índice general 2. Presentación del paquete estadístico Statgraphics. Estadística Descriptiva 3 2.1. Ventanas de Statgraphics.................................... 3 2.1.1. Barras de menú, de herramientas

Más detalles

Clase 2: Estadística

Clase 2: Estadística Clase 2: Estadística Los datos Todo conjunto de datos tiene al menos dos características principales: CENTRO Y DISPERSIÓN Los gráficos de barra, histogramas, de puntos, entre otros, nos dan cierta idea

Más detalles

Trabajo final de Ingeniería

Trabajo final de Ingeniería UNIVERSIDAD ABIERTA INTERAMERICANA Trabajo final de Ingeniería Weka Data Mining Jofré Nicolás 12/10/2011 WEKA (Data Mining) Concepto de Data Mining La minería de datos (Data Mining) consiste en la extracción

Más detalles

Con el fin de obtener los datos, se procede con las siguientes instrucciones:

Con el fin de obtener los datos, se procede con las siguientes instrucciones: Capitulo 3. La predicción de beneficios del mercado bursátil Este segundo caso de estudio va más allá en el uso de técnicas de minería de datos. El dominio específico utilizado para ilustrar estos problemas

Más detalles

Base de datos II Facultad de Ingeniería. Escuela de computación.

Base de datos II Facultad de Ingeniería. Escuela de computación. Base de datos II Facultad de Ingeniería. Escuela de computación. Introducción Este manual ha sido elaborado para orientar al estudiante de Bases de datos II en el desarrollo de sus prácticas de laboratorios,

Más detalles

UNIVERSIDAD CARLOS III DE MADRID CURSO DE FORMACION ESTADISTICA CHEMO MANUAL DE STATGRAPHICS I. INTRODUCCIÓN Y MANEJO DE DATOS

UNIVERSIDAD CARLOS III DE MADRID CURSO DE FORMACION ESTADISTICA CHEMO MANUAL DE STATGRAPHICS I. INTRODUCCIÓN Y MANEJO DE DATOS UNIVERSIDAD CARLOS III DE MADRID CURSO DE FORMACION ESTADISTICA CHEMO MANUAL DE STATGRAPHICS I. INTRODUCCIÓN Y MANEJO DE DATOS Curso de Formación Estadistica. CHEMO Manual de Statgraphics 1 INTRODUCCION

Más detalles

Anexo No. 02 FICHA TECNICA FONDO FINANCIERO DE PROYECTOS DE DESARROLLO FONADE

Anexo No. 02 FICHA TECNICA FONDO FINANCIERO DE PROYECTOS DE DESARROLLO FONADE Anexo No. 02 FICHA TECNICA FONDO FINANCIERO DE PROYECTOS DE DESARROLLO FONADE Unidad Administrativa Especial de Gestión Pensional y Contribuciones Parafiscales de la Protección Social UGPP Objeto: ADQUISICIÓN

Más detalles

Instalación del programa PSPP y obtención de una distribución de frecuencias.

Instalación del programa PSPP y obtención de una distribución de frecuencias. Práctica 2. Instalación del programa PSPP y obtención de una distribución de frecuencias. Con esta práctica instalaremos el programa PSPP. El programa es un software específico para el análisis estadístico

Más detalles

Introducción al SPSS/PC. 1. El editor de datos. Taller de Estadística

Introducción al SPSS/PC. 1. El editor de datos. Taller de Estadística 1 Taller de Estadística Curso 2oo5/2oo6 Introducción al SPSS/PC SPSS: Statistical Package for the Social Sciences. Este programa estadístico está organizado en dos bloques: el editor de datos y el visor

Más detalles

Aplicaciones de Estadística Descriptiva

Aplicaciones de Estadística Descriptiva Aplicaciones de Estadística Descriptiva Contenidos de la presentación Funciones estadísticas en Excel. Gráficos. El módulo de análisis de datos y las tablas dinámicas de Excel. Información Intentaremos

Más detalles

Pág. 7 de 11. SPSS Inc. desarrolla un módulo básico del paquete estadístico SPSS, del que han aparecido las siguientes versiones:

Pág. 7 de 11. SPSS Inc. desarrolla un módulo básico del paquete estadístico SPSS, del que han aparecido las siguientes versiones: Pág. 7 de 11 SPSS Historia Fue creado en 1968 por Norman H. Nie, C. Hadlai (Tex) Hull y Dale H. Bent. Entre 1969 y 1975 la Universidad de Chicago por medio de su National Opinion Research Center estuvo

Más detalles

RClimTool MANUAL DEL USUARIO

RClimTool MANUAL DEL USUARIO RClimTool MANUAL DEL USUARIO Lizeth Llanos Herrera, estudiante de Estadística Esta herramienta ha sido diseñada para el apoyo, automatización de procesos y análisis de series climáticas dentro del convenio

Más detalles

Instalación e introducción al software estadístico R y la librería R-Commander. Estadística descriptiva.

Instalación e introducción al software estadístico R y la librería R-Commander. Estadística descriptiva. Instalación e introducción al software estadístico R y la librería R-Commander. Estadística descriptiva. Botella-Rocamora, P.; Alacreu-García, M.; Martínez-Beneito, M.A. ÍNDICE Página 1. Instalación e

Más detalles

2. Seleccionar Insertar función:

2. Seleccionar Insertar función: Estadística I Curso 2014/2015 Guión de la Práctica 1 Introducción a la Estadística con Excel; Estadística Descriptiva En el siguiente guión vamos a ver cómo realizar Estadística Descriptiva con el software

Más detalles

ANÁLISIS DESCRIPTIVO CON SPSS

ANÁLISIS DESCRIPTIVO CON SPSS ESCUELA SUPERIOR DE INFORMÁTICA Prácticas de Estadística ANÁLISIS DESCRIPTIVO CON SPSS 1.- INTRODUCCIÓN Existen dos procedimientos básicos que permiten describir las propiedades de las distribuciones:

Más detalles

Estadística: conceptos básicos y definiciones.

Estadística: conceptos básicos y definiciones. Estadística: conceptos básicos y definiciones. 1 Conceptos básicos 2 Conceptos básicos cont. 3 Conceptos básicos cont. 4 Conceptos básicos cont. 5 Conceptos básicos cont. 6 Definición de Estadística La

Más detalles

MANUAL MOODLE 2.5.2 Tabla de Contenido

MANUAL MOODLE 2.5.2 Tabla de Contenido MANUAL MOODLE 2.5.2 Tabla de Contenido 1. Cómo ingresar y registrarse en la plataforma moodle?... 2 2. Cómo editar el perfil de usuario?... 6 3. Cómo crear un curso en moodle?... 8 4. Cómo crear un VOKI...

Más detalles

Manual del Usuario. Requisitos del Sistema

Manual del Usuario. Requisitos del Sistema Manual del Usuario Requisitos del Sistema Para poder consultar la información estadística del SISTEMA DE ANALISIS DINAMICO DE LA INFORMACION es necesario contar en su equipo con los siguientes requisitos:

Más detalles

Guía del usuario. Tabla de contenido. 1. Introducción 2

Guía del usuario. Tabla de contenido. 1. Introducción 2 Guía del usuario Tabla de contenido 1. Introducción 2 2. Producir un reporte 3 2.1 El árbol de criterios de selección... 3 2.2 La selección de características y cantidades... 4 3. Filtrar variables 6 3.1

Más detalles

Análisis estadístico con Microsoft Excel

Análisis estadístico con Microsoft Excel Análisis estadístico con Microsoft Excel Microsoft Excel ofrece un conjunto de herramientas para el análisis de los datos (denominado Herramientas para análisis) con el que podrá ahorrar pasos en el desarrollo

Más detalles

ESCUELA SUPERIOR DE INFORMATICA Prácticas de Estadística UNA SESIÓN EN SPSS

ESCUELA SUPERIOR DE INFORMATICA Prácticas de Estadística UNA SESIÓN EN SPSS UNA SESIÓN EN SPSS INTRODUCCIÓN. SPSS (Statistical Product and Service Solutions) es un paquete estadístico orientado, en principio, al ámbito de aplicación de las Ciencias sociales, es uno de las herramientas

Más detalles

Estadística I. Finanzas y Contabilidad

Estadística I. Finanzas y Contabilidad Estadística I. Finanzas y Contabilidad Práctica 1: INTRODUCCIÓN AL USO DE SOFTWARE ESTADÍSTICO OBJETIVO: Los estudiantes deberán conocer el funcionamiento de la Hoja de Cálculo EXCEL y utilizarla para

Más detalles

INSTALACION VIRTUALIZADA DE UBUNTU SERVER CON SERVICIOS LAMP Y OPENSSH SOBRE VIRTUAL BOX. Nicolás Botero Botero Juan Manuel Velásquez Isaza

INSTALACION VIRTUALIZADA DE UBUNTU SERVER CON SERVICIOS LAMP Y OPENSSH SOBRE VIRTUAL BOX. Nicolás Botero Botero Juan Manuel Velásquez Isaza INSTALACION VIRTUALIZADA DE UBUNTU SERVER CON SERVICIOS LAMP Y OPENSSH SOBRE VIRTUAL BOX Nicolás Botero Botero Juan Manuel Velásquez Isaza Universidad Tecnológica de Pereira Facultad de Ingenierías Ingeniería

Más detalles

Anexo 4. Herramientas Estadísticas

Anexo 4. Herramientas Estadísticas Anexo 4 Herramientas Estadísticas La estadística descriptiva es utilizada como una herramienta para describir y analizar las características de un conjunto de datos, así como las relaciones que existen

Más detalles

KNime. KoNstanz Information MinEr. KNime - Introducción. KNime - Introducción. Partes de la Herramienta. Editor Window. Repositorio de Nodos

KNime. KoNstanz Information MinEr. KNime - Introducción. KNime - Introducción. Partes de la Herramienta. Editor Window. Repositorio de Nodos KNime - Introducción KNime Significa KoNstanz Information MinEr. Se pronuncia [naim]. Fue desarrollado en la Universidad de Konstanz (Alemania). Esta escrito en Java y su entorno grafico esta desarrollado

Más detalles

1 Introducción al SPSS

1 Introducción al SPSS Breve guión para las prácticas con SPSS 1 Introducción al SPSS El programa SPSS está organizado en dos bloques: el editor de datos y el visor de resultados. En la barra de menú (arriba de la pantalla)

Más detalles

Parámetros y estadísticos

Parámetros y estadísticos Parámetros y estadísticos «Parámetro»: Es una cantidad numérica calculada sobre una población y resume los valores que esta toma en algún atributo Intenta resumir toda la información que hay en la población

Más detalles

Menú Insertar Celda Inserta una o varias filas o columna o un rango de celdas en blanco equivalente en tamaño y forma al rango de celdas

Menú Insertar Celda Inserta una o varias filas o columna o un rango de celdas en blanco equivalente en tamaño y forma al rango de celdas Menú Insertar Celda Inserta una o varias filas o columna o un rango de celdas en blanco equivalente en tamaño y forma al rango de celdas seleccionado, o inserta una selección a la que previamente se le

Más detalles

Capítulo 10. Análisis descriptivo: Los procedimientos Frecuencias y Descriptivos

Capítulo 10. Análisis descriptivo: Los procedimientos Frecuencias y Descriptivos Capítulo 10 Análisis descriptivo: Los procedimientos Frecuencias y Descriptivos Al analizar datos, lo primero que conviene hacer con una variable es, generalmente, formarse una idea lo más exacta posible

Más detalles

El programa Minitab: breve introducción a su funcionamiento. Para mostrar la facilidad con la que se pueden realizar los gráficos y cálculos

El programa Minitab: breve introducción a su funcionamiento. Para mostrar la facilidad con la que se pueden realizar los gráficos y cálculos El programa Minitab: breve introducción a su funcionamiento Para mostrar la facilidad con la que se pueden realizar los gráficos y cálculos estadísticos en la actualidad, el libro se acompaña, en todo

Más detalles

APLICACIONES DE LA HOJA DE CÁLCULO EXCEL A LA ESTADÍSTICA. Llorente, F. Marín, S. Carrillo, M

APLICACIONES DE LA HOJA DE CÁLCULO EXCEL A LA ESTADÍSTICA. Llorente, F. Marín, S. Carrillo, M APLICACIONES DE LA HOJA DE CÁLCULO EXCEL A LA ESTADÍSTICA Llorente, F. Marín, S. Carrillo, M INDICE Introducción... 3 Nociones de utilización del Excel... 4 Tablas Dinámicas...16 Análisis de datos...34

Más detalles

TEMA 7 ANÁLISIS DE DATOS: INTRODUCCIÓN AL SPSS

TEMA 7 ANÁLISIS DE DATOS: INTRODUCCIÓN AL SPSS TEMA 7 ANÁLISIS DE DATOS: INTRODUCCIÓN AL SPSS 1. Introducción 2. Definición de variables 3. Introducción de los datos 4. Análisis de los datos 5. Otras utilidades 1. INTRODUCCIÓN El SPSS es un paquete

Más detalles

ÍNDICE. Introducción... Capítulo 1. El concepto de Data Mining... 1

ÍNDICE. Introducción... Capítulo 1. El concepto de Data Mining... 1 ÍNDICE Introducción... XV Capítulo 1. El concepto de Data Mining... 1 Introducción... 1 Una definición de Data Mining... 3 El proceso de Data Mining... 6 Selección de objetivos... 8 La preparación de los

Más detalles

Tutorial: Uso básico de RapidMiner

Tutorial: Uso básico de RapidMiner Introducción Tutorial: Uso básico de RapidMiner En el mundo de la minería de datos (Data Mining) es imprescindible contar con software especializado que permita trabajar los datos para alcanzar los objetivos

Más detalles

Ejercicio Tutorial UCINET VI

Ejercicio Tutorial UCINET VI Ejercicio Tutorial UCINET VI Curso de Especialización en Análisis y Gestión de Redes Sociales José Ignacio Porras Mayo 2005 UCINET 6 for Windows Version 6.26 / 30 May 2003 NetDraw1.0: Copyright 2002 -----

Más detalles

Ambiente de trabajo. Tutorial Ambiente de Trabajo en InfoStat ARCHIVO

Ambiente de trabajo. Tutorial Ambiente de Trabajo en InfoStat ARCHIVO Ambiente de trabajo InfoStat ofrece distintas herramientas para explorar su información de manera sencilla, intuitiva y amigable. Al abrir InfoStat, se visualizará una barra de herramientas localizada

Más detalles

Sistema Inteligente de Exploración

Sistema Inteligente de Exploración Observatorio Municipal de Estadística Sistema Inteligente de Exploración Capítulos 1. Consideraciones iniciales y requerimientos... 2 2. Navegación... 3 3. Consulta de indicadores... 5 3.1. Elaboración

Más detalles

UNIVERSIDAD CARLOS III DE MADRID MASTER EN CALIDAD TOTAL MANUAL DE SPSS

UNIVERSIDAD CARLOS III DE MADRID MASTER EN CALIDAD TOTAL MANUAL DE SPSS UNIVERSIDAD CARLOS III DE MADRID MASTER EN CALIDAD TOTAL MANUAL DE SPSS I. INTRODUCCIÓN Y MANEJO DE DATOS MANUAL DE SPSS 1 MASTER CALIDAD TOTAL 1/ INTRODUCCIÓN Las aplicaciones de la Estadística en la

Más detalles

CA Nimsoft Monitor Snap

CA Nimsoft Monitor Snap CA Nimsoft Monitor Snap Guía de configuración de Monitor de respuestas de SQL Serie de sql_response 1.6 Aviso de copyright de CA Nimsoft Monitor Snap Este sistema de ayuda en línea (el "Sistema") se proporciona

Más detalles

MANUAL SIMPLIFICADO DE ESTADÍSTICA APLICADA VIA SPSS

MANUAL SIMPLIFICADO DE ESTADÍSTICA APLICADA VIA SPSS 1 MANUAL SIMPLIFICADO DE ESTADÍSTICA APLICADA VIA SPSS Medidas de tendencia central Menú Analizar: Los comandos del menú Analizar (Estadística) ejecutan los procesamientos estadísticos. Sus comandos están

Más detalles

DYANE Versión 4 Diseño y Análisis de Encuestas

DYANE Versión 4 Diseño y Análisis de Encuestas DYANE Versión 4 Diseño y Análisis de Encuestas Miguel Santesmases Mestre 1. DESCRIPCIÓN GENERAL DEL PROGRAMA DYANE 1. FINALIDAD Y MÉTODO DEL PROGRAMA DYANE (Diseño y Análisis de Encuestas) es un programa

Más detalles

Delphos Portal GUÍA PARA LA CONSULTA DE LA INFORMACIÓN SOBRE PÉRDIDAS OCASIONADAS POR EVENTOS NATURALES MÓDULO DE PÉRDIDAS

Delphos Portal GUÍA PARA LA CONSULTA DE LA INFORMACIÓN SOBRE PÉRDIDAS OCASIONADAS POR EVENTOS NATURALES MÓDULO DE PÉRDIDAS Delphos Portal GUÍA PARA LA CONSULTA DE LA INFORMACIÓN SOBRE PÉRDIDAS OCASIONADAS POR EVENTOS NATURALES MÓDULO DE PÉRDIDAS Índice Aplicación Delphos Portal... 3 Consulta de la Información... 4 1. Información

Más detalles

Apéndice 5 Manual de usuario de ColeXión. ColeXión 1.0. Manual de usuario

Apéndice 5 Manual de usuario de ColeXión. ColeXión 1.0. Manual de usuario Apéndice 5 Manual de usuario de ColeXión ColeXión 1.0 Manual de usuario Índice 1. Qué es ColeXión?... 2 2. Requerimientos del sistema... 3 3. Instalación de ColeXión... 3 4. Creación de un nuevo esquema...

Más detalles

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL Objetivo terminal: Calcular e interpretar medidas de tendencia central para un conjunto de datos estadísticos. Objetivos específicos: 1. Mencionar las características

Más detalles

Formato condicional... 3. Herramientas para el manejo de datos... 4. Tablas (Listas)... 4. Subtotales... 6. Filtros Avanzados... 7

Formato condicional... 3. Herramientas para el manejo de datos... 4. Tablas (Listas)... 4. Subtotales... 6. Filtros Avanzados... 7 Contenido Formato condicional... 3 Herramientas para el manejo de datos... 4 Tablas (Listas)... 4 Subtotales... 6 Filtros Avanzados... 7 Validación de datos... 9 Consolidar datos... 12 Análisis Y si...

Más detalles

Otras medidas descriptivas usuales

Otras medidas descriptivas usuales Tema 7 Otras medidas descriptivas usuales Contenido 7.1. Introducción............................. 1 7.2. Medidas robustas.......................... 2 7.2.1. Media recortada....................... 2 7.2.2.

Más detalles

PRESENTACIÓN, DISCUSIÓN Y ANALISIS DE LOS RESULTADOS

PRESENTACIÓN, DISCUSIÓN Y ANALISIS DE LOS RESULTADOS UNIVERSIDAD DE LOS ANDES FACULTAD DE ODONTOLOGIA MERIDA EDO. MERIDA PRESENTACIÓN, DISCUSIÓN Y ANALISIS DE LOS RESULTADOS Mérida, Febrero 2010. Integrantes: Maria A. Lanzellotti L. Daniela Paz U. Mariana

Más detalles

[Manual de Instalación y Uso]

[Manual de Instalación y Uso] Todos los derechos reservados Aranda Software www.arandasoft.com [1] Introducción Aranda SELF SERVICE es una base de conocimientos desarrollada para consultar y administrar información técnica con todos

Más detalles

MANUAL DE USUARIO CONTABILIDAD ELECTRÓNICA FACTURADOR ELECTRÓNICO

MANUAL DE USUARIO CONTABILIDAD ELECTRÓNICA FACTURADOR ELECTRÓNICO MANUAL DE USUARIO CONTABILIDAD ELECTRÓNICA FACTURADOR ELECTRÓNICO Índice 1. Catálogo de cuentas 1.1 Acceder al catálogo de cuentas 1.2 Crear cuenta de mayor Figura 1.2.2 Barra de tipos de cuentas, el tipo

Más detalles

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN)

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) CLASIFICACIÓN NO SUPERVISADA CLUSTERING Y MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) info@clustering.50webs.com Indice INTRODUCCIÓN 3 RESUMEN DEL CONTENIDO 3 APRENDIZAJE

Más detalles

Ministerio de Educación. Base de datos en la Enseñanza. Open Office. Módulo 5: Report Builder

Ministerio de Educación. Base de datos en la Enseñanza. Open Office. Módulo 5: Report Builder Ministerio de Educación Base de datos en la Enseñanza. Open Office Módulo 5: Report Builder Instituto de Tecnologías Educativas 2011 Informes con Oracle Report Builder En su configuración original, OpenOffice

Más detalles

MANUAL DE USO FILEZILLA

MANUAL DE USO FILEZILLA Manual desarrollado por la Universidad de Jaén, España. http://www.ujaen.es/sci/redes/ftp/filezilla/ 1.- Introducción. MANUAL DE USO FILEZILLA FileZilla es un cliente de FTP desarrollado para la plataforma

Más detalles

Tema: Crear, Modificar y Abrir Conexiones ODBC. Generación de Cubos OLAP Revisado: 2006

Tema: Crear, Modificar y Abrir Conexiones ODBC. Generación de Cubos OLAP Revisado: 2006 1 Jose Ignacio González Gómez. Departamento de Economía Financiera y Contabilidad Universidad de La Laguna www.ecofin.ull.es/users/jggomez. Tema: Crear, Modificar y Abrir Conexiones ODBC. Generación de

Más detalles

Qué es Access? Bases de datos relacionales en Access. Cuando abre Access

Qué es Access? Bases de datos relacionales en Access. Cuando abre Access Qué es Access? Access 2010 es una herramienta de diseño e implementación de aplicaciones de base de datos que se puede usar para realizar un seguimiento de la información importante. Puede conservar los

Más detalles

Haciendo estadística con SPAC-FL y Minitab

Haciendo estadística con SPAC-FL y Minitab Haciendo estadística con SPAC-FL y Minitab Mayo de 2011 Ing. Fernando Tomati Director de Contenidos HLTnetwork S.A. www.hltnetwork.com 1 de 12 HACIENDO ESTADÍSTICA CON SPAC-FL Y MINITAB El uso de las estadísticas

Más detalles

Centro de operación. Uso de lectores de códigos de barra. Ingreso al sistema. General

Centro de operación. Uso de lectores de códigos de barra. Ingreso al sistema. General Centro de operación General Uso de lectores de códigos de barra Es importante destacar que todos los campos de textos donde se permite ingresar códigos de materiales, están habilitados para ser usados

Más detalles

MATERIA: BASE DE DATOS II. GUIA DE LABORATORIO #9. Pág.: 1/ 12 Tema:

MATERIA: BASE DE DATOS II. GUIA DE LABORATORIO #9. Pág.: 1/ 12 Tema: GUIA DE LABORATORIO #9. Pág.: 1/ 12 Tema: Contenido: 1. Objetivos. 2. Entorno teórico. 3. Ejecución de Guía. 4. Actividad Ex aula. 5. Autoevaluación. 6. Bibliografía. Objetivos: Diseño de CUBOS. 1. Desarrolla

Más detalles

Base de datos II Facultad de Ingeniería. Escuela de computación.

Base de datos II Facultad de Ingeniería. Escuela de computación. 2 Base de datos II Facultad de Ingeniería. Escuela de computación. Base de datos II. Guía 9 3 Introducción Este manual ha sido elaborado para orientar al estudiante de Bases de datos II en el desarrollo

Más detalles

Manual de usuario para el lector biométrico EZCLOCK

Manual de usuario para el lector biométrico EZCLOCK Manual de usuario para el lector biométrico EZCLOCK Pasos a seguir para la correcta instalación del equipo 1. Realizar la conexión de alimentación del equipo 2. Inserte una memoria USB o una tarjeta SD

Más detalles

INTRODUCCIÓN a la Web 2.0

INTRODUCCIÓN a la Web 2.0 Acceso plataforma edmodo Para entrar en la plataforma de edmodo, la buscamos en Google y una vez localizada seguimos los siguientes pasos: Nos inscribimos como profesor y comenzamos a rellenar el cuestionario

Más detalles

Conociendo ILWIS. 1.- Ventana principal. Objetivo Conocer las características generales del software ILWIS.

Conociendo ILWIS. 1.- Ventana principal. Objetivo Conocer las características generales del software ILWIS. Conociendo ILWIS Introducción ILWIS o Sistema de Información Integral de Tierra y Agua (Integrated Land and Water Information System en inglés) es un Sistema de Información Geográfica (SIG) y software

Más detalles

DISTRIBUCIÓN NORMAL CON EXCEL Y WINSTATS

DISTRIBUCIÓN NORMAL CON EXCEL Y WINSTATS DISTRIBUCIÓN NORMAL CON EXCEL Y WINSTATS 1) Reseña histórica Abrahan De Moivre (1733) fue el primero en obtener la ecuación matemática de la curva normal. Kart Friedrich Gauss y Márquez De Laplece (principios

Más detalles

Esta es un área donde se ha provisto una gran cantidad de funcionalidades extras en la versión de 2010 vea el apartado 22.6.

Esta es un área donde se ha provisto una gran cantidad de funcionalidades extras en la versión de 2010 vea el apartado 22.6. Unidad 22: Tablas Dinámicas* material 2010* 22.0 Introducción: Esta unidad podría haberse llamado resumir los datos con rapidez. Excel ofrece una herramienta poderosa para crear resúmenes tabulares de

Más detalles

Ministerio de Educación. Base de datos en la Enseñanza. Open Office. Módulo 3: Controles de formulario

Ministerio de Educación. Base de datos en la Enseñanza. Open Office. Módulo 3: Controles de formulario Ministerio de Educación Base de datos en la Enseñanza. Open Office Módulo 3: Controles de formulario Instituto de Tecnologías Educativas 2011 Controles de formulario El control más habitual de un formulario

Más detalles

Guía para trabajar bases de datos con Excel

Guía para trabajar bases de datos con Excel Guía para trabajar bases de datos con Excel Crear una base de datos Una Base de Datos en Excel, denominada lista, es un conjunto de datos organizados en filas o registros, en los cuales la primera fila

Más detalles

Centro de Profesorado Luisa Revuelta (Córdoba) TEMA 6 TABLAS Y GRÁFICOS EN IMPRESS

Centro de Profesorado Luisa Revuelta (Córdoba) TEMA 6 TABLAS Y GRÁFICOS EN IMPRESS Centro de Profesorado Luisa Revuelta (Córdoba) TEMA 6 TABLAS Y GRÁFICOS EN IMPRESS Antes que nada tenemos que hablar de la distinción entre tabla y hoja de cálculo. Una tabla es una estructura formada

Más detalles

Práctica1. Introducción a Microsoft Access. Qué es Access?

Práctica1. Introducción a Microsoft Access. Qué es Access? Práctica1. Introducción a Microsoft Access Los sistemas de información empresariales tienen como misión el proporcionar información precisa en el momento adecuado, tanto para la gestión y realización de

Más detalles

TABLAS DINÁMICAS EXCEL 2007. Manual de Referencia para usuarios. Salomón Ccance CCANCE WEBSITE

TABLAS DINÁMICAS EXCEL 2007. Manual de Referencia para usuarios. Salomón Ccance CCANCE WEBSITE TABLAS DINÁMICAS EXCEL 2007 Manual de Referencia para usuarios Salomón Ccance CCANCE WEBSITE TABLAS DINÁMICAS Una tabla dinámica consiste en el resumen de un conjunto de datos, atendiendo a varios criterios

Más detalles

Sophos Control Center Ayuda

Sophos Control Center Ayuda Sophos Control Center Ayuda Versión: 4.1 Edición: marzo de 2010 Contenido 1 Acerca de Sophos Control Center...3 2 Introducción a Sophos Control Center...4 3 Comprobar que la red se encuentra protegida...8

Más detalles

VISIÓN GENERAL HERRAMIENTAS COMERCIALES

VISIÓN GENERAL HERRAMIENTAS COMERCIALES VISIÓN GENERAL El servidor de MS SQL se ha convertido en un estándar en muchas partes de la América corporativa. Puede manejar volúmenes de datos grandes y se integra bien con otros productos de Microsoft.

Más detalles

Manual de Usuario del

Manual de Usuario del Manual de Usuario del Sistema de Información DevInfo Monitoreo y Evaluación INDICE I. Introducción... 1 Qué es DevInfo?... 1 Objetivos de DevInfo:... 1 I.1 Requerimientos del sistema DEVINFO... 1 I.2 Página

Más detalles

Índice. Acerca de PenReader... 2. Cómo empezar... 2. Ajustes de PenReader... 4. Estándar... 4. Perfiles... 5. Reconocimiento... 6. Registrar...

Índice. Acerca de PenReader... 2. Cómo empezar... 2. Ajustes de PenReader... 4. Estándar... 4. Perfiles... 5. Reconocimiento... 6. Registrar... Índice Acerca de PenReader... 2 Cómo empezar... 2 Ajustes de PenReader... 4 Estándar... 4 Perfiles... 5 Reconocimiento... 6 Registrar... 7 Acerca del programa... 7 Ajustes avanzados de reconocimiento...

Más detalles

UNIVERSIDAD CARLOS III DE MADRID MASTER EN CALIDAD TOTAL PRÁCTICAS DE ESTADÍSTICA I MANUAL DE STATGRAPHICS I. INTRODUCCIÓN Y MANEJO DE DATOS

UNIVERSIDAD CARLOS III DE MADRID MASTER EN CALIDAD TOTAL PRÁCTICAS DE ESTADÍSTICA I MANUAL DE STATGRAPHICS I. INTRODUCCIÓN Y MANEJO DE DATOS UNIVERSIDAD CARLOS III DE MADRID MASTER EN CALIDAD TOTAL PRÁCTICAS DE ESTADÍSTICA I MANUAL DE STATGRAPHICS I. INTRODUCCIÓN Y MANEJO DE DATOS Master en Calidad Total Estadística Manual de Stagraphics 1

Más detalles

Bienvenidos a la 1ª lección del curso de AutoCAD (2d)

Bienvenidos a la 1ª lección del curso de AutoCAD (2d) Lección 1: Introducción a AutoCAD 2D Descargar PDF >>> Bienvenidos a la 1ª lección del curso de AutoCAD (2d) En este curso romperemos con ese mito de que AutoCAD es una aplicación difícil de aprender y

Más detalles

En esta segunda y última parte de la unidad veremos algunas de las funciones

En esta segunda y última parte de la unidad veremos algunas de las funciones Semana 6 Presentación En esta segunda y última parte de la unidad veremos algunas de las funciones más importantes de Microsoft PowerPoint, entre ellas: la creación y el trabajo con gráficos y animaciones,

Más detalles

GEOGEBRA COMO RECURSO PARA UNAS NUEVAS MATEMÁTICAS ESTADÍSTICA CON GEOGEBRA

GEOGEBRA COMO RECURSO PARA UNAS NUEVAS MATEMÁTICAS ESTADÍSTICA CON GEOGEBRA GEOGEBRA COMO RECURSO PARA UNAS NUEVAS MATEMÁTICAS ESTADÍSTICA CON GEOGEBRA Virgilio Gómez Rubio Mª José Haro Delicado Baeza 2014 1 ESTADÍSTICA DESCRIPTIVA 2 Estadística descriptiva 1. El puntaje de Apgar

Más detalles

Weka como herramienta de data mining

Weka como herramienta de data mining Weka como herramienta de data mining Lic. Aldave Rojas Isaac Alberto Instituto Tecnológico Superior de Ciudad Serdán Abstract El presente trabajo muestra un ejemplo introductorio a la herramienta de Data

Más detalles

INTRODUCCIÓN A MOODLE

INTRODUCCIÓN A MOODLE INTRODUCCIÓN A MOODLE ÍNDICE 1. Conocer la plataforma Moodle 1.1 Características de Moodle 2. Acceder a Moodle 2.1 Acceder y modificar nuestro perfil 2.2 Editar perfil de usuario 3. Descripción de la interfaz

Más detalles

Atlas de la Edificación Residencial en España. Manual de Ayuda y Guía Práctica. (Edición de Enero de 2013) Ministerio de Fomento

Atlas de la Edificación Residencial en España. Manual de Ayuda y Guía Práctica. (Edición de Enero de 2013) Ministerio de Fomento Atlas de la Edificación Residencial en España Manual de Ayuda y Guía Práctica (Edición de Enero de 2013) Ministerio de Fomento INDICE: 1.- QUÉ ES EL ATLAS DE LA EDIFICACIÓN RESIDENCIAL EN ESPAÑA? 2.- QUÉ

Más detalles

Cómo se usa Data Mining hoy?

Cómo se usa Data Mining hoy? Cómo se usa Data Mining hoy? 1 Conocer a los clientes Detectar segmentos Calcular perfiles Cross-selling Detectar buenos clientes Evitar el churning, attrition Detección de morosidad Mejora de respuesta

Más detalles

Utilizando este botón se pueden crear los diferentes formatos utilizados en cada documento y con su respectivo prefijo.

Utilizando este botón se pueden crear los diferentes formatos utilizados en cada documento y con su respectivo prefijo. COMO MODIFICAR FORMATOS DE IMPRESIÓN FORMATOS Utilizando este botón se pueden crear los diferentes formatos utilizados en cada documento y con su respectivo prefijo. 6.3.9.1 MEDIDAS DEL PAPEL Para estandarizar

Más detalles

SAP Financial Consolidation, diseñador de cubos Versión del documento: 10.1 Support Package 02 2015-12-14. Manual del usuario del diseñador de cubos

SAP Financial Consolidation, diseñador de cubos Versión del documento: 10.1 Support Package 02 2015-12-14. Manual del usuario del diseñador de cubos SAP Financial Consolidation, diseñador de cubos Versión del documento: 10.1 Support Package 02 2015-12-14 Manual del usuario del diseñador de cubos Contenido 1 Novedades en el diseñador de cubos....6 2

Más detalles

Introducción al programa ImageJ Entrenamiento de docentes para el uso efectivo y desarrollo de recursos informáticos en el aula

Introducción al programa ImageJ Entrenamiento de docentes para el uso efectivo y desarrollo de recursos informáticos en el aula Introducción al programa ImageJ Entrenamiento de docentes para el uso efectivo y desarrollo de recursos informáticos en el aula Proyecto de Voluntariado Universitario DQIAQF, FCEN-UBA Autor: Rolando M.

Más detalles

CONECTIVIDAD EN RED MANUAL DEL ADMINISTRADOR

CONECTIVIDAD EN RED MANUAL DEL ADMINISTRADOR CONECTIVIDAD EN RED MANUAL DEL ADMINISTRADOR ESTE DOCUMENTO CONTIENE INFORMACIÓN CONFIDENCIAL, PROPIEDAD INTELECTUAL DE DO ANALYTICS LLC. Y SE ENTREGA CON EL ENTENDIMIENTO DE QUE SE UTILIZARÁ EXCLUSIVAMENTE

Más detalles

MANUAL DE USUARIO SISIN Web

MANUAL DE USUARIO SISIN Web MANUAL DE USUARIO SISIN Web Versión 2.1 Unidad de Sistemas de Información y Registros Viceministerio de Inversión Pública y Financiamiento Externo 14/03/2011 Contenido 1 INGRESO AL SISTEMA 1 1.1 Certificación

Más detalles

AcadSuite. Módulo de gestión y consulta para docentes de Establecimientos educativos que cuentan con la plataforma de registro Académico 9 Net

AcadSuite. Módulo de gestión y consulta para docentes de Establecimientos educativos que cuentan con la plataforma de registro Académico 9 Net Página 1 AcadSuite Módulo de gestión y consulta para docentes de Establecimientos educativos que cuentan con la plataforma de registro Académico 9 Net Versión 9.2 XaraSoft. Ingeniería de Software c. 1986-2015

Más detalles

Instalación del programa PSPP y obtención de una distribución de frecuencias.

Instalación del programa PSPP y obtención de una distribución de frecuencias. Práctica 2. Instalación del programa PSPP y obtención de una distribución de frecuencias. Con esta práctica instalaremos el programa PSPP. El programa es un software específico para el análisis estadístico

Más detalles

1 Ejemplo de análisis descriptivo de un conjunto de datos

1 Ejemplo de análisis descriptivo de un conjunto de datos 1 Ejemplo de análisis descriptivo de un conjunto de datos 1.1 Introducción En este ejemplo se analiza un conjunto de datos utilizando herramientas de estadística descriptiva. El objetivo es repasar algunos

Más detalles

2. Entorno de trabajo y funcionalidad en Arquímedes

2. Entorno de trabajo y funcionalidad en Arquímedes 2. Entorno de trabajo y funcionalidad en Arquímedes 2.20. Servidor de bases de datos de Arquímedes... 1 2.20.1. Ejemplo de trabajo con una base de datos remota... 14 2.20. Servidor de bases de datos de

Más detalles

nual del Usuario VII

nual del Usuario VII nual del Usuario VII Manual de Usuario del DataCenter Programa de adquisición de datos P/N: QDD 001 ESP Rev. 02 Junio 2011 Índice DataCenter Capitulo 1 Primeros Pasos 1.1 El entorno 6 1.1.1 Botones de

Más detalles

Ayuda en línea de la aplicación Cisco Unified Intelligence Center

Ayuda en línea de la aplicación Cisco Unified Intelligence Center Primera publicación: December 12, 2013 Americas Headquarters Cisco Systems, Inc. 170 West Tasman Drive San Jose, CA 95134-1706 USA http://www.cisco.com Tel: 408 526-4000 800 553-NETS (6387) Fax: 408 527-0883

Más detalles

Introducción a la Estadística con Excel

Introducción a la Estadística con Excel Introducción a la Estadística con Excel En el siguiente guión vamos a introducir el software Excel 2007 y la manera de trabajar con Estadística Descriptiva. Cargar o importar datos En Excel 2007 podemos

Más detalles

INSTALACIÓN DE SQL SERVER 2008 Y SQL SERVER 2008 EXPRESS

INSTALACIÓN DE SQL SERVER 2008 Y SQL SERVER 2008 EXPRESS INSTALACIÓN DE SQL SERVER 2008 Y SQL SERVER 2008 EXPRESS Para instalar este motor de base de datos, SQL Express 2008 requiere de los siguientes prerrequisitos: 1. Microsoft.net Framework 3.5 2. Microsoft

Más detalles

Anexo 11. Manual de Administración

Anexo 11. Manual de Administración PONTIFICIA UNIVERSIDAD JAVERIANA Anexo 11. Manual de Administración Para mantenimiento a los modelos y código fuente Alex Arias 28/05/2014 El presente documento muestra los requerimientos necesarios para

Más detalles