DANIEL. Directora: SEDE MEDELLÍN

Tamaño: px
Comenzar la demostración a partir de la página:

Download "DANIEL. Directora: SEDE MEDELLÍN"

Transcripción

1 MINERÍA DE DATOS EN EL PAQUETE RATTLE DEL LENGUAJE R. DANIEL TUTTLE OSPINA Trabajo de Grado para optar el título de Ingeniero de Sistemas e Informática Directora: Claudia Jiménez Ramírez Escuela de Sistemas UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MEDELLÍN FACULTAD DE MINAS

2 TABLA DE CONTENIDO 1. Introducción 2. La minería de datos 3. Instalación de Rattle 4. Cargando datos 5. Explorando los datos 6. Transformando los datos 7. Análisis de clúster 8. Análisis de asociación 9. Creando modelos 10. Evaluando modelos 11. Revisando el registro 12. Propuestas y conclusiones

3 1. Introducción R es un lenguaje y un entorno diseñado para análisis estadístico. Fue desarrollado por Robert Gentleman y Ross Ihaka del Departamento de Estadística de la Universidad de Auckland en R se distribuye bajo la licencia GNU GPL y está disponible para los sistemas operativos Windows, Macintosh, Unix y GNU/Linux. R provee una gran variedad de técnicas gráficas y estadísticas como: modelos lineales y no lineales, pruebas estadísticas clásicas, análisis de series temporales, clasificación, agrupación entre otras [1]. Rattle (del inglés, R Analytical Tool to Learn Easily) es un paquete de software libre desarrollado por Togaware que proporciona una interfaz gráfica basada en Gnome para la minería de datos desarrollada en el lenguaje de programación R. Este paquete proporciona una interfaz intuitiva que guía con facilidad a través de los pasos básicos de la minería de datos y nos ilustra el código de R que se utiliza para lograr nuestro estudio sobre los datos [2]. Hoy en día Rattle es utilizado por un gran número de empresas gubernamentales y comerciales alrededor del mundo. También es usado con fines educativos donde ha sido la principal herramienta usada en universidades como Harbin Institute of Technology, Shenzhen Graduate School, y por la Universidad Nacional de Australia [2]. Este trabajo tiene como objetivo ser una guía que apoye el proceso de aprendizaje del curso Técnicas en Aprendizaje Estadístico, la cual trata de dar a conocer una herramienta que puede ser útil para que los estudiantes pongan en práctica todos los conocimientos adquiridos en el curso. En este caso Rattle y el lenguaje R tienen la ventaja de ser un producto de software libre lo cual facilita el acceso por parte del docente y los estudiantes a esta herramienta que potencializa el conocimiento impartido en el curso.

4 2. La minería de datos La minería de datos es un conjunto de técnicas y tecnologías que permiten analizar grandes colecciones de datos con el fin de encontrar información implícita en éstos, tales como tendencias o reglas que ayuden a entender y expliquen el comportamiento de los datos analizados. La Estadística y la Inteligencia Artificial son la base de la minería de datos y las que permiten la comprensión de los datos.[9] La minería de datos es utilizada con el fin de: Descubrir patrones, relaciones o tendencias en los datos. Describir fenómenos. Obtener resúmenes. Analizar agrupaciones. Realizar predicciones y clasificaciones.[10] Un estudio de minería de datos está compuesto principalmente por 4 etapas: 1. Determinación de objetivos: se plantean los objetivos y hasta donde se quiere llegar con un estudio. 2. Preprocesamiento de los datos: Se seleccionan los datos que son influyentes en el modelo, se limpian y se transforman las variables que sean necesarias con el fin de generar un modelo. Esta es la etapa que demanda más tiempo y la más importante de un estudio ya que de la calidad de los datos depende la calidad del modelo. 3. Determinación del modelo: por medio de la Estadística y medios visuales se analizan los datos con el fin de conocerlos y tener una idea del comportamiento de estos. Luego según los objetivos planteados en la primera etapa y la tarea que debe realizarse se escoge el tipo de modelo que se ajusta a las necesidades y cumple con los requerimientos establecidos. 4. Análisis de los resultados: se verifica la coherencia de los datos y se comparan con los resultados arrojados por los análisis estadísticos. Se determina si el modelo aporta nuevo conocimiento y cumple las expectativas.[9]

5 3. Instalación del paquete Rattle R es un software libre el cual se puede descargar del sitio Web project.org/. Luego de descargarlo e instalarlo se procede a descargar e instalar el paquete Rattle el cual se estudiará en este trabajo. En la Figura 1 se observa la interfaz de R y la opción que se debe ingresar para descargar el paquete Rattle. Figura 1. Instalación Paquetes Luego de seleccionar la opción Instalar paquetes aparece una lista de sitios de descarga (mirrors), donde se encuentran disponibles los paquetes instalables en R. La idea es seleccionar la ubicación más cercana a su localización con el fin de que la descarga de los paquetes sea más eficiente. Después de seleccionar la ubicación del servidor, se listan los paquetes disponibles para descargar, en este caso se busca y se selecciona Rattle. Cuando finalice la descarga en la consola de R se digitan los siguientes comandos con el fin de iniciar Rattle: Library (rattle) // Este comando carga el paquete en memoria. Rattle() // Con esta función se ejecuta y abre lainterfaz gráfica de Rattle.

6 Tras la ejecución de estos comandos se obtiene el resultado mostrado en la Figura 2, que informa la necesidad de descargar otroo paquete llamado RGtk2 para mostrar la interfaz gráfica del usuario. Al final pregunta que si se desea instalar este paquete ahora y ya que el objetivo es utilizar Rattle se escribe la palabra yes. Figura 2. Instalando Paquete RGtk2. Luego de responder si a la anterior pregunta se despliega otra ventana (Figura 3) preguntando algo similar, para instalar este paquete seleccionamos la opción Install GTK+ y luego se presiona OK. Figura 3. Instalación GTK+. Tras la descarga se inicia el instalador de estee paquete, en el proceso de instalaciónn se seleccionan las opciones recomendadas por éste. Cuando finalice la instalación se debe reiniciar R ya que el paquete que se instaló anteriormente lo requería (simplemente se cierra el programa R y se vuelve a abrir). Luego de reiniciar R se ejecutan de nuevo los comandos que se digitaron anteriormente: library (rattle) y rattle(). Durante la ejecución de Rattle pueden aparecer ventanas como la que se muestra a continuación en la Figura 4, informado que se requieren otros paquetes con el fin de que Rattle funcione adecuadamente.

7 Figura 4. Ejemplo de paquete requerido por Rattle. 4. Cargando los datos La información se pueden encontrar en diversos formatos y R brinda la posibilidad de importar datos en muchas de sus formas. Para cargar los datos en la pestaña Datos la cual se puede observar en la Figura 5, se ofrecen las diferentes opciones para realizarr esto. Figura 5. Interfaz para cargar los datos.

8 Dentro de las opciones que ofrece Rattle se tiene: Hoja de cálculo: en la cual se pueden cargar archivos CSV (comma separated values). En este tipo de archivo las columnas que corresponden a cada variable se separan por medio de comas y en algunos casos por punto y coma. ARFF (Attribute Relation File Format): es esencialmente un CSV con un encabezado que describe los metadatos. Este tipo de formato fue desarrollado para trabajar con WEKA. ODBC (Open Database Connectivity): es un estándar desarrollado para acceder a la información almacenada en una base de datos. R permite conexión con las siguientes bases de datos MS/Excel, MS/Access, SQL Server, Oracle, IBM DB2, Teradata, MySQL, Postgres, and SQLite. Conjunto de datos R: esta opción permite cargar datos en Rattle que hayan sido cargados en R. Archivo de datos R: Rattle brinda la posibilidad de cargar archivos nativos de R los cuales por lo general tienen la extensión RDATA. Estos archivos pueden contener varios conjuntos de datos. Librería: en esta opción se tiene acceso a varios conjuntos de datos disponibles en R.[3] Para cargar los datos simplemente se selecciona el tipo de formato que se desea importar, luego se indica la ubicación del archivo y por último se presiona el botón Execute en la parte superior izquierda de la interfaz o simplemente se presiona la tecla F2. En el caso de la bases de datos se especifica el DSN (data source Name). A continuación, se cargarán los datos con los que se trabajará en el resto del documento. Es un archivo CSV el cual contiene la información de un censo realizado es Estados Unidos. Figura 6. Cargando archivo cenus.csv.

9 Figura 7. Opciones de la interfaz. Luego de seleccionar el archivo con los datos, se procede a indicar por cual carácter están separadas las columnas del archivo y cual estamos utilizando como separador decimal. Se activa la opción encabezado para indicar que la primera fila del archivo tiene los nombres de las columnas y en caso de no activar esta opción se crearán nombres al azar. En el cuadro verde de la Figura 7 se resalta la opción de partir los datos, en caso de querer dividir la muestra, se activa el checkbox partición y en la casilla de la derecha se especifican los tamaños de las particiones. La partición por defecto es 70/15/15 lo que significa que el 70% de los datos se utilizan para entrenamiento, 15% para validación y 15% para prueba. También existe la opción de dividir la muestra en solo dos: entrenamiento y validación, simplemente especificando los dos porcentajes 70/30. En la opción semilla se puede indicar el número que será utilizado para generar números aleatorios, donde diferentes semillas generan distintas particiones. Después de ajustar las preferencias se procede a presionar el botón Excecute en la parte superior. El comando que se ejecuta en R para cargar los datos es el siguiente: crs$dataset < read.csv("file:///c:/users/daniel/desktop/recortes/census.csv", sep=";", na.strings=c(".", "NA", "", "?"), strip.white=true, encoding="utf 8")

10 Cuando se cargan los datos, en la parte inferior de Rattle se muestra cada una de las variables que se tenían en el archivo (ver Figura 8). Además se indica el tipo de cada variable el cual puede ser categórico o numérico, el número de elementos faltantes y el número de niveles en cada una. Rattle selecciona también la variable de destino, la cual será la que se cruzará con la demás. Rattle analiza cada variable y las que tengan menos de 5 valores únicos se convierten en candidatas para ser la variable de destino. La lista de candidatas se ordena a partir de la última variable y luego se busca la primera que cumpla con la condiciones para ser candidata. Por lo general la última variable es la de destino. Figura 8. Variables del archivo cargado. Los botones Ver y Editar ubicados a la derecha de la semilla permiten visualizar y editar el archivo. Existe la posibilidad de ignorar las variables que se deseen ya que puede darse el caso en el que éstas no posean información relevante para el análisis. Esto se hace seleccionando la variable y luego presionando el botón rojo de ignorar. Si se desea indicar que una variable es de tipo ID se puede hacer simplemente activando la opción Ident de ésta. Siempre que se realicen cambios sobre las variables se debe presionar de nuevo el botón Execute. En la calculadora de peso se puede ingresar una fórmula con el fin de asignarle un peso a cada observación.

11 5. Explorando los datos Una vez cargados los datos y definidos los roles de las variables, se procede a explorar los datos con el fin de conocer más sobre éstos y comprender un poco su comportamiento. Para comenzar con el análisis se selecciona la pestaña Explorar (ver Figura 9). Rattle provee las siguientes opciones: Suma: Presenta un resumen de las variables donde se encuentran estadísticas como la mediana, media, moda y muchas otras. Distribuciones: Se pueden realizar gráficos como histogramas, cajas y bigotes, mosaico entre otros. Correlación: Se realiza un estudio de independencia entre las variables numéricas. Componentes principales: Ofrece información sobre la importancia de las variables para explicar la variación que se encuentra en el conjunto de datos. Interactivo: Ofrece una visualización gráfica de los datos de una manera dinámica. Figura 9. Opciones de la pestaña explorar. Luego de esta pequeña introducción se procederá a realizar el análisis exploratorio de los datos cargados en el punto anterior. Se mostrarán las opciones mencionadas anteriormente. Suma Dentro de esta opción se encuentran diferentes tipos de estadísticos e información que ayudarán a entender un poco sobre los datos. Se procederá entonces a mostrar cada una de la información arrojada por las diferentes opciones dentro del Tipo Suma. Suma A continuación se muestra el resultado obtenido tras ejecutar la opción Suma.

12 Figura 10. Información acerca de las variables. En la primera parte del resultado (ver Figura 10) se observa cada una de las variables donde la columna NAs indica el número de faltantes para cada variable y la columna Levels indica el número de niveles para las variables categóricas. Luego más abajo se observa una tabla con las variables categóricas y sus respectivos niveles (Figura 11).

13 Figura 11. Valores de las variables categóricas. Ya en la última parte del resultado arrojado aparecen ciertas estadísticas de cada variable, en el caso de las numéricas se tiene el valor máximo, el valor mínimo, la media, la mediana y los valores del primer y tercer cuartil (ver Figura 12). Para el caso de las categóricas se muestra la frecuencia para algunos de los niveles. En el caso de tener variables con valores faltantes éstos también se muestran.

14 Figura 12. Última parte del resultado arrojado por la opción Suma.

15 Describir Ahora se analizará otra opción de las 6 que ofrece el Tipo Suma, se seleccionará la opción Describir seguido de Execute. Debido a la longitud de las variables no se presentarán todas. Figura 13. Resultados de la opción Describir. Dependiendo del tipo de variable se observará diferente información sobre la variable. Para las categóricas se tendrá una tabla con la frecuencia relativa y la absoluta. Para las numéricas se muestra la media, los valores más altos y bajos y los valores de los 7 percentiles. Cuando se tienen variables numéricas con pocos niveles aparece la tabla de frecuencias y los 7 percentiles. Todo esto se puede observar en la Figura 13.

16 Básicos Esta opción muestra un buen número de estadísticas para las variables numéricas dentro de las cuales las más importantes son: el número de observaciones, numero de faltantes, valor mínimo, valor máximo, primer y tercer cuartil, media, mediana, la suma de los valores, error estándar de la media, varianza, desviación estándar, asimetría y curtosis (ver Figura 14). Figura 14. Resultado de la opción Básicos.

17 Curtosis En esta opción Rattle arroja el coeficiente de curtosis para cada una de las variables numéricas. Este coeficiente indica la forma de la distribución de los datos con respecto a la distribución normal. Si el coeficiente es menor que 0, es una distribución Platicúrtica es decir que la distribución es más plana o achatada que la normal. Si es igual a 0, es una distribución Mesocúrtica lo que indica que los datos tienen una distribución normal. Y si es mayor que 0 ó Leptocúrtica la distribución de los datos es más apuntada que la normal. Figura 15. Curtosis de las variables numéricas. Analizando las variables de la Figura 15 se observa que salario, ganancias y pérdidas leptocurticas y están demasiado alejadas de tener una distribución normal. son Sesgo El sesgo indica cual cola de la distribución es la más larga. Si el valor es positivo la cola de la derecha es más larga. En caso de ser negativo la cola de la izquierda es más larga y en caso de ser cero se dice que los datos no tienen sesgo. En la Figura 16 se muestra el resultado tras ejecutar la opción Sesgo lo que significa que hay simetría en la distribución de los datos. Figura 16. Sesgo de las variables numéricas.

18 Valores faltantes Figura 17. Tabla de valores faltantes. En la Figura 17 se aprecia la tabla que arroja Rattle para indicar los valores faltantes en cada una de las variables. El recuadro verde indica el número de valores faltantes en cada columna. Un cero debajo de una variable indica que ésta tiene valores faltantes y el número de valores lo da la primera columna, por ejemplo en la columna ganancias el primer cero indica que tiene 148 valores faltantes. El recuadro azul representa la suma de cada fila, los primeros valores indican cuantos ceros hay por fila, y el último valor da el total de valores faltantes en la muestra de datos. Por lo general la primera fila da el número de registros que no tienen valores faltantes, en este caso La segunda se observa que hay 7 registros que les falta el valor en la columna trabajo, en la tercera fila hay 148 registros que no tienen valor en ganancias y en la penúltima existen 27 registros con datos faltantes en país_nac, empleado_en y trabajo.[3] Tabulación cruzada Esta opción nos permite cruzar la variable de destino que seleccionamos al cargar los datos, con las demás variables categóricas. En este caso se muestra en la Figura 18 la variable empleado_en cruzada con la variable MAYOR50K.

19

20 Figura 18. Resultados tabulación cruzada.

21 Distribuciones Ahora se analizará la opción Distribuciones Figura 19. Interfaz Distribuciones. En la interfaz de distribuciones (ver Figura 19) se separan las variables, las numéricas en la parte superior y las categóricas en la inferior. Para las numéricas están disponibles los siguientes diagramas: cajas y bigotes, histograma, distribución acumulada y el de Benford. Para las categóricas los diagramas de barras, puntos y mosaico. También se observa cierta información sobre las variables como el valor mínimo, la mediana, la media y el valor máximo para las numéricas, y para las categóricas el número de niveles. En la parte superior se puede escoger cuantos diagramas se desean por página y configurar algunas opciones para el diagrama de Benford.

22 Correlación El análisis de correlación indica que tan relacionadas son dos variables, este análisis solo es para variables numéricas. Hay tres métodos disponibles para hallar la correlación: Pearson, Spearman, Kendall. En este caso se utilizará el de Pearson y se activará la opción Organizado para que organice las variables según la fortaleza de correlación. El resultado se muestra a continuación en la Figura 20. Figura 20. Resultado análisis correlación. Si el coeficiente es igual a 1 existe una correlación positiva perfecta, es decir hay una relación directa entre las variables, cuando una de ellas aumenta la otra también lo hace en proporción constante. Si 0 < coeficiente < 1, existe una correlación positiva. Si es igual a cero, no existe relación lineal. Si 1 < coeficiente < 0, existe una correlación negativa. Si es igual a 1, existe una correlación negativa perfecta, es decir hay una relación inversa entre las variables, cuando una de ellas aumenta la otra disminuye en proporción constante. El resultado del análisis de correlación también viene acompañado de una gráfica, la cual se muestra a continuación en la Figura 21.

23 Figura 21. Gráfico de correlación. El grado de correlación se interpreta según la forma y el color de los elementos en la gráfica. Si el elemento es un círculo perfecto no hay correlación entre las variables. Cada variable está perfectamente correlacionada con ella misma, la perfecta correlación se representa con una línea diagonal. El color rojo indica correlación negativa, el azul positiva y entre más intenso sea el color es mayor la correlación. [3] Rattle también brinda la opción analizar la correlación entre las variables que tienen valores faltantes, para esto de activa la opción Explorar faltantes seguido de presionar el botón Execute.

24 Figura 22. Análisis de correlación entre las variables que posee valores faltantes. En este análisis solo participan las variables que tienen valores faltantes y como se observa en la Figura 22 también aparecen variables categóricas, de igual forma aparece el coeficiente de correlación. Se observa también información de los datos faltantes tales como la cantidad y el porcentaje de cada variable. Tambien se acompaña con un gráfico el cual se muestra a continuación en la Figura 23.

25 Figura 23. Gráfico de correlación entre las variables que poseen valores faltantes. En este grafico se observa que hay un alto grado de correlación entre empleado_en y trabajo, esto quiere decir que en general cuando hay un dato faltante en trabajo también lo hay en empleado_en. Por ultimo también existe la opción de realizar un análisis de correlación jerárquico, para esto se activa la opción jerárquico, esto despliega el gráfico el cual se observa a continuación.

26 Figura 24. Gráfico de correlación jerárquico.

27 6. Transformando los Datos La transformación de los datos es un proceso en el cual se preparan los datos que van a ser estudiados median la minería de datos, por lo tanto el tipo de transformación que se haga depende de la técnica que se vaya a utilizar. [4] Rattle ofrece 4 tipos de transformación los cuales se detallan a continuación: Cambiar escala: dentro de esta opción se pueden realizar diferentes cambios de escala. Recentralizar: centra los datos alrededor de cero, es decir transforma los datos de modo que la media sea 0 y la desviación estándar sea 1. Este término corresponde a normalizar. Escala [0 1]: normaliza los datos en una escala de 0 a 1. Mediana/MAD: cambia la escala de forma que la mediana sea 0 y la desviación absoluta de la mediana sea 1, es una versión más robusta que recentralizar. Registro natural: cambia la escala de los datos por medio de una transformación de logaritmo natural. Matriz: esta transformación es solo para variables numéricas, la variable seleccionada es tratada como una matriz dividiendo cada valor de la matriz por la suma de todos los elementos de la matriz. Intervalo: organiza los valores de la variable dentro de rangos. Figura 25. Interfaz para cambiar la escala de los datos.

28 Atribuir: proporciona diferentes métodos para reemplazar los datos faltantes. Se debe tener cuidado al momento de tratar los datos faltantes ya que se pueden cambiar las distribuciones de las variables y así generar modelos poco adecuados. La traducción correcta de esta opción es imputación. Cero/faltante: Se reemplaza los datos numéricos con 0 y los categóricos con la palabra faltante. Media: reemplaza los valores faltantes con la media. Mediana: llena los datos faltantes con la mediana. Modo: se utiliza la moda para llenar los datos faltantes. Constante: reemplaza los valores faltantes de cierta variable por un valor especificado. Figura 26. Interfaz para manejar los datos faltantes. Recode: se realizan transformaciones sobres las variables, ya sea de su tipo o de su ubicación. Cuantilos (la traducción correcta es cuantiles): divide la variable numérica en categorías con aproximadamente el mismo número de observaciones en cada una de ellas. Kmeans: se utiliza el método Kmeans para basándose en la distancia entre los elementos. dividir la variable numérica en grupos Del mismo ancho: crea grupos del mismo ancho de acuerdo al número de grupos que se le ingrese.

29 Variable indicador: convierte una variable categórica en una colección de variables indicadoras, en donde cada una de estas variables es un nivel de la variable categórica. Para cada observación solo una de estas nuevas variables tendrá el valor de 1 y el resto serán 0. El 1 corresponde al valor actual de la variable categórica original. Unir categorías: Combina múltiples variables categóricas en una sola. Como categórico: Convierte variables numéricas a categóricas Como numérico: Convierte una categórica en una numérica reemplazando cada nivel por el índice numérico del nivel. [3] Figura 27. Interfaz que permite cambiar de tipo las variables. Limpiar: Permite eliminar variables u observaciones. Borrar ignorados: Borra las variables a las que se les haya asignado el rol de ignorar. Borrar seleccionados: Borra las variables que se seleccionen en la lista de abajo. Borrar Faltantes: Borra las variables que contengan valores faltantes. Borrar objs con faltantes: Borra toda observación que contenga valores faltantes.

30 Figura 28. Interfaz para la limpieza de los datos. 7. Análisis de clúster Lo que se busca con este análisis es encontrar agrupaciones dentro de los datos con el fin de observar diferencias o similitudes que contribuyan al entendimiento de los datos. [5]. Por el momento Rattle brinda la posibilidad de realizar el análisis de clústeres mediante dos métodos los cuales solo funcionan con variables numéricas: KMeans: es un método de capa única, el cual divide las observaciones en k grupos, donde k es el número de grupos en los que se desea dividir la muestra. [5] Figura 29. Interfaz para el análisis de clúster con KMeans. En la interfaz se observa el campo Numero de clústers en el cual se indica el número de grupos en el que se dividirán las observaciones, el campo Semilla se ingresa un valor numérico a partir del cual se generarán valores aleatorios y un checkbox Repetir Clústers el cual en caso de estar activado ejecuta el algoritmo KMeans tantas veces como lo indique el numero en el campo Ejecuciones.

31 Luego de correr el algoritmo KMeans Rattle arroja los siguientes resultados (ver figura 30): Figura 30. Resultados del algoritmo KMeans. En esta imagen se observa la cantidad de elementos para cada clúster, la media de cada variable y los centros de cada clúster para las variables. Si se desea más información sobre el análisis el botón Estadísticas se obtiene información como: la entropía, el diámetro, la matriz de separación y mucha más información la cual puede ser de gran utilidad al momento de estudiar los datos. Por otra parte si se quiere una representación gráfica los botones Diagrama de datos y Diagrama discriminante brindan esta posibilidad. Jerárquico: los datos se dividen en subcategorías que se van dividiendo en otras Hasta que se clasifiquen todos los objetos, a diferencia del KMeans no es necesario ingresar el número de grupos de antemano. Figura 31. Interfaz para clúster jerárquico.

32 Para realizar el análisis jerárquico de los datos Rattle permite seleccionar el tipo de distancia que se requiere siendo la euclidiana la predeterminada y también existe la posibilidad de escoger el método de aglomeración el cual Ward es el predeterminado. El campo Número de procesadores hace referencia al número de subprocesos que se ejecutarán paralelamente. [6] Luego de oprimir Execute se tienen las tres mismas opciones: Estadisticas, Diagrama de datos, Diagrama discriminante explicadas anteriormente y además se tiene la opción Dendograma la cual hace una representación gráfica de los datos en forma de árbol y según el Número de clústers se señalan en el dendograma tantos grupos como lo indique el valor de este campo. 8. Análisis de Asociaciones Este análisis busca encontrar relaciones entre la diversas variable de la muestra de datos lo que es muy útil al momento de realizar clasificaciones y predicciones. Rattle brinda una interfaz muy sencilla para realizar el análisis de asociación, en la pestaña Asociada se encuentran las opciones disponibles para realizar dicho análisis. Esta es una interfaz muy sencilla de pocas opciones, donde aparece el checkbox Cestas el cual si se activa ejecuta un análisis de la canasta de mercado, en el cual solo existen dos columnas: una con el ID de la canasta y otra con el nombre del producto. El botón Diagrama de frecuencia presenta un gráfico con los elementos más comunes y usando el valor del soporte. En las opciones Apoyo y Confianza se ingresan el valor mínimo de aceptación para una regla de asociación, es decir solo se elegirán las reglas que tengan un apoyo y una confianza igual o mayor que los valores ingresados en estos campos. Y el botón Mostrar reglas simplemente las muestra, se debe tener en cuenta que los dos botones de esta interfaz solo funcionan después de haber oprimido el botón Execute. La interfaz para este análisis se muestra a continuación en la figura 32. Figura 32. Interfaz para encontrar reglas de asociación. A continuación se mostrarán los resultados arrojados por Rattle con un apoyo y una confianza mínima de 0.5. En la primera parte se muestra un resumen sobre las reglas, donde se observa el número de reglas que en este caso son 20 y luego se muestran diversas estadísticas sobre el soporte o apoyo, la confianza y la elevación (confianza de la regla dividida el soporte de la parte

33 derecha de la regla) [8]. En la segunda parte Rattle nos muestra información sobre la ejecución del algoritmo aprori, la cual no se tratará ya que no presenta información relevante. Figura 33. Resultado arrojado por el algoritmo aprioiri. Al dar click en Mostrar reglas éstas se muestran de la siguiente forma: Figura 34. Reglas de asociación encontradas. Cada regla tiene su soporte, confianza y elevación (lift).

34 9. Creando Modelos Esta es sin duda la parte de mayor importancia en un análisis de minería de datos ya que es donde se construye el modelo que representara el comportamiento de la muestra estudiada y es a partir de este modelo donde se pueden realizar clasificaciones, predicciones y estimaciones. Rattle ofrece la posibilidad de construir una gran variedad de modelos, a continuación se detallarán cada uno de estos y en qué consisten. Árbol: el árbol de decisión es uno de los modelos más comunes en la minería de datos y esto se debe a su facilidad de interpretación. Este modelo funciona para datos numéricos como categóricos. El algoritmo utilizado es rpart el cual es comparable con CART y el ID3/C4. Figura 35. Interfaz para crear un árbol de decisión. Al momento de generar el modelo se pueden ajustar ciertas opciones con el fin de que el modelo se adapte a lo que se desea. El primer cuadro de texto que se observa es División mínima este campo especifica el número mínimo de observaciones que deben existir en un nodo antes de que se realice la división. Cubo mínimo indica el mínimo de observaciones que debe haber en cada hoja del árbol. Profundidad máxima es el número máximo de niveles permitidos en el árbol. Complejidad es un parámetro utilizado para controlar el tamaño del árbol y para seleccionar el tamaño óptimo, si el costo de agregar otra variable al nodo de decisión supera el valor de este parámetro se detiene la construcción del árbol. Previos establece la probabilidad previa para cada clase con el fin de amplificar una clase importante asignándole una mayor probabilidad previa, en caso de tener tres clases se ingresarían las probabilidades de la siguiente forma: 0.3,0.4,0.3. Matriz de pérdida esta es usada para ponderar de diferente forma los errores de clasificación por ejemplo: 0,10,1,0 (TN,FN,FP,TP) esto indica que un FN (false negative) es 10 veces menos deseado que un FP (false positive). Por el último el checkbox Incluir faltantes en caso de activarlo se utilizarán variables suplentes en caso de que hayan valores faltantes. Luego de dar click en Execute podemos ver el árbol gráficamente y las reglas que se generaron. [3] Bosque: este es un modelo donde se crean varios árboles de decisiones, este modelo se usa cuando se tiene bases de datos muy grandes y un gran número de variables de entrada. Cada árbol es construido con un subconjunto de datos aleatorio. El algoritmo utilizado es randomforest el cual no trabaja con variables nominales de más de 32 niveles.

El Programa estadístico R

El Programa estadístico R El Programa estadístico R R es un lenguaje y entorno que permite realizar manipulación de datos, cálculos y gráficos estadísticos, bajo la modalidad de software libre y puede ser instalado en distintos

Más detalles

Clase 2: Estadística

Clase 2: Estadística Clase 2: Estadística Los datos Todo conjunto de datos tiene al menos dos características principales: CENTRO Y DISPERSIÓN Los gráficos de barra, histogramas, de puntos, entre otros, nos dan cierta idea

Más detalles

Clase 2: Estadística

Clase 2: Estadística Clase 2: Estadística Los datos Todo conjunto de datos tiene al menos dos características principales: CENTRO Y DISPERSIÓN Los gráficos de barra, histogramas, de puntos, entre otros, nos dan cierta idea

Más detalles

Statgraphics Centurión

Statgraphics Centurión Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 1 Statgraphics Centurión I.- Nociones básicas El paquete Statgraphics Centurión es un programa para el análisis estadístico que

Más detalles

ANÁLISIS DESCRIPTIVO CON SPSS

ANÁLISIS DESCRIPTIVO CON SPSS ESCUELA SUPERIOR DE INFORMÁTICA Prácticas de Estadística ANÁLISIS DESCRIPTIVO CON SPSS 1.- INTRODUCCIÓN Existen dos procedimientos básicos que permiten describir las propiedades de las distribuciones:

Más detalles

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso 2008-2009

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso 2008-2009 Índice general 2. Presentación del paquete estadístico Statgraphics. Estadística Descriptiva 3 2.1. Ventanas de Statgraphics.................................... 3 2.1.1. Barras de menú, de herramientas

Más detalles

Instalación del programa PSPP y obtención de una distribución de frecuencias.

Instalación del programa PSPP y obtención de una distribución de frecuencias. Práctica 2. Instalación del programa PSPP y obtención de una distribución de frecuencias. Con esta práctica instalaremos el programa PSPP. El programa es un software específico para el análisis estadístico

Más detalles

3. CÁLCULOS Y FORMATOS CONDICIONALES

3. CÁLCULOS Y FORMATOS CONDICIONALES colores, tendremos las opciones Mínima y Máxima, con tres campos cada una: Tipo, Valor y Color. Con este formato podemos crear una regla que le asigne un color al menor valor y otro al mayor, y dé a los

Más detalles

Base de datos II Facultad de Ingeniería. Escuela de computación.

Base de datos II Facultad de Ingeniería. Escuela de computación. Base de datos II Facultad de Ingeniería. Escuela de computación. Introducción Este manual ha sido elaborado para orientar al estudiante de Bases de datos II en el desarrollo de sus prácticas de laboratorios,

Más detalles

Capítulo 10. Análisis descriptivo: Los procedimientos Frecuencias y Descriptivos

Capítulo 10. Análisis descriptivo: Los procedimientos Frecuencias y Descriptivos Capítulo 10 Análisis descriptivo: Los procedimientos Frecuencias y Descriptivos Al analizar datos, lo primero que conviene hacer con una variable es, generalmente, formarse una idea lo más exacta posible

Más detalles

ESCUELA SUPERIOR DE INFORMATICA Prácticas de Estadística UNA SESIÓN EN SPSS

ESCUELA SUPERIOR DE INFORMATICA Prácticas de Estadística UNA SESIÓN EN SPSS UNA SESIÓN EN SPSS INTRODUCCIÓN. SPSS (Statistical Product and Service Solutions) es un paquete estadístico orientado, en principio, al ámbito de aplicación de las Ciencias sociales, es uno de las herramientas

Más detalles

Formato condicional... 3. Herramientas para el manejo de datos... 4. Tablas (Listas)... 4. Subtotales... 6. Filtros Avanzados... 7

Formato condicional... 3. Herramientas para el manejo de datos... 4. Tablas (Listas)... 4. Subtotales... 6. Filtros Avanzados... 7 Contenido Formato condicional... 3 Herramientas para el manejo de datos... 4 Tablas (Listas)... 4 Subtotales... 6 Filtros Avanzados... 7 Validación de datos... 9 Consolidar datos... 12 Análisis Y si...

Más detalles

Con el fin de obtener los datos, se procede con las siguientes instrucciones:

Con el fin de obtener los datos, se procede con las siguientes instrucciones: Capitulo 3. La predicción de beneficios del mercado bursátil Este segundo caso de estudio va más allá en el uso de técnicas de minería de datos. El dominio específico utilizado para ilustrar estos problemas

Más detalles

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL Objetivo terminal: Calcular e interpretar medidas de tendencia central para un conjunto de datos estadísticos. Objetivos específicos: 1. Mencionar las características

Más detalles

2. Seleccionar Insertar función:

2. Seleccionar Insertar función: Estadística I Curso 2014/2015 Guión de la Práctica 1 Introducción a la Estadística con Excel; Estadística Descriptiva En el siguiente guión vamos a ver cómo realizar Estadística Descriptiva con el software

Más detalles

CURSO MINERÍA DE DATOS AVANZADO

CURSO MINERÍA DE DATOS AVANZADO CURSO MINERÍA DE DATOS AVANZADO La minería de datos (en inglés, Data Mining) se define como la extracción de información implícita, previamente desconocida y potencialmente útil, a partir de datos. En

Más detalles

Trabajo final de Ingeniería

Trabajo final de Ingeniería UNIVERSIDAD ABIERTA INTERAMERICANA Trabajo final de Ingeniería Weka Data Mining Jofré Nicolás 12/10/2011 WEKA (Data Mining) Concepto de Data Mining La minería de datos (Data Mining) consiste en la extracción

Más detalles

Tema: Crear, Modificar y Abrir Conexiones ODBC. Generación de Cubos OLAP Revisado: 2006

Tema: Crear, Modificar y Abrir Conexiones ODBC. Generación de Cubos OLAP Revisado: 2006 1 Jose Ignacio González Gómez. Departamento de Economía Financiera y Contabilidad Universidad de La Laguna www.ecofin.ull.es/users/jggomez. Tema: Crear, Modificar y Abrir Conexiones ODBC. Generación de

Más detalles

SofPP Software de Gestión de Salones de Belleza

SofPP Software de Gestión de Salones de Belleza SofPP Software de Gestión de Salones de Belleza Manual de usuario v1.1.1 El propósito de este documento es el de profundizar sobre el uso del programa SofPP al lector, con el fin de facilitar la experiencia

Más detalles

Anexo 4. Herramientas Estadísticas

Anexo 4. Herramientas Estadísticas Anexo 4 Herramientas Estadísticas La estadística descriptiva es utilizada como una herramienta para describir y analizar las características de un conjunto de datos, así como las relaciones que existen

Más detalles

TEMA 7 ANÁLISIS DE DATOS: INTRODUCCIÓN AL SPSS

TEMA 7 ANÁLISIS DE DATOS: INTRODUCCIÓN AL SPSS TEMA 7 ANÁLISIS DE DATOS: INTRODUCCIÓN AL SPSS 1. Introducción 2. Definición de variables 3. Introducción de los datos 4. Análisis de los datos 5. Otras utilidades 1. INTRODUCCIÓN El SPSS es un paquete

Más detalles

RClimTool MANUAL DEL USUARIO

RClimTool MANUAL DEL USUARIO RClimTool MANUAL DEL USUARIO Lizeth Llanos Herrera, estudiante de Estadística Esta herramienta ha sido diseñada para el apoyo, automatización de procesos y análisis de series climáticas dentro del convenio

Más detalles

MANUAL SIMPLIFICADO DE ESTADÍSTICA APLICADA VIA SPSS

MANUAL SIMPLIFICADO DE ESTADÍSTICA APLICADA VIA SPSS 1 MANUAL SIMPLIFICADO DE ESTADÍSTICA APLICADA VIA SPSS Medidas de tendencia central Menú Analizar: Los comandos del menú Analizar (Estadística) ejecutan los procesamientos estadísticos. Sus comandos están

Más detalles

VISIÓN GENERAL HERRAMIENTAS COMERCIALES

VISIÓN GENERAL HERRAMIENTAS COMERCIALES VISIÓN GENERAL El servidor de MS SQL se ha convertido en un estándar en muchas partes de la América corporativa. Puede manejar volúmenes de datos grandes y se integra bien con otros productos de Microsoft.

Más detalles

GENERADOR DE REPORTES. Saint Casa de software Todos los derechos reservados. Contenido. Instrucciones para el Usuario Final 1.

GENERADOR DE REPORTES. Saint Casa de software Todos los derechos reservados. Contenido. Instrucciones para el Usuario Final 1. GENERADOR DE REPORTES Saint Casa de software Todos los derechos reservados Contenido Instrucciones para el Usuario Final 1. CONSULTA RÁPIDA 1 1.1. PANTALLA PRINCIPAL...4 1.2.CLAVE DE ACCESO......4 1.3.

Más detalles

Pág. 7 de 11. SPSS Inc. desarrolla un módulo básico del paquete estadístico SPSS, del que han aparecido las siguientes versiones:

Pág. 7 de 11. SPSS Inc. desarrolla un módulo básico del paquete estadístico SPSS, del que han aparecido las siguientes versiones: Pág. 7 de 11 SPSS Historia Fue creado en 1968 por Norman H. Nie, C. Hadlai (Tex) Hull y Dale H. Bent. Entre 1969 y 1975 la Universidad de Chicago por medio de su National Opinion Research Center estuvo

Más detalles

Parámetros y estadísticos

Parámetros y estadísticos Parámetros y estadísticos «Parámetro»: Es una cantidad numérica calculada sobre una población y resume los valores que esta toma en algún atributo Intenta resumir toda la información que hay en la población

Más detalles

Práctica 2 ESTADÍSTICA DESCRIPTIVA

Práctica 2 ESTADÍSTICA DESCRIPTIVA Práctica 2. Estadística descriptiva 1 Práctica 2 ESTADÍSTICA DESCRIPTIVA Objetivos: En esta práctica utilizaremos el paquete SPSS para calcular estadísticos descriptivos de una muestra. Se representarán

Más detalles

Ambiente de trabajo. Tutorial Ambiente de Trabajo en InfoStat ARCHIVO

Ambiente de trabajo. Tutorial Ambiente de Trabajo en InfoStat ARCHIVO Ambiente de trabajo InfoStat ofrece distintas herramientas para explorar su información de manera sencilla, intuitiva y amigable. Al abrir InfoStat, se visualizará una barra de herramientas localizada

Más detalles

UNIVERSIDAD DON BOSCO FACULTAD DE ESTUDIOS TECNOLÓGICOS

UNIVERSIDAD DON BOSCO FACULTAD DE ESTUDIOS TECNOLÓGICOS UNIVERSIDAD DON BOSCO FACULTAD DE ESTUDIOS TECNOLÓGICOS CICLO: 01/ 2014 Nombre de la Practica: Lugar de Ejecución: Tiempo Estimado: Materia: Docentes: GUIA DE LABORATORIO #08 Gráficos. Importar y exportar

Más detalles

SISTEMA DE CONTROL DE PRESENCIA

SISTEMA DE CONTROL DE PRESENCIA SISTEMA DE CONTROL DE PRESENCIA 1 SISTEMA DE CONTROL DE PRESENCIA 1 1 GENERALIDADES DE LA APLICACIÓN 3 2 SEGURIDAD Y ACCESO AL PROGRAMA 7 2.1 Mantenimiento de usuarios 7 2.2 Perfiles 9 3 GESTIÓN DE EMPRESAS

Más detalles

Introducción a la Estadística con Excel

Introducción a la Estadística con Excel Introducción a la Estadística con Excel En el siguiente guión vamos a introducir el software Excel 2007 y la manera de trabajar con Estadística Descriptiva. Cargar o importar datos En Excel 2007 podemos

Más detalles

Tutorial de Moodle. Actividad Cuestionario

Tutorial de Moodle. Actividad Cuestionario Tutorial de Moodle Actividad Cuestionario Cuestionario Para qué sirve? El Cuestionario es una actividad autoevaluable, en la cual la nota se calcula automáticamente. Sirve al alumno como autoevaluación

Más detalles

Base de Datos REDATAM Censo 2010

Base de Datos REDATAM Censo 2010 Base de Datos REDATAM Censo 2010 29 de marzo 2013 La guía busca mostrar y enseñar a usar la Base de Datos REDATAM disponible en la Web del IX Censo Nacional de Población y Vivienda 2010 de República Dominicana

Más detalles

Introducción al SPSS/PC. 1. El editor de datos. Taller de Estadística

Introducción al SPSS/PC. 1. El editor de datos. Taller de Estadística 1 Taller de Estadística Curso 2oo5/2oo6 Introducción al SPSS/PC SPSS: Statistical Package for the Social Sciences. Este programa estadístico está organizado en dos bloques: el editor de datos y el visor

Más detalles

Otras medidas descriptivas usuales

Otras medidas descriptivas usuales Tema 7 Otras medidas descriptivas usuales Contenido 7.1. Introducción............................. 1 7.2. Medidas robustas.......................... 2 7.2.1. Media recortada....................... 2 7.2.2.

Más detalles

www.pildorasinformaticas.com Página 1

www.pildorasinformaticas.com Página 1 Capítulo 1. CREACIÓN DE BBDD Y VALIDACIÓN DE DATOS... 4 1.1. Crear una BBDD... 4 1.2. Formulario de entrada de datos... 5 1.3. Importación de datos... 7 1.4. Ordenación de registros... 10 1.5. Autofiltros...

Más detalles

Aplicaciones de Estadística Descriptiva

Aplicaciones de Estadística Descriptiva Aplicaciones de Estadística Descriptiva Contenidos de la presentación Funciones estadísticas en Excel. Gráficos. El módulo de análisis de datos y las tablas dinámicas de Excel. Información Intentaremos

Más detalles

El programa Minitab: breve introducción a su funcionamiento. Para mostrar la facilidad con la que se pueden realizar los gráficos y cálculos

El programa Minitab: breve introducción a su funcionamiento. Para mostrar la facilidad con la que se pueden realizar los gráficos y cálculos El programa Minitab: breve introducción a su funcionamiento Para mostrar la facilidad con la que se pueden realizar los gráficos y cálculos estadísticos en la actualidad, el libro se acompaña, en todo

Más detalles

UNIVERSIDAD CARLOS III DE MADRID CURSO DE FORMACION ESTADISTICA CHEMO MANUAL DE STATGRAPHICS I. INTRODUCCIÓN Y MANEJO DE DATOS

UNIVERSIDAD CARLOS III DE MADRID CURSO DE FORMACION ESTADISTICA CHEMO MANUAL DE STATGRAPHICS I. INTRODUCCIÓN Y MANEJO DE DATOS UNIVERSIDAD CARLOS III DE MADRID CURSO DE FORMACION ESTADISTICA CHEMO MANUAL DE STATGRAPHICS I. INTRODUCCIÓN Y MANEJO DE DATOS Curso de Formación Estadistica. CHEMO Manual de Statgraphics 1 INTRODUCCION

Más detalles

INSTALACIÓN DE SQL SERVER 2008 Y SQL SERVER 2008 EXPRESS

INSTALACIÓN DE SQL SERVER 2008 Y SQL SERVER 2008 EXPRESS INSTALACIÓN DE SQL SERVER 2008 Y SQL SERVER 2008 EXPRESS Para instalar este motor de base de datos, SQL Express 2008 requiere de los siguientes prerrequisitos: 1. Microsoft.net Framework 3.5 2. Microsoft

Más detalles

Práctica1. Introducción a Microsoft Access. Qué es Access?

Práctica1. Introducción a Microsoft Access. Qué es Access? Práctica1. Introducción a Microsoft Access Los sistemas de información empresariales tienen como misión el proporcionar información precisa en el momento adecuado, tanto para la gestión y realización de

Más detalles

1 Introducción al SPSS

1 Introducción al SPSS Breve guión para las prácticas con SPSS 1 Introducción al SPSS El programa SPSS está organizado en dos bloques: el editor de datos y el visor de resultados. En la barra de menú (arriba de la pantalla)

Más detalles

Índice. Acerca de PenReader... 2. Cómo empezar... 2. Ajustes de PenReader... 4. Estándar... 4. Perfiles... 5. Reconocimiento... 6. Registrar...

Índice. Acerca de PenReader... 2. Cómo empezar... 2. Ajustes de PenReader... 4. Estándar... 4. Perfiles... 5. Reconocimiento... 6. Registrar... Índice Acerca de PenReader... 2 Cómo empezar... 2 Ajustes de PenReader... 4 Estándar... 4 Perfiles... 5 Reconocimiento... 6 Registrar... 7 Acerca del programa... 7 Ajustes avanzados de reconocimiento...

Más detalles

Manual de Usuario del

Manual de Usuario del Manual de Usuario del Sistema de Información DevInfo Monitoreo y Evaluación INDICE I. Introducción... 1 Qué es DevInfo?... 1 Objetivos de DevInfo:... 1 I.1 Requerimientos del sistema DEVINFO... 1 I.2 Página

Más detalles

Sistema Inteligente de Exploración

Sistema Inteligente de Exploración Observatorio Municipal de Estadística Sistema Inteligente de Exploración Capítulos 1. Consideraciones iniciales y requerimientos... 2 2. Navegación... 3 3. Consulta de indicadores... 5 3.1. Elaboración

Más detalles

Delphos Portal GUÍA PARA LA CONSULTA DE LA INFORMACIÓN SOBRE PÉRDIDAS OCASIONADAS POR EVENTOS NATURALES MÓDULO DE PÉRDIDAS

Delphos Portal GUÍA PARA LA CONSULTA DE LA INFORMACIÓN SOBRE PÉRDIDAS OCASIONADAS POR EVENTOS NATURALES MÓDULO DE PÉRDIDAS Delphos Portal GUÍA PARA LA CONSULTA DE LA INFORMACIÓN SOBRE PÉRDIDAS OCASIONADAS POR EVENTOS NATURALES MÓDULO DE PÉRDIDAS Índice Aplicación Delphos Portal... 3 Consulta de la Información... 4 1. Información

Más detalles

Manual de usuario para el lector biométrico EZCLOCK

Manual de usuario para el lector biométrico EZCLOCK Manual de usuario para el lector biométrico EZCLOCK Pasos a seguir para la correcta instalación del equipo 1. Realizar la conexión de alimentación del equipo 2. Inserte una memoria USB o una tarjeta SD

Más detalles

Tutorial - Parte 2: Scoring

Tutorial - Parte 2: Scoring Introducción Tutorial - Parte 2: Scoring En este segundo tutorial aprenderá lo que significa un modelo de Scoring, verá cómo crear uno utilizando Powerhouse Analytics y finalmente a interpretar sus resultados.

Más detalles

UNIVERSIDAD NACIONAL DE COLOMBIA SEDE DE MEDELLÍN. FACULTAD NACIONAL DE MINAS Escuela de Sistemas

UNIVERSIDAD NACIONAL DE COLOMBIA SEDE DE MEDELLÍN. FACULTAD NACIONAL DE MINAS Escuela de Sistemas UNIVERSIDAD NACIONAL DE COLOMBIA SEDE DE MEDELLÍN FACULTAD NACIONAL DE MINAS Escuela de Sistemas OBJETIVOS: General: Estudiar y utilizar los elementos del entorno de trabajo Visual Basic for Applications

Más detalles

MANUAL MOODLE 2.5.2 Tabla de Contenido

MANUAL MOODLE 2.5.2 Tabla de Contenido MANUAL MOODLE 2.5.2 Tabla de Contenido 1. Cómo ingresar y registrarse en la plataforma moodle?... 2 2. Cómo editar el perfil de usuario?... 6 3. Cómo crear un curso en moodle?... 8 4. Cómo crear un VOKI...

Más detalles

Apéndice 5 Manual de usuario de ColeXión. ColeXión 1.0. Manual de usuario

Apéndice 5 Manual de usuario de ColeXión. ColeXión 1.0. Manual de usuario Apéndice 5 Manual de usuario de ColeXión ColeXión 1.0 Manual de usuario Índice 1. Qué es ColeXión?... 2 2. Requerimientos del sistema... 3 3. Instalación de ColeXión... 3 4. Creación de un nuevo esquema...

Más detalles

Ministerio de Educación. Base de datos en la Enseñanza. Open Office. Módulo 5: Report Builder

Ministerio de Educación. Base de datos en la Enseñanza. Open Office. Módulo 5: Report Builder Ministerio de Educación Base de datos en la Enseñanza. Open Office Módulo 5: Report Builder Instituto de Tecnologías Educativas 2011 Informes con Oracle Report Builder En su configuración original, OpenOffice

Más detalles

2_trabajar con calc I

2_trabajar con calc I Al igual que en las Tablas vistas en el procesador de texto, la interseccción de una columna y una fila se denomina Celda. Dentro de una celda, podemos encontrar diferentes tipos de datos: textos, números,

Más detalles

Manual de Usuario. Extractor Service. www.zktime.eu

Manual de Usuario. Extractor Service. www.zktime.eu Manual de Usuario www.zktime.eu INDICE Página Introducción 1 1. Primeros pasos 1 1.1 Instalación 1 1.2 Finalizando la instalación 2 2. Configuración 3 2.1 Configuración de base de datos 3 2.1.1 Configuración

Más detalles

Introducción al programa ImageJ Entrenamiento de docentes para el uso efectivo y desarrollo de recursos informáticos en el aula

Introducción al programa ImageJ Entrenamiento de docentes para el uso efectivo y desarrollo de recursos informáticos en el aula Introducción al programa ImageJ Entrenamiento de docentes para el uso efectivo y desarrollo de recursos informáticos en el aula Proyecto de Voluntariado Universitario DQIAQF, FCEN-UBA Autor: Rolando M.

Más detalles

Capítulo 17 Análisis de correlación lineal: Los procedimientos Correlaciones bivariadas y Correlaciones parciales

Capítulo 17 Análisis de correlación lineal: Los procedimientos Correlaciones bivariadas y Correlaciones parciales Capítulo 17 Análisis de correlación lineal: Los procedimientos Correlaciones bivariadas y Correlaciones parciales Cuando se analizan datos, el interés del analista suele centrarse en dos grandes objetivos:

Más detalles

2_dar formato al texto / documentos I

2_dar formato al texto / documentos I Es posible ejecutar el comando tantas veces como copias se desee hacer, ya que tras pegar el texto, una copia del mismo sigue en el Portapapeles. Se dispone de varios caminos para llegar a estas opciones:

Más detalles

CÓMO MANEJAR SU NUEVO SITIO WEB SOBRE DRUPAL Manual técnico y de usuario. Pontificia Universidad Javeriana Grupo PSU 2009-1 CDI

CÓMO MANEJAR SU NUEVO SITIO WEB SOBRE DRUPAL Manual técnico y de usuario. Pontificia Universidad Javeriana Grupo PSU 2009-1 CDI CÓMO MANEJAR SU NUEVO SITIO WEB SOBRE DRUPAL Manual técnico y de usuario Pontificia Universidad Javeriana Grupo PSU 2009-1 CDI Sobre Drupal Instalación y configuración Drupal es un sistema de gestión de

Más detalles

Archivo: ITX - Manual de InterXel3-FAQ-03.docx

Archivo: ITX - Manual de InterXel3-FAQ-03.docx Pág. 1 de 57 1. Qué es InterXel3?... 3 2. Dónde obtener los archivos de.. 3 InterXel3?. 3. Cómo instalar InterXel3?. 4. Actualización de InterXel3.. 4.. 8 5. Configuración. a. Tipo de Aranxel 12 13 b.

Más detalles

En esta segunda y última parte de la unidad veremos algunas de las funciones

En esta segunda y última parte de la unidad veremos algunas de las funciones Semana 6 Presentación En esta segunda y última parte de la unidad veremos algunas de las funciones más importantes de Microsoft PowerPoint, entre ellas: la creación y el trabajo con gráficos y animaciones,

Más detalles

DISTRIBUCIÓN NORMAL CON EXCEL Y WINSTATS

DISTRIBUCIÓN NORMAL CON EXCEL Y WINSTATS DISTRIBUCIÓN NORMAL CON EXCEL Y WINSTATS 1) Reseña histórica Abrahan De Moivre (1733) fue el primero en obtener la ecuación matemática de la curva normal. Kart Friedrich Gauss y Márquez De Laplece (principios

Más detalles

KNime. KoNstanz Information MinEr. KNime - Introducción. KNime - Introducción. Partes de la Herramienta. Editor Window. Repositorio de Nodos

KNime. KoNstanz Information MinEr. KNime - Introducción. KNime - Introducción. Partes de la Herramienta. Editor Window. Repositorio de Nodos KNime - Introducción KNime Significa KoNstanz Information MinEr. Se pronuncia [naim]. Fue desarrollado en la Universidad de Konstanz (Alemania). Esta escrito en Java y su entorno grafico esta desarrollado

Más detalles

Haciendo estadística con SPAC-FL y Minitab

Haciendo estadística con SPAC-FL y Minitab Haciendo estadística con SPAC-FL y Minitab Mayo de 2011 Ing. Fernando Tomati Director de Contenidos HLTnetwork S.A. www.hltnetwork.com 1 de 12 HACIENDO ESTADÍSTICA CON SPAC-FL Y MINITAB El uso de las estadísticas

Más detalles

Por qué usar VBA en Excel 2010?

Por qué usar VBA en Excel 2010? Por qué usar VBA en Excel 2010? Microsoft Excel 2010 es una herramienta muy eficaz que se puede usar para manipular, analizar y presentar datos. A veces, no obstante, a pesar del amplio conjunto de características

Más detalles

Análisis estadístico con Microsoft Excel

Análisis estadístico con Microsoft Excel Análisis estadístico con Microsoft Excel Microsoft Excel ofrece un conjunto de herramientas para el análisis de los datos (denominado Herramientas para análisis) con el que podrá ahorrar pasos en el desarrollo

Más detalles

Tabla dinámica. Vamos a crear una tabla dinámica a partir de un conjunto de datos.

Tabla dinámica. Vamos a crear una tabla dinámica a partir de un conjunto de datos. Tabla dinámica Una tabla dinámica consiste en el resumen de un conjunto de datos, atendiendo a uno o varios criterios de agrupación, representado como una tabla de doble entrada que nos facilita la interpretación

Más detalles

La ventana de Microsoft Excel

La ventana de Microsoft Excel Actividad N 1 Conceptos básicos de Planilla de Cálculo La ventana del Microsoft Excel y sus partes. Movimiento del cursor. Tipos de datos. Metodología de trabajo con planillas. La ventana de Microsoft

Más detalles

Guía Rápida de Inicio

Guía Rápida de Inicio Guía Rápida de Inicio 1. Acerca de esta Guía Esta guía le ayudará a instalar y dar los primeros pasos con BitDefender Security for File Servers. Para disponer de instrucciones detalladas, por favor, diríjase

Más detalles

Unicenta software punto de venta gratis para tu empresa

Unicenta software punto de venta gratis para tu empresa Unicenta software punto de venta gratis para tu empresa 1 ÍNDICE 1 Introducción 2 Cómo instalar 3 4 Repositorios de Aplicaciones de Software libre 1 Introducción 3 INTRODUCCIÓN UniCenta es un software

Más detalles

Creación y administración de grupos de dominio

Creación y administración de grupos de dominio Creación y administración de grupos de dominio Contenido Descripción general 1 a los grupos de Windows 2000 2 Tipos y ámbitos de los grupos 5 Grupos integrados y predefinidos en un dominio 7 Estrategia

Más detalles

Manual del Usuario. Requisitos del Sistema

Manual del Usuario. Requisitos del Sistema Manual del Usuario Requisitos del Sistema Para poder consultar la información estadística del SISTEMA DE ANALISIS DINAMICO DE LA INFORMACION es necesario contar en su equipo con los siguientes requisitos:

Más detalles

Análisis de dominancia usando ruby-statsample. Introducción. Instalación de Ruby y gemas. Windows

Análisis de dominancia usando ruby-statsample. Introducción. Instalación de Ruby y gemas. Windows Análisis de dominancia usando ruby-statsample Introducción El análisis de dominancia(azen y Bodescu, 2003), es un método para determinar la importancia relativa de uno o más predictores en comparación

Más detalles

Introducción. La guía para descubrir su oportunidad de ventas. Introducción...2. 1 Introducción...3 1.1 Conexión...3. 1.2 Cómo cambiar su perfil...

Introducción. La guía para descubrir su oportunidad de ventas. Introducción...2. 1 Introducción...3 1.1 Conexión...3. 1.2 Cómo cambiar su perfil... FCA SI2 GUÍA RÁPIDA Introducción...2 1 Introducción...3 1.1 Conexión...3 1.2 Cómo cambiar su perfil...3 1.3 Funciones del sistema...4 2 Cómo?...5 2.1 Informe Navegación...5 2.2 Despliegue por Geografía...5

Más detalles

Operación Microsoft Access 97

Operación Microsoft Access 97 Trabajar con Controles Características de los controles Un control es un objeto gráfico, como por ejemplo un cuadro de texto, un botón de comando o un rectángulo que se coloca en un formulario o informe

Más detalles

CÓMO CREAR NUESTRO CATÁLOGO

CÓMO CREAR NUESTRO CATÁLOGO CÓMO CREAR NUESTRO CATÁLOGO Mediante la aplicación (http://www.prensasoft.com/programas/conline) podemos crear nuestros propios catálogos. Para crear un catálogo necesitamos: - Varios productos que mostrar,

Más detalles

Herramientas Informáticas para la Documentación Práctica 1. Introducción al navegador Netscape

Herramientas Informáticas para la Documentación Práctica 1. Introducción al navegador Netscape Herramientas Informáticas para la Documentación Práctica 1. Introducción al navegador Netscape Introducción y objetivos De modo muy resumido Internet es una red que interconecta redes de ordenadores. Conectándose

Más detalles

MANUAL DE USO FILEZILLA

MANUAL DE USO FILEZILLA Manual desarrollado por la Universidad de Jaén, España. http://www.ujaen.es/sci/redes/ftp/filezilla/ 1.- Introducción. MANUAL DE USO FILEZILLA FileZilla es un cliente de FTP desarrollado para la plataforma

Más detalles

Mini Curso Excel 1. HOJAS DE CÁLCULO

Mini Curso Excel 1. HOJAS DE CÁLCULO Mini Curso Excel El siguiente documento ha sido tomado con permiso desde GuillermoDiaz.com y adaptado para ser utilizado con Microsoft Excel 2003 y en coherencia con los contenidos expuestos en el laboratorio.

Más detalles

Prácticas de programación en C con MinGW Developer Studio

Prácticas de programación en C con MinGW Developer Studio Prácticas de programación en C con MinGW Developer Studio MinGW Developer Studio es un entorno de desarrollo integrado (IDE) para la programación en lenguaje C gratuito y cómodo de usar. Se ejecuta en

Más detalles

CA Nimsoft Monitor Snap

CA Nimsoft Monitor Snap CA Nimsoft Monitor Snap Guía de configuración de Monitor de respuestas de SQL Serie de sql_response 1.6 Aviso de copyright de CA Nimsoft Monitor Snap Este sistema de ayuda en línea (el "Sistema") se proporciona

Más detalles

Correo ONO. Servicio Webmail

Correo ONO. Servicio Webmail Correo ONO Servicio Webmail La fibra no tiene competencia Contenido 1. INTERFAZ WEBMAIL 4 2. BARRA SUPERIOR 4 3. CORREO 5 3.1. Panel de lectura mensajes 5 3.2. Barra de herramientas de correo 6 3.3. Sección

Más detalles

MO-Call para PCs. Guía del Usuario

MO-Call para PCs. Guía del Usuario MO-Call para PCs Guía del Usuario Tabla de Contenidos MO-CALL PARA PCS...1 GUIA DEL USUARIO...1 TABLA DE CONTENIDOS...2 BIENVENIDO A MO-CALL...4 COMENZANDO...5 INICIAR SESIÓN...5 LLAMADAS...7 MARCANDO

Más detalles

Guía Rápida de Inicio

Guía Rápida de Inicio Guía Rápida de Inicio 1. Acerca de esta Guía Esta guía le ayudará a instalar y dar los primeros pasos con BitDefender Security for Exchange. Para disponer de instrucciones detalladas, por favor, diríjase

Más detalles

A continuación enlistamos estos pasos y seguido a ello describimos detalladamente cada uno de ellos:

A continuación enlistamos estos pasos y seguido a ello describimos detalladamente cada uno de ellos: Manual de Implementación del módulo de Contabilidad en Openbravo ERP. Como sabemos una de las características más importantes de un ERP es la capacidad de poder administrar de forma integrada la contabilidad

Más detalles

Identificación fácil de los clientes adecuados

Identificación fácil de los clientes adecuados PASW Direct Marketing 18 Especificaciones Identificación fácil de los clientes adecuados Sabemos que le gustaría que sus programas de marketing sean lo más rentables posible y sabemos que conocer la información

Más detalles

QUERCUS PRESUPUESTOS MANUAL DEL USO

QUERCUS PRESUPUESTOS MANUAL DEL USO QUERCUS PRESUPUESTOS MANUAL DEL USO 2 Tabla de Contenido 1 Introducción 1 1.1 General 1 1.1.1 Que es Quercus Presupuestos? 1 1.1.2 Interfaz 1 1.1.3 Árbol de Navegación 2 1.1.4 Estructura de Datos de un

Más detalles

Arquitectura para análisis de información. Zombi es una arquitectura que proporciona de manera integrada los componentes

Arquitectura para análisis de información. Zombi es una arquitectura que proporciona de manera integrada los componentes Capítulo 4 Arquitectura para análisis de información propuesta 4.1 Arquitectura Zombi es una arquitectura que proporciona de manera integrada los componentes necesarios para el análisis de información

Más detalles

Inventek Punto de Venta 7.0

Inventek Punto de Venta 7.0 Inventek Punto de Venta 7.0 Guía de Inicio Rápido Inventek POS Ltda. Manual Tabla de Contenido Procedimiento de Inicio de sesión... 3 Resumen General... 3 Manejo de Productos... 5 Agregar Productos...

Más detalles

ÍNDICE. Manual Agente CenterWare V. Agente CenterWare. Uso de CenterWare Agente. Sobre Agente RIA 29. Acceso al sistema 3 Interfaz de Agente 5.

ÍNDICE. Manual Agente CenterWare V. Agente CenterWare. Uso de CenterWare Agente. Sobre Agente RIA 29. Acceso al sistema 3 Interfaz de Agente 5. ÍNDICE Manual Agente CenterWare V Agente CenterWare Acceso al sistema 3 Interfaz de Agente 5 Uso de CenterWare Agente Menú Chat con supervisor 7 Estado no disponible 9 Llamada manual 11 Historial de llamadas

Más detalles

Centro de Profesorado Luisa Revuelta (Córdoba) TEMA 6 TABLAS Y GRÁFICOS EN IMPRESS

Centro de Profesorado Luisa Revuelta (Córdoba) TEMA 6 TABLAS Y GRÁFICOS EN IMPRESS Centro de Profesorado Luisa Revuelta (Córdoba) TEMA 6 TABLAS Y GRÁFICOS EN IMPRESS Antes que nada tenemos que hablar de la distinción entre tabla y hoja de cálculo. Una tabla es una estructura formada

Más detalles

Estadística I. Finanzas y Contabilidad

Estadística I. Finanzas y Contabilidad Estadística I. Finanzas y Contabilidad Práctica 1: INTRODUCCIÓN AL USO DE SOFTWARE ESTADÍSTICO OBJETIVO: Los estudiantes deberán conocer el funcionamiento de la Hoja de Cálculo EXCEL y utilizarla para

Más detalles

Guía N 1: Fundamentos básicos(i)

Guía N 1: Fundamentos básicos(i) 1 Guía N 1: Fundamentos básicos(i) Objetivos Generales: Ver una breve descripción de las capacidades más comunes de Excel Objetivos específicos: Descripción de los elementos de un libro: Hojas, iconos,

Más detalles

Capítulo 7. Software para Pruebas. 7.1 Programa Principal

Capítulo 7. Software para Pruebas. 7.1 Programa Principal Capítulo 7 Software para Pruebas MaGeS es un marco de simulación que ofrece los lineamientos para construir animaciones 3D, centrándose principalmente en el diseño del AVA. Sin embargo, son tantos los

Más detalles

Instrucciones de instalación de IBM SPSS Modeler Server 16 para Windows

Instrucciones de instalación de IBM SPSS Modeler Server 16 para Windows Instrucciones de instalación de IBM SPSS Modeler Server 16 para Windows Contenido Instrucciones para la instalación.... 1 Requisitos del sistema........... 1 Instalación............... 1 Destino...............

Más detalles

Apuntes de ACCESS. Apuntes de Access. Campos de Búsqueda:

Apuntes de ACCESS. Apuntes de Access. Campos de Búsqueda: Apuntes de ACCESS Campos de Búsqueda: Los campos de búsqueda permiten seleccionar el valor de un campo de una lista desplegable en lugar de tener que escribirlos. El usuario sólo tiene que elegir un valor

Más detalles

PRESENTACIÓN, DISCUSIÓN Y ANALISIS DE LOS RESULTADOS

PRESENTACIÓN, DISCUSIÓN Y ANALISIS DE LOS RESULTADOS UNIVERSIDAD DE LOS ANDES FACULTAD DE ODONTOLOGIA MERIDA EDO. MERIDA PRESENTACIÓN, DISCUSIÓN Y ANALISIS DE LOS RESULTADOS Mérida, Febrero 2010. Integrantes: Maria A. Lanzellotti L. Daniela Paz U. Mariana

Más detalles

Introducción a macros en Excel 2007

Introducción a macros en Excel 2007 MACROS CON EXCEL Capítulo 1 Introducción a macros en Excel 2007 A lo largo de este primer capítulo comenzaremos a recorrer el camino de las macros en Excel 2007. Para eso, conoceremos las herramientas

Más detalles

Entidad Formadora: Plan Local De Formación Convocatoria 2010

Entidad Formadora: Plan Local De Formación Convocatoria 2010 Entidad Formadora: Enterprise Architect Comenzando Puede iniciar Enterprise Architect desde el ícono que se creó en su escritorio de Windows durante la instalación, o alternativamente: 1. Abrir el menú

Más detalles

La Administración de Proyectos

La Administración de Proyectos La Administración de Proyectos La administración de proyectos es el proceso de planear, organizar y administrar tareas y recursos para alcanzar un objetivo concreto, generalmente con delimitaciones de

Más detalles