INFORME TAREA N 5 SELF-ORGANIZING MAPS
|
|
- Julián Franco Morales
- hace 8 años
- Vistas:
Transcripción
1 Universidad de Chile Facultad de Ciencias Físicas y Matemáticas Departamento de Ingeniería Eléctrica EL4106 Inteligencia Computacional INFORME TAREA N 5 SELF-ORGANIZING MAPS Nombre Alumno : Profesor : Profesor Auxiliar : Sebastián Gálvez Javier Ruiz del Solar Daniel Herrmann Felipe Valdés Fecha : 30/06/2014 Santiago, Chile.
2 Contenido Contenido... II Índice de Figuras y Tablas... III 1. Introducción Desarrollo Teoría División de Base de Datos Estructuras de datos e inicialización red SOM Entrenamiento, Labeling y Clasificación Visualización y Resultados... 7 Red SOM Rectangular, Vecindad tipo bubble... 8 Red SOM Rectangular, Vecindad tipo gaussian Red SOM Rectangular, Vecindad tipo ep Red SOM Rectangular, Vecindad tipo cutgauss... 9 Red SOM Hexagonal, Vecindad tipo bubble Red SOM Hexagonal, Vecindad tipo gaussian Red SOM Hexagonal, Vecindad tipo cutgauss Red SOM Hexagonal, Vecindad tipo ep Normalización Conclusiones Anexos Bibliografía...21
3 Índice de Figuras y Tablas Figura 1: U-Matrix para grilla rectangular... 3 Figura 2: Mapa de Sammon para datos de entrenamiento Figura 3: Tipos de Lattice para la red SOM Figura 4: U-matrix, grilla etiquetada y matriz de confusión para red SOM rectangular con vecindad tipo bubble. Porcentaje correctamente clasificados: 64.11% Figura 5: U-matrix, grilla etiquetada y matriz de confusión para red SOM rectangular con vecindad tipo gaussian. Porcentaje correctamente clasificados: 68.10% Figura 6: U-matrix, grilla etiquetada y matriz de confusión para red SOM rectangular con vecindad tipo bubble. Porcentaje correctamente clasificados: 65.86% Figura 7: U-matrix, grilla etiquetada y matriz de confusión para red SOM rectangular con vecindad tipo cutgauss. Porcentaje correctamente clasificados: 70.90% Figura 8: U-matrix, grilla etiquetada y matriz de confusión para red SOM hexagonal con vecindad tipo bubble. Porcentaje correctamente clasificados: 69.76% Figura 9: U-matrix, grilla etiquetada y matriz de confusión para red SOM hexagonal con vecindad tipo gaussian. Porcentaje correctamente clasificados: 68.16% Figura 10: U-matrix, grilla etiquetada y matriz de confusión para red SOM hexagonal con vecindad tipo cutgauss. Porcentaje correctamente clasificados: 70.23% Figura 11: U-matrix, grilla etiquetada y matriz de confusión para red SOM hexagonal con vecindad tipo ep. Porcentaje correctamente clasificados: 75.91% Figura 12: Mapa de Sammon para datos de entrenamiento normalizados Figura 13: U-Matrix coloreada, malla etiquetada y matriz de confusión para red SOM rectangular con vecindad tipo bubble, usando datos normalizados Figura 14: U-Matrix coloreada, malla etiquetada y matriz de confusión para red SOM hexagonal con vecindad tipo ep, usando datos normalizados
4 Introducción 1. Introducción El objetivo general de esta tarea consiste en utilizar el algoritmo de clustering SOM, analizando su desempeño para distintos parámetros de entrenamiento. Para esto se utilizará la base de datos Wine Data Set, que forma parte del UC Irvine Machine Learning Repository. Esta base de dato contiene 13 características fisicoquímicas medidas para 178 muestras de vino, las cuales son: 1) Alcohol 2) Malic acid 3) Ash 4) Alcalinity of ash 5) Magnesium 6) Total phenols 7) Flavanoids 8) Nonflavanoid phenols 9) Proanthocyanins 10)Color intensity 11)Hue 12)OD280/OD315 of diluted wines 13)Proline La base de datos contiene información de vinos Italianos, producidos en la misma región, pero por 3 productores distintos. Cada productor produce un tipo de vino distinto. En particular, se tiene como objetivo encontrar la correspondencia entre los productores y los clusters caracterizados mediante redes de tipo SOM (Self- Organizing Maps). Para esto se utilizará un programa en Matlab que utilice la herramienta SOM toolbox de Helsinki University of Technology. Cuya documentación, manuales y archivos se encuentran disponibles en: U. de Chile. FCFM. DIE ~1~
5 Desarrollo 2. Desarrollo 2.1. Teoría a) Self-Organizing Maps (SOM) o Mapas de Kohonen Una red SOM permite realizar clustering sobre un conjunto de datos de manera tal que permite realizar un mapeo a una baja dimensionalidad (2D o 3D) para visualizar cómo se agrupan los vectores prototipo y posteriormente realizar cuantización vectorial en el espacio de características. El entrenamiento de este tipo de redes es no supervisado, lo que permite completa automatización del mismo una vez que se definen los parámetros que debe fijar el diseñador. El algoritmo de aprizaje secuencial consiste en presentar ejemplos, buscar el prototipo más cercano y actualizar su posición en el espacio de características, junto a la de sus vecinos en el espacio de prototipos. Para realizar una buena estructura SOM se debe fijar inicialmente su topología, ya que los prototipos se pueden almacenar en distintas topologías de grillas, por ejemplo, hexagonales o rectangulares. Además, es fundamental definir qué tipo de vecindad se utilizará para determinar qué vectores deben actualizar su posición junto al prototipo más cercano a un dato, por lo cual se define la función de vecindad h, la cual puede ser de diversos tipos (gaussiana, cilíndrica, etc.) y debe contar con un radio inicial e ir disminuyo a medida que se avanza en el entrenamiento hasta un radio final. Al igual que en el método K-means, también se deben determinar las posiciones iniciales de los vectores prototipo, que generalmente se hace de manera aleatoria. Por último, también se debe determinar la tasa de aprizaje y la función según la cual cambia en cada instancia del entrenamiento, se recomia comenzar con un valor cercano a 1 e ir disminuyéndola a medida que avanza el tiempo para refinar el aprizaje. b) Labeling y U-matrix Una vez que ya se ha entrenado una red SOM, a cada vector prototipo le puede ser asignado una etiqueta que finalmente representará al cluster en el que se encuentra y permitirá realizar clasificación. Para realizar este etiquetado o labeling, es fundamental identificar las nuevas relaciones geométricas que adoptó la red SOM al ser entrenada, en cuanto a que sus vectores prototipos se encontrarán distanciados entre ellos de manera no uniforme. Para esto se define una matriz que muestra información de las distancias de los vectores prototipo, en base a la información de posiciones y vecindad de la grilla, esta matriz es conocida como U-matrix. En la U. de Chile. FCFM. DIE ~2~
6 Desarrollo Figura 1 se observa un ejemplo de matriz U, en escala de grises, donde los puntos más oscuros denotan una mayor separación entre los vectores prototipo. Figura 1: U-Matrix para grilla rectangular 2.2. División de Base de Datos El programa generado en el archivo separacion.m contiene un script que carga la base de datos usando el comando load Base_de_Datos_Tarea5 y divide la base de datos en los conjuntos de entrenamiento y prueba, para finalmente guardar un archivo Conjuntos_Separados.mat que contiene las matrices entren, labels_entren, prueba, labels_prueba y headers. El script de Matlab identifica los conjuntos de datos de distinto productor y extrae aleatoriamente datos para formar el conjunto de prueba según el parámetro pr_rate, que en este caso se dio como valor 0.4, para obtener el 40% de los datos para prueba. Luego, del conjunto original se restan estos datos para obtener el conjunto de entrenamiento. El desempeño muestra que la representatividad y la proporción de clases se mantiene en niveles similares como muestra Tabla 1. Clase Productor 1 Productor 2 Productor 3 Conjunto [%] [%] [%] Conjunto Original Conjunto Prueba Conjunto Entrenamiento Tabla 1: Representatividad de conjunto original y sus separaciones en prueba y entrenamiento Y se logró que la proporción de conjuntos fuera la pedida. En este caso se logró que el conjunto de prueba fuera 39.89% de los datos, lo que corresponde a 71 muestras. U. de Chile. FCFM. DIE ~3~
7 Desarrollo 2.3. Estructuras de datos e inicialización red SOM En el archivo tarea5.m se desarrolla un script con distintos bloques de código utilizados, el cual se puede ver completamente en la sección de Anexos. En primer lugar, se cargan los conjuntos de entrenamiento y prueba del archivo Conjuntos_Separados.mat generado por el script separacion.m, y se extraen variables como número de datos de entrenamiento e índices que separan los distintos productores. Luego, se inicializan las estructuras de datos para el SOM Toolbox a utilizar, mediante las instrucciones: somdata_en=som_data_struct(entren,'labels',en_labels_som,'comp_names',headers); somdata_pr=som_data_struct(prueba,'labels',pr_labels_som,'comp_names',headers); Antes de inicializar la red SOM y configurar los distintos parámetros, se utiliza una herramienta llamada mapa de Sammon, el cual permite visualizar en cierto grado la orientación que poseen los datos proyectados en el plano bidimensional, con el objetivo de ajustar las dimensiones de la grilla de manera más adecuada, ya que una grilla cuadrada no siempre es lo más adecuado. En la Figura 2 se observa el mapa de Sammon para los datos de entrenamiento, donde claramente se observa que los datos varían con un rango a razón 7:10 aproximadamente. Figura 2: Mapa de Sammon para datos de entrenamiento. En base a esta observación, considerando que idealmente el número de vectores prototipo debe ser inferior al número de datos de entrenamiento, esto es, MxN < 107, se determinó que la red SOM se construya con un tamaño 6x10, utilizando 60 vectores prototipo, formando una grilla rectangular. U. de Chile. FCFM. DIE ~4~
8 Desarrollo Para la primera prueba se determinaron los parámetros de la red y de entrenamiento como se muestra en el siguiente bloque de instrucciones: som_m=6; som_n=10; %MxN a_init=1; a_type='inv';%linear/power/inv radius=[5 1]; %radius_init radius_final epochs=1000; somap = som_randinit (somdata_en,'msize',[som_m som_n]); latt='rect'; %rect/hexa vecindad='bubble'; %cutgauss/gaussian/bubble/ep La variable latt hace referencia al lattice o tipo de grilla donde se guardan los vectores prototipo, la cual puede ser hexagonal o rectangular, como se muestra en la Figura 3. Figura 3: Tipos de Lattice para la red SOM. En una primera instancia se prueba con la red rectangular, sin embargo, se sabe que la malla hexagonal es menos sesgada a las direcciones vertical y horizontal, por lo que permite una inspección visual más adecuada. Se utilizan 1000 épocas de entrenamiento, con 107 datos por época, por lo que hay un total de pasos para el entrenamiento, lo cual permite una buena precisión estadística que se traduce en un ajuste muy fino de los prototipos sin aumentar de sobremanera el tiempo del mismo. En cuanto al radio de la vecindad, se plantea que se inicie con un valor 5 y que termine en 1, para que al comienzo se ordenen rápidamente los vectores y en las etapas finales se refine el ordenamiento. U. de Chile. FCFM. DIE ~5~
9 Desarrollo 2.4. Entrenamiento, Labeling y Clasificación Se define la estructura de entrenamiento, junto a los parámetros definidos anteriormente mediante las instrucciones: somtrain = som_train_struct (somap,'dlen',n_en,'algorithm','sec'); somtrain = som_set(somtrain,'neigh',vecindad,'trainlen',... epochs,'radius_ini',radius(1),'radius_fin',radius(2),... 'alpha_ini',a_init,'alpha_type',a_type); Y luego se entrena usando el algoritmo de entrenamiento secuencial: [somap, st_par]= som_seqtrain(somap,somdata_en,somtrain) Posteriormente se realiza el labeling para etiquetar los vectores prototipo de la red mediante la función somap = som_autolabel(somap,somdata_en,'vote'), la cual usa el modo vote en vez del add como pide el enunciado debido a que el modo vote asigna automáticamente el label más frecuente o con más votos en cada nodo, que es lo que se pide finalmente, y es más directo que utilizar add y luego buscar el label con más votos en cada nodo manualmente. A pesar de esto, existen nodos que quedaron sin etiquetar, los cuales se dejan así, ya que la clasificación con redes SOM permite esto para una cierta fracción de los nodos. Una vez etiquetados los nodos de la red según el productor de vino al que corresponden, se clasifican los datos de prueba mediante el siguiente bloque de instrucciones: [bmus qe]=som_bmus(somap,somdata_pr); pr_real=cell2mat(somdata_pr.labels); pr_classified=num2str(zeros(length(bmus),1)); for i=1:length(bmus) if ~isempty(somap.labels{bmus(i)}) pr_classified(i)=somap.labels{bmus(i)}; else if bmus(i)==1 if ~isempty(somap.labels{bmus(i)+1}) pr_classified(i)=somap.labels{bmus(i)+1}; else pr_classified(i)=sprintf('%i',randi([1 3])); else if ~isempty(somap.labels{bmus(i)+1})&&~isempty(somap.labels{bmus(i)-1}) aux=[somap.labels{bmus(i)-1} somap.labels{bmus(i)+1}]; pr_classified(i)=aux(1,randi([1 2])); else pr_classified(i)=sprintf('%i',randi([1 3])); U. de Chile. FCFM. DIE ~6~
10 Desarrollo Este método asigna la etiqueta del Best Matching Unit (BMU) para cada dato de prueba, si es que ese nodo está etiquetado. Si no, se elige aleatoriamente entre los dos nodos inmediatamente vecinos según el orden definido en la estructura del mapa SOM, los cuales generalmente se condicen con el productor verdadero. En el eventual caso de que alguno de sus dos vecinos tampoco esté etiquetado, simplemente se le otorga un productor aleatorio. Finalmente se calcula una matriz de confusión utilizando las etiquetas verdaderas del productor de cada muestra del conjunto de prueba, obtenio un porcentaje de muestras correctamente clasificadas al promediar los valores relativos de la diagonal de la matriz Visualización y Resultados Para visualizar la organización de la red SOM y el etiquetado de la misma se utiliza la función som_show y som_show_add con distintas modalidades, lo cual permite mostrar una U-matrix coloreada según los vectores prototipo etiquetados para cada productor, y la malla con las etiquetas de los labels más votados en los nodos etiquetados. A continuación se muestran los resultados para distintas combinaciones de los parámetros de entrenamiento y de topología de la red. Para realizar un análisis un tanto más simplificado, se mantienen constantes el tamaño, el radio inicial y final de la red, número de épocas, la tasa de aprizaje inicial y la función de aprizaje, como se inicializó en la sección 2.3. Es decir, se evaluarán diferencias en los resultados para distintos tipos de vecindad y organización de la malla de la red. U. de Chile. FCFM. DIE ~7~
11 Desarrollo Red SOM Rectangular, Vecindad tipo bubble. En la Figura 4 se observan la matriz U, la matriz de confusión y la grilla con etiquetas asignadas para este caso. Si bien el rimiento de clasificación es relativamente bajo, se observa que la red SOM diferencia en cierto grado los clusters asociados a cada productor, cumplio su objetivo. Figura 4: U-matrix, grilla etiquetada y matriz de confusión para red SOM rectangular con vecindad tipo bubble. Porcentaje correctamente clasificados: 64.11%. Red SOM Rectangular, Vecindad tipo gaussian. En este caso el rimiento mejora en un 4% como muestra la Figura 5. Figura 5: U-matrix, grilla etiquetada y matriz de confusión para red SOM rectangular con vecindad tipo gaussian. Porcentaje correctamente clasificados: 68.10%. U. de Chile. FCFM. DIE ~8~
12 Desarrollo Red SOM Rectangular, Vecindad tipo ep. En la Figura 6 se ve que el rimiento de clasificación es muy parecido al caso con vecindad tipo bubble. Figura 6: U-matrix, grilla etiquetada y matriz de confusión para red SOM rectangular con vecindad tipo bubble. Porcentaje correctamente clasificados: 65.86%. Red SOM Rectangular, Vecindad tipo cutgauss. En la Figura 7 se observa que este tipo de vecindad, a pesar de presentar traslape entre los Productores 2 y 3, obtiene el mejor rimiento neto para la red con malla rectangular, logrando un 70.9%. Figura 7: U-matrix, grilla etiquetada y matriz de confusión para red SOM rectangular con vecindad tipo cutgauss. Porcentaje correctamente clasificados: 70.90%. U. de Chile. FCFM. DIE ~9~
13 Desarrollo Red SOM Hexagonal, Vecindad tipo bubble. En la Figura 8 se ve que a contraste con la topología rectangular, una red SOM con malla hexagonal logra mejores resultados para clasificación, llegando a un rimiento de 69.76%. Figura 8: U-matrix, grilla etiquetada y matriz de confusión para red SOM hexagonal con vecindad tipo bubble. Porcentaje correctamente clasificados: 69.76%. Red SOM Hexagonal, Vecindad tipo gaussian. Como muestra la Figura 9, se obtiene un rimiento de 68.16%, muy similar al caso anterior. Se identifica gran traslape entre productores 2 y 3. Figura 9: U-matrix, grilla etiquetada y matriz de confusión para red SOM hexagonal con vecindad tipo gaussian. Porcentaje correctamente clasificados: 68.16%. U. de Chile. FCFM. DIE ~10~
14 Desarrollo Red SOM Hexagonal, Vecindad tipo cutgauss. En este caso, como se ve en la Figura 10, este tipo de vecindad obtiene un 70.9% de datos clasificados correctamente. Figura 10: U-matrix, grilla etiquetada y matriz de confusión para red SOM hexagonal con vecindad tipo cutgauss. Porcentaje correctamente clasificados: 70.23%. Red SOM Hexagonal, Vecindad tipo ep. En la Figura 11 se ve que el rimiento de clasificación es el mejor logrado, llegando a un 75.91%, a pesar de que aún existe un cierto grado de traslape entre las zonas de los productores 2 y 3 en la U-Matrix. Figura 11: U-matrix, grilla etiquetada y matriz de confusión para red SOM hexagonal con vecindad tipo ep. Porcentaje correctamente clasificados: 75.91%. U. de Chile. FCFM. DIE ~11~
15 Desarrollo 2.6. Normalización Realizando una normalización según la varianza al incorporar las líneas de código para las estructuras de datos de entrenamiento y prueba: somdata_en=som_normalize(somdata_en,'var'); somdata_pr=som_normalize(somdata_pr,'var'); En primer lugar, se observa en la Figura 12 que el mapa de Sammon cambia drásticamente, observándose una distribución bastante simétrica y cuyo rango en ambas direcciones es muy similar. En base a esto, se utilizará un tamaño de red igual a 8x8, usando 64 vectores prototipo. Figura 12: Mapa de Sammon para datos de entrenamiento normalizados Luego, mantenio el resto de los parámetros, se evaluaron los mismos casos que antes, llegando a que los mejores rimientos para una malla rectangular se logran usando una vecindad tipo bubble, obtenio un 94.95% como se ve en la Figura 13 y para una malla hexagonal con vecindad tipo ep, logrando clasificar correctamente 93.21% de los datos de prueba, mostrado en la Figura 14, aunque cabe destacar que para vecindad tipo cutgauss también se obtuvo resultados muy cercanos. Para la malla rectangular para las otras funciones de vecindad, en promedio se logró un rimiento del orden de 88%, mientras que el promedio para la malla hexagonal fue de 87% aproximadamente. Se observa que al normalizar los datos, el rimiento de clasificación aumenta considerablemente, esto debido a que las variables de las características poseen rangos de órdenes de magnitud muy distintos, alterando la importancia que se le da a una característica al medir distancias euclidianas. U. de Chile. FCFM. DIE ~12~
16 Desarrollo Figura 13: U-Matrix coloreada, malla etiquetada y matriz de confusión para red SOM rectangular con vecindad tipo bubble, usando datos normalizados. Figura 14: U-Matrix coloreada, malla etiquetada y matriz de confusión para red SOM hexagonal con vecindad tipo ep, usando datos normalizados. En resumen, el mejor clasificador logrado se obtiene para una red SOM rectangular con vecindad tipo bubble al ser entrenada y probada con datos normalizados según varianza, logrando un rimiento de 94.95%. U. de Chile. FCFM. DIE ~13~
17 Conclusiones 3. Conclusiones En primer lugar, se logró implementar los mapas auto-organizativos que realizaron clustering exitosamente, esto gracias a la utilización del SOM Toolbox desarrollado por Helsinki University of Technology. En segundo lugar, se pudo identificar la importancia de la normalización de los datos para implementar este tipo de algoritmo de clustering, debido a que las distancias euclidianas utilizadas se ven considerablemente afectadas cuando existen variables de características con órdenes de magnitud muy diferentes al resto. En este sentido, se logró aumentar el rimiento máximo de clasificación en un 20%, llegando al mejor clasificador para una red SOM rectangular con vecindad tipo bubble. Se puede concluir que los parámetros de entrenamiento y topología de una red SOM son muy determinantes para el nivel de ordenamiento deseado en el espacio de salida, por lo que conviene ayudarse de herramientas como los mapas de Sammon para determinar las dimensiones de la malla, y de heurísticas conocidas para configurar las tasas de aprizaje y el radio de la vecindad. Además, una conclusión interesante del trabajo realizado es que a partir de las redes SOM, se permite visualizar de manera intuitiva en un plano 2D la organización de los distintos clusters de los datos, los cuales pueden ser coloreados según la clase a la que pertenecen, hacio más fácil la visualización de los vectores prototipo asociados a cada cluster. Finalmente, se concluye que fue posible caracterizar los 3 clusters asociados a los productores, en cuanto se logró una clasificación utilizando el mapa SOM con un alto porcentaje de datos clasificados correctamente. U. de Chile. FCFM. DIE ~14~
18 Anexos 4. Anexos A continuación se muestran los códigos contenidos en cada uno de los archivos entregados en la tarea. separacion.m load Base_de_Datos_Tarea5 data=muestras; productor=double(cell2mat(labels))-48; N=length(data(:,1)); nfeats=13; % n de caracteristicas nc=3; % n de clases pr_rate=0.4; % Entrenamiento (60%)... Prueba(40%) %Uno los datos con las clases en una sola matriz, para asociar los %índices de las filas a cada clase distinta. newdata=[data,productor]; %ordeno y obtengo los índices de las muestras de cada clase. [aux ind]=sortrows(newdata,14); szs=zeros(1,nc); ind_bord=zeros(1,nc); %debo encontrar los indices de los que efectivamente pertenecen a cada %clase, para guardarlos en una matriz y luego separarlos. for i=1:nc auxaux=(aux(:,nfeats+1)==i); ind_aux=find(auxaux,1,'last'); ind_bord(i)=ind_aux; szs(i)=sum(auxaux(:)); %también calculo cuántos hay por clase. clear auxaux; %Se quiere pr_rate% de los datos por cada clase para el conjunto de prueba pr_szs=round(szs.*pr_rate); ind_bord_pr=cumsum(pr_szs);%esto me sirve para saber cuántos datos seleccionar por cada clase en las iteraciones. sz_prueba=sum(pr_szs); %tamaño total del conjunto de prueba. prueba=zeros(sz_prueba,nfeats+1); r_vec=zeros(sz_prueba,1); %vector que trá los indices seleccionados. U. de Chile. FCFM. DIE ~15~
19 Anexos %Selección de datos de prueba (20% por cada clase) %primera iteración for i=1:ind_bord_pr(1) r=randi([1 ind_bord(1)]); while(find(r_vec==ind(r))) %selecciono un indice al azar dentro del rango de la clase '1'. % y me aseguro que sea distinto a alguno seleccionado. r=randi([1 ind_bord(1)]); prueba(i,:)=newdata(ind(r),:); %guardo los datos y la clase a la que pertenece el dato elegido en el conjunto de prueba r_vec(i)=ind(r); %guardo el indice para luego borrar ese dato del conjunto y que lo que quede sea el de entrenamiento % repito para el resto de las clases. for j=2:nc for i=(ind_bord_pr(j-1)+1):ind_bord_pr(j) r=randi([(ind_bord(j-1)+1) ind_bord(j)]); while(find(r_vec==ind(r))) r=randi([(ind_bord(j-1)+1) ind_bord(j)]); prueba(i,:)=newdata(ind(r),:); r_vec(i)=ind(r); prueba2 = prueba(randperm(length(prueba(:,1))),:); %desordeno las filas prueba=prueba2; clear prueba2; %extraigo del conjunto original los datos utilizados para el conjunto de prueba entren=newdata; entren(r_vec,:)=[]; sz_entren=length(entren(:,1)); %Verificar representatividad %calculo cantidad de datos por clase en cada conjunto [aux ind]=sortrows(prueba,14); [aux2 ind2]=sortrows(entren,14); ver_szs_prueba=zeros(1,nc); ver_szs_entren=zeros(1,nc); for i=1:nc auxaux=(aux(:,nfeats+1)==i); auxaux2=(aux2(:,nfeats+1)==i); ver_szs_prueba(i)=sum(auxaux(:)); %calculo cuántos datos hay por clase en el conjunto de prueba construido. ver_szs_entren(i)=sum(auxaux2(:)); %y cuántos por clase en el conjunto de entrenamiento clear auxaux; clear auxaux2; U. de Chile. FCFM. DIE ~16~
20 Anexos %verifico proporciones parecidas por clase en ambos conjuntos. (DESCOMENTAR %PARA VERIFICAR) % % repr_total=szs./n % repr_prueba=ver_szs_prueba./sz_prueba % repr_entren=ver_szs_entren./sz_entren % % %verifico proporción 80/20 de los datos en cada conjunto. % % sz_entren/n % sz_prueba/n %Separo datos de información sobre la clase a la que pertenece cada uno. labels_entren = entren(:,14); entren(:,14)=[]; labels_prueba = prueba(:,14); prueba(:,14)=[]; save('conjuntos_separados.mat','entren','labels_entren','prueba','labels_pr ueba','headers') clear all; prodbordes.m function indbord=prodbordes(xlabels) %retorna bordes que separan los 3 grupos distintos de labels %(requiere que estén ordenados) ind1=find((xlabels==1),1,'last'); ind2=find((xlabels==2),1,'last'); ind3=find((xlabels==3),1,'last'); indbord=[ind1 ind2 ind3]; tarea5.m % ********************* TAREA 5 ************************** set(0,'defaultfigurecolormap',gray) clear all; close all; echo off; U. de Chile. FCFM. DIE ~17~
21 Anexos %% Cargar Conjuntos de datos separados y generar estructura de datos para el toolbox load Conjuntos_Separados; %entren, labels_entren, prueba, labels_prueba, headers N_en=length(labels_entren); en_bord=prodbordes(labels_entren); en_labels_som=num2str(labels_entren); %str_array para argumento pr_labels_som=num2str(labels_prueba); somdata_en=som_data_struct(entren,'labels',en_labels_som,'comp_names',heade rs); somdata_pr=som_data_struct(prueba,'labels',pr_labels_som,'comp_names',heade rs); %% Normalización somdata_en=som_normalize(somdata_en,'var'); somdata_pr=som_normalize(somdata_pr,'var'); %% Mapa de Sammon % < % %datos normalizados % norm_entren=som_normalize(entren,'var'); % P = sammon(norm_entren,2); %Permite ver la "orientacion" de los datos % figure; % plot(p(:,1),p(:,2),'x') % title('mapa de Sammon: Proyeccion no lineal 2D de los datos normalizados') % %datos sin normalizar % P = sammon(entren,2); %Permite ver la "orientacion" de los datos % figure; % plot(p(:,1),p(:,2),'x') % title('mapa de Sammon: Proyeccion no lineal 2D de los datos') %% Inicializar red SOM % Cambiar parámetros de diseño AQUÍ som_m=8; som_n=8; %MxN // recomado: 8x8 para Normalizado, 6x10 sin normalizar. a_init=1; a_type='inv';%linear/power/inv radius=[5 1]; %radius_init radius_final epochs=1000; somap = som_randinit (somdata_en,'msize',[som_m som_n]); latt='hexa'; %rect/hexa vecindad='cutgauss'; %cutgauss/gaussian/bubble/ep U. de Chile. FCFM. DIE ~18~
22 Anexos %defino Grilla somap = som_set(somap,'neigh',vecindad,'lattice',latt); %% Estructura de entrenamiento somtrain = som_train_struct (somap,'dlen',n_en,'algorithm','sec'); %seteo parámetros de entrenamiento somtrain = som_set(somtrain,'neigh',vecindad,'trainlen',epochs,'radius_ini',radius(1), 'radius_fin',radius(2),'alpha_ini',a_init,'alpha_type',a_type); %% Entrenamiento [somap, st_par]= som_seqtrain(somap,somdata_en,somtrain); %% Labeling somap = som_autolabel(somap,somdata_en,'vote'); %% Visualizo warning('off','all'); % % U-mat % figure; % colormap(1-gray) % som_show(somap,'umat','all') % colorbar %U-mat con hits en color + labels figure; colormap(1-gray) som_show(somap,'umat','all','empty','labels','subplots',[2 1]) som_show_add('label',somap,'textsize',8,'textcolor','r','subplot',2) h1 = som_hits(somap,somdata_en.data(1:en_bord(1),:)); h2 = som_hits(somap,somdata_en.data(en_bord(1)+1:en_bord(2),:)); h3 = som_hits(somap,somdata_en.data(en_bord(2):en_bord(3),:)); som_show_add('hit',[h1, h2, h3],'markercolor',[1 0 0; 0 1 0; 0 0 1],'Subplot',1) if(som_m==8 && som_n==8) text(0,9.7,['\color{red}productor 1' '\color{black}, ' '\color{green}productor 2'... '\color{black}, ' '\color{blue}productor 3'],'BackgroundColor',[1 1 1],... 'EdgeColor',[0 0 0],'Margin',5) else text(2,7.5,['\color{red}productor 1' '\color{black}, ' '\color{green}productor 2'... '\color{black}, ' '\color{blue}productor 3'],'BackgroundColor',[1 1 1],... 'EdgeColor',[0 0 0],'Margin',5) % Productor 1: ROJO Productor 2: VERDE Productor 3: AZUL colorbar warning('on','all'); U. de Chile. FCFM. DIE ~19~
23 Anexos %% Clasificación de Datos de prueba [bmus qe]=som_bmus(somap,somdata_pr); pr_real=cell2mat(somdata_pr.labels); pr_classified=num2str(zeros(length(bmus),1)); for i=1:length(bmus) if ~isempty(somap.labels{bmus(i)}) pr_classified(i)=somap.labels{bmus(i)}; else if bmus(i)==1 if ~isempty(somap.labels{bmus(i)+1}) pr_classified(i)=somap.labels{bmus(i)+1}; else pr_classified(i)=sprintf('%i',randi([1 3])); else if ~isempty(somap.labels{bmus(i)+1})&&~isempty(somap.labels{bmus(i)-1}) aux=[somap.labels{bmus(i)-1} somap.labels{bmus(i)+1}]; pr_classified(i)=aux(1,randi([1 2])); else pr_classified(i)=sprintf('%i',randi([1 3])); %% Generar matriz de confusión figure; colormap('jet'); C =confusionmat(pr_real,pr_classified); sc=sum(c); for i=1:3 C(:,i)=C(:,i)./sC(i); %normalizo la matriz de confusión imagesc(c) axis('ij') colorbar; xlabel('clases Verdaderas') ylabel('clases Predichas') set(gca,'xtick',[1:3]) set(gca,'xticklabel',['productor 1';'Productor 2';'Productor 3']) set(gca,'ytick',[1:3]) set(gca,'yticklabel',['productor 1';'Productor 2';'Productor 3']) C1=sum(diag(C))/3 ; tt=sprintf('matriz de Confusión: Porcentaje Clasificación correcta: %.2f%%',C1*100); title(tt) U. de Chile. FCFM. DIE ~20~
24 Bibliografía 5. Bibliografía Presentación EL Inteligencia Computacional Self Organizing Map SOM Redes Auto-Organizativas de Kohonen - Prof. Javier Ruiz del Solar- Otoño Presentación EL4106 Inteligencia Computacional Performance Evaluation Otoño SOMToolboxManual SOM Toolbox for Matlab 5 - Esa Alhoniemi, Johan Himberg, Juha Parhankangas and Juha Vesanto - Laboratory of Information and Computer Science in the Helsinki University of Technology Sammon mapping - U. de Chile. FCFM. DIE ~21~
Redes de Kohonen y la Determinación Genética de las Clases
Redes de Kohonen y la Determinación Genética de las Clases Angel Kuri Instituto Tecnológico Autónomo de México Octubre de 2001 Redes Neuronales de Kohonen Las Redes de Kohonen, también llamadas Mapas Auto-Organizados
Más detalles1.1. Introducción y conceptos básicos
Tema 1 Variables estadísticas Contenido 1.1. Introducción y conceptos básicos.................. 1 1.2. Tipos de variables estadísticas................... 2 1.3. Distribuciones de frecuencias....................
Más detallesMapas Autoorganizados
Mapas Autoorganizados 1 Mapas Autoorganizados S.O.M (Self organized Maps) Mapas de características similar a la organización topológica de la corteza cerebral. Kohonen :dada una estructura y una descripción
Más detallesINFORME TAREA N 4 CLUSTERING
Universidad de Chile Facultad de Ciencias Físicas y Matemáticas Departamento de Ingeniería Eléctrica EL4106 Inteligencia Computacional INFORME TAREA N 4 CLUSTERING Nombre Alumno : Profesor : Profesor Auxiliar
Más detallesTema 3. Medidas de tendencia central. 3.1. Introducción. Contenido
Tema 3 Medidas de tendencia central Contenido 31 Introducción 1 32 Media aritmética 2 33 Media ponderada 3 34 Media geométrica 4 35 Mediana 5 351 Cálculo de la mediana para datos agrupados 5 36 Moda 6
Más detallesCapítulo 12: Indexación y asociación
Capítulo 12: Indexación y asociación Conceptos básicos Índices ordenados Archivos de índice de árbol B+ Archivos de índice de árbol B Asociación estática Asociación dinámica Comparación entre indexación
Más detallesOperación Microsoft Access 97
Trabajar con Controles Características de los controles Un control es un objeto gráfico, como por ejemplo un cuadro de texto, un botón de comando o un rectángulo que se coloca en un formulario o informe
Más detallesTAREA N 3 OPERADORES DE DETECCIÓN DE BORDES
Universidad de Chile Facultad de Ciencias Físicas y Matemáticas Departamento de Ingeniería Eléctrica EL7007 Introducción al Procesamiento Digital de Imágenes TAREA N 3 OPERADORES DE DETECCIÓN DE BORDES
Más detallesARREGLOS DEFINICION GENERAL DE ARREGLO
ARREGLOS DEFINICION GENERAL DE ARREGLO Conjunto de cantidades o valores homogéneos, que por su naturaleza se comportan de idéntica forma y deben de ser tratados en forma similar. Se les debe de dar un
Más detalles8.1. Introducción... 1. 8.2. Dependencia/independencia estadística... 2. 8.3. Representación gráfica: diagrama de dispersión... 3. 8.4. Regresión...
Tema 8 Análisis de dos variables: dependencia estadística y regresión Contenido 8.1. Introducción............................. 1 8.2. Dependencia/independencia estadística.............. 2 8.3. Representación
Más detallesAnálisis Estadístico de Datos Climáticos
Análisis Estadístico de Datos Climáticos Análisis de agrupamiento (o clusters) (Wilks, Cap. 14) Facultad de Ciencias Facultad de Ingeniería 2013 Objetivo Idear una clasificación o esquema de agrupación
Más detallesEstándares para planes de calidad de software. Escuela de Ingeniería de Sistemas y Computación Desarrollo de Software II Agosto Diciembre 2008
Estándares para planes de calidad de software Escuela de Ingeniería de Sistemas y Computación Desarrollo de Software II Agosto Diciembre 2008 DIFERENCIA ENTRE PRODUCIR UNA FUNCION Y PRODUCIR UNA FUNCION
Más detallesCLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN)
CLASIFICACIÓN NO SUPERVISADA CLUSTERING Y MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) info@clustering.50webs.com Indice INTRODUCCIÓN 3 RESUMEN DEL CONTENIDO 3 APRENDIZAJE
Más detallesCLASIFICACIÓN NO SUPERVISADA
CLASIFICACIÓN NO SUPERVISADA CLASIFICACION IMPORTANCIA PROPÓSITO METODOLOGÍAS EXTRACTORES DE CARACTERÍSTICAS TIPOS DE CLASIFICACIÓN IMPORTANCIA CLASIFICAR HA SIDO, Y ES HOY DÍA, UN PROBLEMA FUNDAMENTAL
Más detallesAplicación de mapas autoorganizados (SOM) a la visualización de datos. Modelos Computacionales Fernando José Serrano García
Aplicación de mapas autoorganizados (SOM) a la visualización de datos Modelos Computacionales Fernando José Serrano García 2 Contenido Introducción... 3 Estructura... 3 Entrenamiento... 3 Aplicación de
Más detallesMedidas de tendencia central o de posición: situación de los valores alrededor
Tema 10: Medidas de posición y dispersión Una vez agrupados los datos en distribuciones de frecuencias, se calculan unos valores que sintetizan la información. Estudiaremos dos grandes secciones: Medidas
Más detalles!!!!!!!! !!!!! Práctica!4.! Programación!básica!en!C.! ! Grado!en!Ingeniería!!en!Electrónica!y!Automática!Industrial! ! Curso!2015H2016!
INFORMÁTICA Práctica4. ProgramaciónbásicaenC. GradoenIngenieríaenElectrónicayAutomáticaIndustrial Curso2015H2016 v2.1(18.09.2015) A continuación figuran una serie de ejercicios propuestos, agrupados por
Más detallesCap. 24 La Ley de Gauss
Cap. 24 La Ley de Gauss Una misma ley física enunciada desde diferentes puntos de vista Coulomb Gauss Son equivalentes Pero ambas tienen situaciones para las cuales son superiores que la otra Aquí hay
Más detalles1.4.1.2. Resumen... 1.4.2. ÁREA DE FACTURACIÓN::INFORMES::Pedidos...27 1.4.2.1. Detalle... 1.4.2.2. Resumen... 1.4.3. ÁREA DE
MANUAL DE USUARIO DE ABANQ 1 Índice de contenido 1 ÁREA DE FACTURACIÓN......4 1.1 ÁREA DE FACTURACIÓN::PRINCIPAL...4 1.1.1. ÁREA DE FACTURACIÓN::PRINCIPAL::EMPRESA...4 1.1.1.1. ÁREA DE FACTURACIÓN::PRINCIPAL::EMPRESA::General...4
Más detallesINFORMÁTICA. Práctica 5. Programación en C. Grado en Ingeniería en Electrónica y Automática Industrial. Curso 2013-2014. v1.0 (05.03.
INFORMÁTICA Práctica 5. Programación en C. Grado en Ingeniería en Electrónica y Automática Industrial Curso 2013-2014 v1.0 (05.03.14) A continuación figuran una serie de ejercicios propuestos, agrupados
Más detallesClasificación de Música por Genero Utilizando Redes Neuronales Artificiales. Elkin García, Germán Mancera, Jorge Pacheco
Clasificación de Música por Genero Utilizando Redes Neuronales Artificiales Elkin García, Germán Mancera, Jorge Pacheco Presentación Los autores han desarrollado un método de clasificación de música a
Más detallesProcesamiento Digital de Imágenes. Compresión de imágenes
FICH, UNL - Departamento de Informática - Ingeniería Informática Procesamiento Digital de Imágenes Guía de Trabajos Prácticos 8 Compresión de imágenes 2010 1. Objetivos Analizar las características y el
Más detallesSISTEMAS DE ECUACIONES LINEALES
SISTEMAS DE ECUACIONES LINEALES INTRODUCCIÓN En el presente documento se explican detalladamente dos importantes temas: 1. Descomposición LU. 2. Método de Gauss-Seidel. Se trata de dos importantes herramientas
Más detallesMetodología. del ajuste estacional. Tablero de Indicadores Económicos
Metodología del ajuste estacional Tablero de Indicadores Económicos Metodología del ajuste estacional Componentes de una serie de tiempo Las series de tiempo están constituidas por varios componentes que,
Más detallesRoberto Quejido Cañamero
Crear un documento de texto con todas las preguntas y respuestas del tema. Tiene que aparecer en él todos los contenidos del tema. 1. Explica qué son los modos de presentación en Writer, cuáles hay y cómo
Más detallesNaive Bayes Multinomial para Clasificación de Texto Usando un Esquema de Pesado por Clases
Naive Bayes Multinomial para Clasificación de Texto Usando un Esquema de Pesado por Clases Emmanuel Anguiano-Hernández Abril 29, 2009 Abstract Tratando de mejorar el desempeño de un clasificador Naive
Más detallesManual de rol gestor de GAV para moodle 2.5
Manual de rol gestor de GAV para moodle 2.5 Consultas LDAP-GAUR... 2 Buscar en LDAP datos de un usuario... 2 Docentes... 3 Buscar en GAUR datos de un docente... 3 Buscar en GAUR la docencia de un docente
Más detallesSistemas de Información Geográficos (SIG o GIS)
Sistemas de Información Geográficos (SIG o GIS) 1) Qué es un SIG GIS? 2) Para qué sirven? 3) Tipos de datos 4) Cómo trabaja? 5) Modelos de datos, Diseño Conceptual 6) GeoDataase (GD) 7) Cómo evaluamos
Más detallesCiclo de vida y Metodologías para el desarrollo de SW Definición de la metodología
Ciclo de vida y Metodologías para el desarrollo de SW Definición de la metodología La metodología para el desarrollo de software es un modo sistemático de realizar, gestionar y administrar un proyecto
Más detallesAnálisis de Datos. Práctica de métodos predicción de en WEKA
SOLUCION 1. Características de los datos y filtros Una vez cargados los datos, aparece un cuadro resumen, Current relation, con el nombre de la relación que se indica en el fichero (en la línea @relation
Más detallesSeminario Aplicaciones de las Redes Neuronales (WebSOM)
Seminario Aplicaciones de las Redes Neuronales (WebSOM) Inteligencia Artificial 5 o Informática IA curso 2012-2013 CCIA Noviembre 2012 IA 1213 (CCIA) Seminario WebSOM Noviembre-2012 1 / 12 Usos de los
Más detallesCómo?: Resolviendo el sistema lineal homógeneo que satisfacen las componentes de cualquier vector de S. x4 = x 1 x 3 = x 2 x 1
. ESPACIOS VECTORIALES Consideremos el siguiente subconjunto de R 4 : S = {(x, x 2, x 3, x 4 )/x x 4 = 0 x 2 x 4 = x 3 a. Comprobar que S es subespacio vectorial de R 4. Para demostrar que S es un subespacio
Más detallesLección 7 - Coordenadas rectangulares y gráficas
Lección 7 - Coordenadas rectangulares gráficas Coordenadas rectangulares gráficas Objetivos: Al terminar esta lección podrás usar un sistema de coordenadas rectangulares para identificar puntos en un plano
Más detallesCapítulo 2. Técnicas de procesamiento digital de imágenes y reconocimiento de patrones.
Capítulo 2. Técnicas de procesamiento digital de imágenes y reconocimiento de patrones. 2.1 Revisión sistema reconocimiento caracteres [9]: Un sistema de reconocimiento típicamente esta conformado por
Más detallesMÁQUINA DE VECTORES DE SOPORTE
MÁQUINA DE VECTORES DE SOPORTE La teoría de las (SVM por su nombre en inglés Support Vector Machine) fue desarrollada por Vapnik basado en la idea de minimización del riesgo estructural (SRM). Algunas
Más detallesSe podría entender como una matriz de filas y columnas. Cada combinación de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68.
Departamento de Economía Aplicada: UDI de Estadística. Universidad Autónoma de Madrid Notas sobre el manejo de Excel para el análisis descriptivo y exploratorio de datos. (Descriptiva) 1 1 Introducción
Más detallesCentro de Capacitación en Informática
Fórmulas y Funciones Las fórmulas constituyen el núcleo de cualquier hoja de cálculo, y por tanto de Excel. Mediante fórmulas, se llevan a cabo todos los cálculos que se necesitan en una hoja de cálculo.
Más detallesDeterminación de primas de acuerdo al Apetito de riesgo de la Compañía por medio de simulaciones
Determinación de primas de acuerdo al Apetito de riesgo de la Compañía por medio de simulaciones Introducción Las Compañías aseguradoras determinan sus precios basadas en modelos y en información histórica
Más detallesProgramación Genética
Programación Genética Programación Genética consiste en la evolución automática de programas usando ideas basadas en la selección natural (Darwin). No sólo se ha utilizado para generar programas, sino
Más detallesConstrucción de Escenarios
Construcción de Escenarios Consiste en observar los diferentes resultados de un modelo, cuando se introducen diferentes valores en las variables de entrada. Por ejemplo: Ventas, crecimiento de ventas,
Más detalles5.4. Manual de usuario
5.4. Manual de usuario En esta sección se procederá a explicar cada una de las posibles acciones que puede realizar un usuario, de forma que pueda utilizar todas las funcionalidades del simulador, sin
Más detallesIngeniería del Software I Clase de Testing Funcional 2do. Cuatrimestre de 2007
Enunciado Se desea efectuar el testing funcional de un programa que ejecuta transferencias entre cuentas bancarias. El programa recibe como parámetros la cuenta de origen, la de cuenta de destino y el
Más detallesIndicaciones específicas para los análisis estadísticos.
Tutorial básico de PSPP: Vídeo 1: Describe la interfaz del programa, explicando en qué consiste la vista de datos y la vista de variables. Vídeo 2: Muestra cómo crear una base de datos, comenzando por
Más detallesFundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 -
Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 9 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Actividad. Qué es un modelo de Data Mining Qué es
Más detallesVI PLAN DE PRUEBAS, RESULTADOS Y RECOMENDACIONES
VI PLAN DE PRUEBAS, RESULTADOS Y RECOMENDACIONES En la presente sección, se realiza el correspondiente plan de pruebas del prototipo con la finalidad de exponer las estrategias y recursos necesarios para
Más detallesConclusiones. Particionado Consciente de los Datos
Capítulo 6 Conclusiones Una de las principales conclusiones que se extraen de esta tesis es que para que un algoritmo de ordenación sea el más rápido para cualquier conjunto de datos a ordenar, debe ser
Más detallesSoftware de Particle Tracking Version 1.0
Software de Particle Tracking Version 1.0 Martín Pastor Laboratorio de Medios Granulares Departamento de Física y Matemática Aplicada Universidad de Navarra Enero, 2007 Índice general 1. Introducción 3
Más detallesETSIINGENIO 2009 DIBUJO DE GRAFOS MEDIANTE ALGORITMOS GENÉTICOS
ETSIINGENIO 2009 DIBUJO DE GRAFOS MEDIANTE ALGORITMOS GENÉTICOS EtsiIngenio Inteligencia Artificial 1 Raposo López Alejandro Sánchez Palacios Manuel Resumen dibujo de grafos mediante algoritmos genéticos
Más detallesAmpliación de Estructuras de Datos
Ampliación de Estructuras de Datos Amalia Duch Barcelona, marzo de 2007 Índice 1. Diccionarios implementados con árboles binarios de búsqueda 1 2. TAD Cola de Prioridad 4 3. Heapsort 8 1. Diccionarios
Más detallesDefinición 1.1.1. Dados dos números naturales m y n, una matriz de orden o dimensión m n es una tabla numérica rectangular con m filas y n columnas.
Tema 1 Matrices Estructura del tema. Conceptos básicos y ejemplos Operaciones básicas con matrices Método de Gauss Rango de una matriz Concepto de matriz regular y propiedades Determinante asociado a una
Más detallesEL ANÁLISIS DE CONGLOMERADOS EN LOS ESTUDIOS DE MERCADO
EL ANÁLISIS DE CONGLOMERADOS EN LOS ESTUDIOS DE MERCADO I. INTRODUCCIÓN Beatriz Meneses A. de Sesma * En los estudios de mercado intervienen muchas variables que son importantes para el cliente, sin embargo,
Más detallesCAPÍTULO VI PREPARACIÓN DEL MODELO EN ALGOR. En este capítulo, se hablará acerca de los pasos a seguir para poder realizar el análisis de
CAPÍTULO VI PREPARACIÓN DEL MODELO EN ALGOR. En este capítulo, se hablará acerca de los pasos a seguir para poder realizar el análisis de cualquier modelo en el software Algor. La preparación de un modelo,
Más detallesCapítulo 10. Gráficos y diagramas
Capítulo 10. Gráficos y diagramas 1. Introducción Los gráficos y diagramas que se acostumbran a ver en libros e informes para visualizar datos estadísticos también se utilizan con propósitos cartográficos,
Más detallesProceso Unificado de Rational PROCESO UNIFICADO DE RATIONAL (RUP) El proceso de desarrollo de software tiene cuatro roles importantes:
PROCESO UNIFICADO DE RATIONAL (RUP) El proceso de desarrollo de software tiene cuatro roles importantes: 1. Proporcionar una guía de actividades para el trabajo en equipo. (Guía detallada para el desarrollo
Más detallesANÁLISIS DE DATOS NO NUMERICOS
ANÁLISIS DE DATOS NO NUMERICOS ESCALAS DE MEDIDA CATEGORICAS Jorge Galbiati Riesco Los datos categóricos son datos que provienen de resultados de experimentos en que sus resultados se miden en escalas
Más detallesSistema Inteligente de Exploración
Observatorio Municipal de Estadística Sistema Inteligente de Exploración Capítulos 1. Consideraciones iniciales y requerimientos... 2 2. Navegación... 3 3. Consulta de indicadores... 5 3.1. Elaboración
Más detallesEjemplo: Apuesta? 100 PERA PERA MANZANA La casa gana!!! Apuesta? 300 FRUTILLA FRUTILLA FRUTILLA GANASTE 600!!! Apuesta? 0 Gracias por jugar!!!
Problema: El Tragamonedas. Pepito fue a un casino de juegos y ganó un montón de dinero apostando al tragamonedas. Quedó tan fascinado con el juego que decidió, una vez en casa, hacer un programa que le
Más detallesFundamentos de Matemática Aplicada. (Prácticas)
Fundamentos de Matemática Aplicada (Prácticas) Damián Ginestar Peiró UNIVERSIDAD POLITÉCNICA DE VALENCIA 1 Índice general 1. Matrices dispersas 3 1.0.1. Esquemas de almacenamiento.............. 3 1.0.2.
Más detallesEJEMPLO PRÁCTICO DE CÁLCULO DEL VALOR DE VIDA DEL CLIENTE (VVC) O LIFE TIME VALUE (LTV)
APARTADO Nº: 6 DIAPOSITIVA Nº: 2 PRÁCTICA Nº 2: Ejemplo práctico de cálculo del Valor de Vida del Cliente (VVC) o Life Time Value (LTV) EJEMPLO PRÁCTICO DE CÁLCULO DEL VALOR DE VIDA DEL CLIENTE (VVC) O
Más detallesLos mapas auto-organizados de Kohonen (SOM )
Los mapas auto-organizados de Kohonen (SOM ) Introducción En 1982 T. Kohonen presentó un modelo de red denominado mapas auto-organizados o SOM (Self-Organizing Maps), basado en ciertas evidencias descubiertas
Más detallesLa ventana de Microsoft Excel
Actividad N 1 Conceptos básicos de Planilla de Cálculo La ventana del Microsoft Excel y sus partes. Movimiento del cursor. Tipos de datos. Metodología de trabajo con planillas. La ventana de Microsoft
Más detallesSISTEMAS DE COORDENADAS SISTEMA COORDENADO UNIDIMENSIONAL
SISTEMAS DE COORDENADAS En la vida diaria, nos encontramos con el problema de ordenar algunos objetos; de tal manera que es necesario agruparlos, identificarlos, seleccionarlos, estereotiparlos, etc.,
Más detallesPRODUCTIVIDAD DE PROYECTOS DE DESARROLLO DE SOFTWARE: FACTORES DETERMINANTES E INDICADORES
PRODUCTIVIDAD DE PROYECTOS DE DESARROLLO DE SOFTWARE: FACTORES DETERMINANTES E INDICADORES Raúl Palma G. y Guillermo Bustos R. Escuela de Ingeniería Industrial Universidad Católica de Valparaíso Casilla
Más detallesMinería de Datos Web. 1 er Cuatrimestre 2015. Página Web. Prof. Dra. Daniela Godoy. http://www.exa.unicen.edu.ar/catedras/ageinweb/
Minería de Datos Web 1 er Cuatrimestre 2015 Página Web http://www.exa.unicen.edu.ar/catedras/ageinweb/ Prof. Dra. Daniela Godoy ISISTAN Research Institute UNICEN University Tandil, Bs. As., Argentina http://www.exa.unicen.edu.ar/~dgodoy
Más detallesManual para la utilización de PrestaShop
Manual para la utilización de PrestaShop En este manual mostraremos de forma sencilla y práctica la utilización del Gestor de su Tienda Online mediante Prestashop 1.6, explicaremos todo lo necesario para
Más detallesde la empresa Al finalizar la unidad, el alumno:
de la empresa Al finalizar la unidad, el alumno: Identificará el concepto de rentabilidad. Identificará cómo afecta a una empresa la rentabilidad. Evaluará la rentabilidad de una empresa, mediante la aplicación
Más detalles1. Resolver el sistema de dos ecuaciones con dos incógnitas AX = B, donde 1 0,999 1,999 A = 1,999 . 0,999 1 1 0,999 A = . 0,999 1. AX = αo 1 + βo 2.
Instituto de Matemática y Estadística Prof Ing Rafael Laguardia Facultad de Ingeniería Universidad de la República C1 y GAL1 anuales 2009 Trabajo: número de condición y SVD El objetivo de este trabajo
Más detallesSesión No. 4. Contextualización INFORMÁTICA 1. Nombre: Procesador de Texto
INFORMÁTICA INFORMÁTICA 1 Sesión No. 4 Nombre: Procesador de Texto Contextualización La semana anterior revisamos los comandos que ofrece Word para el formato del texto, la configuración de la página,
Más detallesMUESTREO TIPOS DE MUESTREO
MUESTREO En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una población), se selecciona una muestra, entendiendo por tal una parte representativa de
Más detallesExcel 2010 Representación gráfica de datos
Excel 2010 Representación gráfica de datos Contenido CONTENIDO... 1 CONCEPTO DE GRÁFICO... 2 CREACIÓN DE GRÁFICOS... 3 CREAR UN GRÁFICO EN EXCEL WEB APP... 13 ESTABLECER FORMATOS AL GRÁFICO... 16 1 Concepto
Más detallesMUESTREO CONCEPTOS GENERALES
MUESTREO CONCEPTOS GENERALES Resumen del libro Muestreo para la investigación en Ciencias de la Salud Luis Carlos Silva Ayçaguer (páginas de la 1 a la 14) Cuando se decide cuantificar sólo una parte de
Más detallesOperación de Microsoft Excel
Representación gráfica de datos Generalidades Excel puede crear gráficos a partir de datos previamente seleccionados en una hoja de cálculo. El usuario puede incrustar un gráfico en una hoja de cálculo,
Más detallesSoluciones Informáticas para la Gestión de la Calidad c/vicente Aleixandre nº 10 4º H, 15009 A CORUÑA Telf: 981 133 207 / 616 145 723 info@spuch.
MANUAL DE USUARIO Índice Índice... 2 Introducción... 2 Pantalla inicial... 3 Conectar las bases de datos... 4 Periodicidad de sincronización... 6 Reglas de sincronización... 7 Ejecutar consultas SQL...
Más detallesSistemas de Sensación Segmentación, Reconocimiento y Clasificación de Objetos. CI-2657 Robótica M.Sc. Kryscia Ramírez Benavides
Sistemas de Sensación Segmentación, Reconocimiento y Clasificación de Objetos CI-2657 Robótica M.Sc. Kryscia Ramírez Benavides Introducción La visión artificial, también conocida como visión por computador
Más detallesAnálisis de propuestas de evaluación en las aulas de América Latina
Este trabajo de evaluación tiene como objetivo la caracterización de figuras del espacio. Para ello el alumno debe establecer la correspondencia entre la representación de la figura y algunas de sus propiedades.
Más detallesÁrea Académica: ICBI, Sistemas Computacionales. Profesor: M.C.C Víctor Tomás Tomás Mariano
Área Académica: ICBI, Sistemas Computacionales Tema: Mapas auto organizados Profesor: M.C.C Víctor Tomás Tomás Mariano Alumnos: Leticia Hernandez Hernandez. Agustin Escamilla Hernández Periodo: Julio-Diciembre
Más detallesTema 2. Espacios Vectoriales. 2.1. Introducción
Tema 2 Espacios Vectoriales 2.1. Introducción Estamos habituados en diferentes cursos a trabajar con el concepto de vector. Concretamente sabemos que un vector es un segmento orientado caracterizado por
Más detallesPROBLEMA 1. 1. [1.5 puntos] Obtener la ecuación de la recta tangente en el punto ( 2, 1) a la curva dada implícitamente por y 3 +3y 2 = x 4 3x 2.
PROBLEMA. ESCUELA UNIVERSITARIA POLITÉCNICA DE SEVILLA Ingeniería Técnica en Diseño Industrial Fundamentos Matemáticos de la Ingeniería Soluciones correspondientes a los problemas del Primer Parcial 7/8.
Más detallesMODELOS DE RECUPERACION
RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN INGENIERÍA INFORMÁTICA RECUPERACIÓN Y ACCESO A LA INFORMACIÓN MODELOS DE RECUPERACION AUTOR: Rubén García Broncano NIA 100065530 grupo 81 1 INDICE 1- INTRODUCCIÓN
Más detallesDecisión: Indican puntos en que se toman decisiones: sí o no, o se verifica una actividad del flujo grama.
Diagrama de Flujo La presentación gráfica de un sistema es una forma ampliamente utilizada como herramienta de análisis, ya que permite identificar aspectos relevantes de una manera rápida y simple. El
Más detallesEjemplos de conversión de reales a enteros
Ejemplos de conversión de reales a enteros Con el siguiente programa se pueden apreciar las diferencias entre las cuatro funciones para convertir de reales a enteros: program convertir_real_a_entero print
Más detallesApoyo para la preparación de los estudios de Ingeniería y Arquitectura Física (Preparación a la Universidad) Unidad 4: Vectores
Apoyo para la preparación de los estudios de Ingeniería y Arquitectura Física (Preparación a la Universidad) Unidad 4: Vectores Universidad Politécnica de Madrid 5 de marzo de 2010 2 4.1. Planificación
Más detallesESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Construcción de una Base de Datos
Descargado desde www.medwave.cl el 13 Junio 2011 por iriabeth villanueva Medwave. Año XI, No. 2, Febrero 2011. ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Construcción de una Base de Datos Autor:
Más detallesUNIDAD I: LÓGICA PROPOSICIONAL
UNIDAD I: LÓGICA PROPOSICIONAL ASIGNATURA: INTRODUCCIÓN A LA COMPUTACIÓN CARRERAS: LICENCIATURA Y PROFESORADO EN CIENCIAS DE LA COMPUTACIÓN DEPARTAMENTO DE INFORMÁTICA FACULTAD DE CIENCIAS FÍSICO MATEMÁTICA
Más detallesCapítulo 5: METODOLOGÍA APLICABLE A LAS NORMAS NE AI
Capítulo 5: METODOLOGÍA APLICABLE A LAS NORMAS NE AI La segunda fase del NIPE corresponde con la adecuación de las intervenciones de enfermería del sistema de clasificación N.I.C. (Nursing Intervention
Más detallesCOMPARACIÓN DE ÁREAS DE FIGURAS POR ESTUDIANTES DE PRIMERO DE MAGISTERIO
COMPARACIÓN DE ÁREAS DE FIGURAS POR ESTUDIANTES DE PRIMERO DE MAGISTERIO Sonia Aguilera Piqueras y Pablo Flores Martínez Departamento de Didáctica de la Matemática Universidad de Granada 1. Introducción
Más detallesARCHIVOS CON SERIES DEL BOLETÍN ESTADÍSTICO Manual de Usuario
Dirección General del Servicio de Estudios 04.09.2007 ARCHIVOS CON SERIES DEL BOLETÍN ESTADÍSTICO Manual de Usuario Departamento de Estadística Hoja de Control Título Autor Versión Fecha Registro de Cambios
Más detallesCaracterísticas de funciones que son inversas de otras
Características de funciones que son inversas de otras Si f es una función inyectiva, llamamos función inversa de f y se representa por f 1 al conjunto. f 1 = a, b b, a f} Es decir, f 1 (x, y) = { x =
Más detallesComenzando con MATLAB
ÁLGEBRA LINEAL INGENIERÍA INFORMÁTICA Curso 08/09 PRÁCTICA 1 Comenzando con MATLAB 1 Funcionamiento de Matlab MATLAB es un sistema interactivo basado en matrices para cálculos científicos y de ingeniería.
Más detallesMANUAL DE USUARIO APLICACIÓN SYSACTIVOS
MANUAL DE USUARIO APLICACIÓN SYSACTIVOS Autor Edwar Orlando Amaya Diaz Analista de Desarrollo y Soporte Produce Sistemas y Soluciones Integradas S.A.S Versión 1.0 Fecha de Publicación 19 Diciembre 2014
Más detallesx 10000 y 8000 x + y 15000 a) La región factible asociada a las restricciones anteriores es la siguiente: Pedro Castro Ortega lasmatematicas.
Pruebas de Acceso a Enseñanzas Universitarias Oficiales de Grado (PAEG) Matemáticas aplicadas a las Ciencias Sociales II - Septiembre 2012 - Propuesta A 1. Queremos realizar una inversión en dos tipos
Más detallesDirección de Planificación Universitaria Dirección de Planificación Universitaria 0819-07289 Panamá, Rep. de Panamá 0819-07289 Panamá, Rep.
Comparación de las tasas de aprobación, reprobación, abandono y costo estudiante de dos cohortes en carreras de Licenciatura en Ingeniería en la Universidad Tecnológica de Panamá Luzmelia Bernal Caballero
Más detallesCovarianza y coeficiente de correlación
Covarianza y coeficiente de correlación Cuando analizábamos las variables unidimensionales considerábamos, entre otras medidas importantes, la media y la varianza. Ahora hemos visto que estas medidas también
Más detallesConciliación bancaria en CheqPAQ Cargado de estado de cuenta
Conciliación bancaria en CheqPAQ Cargado de estado de cuenta Introducción Con la finalidad de mantenerte informado respecto a todos los cambios y mejoras de los productos de CONTPAQ i, ponemos a tu disposición
Más detallesCAPÍTULO V METODOLOGÍA
CAPÍTULO V METODOLOGÍA Los objetivos planteados según la geología existente y el tiempo de su realización son: a) Aplicar el Método de Tomografía Eléctrica en una zona de alto contraste resistivo, mediante
Más detallesBase de datos II Facultad de Ingeniería. Escuela de computación.
Base de datos II Facultad de Ingeniería. Escuela de computación. Introducción Este manual ha sido elaborado para orientar al estudiante de Bases de datos II en el desarrollo de sus prácticas de laboratorios,
Más detallesSEGURIDAD Y PROTECCION DE FICHEROS
SEGURIDAD Y PROTECCION DE FICHEROS INTEGRIDAD DEL SISTEMA DE ARCHIVOS ATAQUES AL SISTEMA PRINCIPIOS DE DISEÑO DE SISTEMAS SEGUROS IDENTIFICACIÓN DE USUARIOS MECANISMOS DE PROTECCIÓN Y CONTROL INTEGRIDAD
Más detallesPhotoshop. Conceptos Básicos
Photoshop Conceptos Básicos Qué es Photoshop? Tratamiento de imágenes Retoque fotográfico Pintura Posee gran versatilidad Herramienta de post-producción (separación de colores y medios tonos) La ventana
Más detallesAnálisis de componentes principales
Capítulo 2 Análisis de componentes principales 2.1. INTRODUCCIÓN El Análisis de componentes principales trata de describir las características principales de un conjunto de datos multivariantes, en los
Más detallesSIMULACION. Modelos de. Julio A. Sarmiento S. http://www.javeriana.edu.co/decisiones/julio sarmien@javeriana.edu.co
SIMULACION Modelos de http://www.javeriana.edu.co/decisiones/julio sarmien@javeriana.edu.co Julio A. Sarmiento S. Profesor - investigador Departamento de Administración Pontificia Universidad Javeriana
Más detalles