Evaluación de la Calidad de Datos en Portales Web

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Evaluación de la Calidad de Datos en Portales Web"

Transcripción

1 Departamento de Tecnologías y Sistemas de Información Universidad de Castilla-La Mancha Tesis Doctoral Evaluación de la Calidad de Datos en Portales Web Doctoranda: Carmen Moraga de la Rubia Directoras: Dra. Mª Ángeles Moraga Dra. Angélica Caro

2

3 Departamento de Tecnologías y Sistemas de Información Universidad de Castilla-La Mancha Tesis Doctoral Evaluación de la Calidad de Datos en Portales Web Ciudad Real (España), Julio 2013 Doctoranda: Carmen Moraga de la Rubia Directoras: Dra. Mª Ángeles Moraga Dra. Angélica Caro

4

5 Dedicatoria: A mis padres, José y Mª Carmen por estar siempre ahí, apoyándome en los momentos buenos y en los difíciles. Por aportar las palabras de aliento que me permiten continuar cuando es necesario. A mi hermana Marian por ser un pilar importante en mi vida. Por ayudarme y soportarme durante todos estos años de preparación de tesis. Sin ella, este proyecto no habría sido posible. A mi marido Héctor, que desde la discreción me ha aportado la calma que me hacía falta para dedicar tantas horas a esta tesis. A mis abuelos y tíos abuelos que se acuerdan de mí incluso en la distancia.

6

7 Agradecimientos: En primer lugar, mi agradecimiento a mi directoras de tesis, Marian Moraga y Angélica Caro por su paciencia y dedicación. Ha sido un honor trabajar con vosotras durante estos años, ya que he aprendido mucho y me habéis aportado parte de vuestra sabiduría. A Coral Calero por su apoyo y consejos. También me gustaría agradecer a Rodrigo por su apoyo en la obtención de cálculos y enseñanza de la herramienta SPSS. Y a Manuel por sus sabios consejos. Espero que sigamos en contacto en el futuro. A todos los miembros del grupo Alarcos por su ayuda y los buenos momentos que hemos pasado juntos. En especial, a Aurora, por las interminables charlas que hemos tenido. A todas aquellas personas que de una manera directa o indirecta han contribuido en la realización de esta tesis.

8

9 ÍNDICE ÍNDICE

10

11 ÍNDICE DE CONTENIDOS ÍNDICE... I ÍNDICE DE CONTENIDOS...III ÍNDICE DE FIGURAS...III ÍNDICE DE TABLAS... IX 1.- INTRODUCCIÓN INTRODUCCIÓN JUSTIFICACIÓN DEL TRABAJO HIPÓTESIS Y OBJETIVOS MARCO DE LA TESIS RESUMEN MÉTODOS DE TRABAJO INTRODUCCIÓN REVISIÓN SISTEMÁTICA DE LA LITERATURA Paso 1: Planificación de la revision sistemática Paso 2: Desarrollo de la revision sistemática Paso 3: Resultados de la revision sistemática Aplicación de RSL en la tesis DISEÑO DE ENCUESTAS Actividad 1: Establecer objetivos medibles y específicos Actividad 2: Planificar la encuesta Actividad 3: Asegurar que están disponibles los recursos apropiados Actividad 4: Diseñar la encuesta Actividad 5: Preparar el instrumento de colección de datos Actividad 6: Validar el instrumento Actividad 7: Seleccionar los participantes Actividad 8: Documentar la encuesta Actividad 9: Analizar los datos Actividad 10: Informar los resultados Aplicación de encuestas en la tesis RESUMEN ESTADO DEL ARTE PORTALES WEB TIPOS DE PORTALES WEB III

12 3.2.- CALIDAD DE DATOS CALIDAD DE DATOS EN PORTALES WEB PERFILES DE USUARIO ESTUDIOS RELACIONADOS CON LA CALIDAD DE DATOS Modelo de calidad de datos ESTÁNDAR DE CALIDAD ISO/IEC PDQM: Portal Data Quality Model Revisión sistemática de la literatura, para trabajos de DQ RESUMEN PROPUESTA DEL MODELO DE CALIDAD DE DATOS PARA PORTALES WEB INTRODUCCIÓN SPDQM Paso 1: Estudio de propuestas relacionadas Paso 2: Integración y adaptación al contexto Paso 3: Estructuración del modelo Paso 4: Operacionalización del modelo ANÁLISIS ESTÁTICO ) Definición del cuestionario ) Distribución de encuestas ) Análisis de resultados RESUMEN VALIDACIÓN DEL MODELO INTRODUCCIÓN ANÁLISIS DE RESULTADOS PARA LA CATEGORÍA INTRÍNSECA Paso 1. Análisis de correlación Paso 2. Análisis estadístico descriptivo Paso 3. Análisis de la varianza Paso 4. Análisis factorial Paso 5. Análisis de cluster ANÁLISIS DE RESULTADO PARA LA CATEGORÍA CONTEXTUAL IV

13 Paso 1. Análisis de correlación Paso 2. Análisis estadístico descriptivo Paso 3. Análisis de la varianza Paso 4. Análisis factorial Paso 5. Análisis de cluster RESUMEN SPDQM EN LA PRÁCTICA INTRODUCCIÓN PROCEDIMIENTO DE OBTENCIÓN DE GUÍAS PARA LA CATEGORÍA INTRÍNSECA Y LA CATEGORÍA CONTEXTUAL Ejemplo de procedimiento de obtención de guías para características de categoría Intrínseca Procedimiento de obtención de guías para características de categoría Contextual HERRAMIENTA PoDQA Características generales de PoDQA Aplicación Web. Acceso y pantallas principales Consultar qué es PoDQA y cómo funciona Aplicación del modelo Obtener información adicional RESUMEN CONCLUSIONES Y TRABAJO FUTURO ANÁLISIS DE LA CONSECUCIÓN DE OBJETIVOS ANÁLISIS DE LA CONSECUCIÓN DE OBJETIVOS PRINCIPALES APORTACIONES CONTRASTACIÓN DE RESULTADOS TRABAJO FUTURO RESUMEN BIBLIOGRAFÍA V

14 ACRÓNIMOS APÉNDICES VI

15 ÍNDICE DE FIGURAS DE FIGURAS

16

17 Índice de figuras Figura 1.-Ecuación para calcular el tamaño de una muestra Figura 2.- Organización de las normas del estándar SQuaRE Figura 3.- Red Bayesiana de PDQM Figura 4.- Artículos según la perspectiva desde la que han sido analizados Figura 5.- Artículos en función del contexto Figura 6.- Propuestas con modelo de calidad Figura 7.- Propuestas con medidas definidas Figura 8.- Herramientas Figura 9.- Artículos en cada año revisado Figura 10.- Características de calidad de datos Figura 11.- Procedimiento utilizado para obtener el modelo SPDQM Figura 12.- Estructura del modelo SPDQM por niveles Figura 13.- Análisis estático y análisis dinámico del modelo SPDQM Figura 14.- Clasificación de portales Web de Guruge Figura 15.- Clasificación de portales Web de Davydov Figura 16.- Tipos de portales Web Figura 17.- Porcentaje de la muestra Figura 18.- Aspectos de uso Figura 19.- Pasos del análisis de resultados Figura 20.- Interacción de usuarios con PoDQA Figura 21.- Qué es PoDQA Figura 22.- Cómo funciona PoDQA Figura 23.- Características/Subcaracterísticas de la categoría Intrínseca Figura 24.- Características/Subcaracterísticas de la categoría Contextual Figura 25.- Características/Subcaracterísticas de la categoría Representacional Figura 26.- Características/Subcaracterísticas de la categoría Operacional Figura 27.- Perfiles de la categoría Intrínseca Figura 28.- Aspectos demográficos de la categoría Intrínseca Figura 29.- Aspectos demográficos seleccionados para ejemplo 1 de categoría Intrínseca Figura 30.- Primera parte de guías para el ejemplo 1 de la categoría Intrínseca Figura 31.- Segunda parte de guías para el ejemplo 1 de la categoría Intrínseca Figura 32.- Aspectos demográficos seleccionados para ejemplo 2 de categoría Intrínseca Figura 33.- Guías para el ejemplo 2 de la categoría Intrínseca Figura 34.- Selección de tipo de portal Web en la categoría Contextual Figura 35.- Aspectos demográficos seleccionados para ejemplo 1 de la categoría Contextual y tipo de portal Web Búsqueda y lectura de Información Figura 36.- Guías para el ejemplo 1 de la categoría Contextual y tipo de portal Web Búsqueda y lectura de Información Figura 37.- Aspectos demográficos seleccionados para ejemplo 2 de la categoría Contextual y tipo de portal Web Búsqueda y lectura de Información Figura 38.- Primera parte de las guías para el ejemplo 2 de la categoría Contextual y tipo de portal Web Búsqueda y lectura de Información Figura 39.- Segunda parte de las guías para el ejemplo 2 de la categoría Contextual y tipo de portal Web Búsqueda y lectura de Información Figura 40.- Aspectos demográficos seleccionados para ejemplo 1 de la categoría Contextual y tipo de portal Web Interacción comercial IX

18 Figura 41.- Guías para el ejemplo 1 de la categoría Contextual y tipo de portal Web Interacción comercial Figura 42.- Aspectos demográficos seleccionados para ejemplo 2 de la categoría Contextual y tipo de portal Web Interacción comercial Figura 43.- Guías para el ejemplo 2 de la categoría Contextual y tipo de portal Web Interacción comercial Figura 44.- Aspectos demográficos seleccionados para ejemplo 1 de la categoría Contextual y tipo de portal Web Interacción con otras personas Figura 45.- Guías para el ejemplo 1 de la categoría Contextual y tipo de portal Web Interacción con otras personas Figura 46.- Aspectos demográficos seleccionados para ejemplo 2 de la categoría Contextual y tipo de portal Web Interacción con otras personas Figura 47.- Guías para el ejemplo 2 de la categoría Contextual y tipo de portal Web Interacción con otras personas Figura 48.- Sitios Web Figura 49.- Acerca de los creadores de la herramienta X

19 ÍNDICE DE TABLAS ÍNDICE DE TABLAS

20

21 Índice de tablas Tabla 1.- Principales actividades del proceso de creación de encuestas Tabla 2.- Categorías y dimensione de Calidad de Datos (Strong et al., 1997) Tabla 3.- Características del modelo de calidad de datos ISO/IEC Tabla 4.- Dimensiones de la clasificación de los artículos Tabla 5.- Pregunta y subpreguntas Tabla 6.- Distribución de estudios por fuentes Tabla 7.- Características de DQ para Web en general y para sitios Web Tabla 8.- Características descartadas Tabla 9.- Características de DQ aplicables a portales Web Tabla 10.- Características con diferente nombre pero el mismo concepto Tabla 11.- Características seleccionadas para portales Web Tabla 12.- Características por origen Tabla 13.- Clasificación de características de calidad de datos Tabla 14.- Características de calidad de datos para SPDQM Tabla 15.- Conjunto final de características de calidad de datos para SPDQM Tabla 16.- Estructura inicial de SPDQM Tabla 17.- Estructura final de SPDQM Tabla 18.- Definición de las características de DQ del modelo SPDQM Tabla 19.- Porcentajes de la muestra para categoría Intrínseca Tabla 20.- Porcentaje de la muestra para categoría Contextual Tabla 21.- Alfa de Cronbach para análisis de fiabilidad en la categoría Contextual Tabla 22.- Análisis de correlación de Spearman para categoría Intrínseca Tabla 23.- Resultado del análisis estadístico descriptivo para categoría Intrínseca Tabla 24.- ANOVA para el aspecto demográfico sexo para categoría Intrínseca Tabla 25.- ANOVA para el aspecto demográfico rango de edad para categoría Intrínseca Tabla 26.- ANOVA para el aspecto demográfico nivel de estudios para categoría Intrínseca Tabla 27.- ANOVA para el aspecto demográfico conocimientos informáticos para categoría Intrínseca Tabla 28.- Resumen de análisis de varianza para categoría Intrínseca Tabla 29.- Análisis factorial para categoría Intrínseca Tabla 30.- Análisis de cluster para categoría Intrínseca Tabla 31.- Tabla de contingencia para categoría Intrínseca Tabla 32.- Resumen de tabla de contingencia para categoría Intrínseca Tabla 33.- Análisis de correlación para categoría Contextual Tabla 34.- Análisis estadístico descriptivo para categoría Contextual Tabla 35.- ANOVA para el aspecto demográfico sexo para categoría Contextual y Búsqueda y lectura de información Tabla 36.- ANOVA para el aspecto demográfico sexo para categoría Contextual e Interacción con otras personas Tabla 37.- ANOVA para aspecto demográfico rango de edad para categoría Contextual y Búsqueda y lectura de información Tabla 38.- ANOVA para aspecto demográfico rango de edad para categoría Contextual e Interacción comercial Tabla 39.- ANOVA para aspecto demográfico nivel de estudios para categoría Contextual y Búsqueda y lectura de información XIII

22 Tabla 40.- ANOVA para aspecto demográfico nivel de estudios para categoría Contextual e Interacción comercial Tabla 41.- ANOVA para aspecto demográfico nivel de estudios para categoría Contextual e Interacción con otras personas Tabla 42.- ANOVA para aspecto demográfico tipo de organización para categoría Contextual Tabla 43.- Resumen de análisis de varianza para categoría Contextual Tabla 44.- Medida de adecuación muestral KMO Tabla 45.- Análisis factorial por cada tipo de portal Web Tabla 46.- Análisis de cluster para cada tipo de portal Web considerando los factores obtenidos Tabla 47.- Tabla de contingencia para categoría Contextual Tabla 48.- Resumen de tabla de contingencia Búsqueda y lectura de información Tabla 49.- Resumen tabla de contingencia Interacción comercial Tabla 50.- Resumen tabla de contingencia Interacción con otras personas Tabla 51.- Resultados de los ejemplos para los tres tipos de portales Web XIV

23 ABSTRACT More and more people are currently using Web portals, and this has led to an increase in the number of Web portals that are available. This implies that users have a great variety of Web portals with similar functionalities to choose from. Ensuring customer loyalty and an increase in user numbers thus signifies that Web portals must be more competitive if they are to remain in the market. We therefore believe that the Data Quality that they provide is of the upmost importance, since if Web portals have data quality their users will trust them and will use them to a greater extent in their daily tasks. Bearing all of the above in mind, in this thesis we have defined a data quality model denominated as SPDQM (SQuaRE aligned Portal Data Quality Model). The SPDQM model identifies a set of characteristics that affect the quality of the data in Web portals. These characteristics are grouped together in two viewpoints (Inherent and System Dependent) and four categories (Intrinsic, Contextual, Operational and Representational). The model has been operationalised by carrying out various statistical analyses which have allowed the different profiles of Web portal users to be identified according to their Data Quality preferences. These user profiles have been determined on the basis of various demographic aspects (gender, age, level of studies, knowledge of computing, type of organisation to which the user belongs, etc.). We have consequently obtained Data Quality guidelines that will allow designers and developers to discover the data quality characteristics to which most attention should be paid according to the different user profiles towards which their Web portals are aimed. These guidelines can be found in a tool which is available at: 1

24 2

25 RESUMEN Los portales Web son cada vez más utilizados, lo que ha derivado en una proliferación de los mismos. Esto implica que los usuarios tienen una gran variedad de portales Web, con funcionalidades similares, entre los que escoger. Por ello, y con el objetivo de mantenerse en el mercado, fidelizar a sus clientes y aumentar el número de usuarios, los portales Web tienen que ser más competitivos. En este sentido, creemos que para conseguirlo es muy importante la Calidad de los Datos que éstos proporcionan. Ya que, si los portales Web tienen calidad en sus datos, los usuarios tendrán más confianza en ellos y los utilizarán más en sus tareas diarias. Teniendo todo esto en cuenta, en esta tesis hemos definido un modelo de calidad de datos, denominado SPDQM (Modelo de Calidad de datos para portales Web alineado con SQuaRE). El modelo SPDQM identifica un conjunto de características de calidad que afectan a la calidad de los datos de los portales Web. Estas características se agrupan en dos puntos de vista (Inherente y Dependiente del Sistema) y cuatro categorías (Intrínseca, Contextual, Operacional y Representacional). Con el objetivo de operacionalizar el modelo, se han realizado varios análisis estadísticos que han permitido identificar los diferentes perfiles que existen entre los usuarios de los portales Web en función de sus preferencias de Calidad de Datos. Estos perfiles de usuario se determinan en función de distintos aspectos demográficos (sexo, edad, nivel de estudios, conocimientos informáticos, tipo de organización a la que pertenece, ). Como resultado se obtienen guías de Calidad de Datos que permiten a diseñadores y desarrolladores conocer las características de calidad de datos a las que deben prestar más atención en función de diferentes perfiles de usuario a los que vaya dirigido el portal Web. Finalmente, estas guías se dan a conocer en una herramienta libre que se encuentra disponible en 3

26 4

27 1.- INTRODUCCIÓN 1.- INTRODUCCIÓN 5

28 6

29 1.- Introducción INTRODUCCIÓN El auge de las Tecnologías de la Información (TI s) está cambiando la forma de actuar. Inicialmente, el traspaso de información entre los individuos era verbal, necesitando estar físicamente cerca o con señales de humo, para distancias relativamente cortas. Posteriormente, apareció la escritura, lo que posibilitó el intercambio de información, mediante palomas o personas que enviaban y transportaban las cartas de un lugar de otro. Más tarde, se inventó el telégrafo y el teléfono que permitían informar a otras personas a grandes distancias. En la actualidad, con la llegada de Internet, se ha revolucionado la manera de comunicarnos, ya que que permite interconectar muchos ordenadores, y conseguir que millones de personas accedan a grandes volúmenes de información con un solo click. Internet, nos ha permitido desde comunicarnos en tiempo real con otras personas geográficamente lejanas, hasta enviar y obtener información de manera anónima. Al principio, era poca la información que había, por lo que se gestionaba fácilmente. A medida que ha ido pasando el tiempo, la cantidad de información ha aumentado, dificultando su localización porque estaba disgregada, de forma que los usuarios no sabían dónde acceder para obtener lo que buscaban. Como solución a este problema, surgen los portales Web. Cada vez más compañías han decidido utilizar los portales Web para vender sus productos o como punto de acceso a las herramientas que sus empleados necesitan para realizar su trabajo. Además, con el tiempo los portales Web han evolucionado y hoy proporcionan gran variedad de servicios. En este sentido, uno de los ojetivos de muchos portales Web es seleccionar, organizar y distribuir contenidos (información u otros servicios y productos) para satisfacer las necesidades de sus usuarios/consumidores (Domingues et al., 2006). Por tanto, es esencial que la información contenida en los portales Web tenga cierta calidad en sus datos (Domingues et al., 2006). El éxito de un portal Web depende de si los usuarios acceden a él o no. En este sentido, si la calidad de la información que el portal Web ofrece, no es buena o suficiente, es posible que los usuarios no vuelvan a acceder a dicho portal Web y busquen otros que tengan mayor calidad en sus datos. 7

30 1.- Introducción Sin embargo, cada usuario es diferente. Por ello, la percepción que se tiene sobre la calidad de los datos de un portal Web es subjetiva y puede variar en función del usuario que acceda a dicho portal Web. En este sentido, se considera también importante definir perfiles de usuario que agrupen el comportamiento que estos tienen ante un portal Web. Estos perfiles de usuario vienen definidos por diferentes aspectos demográficos JUSTIFICACIÓN DEL TRABAJO Como hemos comentado anteriormente es fundamental evaluar la calidad de datos dentro del contexto de portales Web ya que los usuarios que acceden a los mismos requieren datos que cumplan unos mínimos de calidad. Si los portales Web no satisfacen las necesidades de los usuarios, en cuanto a la calidad de datos (DQ 1 ) se refiere, éstos pueden incluso llegar a desaparecer. Por ello, y con el objetivo de poder analizar la calidad de datos en portales Web, es necesario tener un modelo de DQ formado por un conjunto de características de calidad de datos. A pesar de que existen trabajos que abordan la DQ en portales Web y que proponen un modelo de DQ para este contexto, ninguno de ellos tiene en cuenta el estandar ISO/IEC por lo que se hace necesaria la creación de un modelo de calidad de datos donde este estándar sea tenido en cuenta. Sin embargo, la definición teórica del modelo no es suficiente por lo que realizamos además la operacionalización del mismo. Para ello, se tiene en cuenta la percepción que los usuarios tienen sobre las características de DQ de portales Web. En este sentido, consideramos que esto es importante, pues ellos influyen en la relevancia que se le da a cada una de ellas. De forma que, estudiaremos posibles perfiles de usuario en función de diferentes aspectos demográficos (sexo, edad, nivel de estudios, conocimientos informáticos, tipo de organización a la que pertenece). Estos perfiles son importantes, porque no todos los 1 Calidad de Datos: se denominará DQ por las siglas inglesas de Data Quality 8

31 1.- Introducción usuarios van a considerar las mismas características de DQ ni le van a dar la misma importancia, ya que sus necesidades son diferentes. Los resultados obtenidos serán útiles a la hora de crear o modificar portales Web, ya que permitirá saber en qué características de calidad de datos se debe prestar más atención en función del perfil de usuario al que vaya destinado HIPÓTESIS Y OBJETIVOS Llegados a este punto, es preciso definir las hipótesis y objetivos de esta tesis. La hipótesis de la que partimos es: Es posible identificar un conjunto de características de calidad de datos de los portales Web que se agrupan formando un modelo de DQ y que se puede refinar en función de diferentes perfiles de usuario. El objetivo principal es: Definir un modelo de calidad de datos de portales Web que pueda ser utilizado por los diseñadores y desarrolladores para conseguir la mayor satisfacción de sus usuarios clasificados por perfiles. Para conseguir este objetivo principal llevamos a cabo los siguientes objetivos secundarios: Obtener características de DQ de la literatura. Seleccionar características de DQ válidas para portales Web. 9

32 1.- Introducción Crear modelo de DQ agrupando las características en puntos de vista y categorías. Para ello es preciso: - Clasificar las características seleccionadas. - Alinear el modelo de DQ con el estándar ISO/IEC Analizar la percepción de los usuarios para las características de DQ, mediante la realización de encuestas. Definir perfiles de usuario de portales Web. Crear guías para indicar las características de DQ de portales Web a las que se debe prestar más atención para cada perfil de usuario. Implementar las guías en una herramienta libre MARCO DE LA TESIS Esta tesis se enmarca dentro de los proyectos: ORIGIN (CDTI-MICINN and FEDER IDI (1-5)), PEGASO/MAGO (TIN C02-01) y GEODAS-BC (Ministerio de Economía y Competitividad and Fondo Europeo de Desarrollo Regional FEDER, TIN C03-01). Proyecto ORIGIN (CDTI-MICINN and FEDER IDI (1-5)): plantea como objetivo principal aumentar la productividad de las actividades de desarrollo de software en escenarios globales y mejorar la calidad del software desarrollado, tomando como base la inteligencia organizacional y la innovación, incrementando el nivel competitivo de las organizaciones. Esto contribuirá de manera significativa a impulsar el papel de España como destino y origen de fábricas de software, además permitirá disponer de un modelo exportable a otros países y empresas, con la consecuente prestación de servicios de consultoría en esta área. Para ello se desarrolla un conjunto de herramientas conceptuales, metodológicas y sistemas software que permitan a los proveedores optimizar la fabricación de software en escenarios globales, paliando los problemas de comunicación y gestión de conocimiento y asegurando la calidad del software desarrollado. Del mismo modo, las tecnologías desarrolladas facilitarán la utilización del conocimiento organizacional en las actividades de desarrollo (a la vez que dichas actividades contribuyen a la 10

33 1.- Introducción generación del mismo), descubriéndolo y haciéndolo fluir desde las personas hasta los distintos niveles organizativos y viceversa. De esta forma se podrán desarrollar sistemas que facilitarán la toma de decisiones que dirigirá éstas y el resto de actividades de la organización, con el objetivo de incrementar su competitividad, centrándose para ello en la innovación y excelencia como factores diferenciadores. Proyecto PEGASO/MAGO (TIN C02-01): investiga la aplicación de diferentes técnicas de la ingeniería de procesos software con el fin de mejorar la calidad del software desarrollado en entornos globales. Estas técnicas se contrastan experimentalmente utilizando Ingeniería del Software Empírica. Sus principales aportaciones se clasifican en cuatro áreas: - Definición de procesos software adaptables y flexibles. - Desarrollo de marcos multimodelo para la mejora de la calidad del software. - Diseño de técnicas avanzadas para la gestión cuantitativa de procesos software. - Desarrollo de un método para la ingeniería de requisitos global. Se trata de un proyecto coordinado entre el Grupo Alarcos de la Universidad de Castilla-La Mancha y el Grupo de Investigación de Ingeniería del Software de la Universidad de Murcia. Cuenta con la colaboración de grupos de investigación internacionales, lo que hace posible la experimentación en entornos globales, así como con numerosas empresas, que permite contrastar las técnicas propuestas en factorías de software reales. Proyecto GEODAS-BC2 (Ministerio de Economía y Competitividad and Fondo Europeo de Desarrollo Regional FEDER, TIN C03-01): investiga la aplicación de diferentes técnicas con el fin de mejorar la gestión de factorías de software que trabajan en entornos globales. Estas técnicas serán aplicadas en entornos reales en colaboración con importantes empresas en el ámbito internacional como Indra o Prologue. 2 GEODAS, siglas de GEstiÓn para el Desarrollo global del Software 11

34 1.- Introducción Las aportaciones se clasifican en cuatro áreas: Aplicación de la ingeniería de negocio para la definición de procesos en factorías de software en entornos globales. Creación de entornos avanzados de colaboración basados en análisis de redes sociales y en técnicas de gestión de conocimiento, y desarrollo de técnicas de formación para entornos de desarrollo global de software. Aplicación de Inteligencia de Negocio (Business Intelligence) para la definición de cuadros de mando de gestión y técnicos para factorías de software en entornos globales. Soporte a la gestión de factorías de software en entornos globales guiada por los requisitos. Se trata de un proyecto coordinado entre el Grupo Alarcos de la Universidad de Castilla-La Mancha, el Grupo de Investigación de Ingeniería del Software de la Universidad de Murcia y el Grupo Lucentia de la Universidad de Alicante. Cuenta con la colaboración de varios grupos de investigación internacionales, así como con numerosas empresas RESUMEN En este capítulo se han expuesto los conceptos generales relativos a los portales Web, y a calidad de datos, especificando las ventajas de la utilización de los mismos y la importancia de que estos tengan calidad en sus datos. Además, se han especificado los principales objetivos que se pretenden alcanzar en este trabajo. 12

35 MÉTODOS DE TRABAJO DE TRABAJO 13

36 14

37 2.-Métodos de trabajo INTRODUCCIÓN En este apartado presentamos los métodos de trabajo utilizados para definir el modelo de calidad de datos e identificar los diferentes perfiles de usuarios de portales Web REVISIÓN SISTEMÁTICA DE LA LITERATURA Una revisión sistemática de la literatura (RSL) (a menudo nombrada como revisión sistemática) es un medio para identificar, evaluar e interpretar todas las investigaciones relevantes disponibles para una pregunta concreta de investigación, tema de un área o fenómeno de interés. Para llevar a cabo una revisión sistemática de la literatura, (Kitchenham and Charters, 2007) proponen seguir tres pasos principales. Estos pasos se muestran en las siguientes subsecciones Paso 1: Planificación de la revision sistemática Antes de emprender una revisión sistemática es necesario confirmar la necesidad de su realización. En algunos casos las revisiones sistemáticas son realizadas por encargo en cuyo caso la petición debe quedar por escrito en un documento. Sin embargo, las actividades de pre-revisión más importantes son la definición de las preguntas de investigación y el desarrollo de protocolo de revisión, ya que son la base del procedimiento a seguir. En este paso se diferencian los siguientes subpasos: - La identificación de la necesidad de realizar una revisión sistemática. - El encargo de una revisión. - La definición de las preguntas de investigación que son necesarias para la realización de la revisión sistemática. 15

38 2.-Métodos de trabajo - La generación de un protocolo de revisión. - La evaluación del protocolo Identificación de la necesidad de realizar una revisión sistemática La realización de una revisión sistemática surge de la necesidad de los investigadores de resumir de una manera minuciosa e imparcial toda la información existente sobre algún fenómeno. De esta forma se obtienen conclusiones más generales que las obtenidas con estudios individuales Encargo de una revisión Algunas veces las organizaciones necesitan información sobre un tema específico pero no tienen tiempo o no disponen de los conocimientos necesarios para realizar una revisión sistemática, en esos casos habrá investigadores de encargo para desarrollar la revisión sistemática de la literatura para ese tema en concreto. Cuando esto ocurre la organización debe crear un documento de petición con la información sobre el trabajo requerido Definición de las preguntas de investigación que son necesarias para la realización de la revisión sistemática La especificación de las preguntas de investigación es una de las partes más importantes de la revisión sistemática. Las preguntas de la revisión conducen la metodología de la revisión sistemática completa. Por ello, es necesario que: - El proceso de búsqueda identifique los estudios primarios que guían las preguntas de investigación. - El proceso de obtención de datos extraiga la información necesaria para contestar las preguntas. - El proceso de análisis de datos sintetice los datos para que las preguntas puedan ser contestadas. 16

39 2.-Métodos de trabajo Generación de un protocolo de revisión El protocolo de revisión especifica los métodos utilizados para llevar a cabo una revisión sistemática concreta. Para reducir posibles sesgos o parcialidad de la investigación es necesario realizar un protocolo pre-definido. Por ejemplo, sin un protocolo, es posible que la selección de los estudios individuales esté dirigido por las expectativas de los investigadores Evaluación del protocolo de revisión El protocolo es un elemento importante de una revisión sistemática. Los investigadores deben acordar un procedimiento de evaluación del protocolo. En caso de disponer de suficiente financiación, un grupo de expertos independientes podría encargarse de revisar el protocolo e incluso revisar los resultados finales Paso 2: Desarrollo de la revision sistemática Una vez que el protocolo ha sido aprobado, empieza la revisión propiamente dicha. Con respecto al desarrollo se deben considerar los siguientes subpasos: - Identificación de la investigación. - Selección de estudios primarios. - Evaluación de la calidad del estudio. - Extracción y monitorización de datos. - Realización de síntesis de datos Identificación de la investigación El objetivo de la revisión sistemática es encontrar, por medio del uso de estrategias de búsqueda imparciales, todos los estudios primarios que sean posibles y que están relacionados con las preguntas de investigación,. El rigor del proceso de búsqueda es uno de los factores que distingue a las revisiones sistemáticas de las revisiones tradicionales. 17

40 2.-Métodos de trabajo Selección de estudios primarios Una vez que se han obtenido los estudios primarios potencialmente relevantes, estos se evaluan para analizar su relevancia real. Es necesario definir criterios de selección para identificar aquellos estudios primarios que proporcionan información adecuada y directa sobre las preguntas de investigación. Para evitar posibles sesgos o parcialidad los criterios de selección deben decidirse durante la definición del protocolo aunque pueden ser refinados a lo largo del proceso de búsqueda. Los criterios de inclusión y exclusión deben basarse en las preguntas de investigación y deben asegurar que los estudios son clasificados correctamente. Los criterios de inclusión consideran aquello que deben cumplir los artículos para ser seleccionados, por ejemplo, que todos los artículos estén en inglés. Sin embargo, los criterios de exclusión son aquellos que hacen que un artículo sea descartado, por ejemplo, artículos duplicados Evaluación de la calidad del estudio Además de los criterios generales de inclusión y de exclusión se debe evaluar la calidad de los estudios primarios, por ello, puede ser necesario: - Proporcionar criterios de inclusión y exclusión más detallados. - Interpretar de resultados para comprobar si son correctos. - Definir recomendaciones para más investigaciones Extracción y monitorización de datos El objetivo es diseñar los formularios en los que se van a extraer los datos para registrar con exactitud la información obtenida por los investigadores sobre los estudios primarios. Para reducir la posibilidad de parcialidad, la forma de extracción debe ser definida y guiada después de definirse el protocolo de estudio. 18

41 2.-Métodos de trabajo Las formas de extracción de datos deben diseñarse para recoger toda la información necesaria para guiar las preguntas de la revisión y los criterios de calidad del estudio. Es importante no incluir múltiples publicaciones de los mismos datos en una revisión sistemática porque artículos duplicados podrían influir seriamente en los resultados. Por tanto, sería necesario contactar con los autores para confirmar si los artículos se refieren a los mismos estudios. En el caso de publicaciones duplicadas, se debe seleccionar la más completa Realización de síntesis de datos La síntesis de datos recoge el resumen de los resultados obtenidos de los estudios primarios seleccionados. La síntesis puede ser descriptiva (no-cuantitativa). Sin embargo, algunas veces es posible completar una síntesis descriptiva con un resumen cuantitativo Paso 3: Resultados de la revision sistemática La fase final de la revisión sistemática implica escribir los resultados de la revisión y ponerlos a disposición de posibles interesados. Dentro de este paso se deben realizar los siguientes subpasos: - Definición de mecanismos de difusión. - Dar formato al resultado principal. - Evaluar el resultado Definición de mecanismos de difusión Es importante comunicar los resultados de la revisión sistemática de manera efectiva. Por esta razón, se recomienda planificar la definición de mecanismos de difusión durante el paso del encargo de la revisión (si lo hay) o cuando se prepara el protocolo de la revisión sistemática. 19

42 2.-Métodos de trabajo Los académicos normalmente difunden los resultados en revistas académicas y/o conferencias. Sin embargo, si los resultados de la revisión sistemática son de interés general, se pueden utilizar: - Revistas de interés general. - Prensa de interés general o prensa especializada. - Folletos. - Posters. - Páginas Web. - Comunicación directa a los interesados Dar formato al resultado principal Normalmente las revisiones sistemáticas son presentadas en al menos dos formatos: - Un informe técnico o una sección de una tesis de doctorado. - Una revista o una conferencia. Normalmente los artículos publicados en revistas o conferencias tienen un tamaño limitado. Por ello, para asegurar que el lector es capaz de evaluar con rigor y validar la revisión sistemática, los artículos de revista o de conferencia deberían hacer referencia a un informe técnico o una tesis que contenga los detalles Evaluar el resultado Los artículos de revista son revisados antes de ser publicados. Las tesis son revisadas por expertos como parte del proceso de examinado. Por su contra, los informes técnicos no suelen estar sujetos a ninguna evaluación independiente. Sin embargo, si la revisión sistemática está disponible en la Web los resultados pueden ser rápidamente analizados por expertos. 20

43 2.-Métodos de trabajo Aplicación de RSL en la tesis En esta tesis la revisión sistemática de la literatura se realiza para obtener aquellos artículos que tratan la calidad de datos tanto en la Web en general como en portales Web de forma que seleccionan las características de calidad de datos que son tratadas en los mismos. Esto sirve como base para la creación de un modelo de calidad de datos de portales Web formado por un conjunto de características DISEÑO DE ENCUESTAS En (Kitchenham and Pfleeger, 2002d; Kitchenham and Pfleeger, 2002c; Kitchenham and Pfleeger, 2002b; Kitchenham and Pfleeger, 2002a; Kitchenham and Pfleeger, 2003; Pfleeger and Kitchenham, 2001) se indica el procedimiento que se debe seguir para realizar encuestas. Una encuesta es un sistema que permite recoger información, describir, comparar o explicar conocimiento, actitudes y comportamiento (Pfleeger and Kitchenham, 2001). Son varios los tipos de encuestas existentes. Entre ellas se pueden destacar las siguientes (Pfleeger and Kitchenham, 2001): - Supervisadas: a cada encuestado se le asigna un investigador con el objetivo de que le resuelva todas las dudas que le puedan surgir acerca de las preguntas y que responda a todas las preguntas. - No supervisadas: no existe un investigador para resolver las dudas. - Semi-supervisadas: un investigador explica los objetivos y el formato, e incluso puede hacer algunos ejemplos, pero después deja a los encuestados que proporcionen la información por sí mismos. 21

44 2.-Métodos de trabajo Asimismo, para llevar a cabo una encuesta debe desarrollarse un conjunto concreto de actividades que se muestran en la siguiente tabla. Actividad 1. Establecer objetivos medibles y específicos 2. Planificar la encuesta 3. Asegurar que están disponibles los recursos apropiados 4. Diseñar la encuesta 5. Preparar el instrumento de colección de datos 6. Validar el instrumento 7. Seleccionar los participantes 8. Documentar la encuesta 9. Analizar los datos 10. Informar los resultados Tabla 1.- Principales actividades del proceso de creación de encuestas A continuación, se detallan cada una de las actividades presentadas en la Tabla Actividad 1: Establecer objetivos medibles y específicos En este paso es importante definir adecuadamente los objetivos de la encuesta. De forma que se eviten ambigüedades, mediante una definición clara de cada uno de los términos incluidos en la encuesta. Estas definiciones son útiles tanto para el desarrollo y diseño del instrumento como para el entendimiento de la terminología por parte de los encuestados. Los objetivos son esenciales para el desarrollo del resto de actividades del proceso, ya que determinan qué se va a preguntar, qué población es objeto de estudio y qué tipo de información es preciso recolectar. Una vez definidos los objetivos se pasa a realizar el resto de actividades. 22

45 2.-Métodos de trabajo Actividad 2: Planificar la encuesta Antes de diseñar la encuesta se debe determinar la muestra de población en base a los objetivos, teniendo en cuenta factores como el tamaño apropiado de la muestra y la obtención del mayor número posible de respuestas Actividad 3: Asegurar que están disponibles los recursos apropiados Para realizar una encuesta es preciso disponer de los recursos que vayan a ser necesarios. Por ejemplo, recursos para construir el instrumento y distribuirlo Actividad 4: Diseñar la encuesta El proceso de diseño empieza con la revisión de los objetivos, examinando la muestra de población que se ha identificado en función de los objetivos y decidiendo la mejor forma de obtener la infomación que se necesita para conseguir esos objetivos (Kitchenham and Pfleeger, 2002d). Por ello, el diseño debe ser adecuado y coincidente con los objetivos de ésta, además es muy similar al diseño de un experimento (Pfleeger, 1995 and 1996). Como con un método experimental, los diseños pueden ir de los más simples a los más complejos, escogiendo el que más convenga según la situación. Es decir, debemos seleccionar un diseño que proporcione la forma más efectiva para obtener la información necesaria para alcanzar los objetivos (Kitchenham and Pfleeger, 2002d), donde efectividad significa:: - Evitar parcialidad: el diseño no debe estar influenciado por algún hecho, aspecto u opinión particular. Los resultados de la encuesta deben reflejar la realidad de la situación. - Apropiada: el diseño debe tener sentido dentro del contexto de la población. Debe ser lo suficientemente complejo para tratar los temas planteados en los objetivos del estudio pero no debe ser más complejo de lo necesario. 23

46 2.-Métodos de trabajo - Coste efectivo: la distribución y análisis del diseño deben estar dentro de los recursos destinados a la encuesta. Este coste efectivo también se aplica a los participantes en la encuesta, de forma que los resultados de la encuesta sean útiles para ellos y así consideren que vale la pena completar la encuesta. El diseño de la encuesta dependerá de los objetivos, recursos y tipo de estudio a realizar. En particular, puede ser descriptivo o experimental. En el diseño descriptivo se proporcionan los objetivos y recursos para hacer un estudio observacional. Este diseño se puede dividir en los siguientes tres tipos (Kitchenham and Pfleeger, 2002d): - Sección transversal: en este tipo se pregunta a los participantes acerca de la información en una hora concreta. Esta información nos da una fotografía de lo que se está haciendo en una organización. - Cohorte: este tipo de estudio es progresista y entrega información acerca de los cambios en una población específica. - Caso de control: este estudio es retrospectivo, consulta a los participantes sobre sus circunstancias anteriores para tratar de explicar un fenómeno actual. En el diseño experimental distinguimos cinco tipos (Kitchenham and Pfleeger, 2002d), que son: - Estudios de control concurrente en los que los participantes son asignados a grupos de forma aleatoria: en este tipo se convoca a los participantes y se asignan de forma aleatoria a grupos experimentales reales en un mismo instante de tiempo. - Estudios de control concurrente en los que los participantes no son asignados de forma aleatoria a grupos: en este caso los participantes no se pueden asignar de forma aleatoria. Esto sucede en las ocasiones en las que los grupos experimentales existen de forma natural. - Estudios auto-controlados: estos estudios están basados en medidas pre y post tratamiento. Por ejemplo, estudios en los que a los participantes se les pregunta por la información antes o después de alguna intervención. 24

47 2.-Métodos de trabajo - Estudios de control histórico: en este tipo de diseño, las comparaciones entre grupos están basadas en los datos obtenidos en encuestas o estudios anteriores. - Estudios que utilizan una combinación de técnicas: consisten en realizar el diseño mediante la combinación de los diseños anteriores de diferentes maneras Actividad 5: Preparar el instrumento de colección de datos La siguiente tarea consiste en construir el instrumento de encuesta. Los pasos a realizar son (Kitchenham and Pfleeger, 2002c): Buscar en la literatura Como cualquier buen estudio de investigación, se debe empezar con la búsqueda en la literatura de trabajos parecidos sobre un tema en concreto para determinar cómo en los estudios previos los investigadores recogieron los datos. Esto se realiza, con la finalidad de no duplicar los trabajos existentes y de aprender y mejorar a partir de los estudios previos Construir un instrumento o reutilizar uno existente En algunas ocasiones se utilizan instrumentos existentes, lo cual puede ser ventajoso ya que, se ha evaluado su validez y fiabilidad y además, permite comparar los nuevos resultados con los resultados de otros estudios. Sin embargo, no siempre es posible utilizar un instrumento existente y hay que crear uno nuevo o modificar uno existente. Los pasos necesarios para construir un instrumento son los siguientes: Selección de las preguntas Para realizar las preguntas es necesario tener en cuenta el propósito y los objetivos de la encuesta. Los objetivos pueden ser formulados como preguntas de investigación o 25

48 2.-Métodos de trabajo hipótesis de investigación, o como sentencias simples. Lo importante es conseguir que las preguntas de la encuesta estén directamente relacionadas con los objetivos de la misma. Además, cuando se decide qué preguntar es importante considerar los siguientes factores: Entendimiento de los encuestados: Las preguntas deben ser formuladas de forma que los encuestados puedan responderlas de forma fácil y precisa. Es importante asegurarse de que los encuestados tienen el conocimiento necesario para responder a las preguntas. Realización de un número apropiado de preguntas: Es importante considerar un número de preguntas que los encuestados realmente puedan contestar en el tiempo asignado y estén dispuestos a destinar ese tiempo. Es importante no realizar demasiadas preguntas porque en ese caso es posible que los encuestados proporcionen respuestas que sean convenientes pero que en realidad no sean precisas ni serias. Por tanto, si el número de preguntas es muy elevado se deberían eliminar algunas de ellas. De forma que, las preguntas deberían agruparse por temas y eliminar las menos importantes sin reducir los objetivos iniciales de la encuesta. Además, debe tenerse en cuenta que el tiempo necesario para responder a las preguntas no está siempre relacionado con el número de éstas. Estandarización de los formatos de las respuestas: La estandarización del formato de las preguntas permite reducir el tiempo necesario para completar la encuesta. Por ejemplo, un posible formato de respuesta sería utilizar una escala ordinal de la forma: Totalmente de acuerdo, De acuerdo, En desacuerdo y Totalmente en desacuerdo. De esta forma los encuestados conocen las diferentes posibilidades para cada pregunta y no tienen que perder el tiempo leyendo y tratando de entender las alternativas de respuesta para cada pregunta Construcción de las preguntas Cuando se conoce qué se quiere preguntar, se debe definir cómo hacerlo. Las preguntas deben ser: Preguntas con sentido: Las preguntas deben estar redactadas de forma que los encuestados puedan ver la relación entre la intención de la pregunta y los objetivos de la encuesta. 26

49 2.-Métodos de trabajo Preguntas concretas: Cada pregunta debe ser precisa y no contener ambigüedades. Para conseguirlo, hay que poner atención en la redacción y clarificar las preguntas, para evitar dos ideas diferentes en una misma pregunta que confunda al encuestado, por lo que se tendrán que incluir algunos detalles adicionales. Es preciso considerar el tiempo necesario para responder a cada pregunta, pues puede haber preguntas que requieran un año para ser respondidas y otras en las que se necesiten sólo unos minutos. El lenguaje utilizado para la construcción de las preguntas debe ser un lenguaje convencional, con sentencias completas que expresen una idea simple. Esto implica cuidar la gramática, las puntuaciones y la ortografía. Además, no se debe asumir que los encuestados conocen la terminología que se utiliza, por tanto, se puede definir un conjunto de términos si se considera necesario. Otra precaución es no realizar preguntas negativas, ya que son más difíciles de comprender y requieren un ejercicio de razonamiento lógico Tipos de preguntas Las preguntas para un instrumento de encuesta pueden ser de dos tipos: Abiertas: los encuestados tienen libertad para realizar su propia respuesta. Cerradas: las respuestas están predefinidas y los encuestados deben seleccionar una de las posibles opciones de entre una lista de alternativas predefinidas. En ambos tipos de preguntas se presentan tanto ventajas como desventajas. Por ejemplo, las preguntas abiertas evitan imponer cualquier tipo de restricción a los encuestados, pero pueden dar lugar a interpretaciones incorrectas y las respuestas son más difíciles de codificar y de analizar. Las preguntas cerradas restringen al encuestado pero son más fáciles de analizar. En las preguntas cerradas cuando se realizan preguntas categóricas se necesita incluir una respuesta que sea ninguna de las anteriores o no sabe o bien alguna respuesta neutral como ninguna preferencia como punto medio de la escala. En las preguntas cerradas los encuestados pueden elegir una o varias 27

50 2.-Métodos de trabajo respuestas, a no ser que se pongan alternativas totalmente excluyentes entre sí. Además, es aconsejable que la escala sea balanceada, es decir, que los dos extremos signifiquen el uno lo opuesto del otro y los intervalos entre los puntos de la escala sean iguales. Normalmente este tipo de preguntas son muy utilizadas en las encuestan que se envían por correo electrónico. Adicionalmente, la mayoría de las encuestas incluyen preguntas demográficas que describen a los encuestados. Estas preguntas suelen ponerse al final para no desalentar a los encuestados Formato del cuestionario Para los cuestionarios que se proporcionan de forma libre, es importante tener en cuenta tanto el formato del cuestionario como las instrucciones que se van a indicar para su realización. Para los cuestionarios impresos y los cuestionarios Web se muestra a continuación una lista de comprobación del formato: - Dejar en el cuestionario un espacio para que los encuestados puedan realizar comentarios. - Utilizar espacios entre las preguntas. - Usar un formato vertical, espacios, cajas, flechas, etc para maximizar la claridad de las preguntas. - Considerar el uso de cuadrículas simples. - Considerar el uso de un formato de folleto. - Tener un buen contraste en el papel impreso. - Utilizar un tamaño de fuente entre 10 y Usar una letra que sea fácil de leer. - Evitar el uso de la letra cursiva. - Utilizar negrita, subrayado o mayúsculas de forma coherente y consistente para enfatizar y ordenar. - No dividir las instrucciones, preguntas y respuestas asociadas en distintas páginas. 28

51 2.-Métodos de trabajo Para la información y las instrucciones se puede utilizar la siguiente lista de comprobación: - Explicar el propósito del estudio. - Indicar quién es el patrocinador del estudio y quizás por qué. - Incluir un sobre con membrete y fecha y que incluya un nombre de contacto y un número de teléfono. - Explicar cómo fueron seleccionados los encuestados y porqué. - Explicar cómo devolver el cuestionario. - Proporcionar una estimación realista del tiempo necesario para completar el cuestionario. Considerar una estimación no realista puede ser contraproducente Actividad 6: Validar el instrumento A continuación se debe evaluar el cuestionario. Para ello, se consideran los siguientes aspectos (Kitchenham and Pfleeger, 2002b): - Motivar a los encuestados para que respondan de forma libre a los instrumentos que se proporcionan. - Evitar o disminuir la parcialidad del encuestado. - Evaluar los cuestionarios y los instrumentos de encuesta Motivar a los encuestados para que respondan de forma libre a los instrumentos que se proporcionan A menudo es difícil motivar a la gente para que responda a una encuesta sin que se lo pidan de forma expresa. Los investigadores han utilizado diferentes incentivos como pequeños premios monetarios o regalos, pero esto generalmente no ha tenido mucho éxito. En general, la gente está más motivada a contestar si pueden ver que los resultados del estudio probablemente son útiles para ellos. Una forma de motivar es proporcionar a los participantes cierta información como: - Cuál es el propósito del estudio. - Por qué éste podría ser relevante para ellos. - Por qué es importante la participación de cada individuo. 29

52 2.-Métodos de trabajo - Cómo y por qué fue elegido cada participante. - Cómo se mantendrá la confidencialidad Evitar o disminuir la parcialidad del encuestado Es importante considerar que a la hora de construir el instrumento de encuesta, como el investigador sabe qué es lo que trata de buscar, puede revelar cuál es su punto de vista en la forma en la que lo construye. El investigador puede influir en las respuestas de las siguientes formas: - La forma en que formula una pregunta. - El número de preguntas que realiza. - El rango y el tipo de categorías de las respuestas. - Las instrucciones que proporciona a los encuestados. Para evitar la parcialidad, es necesario: - Desarrollar preguntas neutras. - Realizar suficientes preguntas para cubrir adecuadamente el tema. - Prestar atención al orden de las preguntas. - Proporcionar categorías de respuestas exhaustivas, imparciales y mutuamente exclusivas. - Escribir instrucciones claras e imparciales Evaluar los cuestionarios y los instrumentos de encuesta Una vez que se ha creado el instrumento, es necesario evaluarlo. La evaluación es a menudo llamada pre-prueba y tiene diferentes objetivos: - Comprobar que las preguntas son entendibles. - Calcular el ratio de respuesta probable y la efectividad del procedimiento de seguimiento. - Evaluar la fiabilidad y la validez del instrumento. - Asegurar que nuestra técnica de análisis de los datos coincide con nuestras respuestas esperadas. 30

53 2.-Métodos de trabajo Las dos formas más comunes de organizar una evaluación son la utilización de los grupos de control y estudios pilotos. Los grupos de control son grupos de discusión arbitrados. Se espera que éstos ayuden a identificar preguntas olvidadas o innecesarias, así como preguntas e instrucciones ambiguas. Los estudios pilotos se realizan utilizando los mismos procedimientos de las encuestas, pero se aplica sobre una muestra más pequeña. Están destinados a identificar cualquier problema con la propia encuesta, así como con el ratio de respuesta y el procedimiento de seguimiento. También pueden contribuir en la evaluación de la fiabilidad. Una encuesta es fiable si se obtienen las mismas clases y distribución de respuestas al aplicarla a dos grupos similares de encuestados. En contraste la validez se refiere a lo bien que mide el instrumento lo que se quiere medir. Existen diferentes formas para calcular la fiabilidad de una encuesta: - Test-Retest (Intra-observadores): se aplica la misma encuesta a los mismos sujetos pero en periodos de tiempo diferentes. El coeficiente de fiabilidad es la correlación que existe entre las puntuaciones de las dos aplicaciones. o Problema: no funciona si las variables cambian naturalmente en el tiempo o si los sujetos recuerdan las preguntas previas. - Forma alternativa: consiste en dar a los participantes versiones distintas de la encuesta. Las preguntas son reformuladas o reordenadas en cada versión. o Problema: difícil reformular las preguntas y asegurarse de que no cambiará su significado o serán más difíciles de entender. - Consistencia Interna: se aplica cuando tenemos un grupo de preguntas que miden diferentes aspectos de un mismo concepto. - Inter-observadores: consiste en comprobar si diferentes observadores dan respuestas similares cuando evalúan una misma situación. Esta forma es usada cuando hay un componente subjetivo en la medición de una variable externa. 31

54 2.-Métodos de trabajo Para determinar la validez de una encuesta se pueden considerar diferentes aspectos para verificar que realmente se están midiendo las características deseadas: - Validez de apariencia: consiste en que miembros sin formación realicen una revisión superficial de los ítems mediante jueces no entrenados. Este tipo apenas si cuenta como una medida de validez, ya que es muy subjetiva. - Validez del contenido: la validez del contenido es un cálculo subjetivo de cómo de apropiado les parece el instrumento a un grupo de revisores con conocimientos en el tema. Involucra una revisión sistemática del contenido de la encuesta para asegurar que incluye todo lo que debería y nada que no debiese. - Validez del criterio: es una medida que indica cómo de bien un instrumento predice o se compara con otro instrumento (criterio concurrente) o la habilidad de un instrumento para predecir un fenómeno futuro (criterio predictivo). - Validez de la construcción: está referida a cómo un instrumento se comporta cuando se utiliza Actividad 7: Seleccionar los participantes El siguiente paso consiste en determinar la muestra o subconjunto de la población que va a ser encuestada. Las respuestas de esta muestra deberían representar lo que serían las respuestas de toda la población, ya que debido a los costes, normalmente no es posible encuestar a toda una población. Cuando se selecciona una muestra deben tenerse en cuenta que realmente representa toda la población y que está formada por aquellos individuos que están en situación de responder a las preguntas. La muestra debe obtenerse a partir de una población objetivo. Una población objetivo es el grupo o individuos a quienes se les realiza la encuesta. Existen diferentes métodos de muestreo cuyo objetivo es extraer una muestra a partir de una población (Kitchenham and Pfleeger, 2002a): a.- Métodos de muestreo probabilísticos En una muestra probabilística cada miembro de la población destinataria tiene una probabilidad conocida, diferente de cero, de ser incluido en la muestra. El objetivo de este tipo de muestra es eliminar la subjetividad y obtener una muestra representativa y 32

55 2.-Métodos de trabajo no ambigua de la población objetivo. A continuación, se describen los métodos más conocidos de muestro probabilístico. - Muestra aleatoria simple: es aquella en la que todos los miembros de la población destinataria tienen la misma probabilidad de ser incluidos en la muestra. La muestra se forma utilizando un generador de números aleatorios, de forma que, a cada miembro de la población destinataria se le asigna un número aleatorio. A continuación, se ordenan los miembros en una lista en función del número aleatorio. Finalmente se escogen los n primeros miembros de la lista, donde n es el tamaño de la muestra. - Muestra aleatoria estratificada: en este caso, la población objetivo destinataria se divide en subgrupos llamados capas. Las capas son utilizadas cuando se espera que diferentes secciones de la población destinataria respondan a las preguntas de forma diferente, o cuando se espera que diferentes secciones de la población objetivo destinataria tengan tamaños diferentes. Normalmente, el número de miembros que se seleccionan de cada capa es proporcional al tamaño de la capa. Este tipo de muestra es útil en poblaciones no homogéneas. - Muestreo sistemático: se selecciona cada miembro n-ésimo de la lista en la que aparece toda la población. - Muestreo basado en grupos: los individuos encuestados pertenecen a grupos definidos. b.- Métodos de muestreo no probabilísticos Las muestras no probabilísticas son creadas cuando los encuestados se seleccionan porque son fácilmente accesibles o porque los investigadores tienen alguna razón o justificación para creer que son representativos de la población. El problema de este tipo de muestras es que pueden ser parciales y por ello no se deben realizar grandes inferencias a partir de ellas. A continuación, se muestran los diferentes tipos de métodos de muestreo no probabilísticos: - Muestreo por conveniencia: involucra obtener respuestas de gente que está disponible o que quiere formar parte. - Muestreo que aumenta progresivamente (de bola de nieve): consiste en utilizar a la gente que ha participado en una encuesta para que nomine a otras personas 33

56 2.-Métodos de trabajo que ellos creen que querrían formar parte. Este proceso continúa hasta que se obtiene el número de respuestas requerido. - Muestreo de cuota: es la versión no probabilística del muestreo aleatorio estratificado. La población destinataria se divide en capas en función de los subgrupos que se conocen. - Grupos de control: está formada por contactos personales de los investigadores. Generalmente incluyen de 10 a 20 personas que representarían a alguna población. Para asegurar la precisión y fiabilidad de un estudio es preciso tener información previa sobre el fenómeno que se desea estudiar. Esta información permitirá calcular el tamaño de la muestra requerida. Es necesario que el tamaño de la muestra sea adecuado para que el coste de aplicar la encuesta sea efectivo, independientemente del tipo de muestro que se realice. Es decir, debe ser lo suficientemente grande como para poder generalizar los resultados pero a la vez, lo suficientemente pequeño como para poder afrontar los costes. Algunas veces es posible reducir los costes usando tecnología existente (como por ejemplo, encuestas por correo electrónico). Además, utilizar muestras de tamaño apropiado ayuda a concentrar esfuerzo en las siguientes actividades del proceso. En cualquier estudio no sólo hay que entender al grupo que responde las encuestas sino también al que no responde. Esto ayuda a encontrar formas para mejorar el diseño de la encuesta. Además, se debe tener en cuenta que los costes no sólo engloban los gastos derivados de proporcionar el cuestionario sino también los de examinar y analizar los datos obtenidos de la realización del mismo. Por ello, cuanto mayor es el tamaño de la muestra, mayores son los costes. (Kitchenham and Pfleeger, 2002a) proponen la siguiente fórmula (ver Figura 1) para estimar el tamaño adecuado de la muestra: ( ) z a z b µ µ σ Figura 1.-Ecuación para calcular el tamaño de una muestra. 34

57 2.-Métodos de trabajo Donde: µ 1 -µ 2 : es el tamaño efectivo. σ : es la desviación estándar común. z a : es el tramo superior en la distribución normal estándar correspondiente a a. Donde a es la probabilidad de error de tipo I, es decir, la probabilidad de rechazar de forma equivocada la hipótesis nula. z b : es el tramo inferior en la distribución normal estándar correspondiente a b. Donde b es la probabilidad de error de tipo II, es decir, la probabilidad de aceptar de forma equivocada la hipótesis nula. Además de controlar el tamaño de la muestra, se tiene que controlar que el número de personas que responda al cuestionario sea adecuado. Por tanto, otro aspecto que da fiabilidad a una encuesta es el ratio de respuesta, es decir, la proporción de participantes que han respondido la encuesta respecto al número de participantes a los que se les había proporcionado la encuesta para que la respondiesen. Si se tiene un alto número de encuestas no respondidas pero se entiende por qué y se puede asegurar que el total de encuestados es representativo, entonces es posible proceder al análisis de los datos recogidos. Para mejorar el ratio de respuesta es aconsejable asegurar que los encuestados son capaces de responder las preguntas, que están dispuestos a responderla y que están motivados para ello Actividad 8: Documentar la encuesta Una vez que el instrumento se ha finalizado, es recomendable documentar la encuesta. Si la encuesta es proporcionada de forma libre, se debería considerar escribir un documento inicial descriptivo, denominado especificación del cuestionario. Este documento debería incluir: - Los objetivos del estudio. - Una descripción racional para cada pregunta. - Los fundamentos para cualquier pregunta adoptada o adaptada de otra fuente, junto con las citas apropiadas. - Una descripción del proceso de evaluación. 35

58 2.-Métodos de trabajo Una vez que el cuestionario es suministrado, la documentación debería ser adaptada para incluir la siguiente información: - Quiénes fueron los responsables. - Cómo fue suministrada. - Cómo se llevó a cabo el procedimiento de seguimiento. - Cómo fueron procesados los cuestionarios completados Actividad 9: Analizar los datos Una vez que la encuesta ha sido diseñada y administrada, el siguiente paso consiste en analizar los datos obtenidos. Algunos aspectos generales respecto del análisis de datos son (Kitchenham and Pfleeger, 2003): - Validación de los datos: antes de proceder con el análisis de los datos, las respuestas deben ser examinadas en cuanto a consistencia y completitud. Es importante contar con políticas para manejar inconsistencias e incompletitud de las encuestas. - Partición de las respuestas: a menudo es necesario particionar las respuestas en subgrupos homogéneos antes del análisis. Estas particiones son realizadas normalmente en base a la información demográfica. - Codificación de los datos: algunas veces es necesario convertir los datos de las respuestas a escala ordinal o nominal. Los mayores problemas se dan en la conversión de las respuestas de preguntas abiertas. - Análisis estándar de los datos: si se realiza un muestreo probabilístico es posible calcular estadísticas asociadas con la población, entre ellas: total de la población, media de la población, varianza de la población. Si se utilizan variables de Si/No o 0/1, los cálculos más comunes son la proporción y la varianza de una proporción. - Análisis de datos nominales y ordinales: es importante entender el tipo de escala de los datos y analizar ésta apropiadamente. A veces se realizan conversiones de escala, pero no siempre es lo más adecuado ya que puede generar análisis erróneos. Si los datos son nominales, la forma más común de analizarlos es determinando la proporción de respuestas que hay en cada una de las categorías. 36

59 2.-Métodos de trabajo Actividad 10: Informar los resultados Finalmente, cuando se tienen los resultados del análisis de datos, se pueden comunicar los resultados de la encuesta a la comunidad interesada. En cualquier caso, antes de comenzar cualquier encuesta, hay que fijar los objetivos, es decir, qué se desea obtener a partir de los resultados de la encuesta Aplicación de encuestas en la tesis En esta tesis se utilizan las encuestas para obtener la percepción de los usuarios sobre las características de calidad de datos que son necesarias para los portales Web RESUMEN En este capítulo se han revisado los métodos utilizados para crear y operacionalizar un modelo de calidad de datos, SPDQM 3. En concreto, se ha presentado un método para la realización de revisiones sistemáticas de la literatura y el método de creación de encuestas. 3 SPDQM, de las siglas inglesas SQuaRE aligned Portal Data Quality Model 37

60 38

61 3.- ESTADO DEL ARTE 3.- ESTADO DEL ARTE

62

63 3.- Estado del arte Como se comentó en la sección 1, es necesario tener calidad de datos en los portales Web y considerar la percepción de los usuarios en función de diferentes perfiles. A continuación se detalla cada uno de estos conceptos PORTALES WEB Un portal Web se define como un punto de entrada a Internet (Laudon and Traver, 2008; Sharma and Gupta, 2005; Stair and Reynolds, 2008). Los portales Web permiten seleccionar, organizar, integrar contenidos distribuidos y facilitar el acceso a datos en Internet, posibilitando a los usuarios obtener la información de manera ordenada (Al- Mudimigh et al., 2011; Domingues et al., 2006; Kaur and Singh, 2006; Presley and Presley, 2009; Yang et al., 2007; Zirpins et al., 2001). Por ello, los portales Web están incrementando su importancia en el mundo online (Sharma and Gupta, 2005) y son cada vez más populares y utilizados por personas y compañías (Al-Mudimigh et al., 2011) para dar a conocer sus productos y servicios, y estar operativos las 24 horas al día, todos los días del año. Así mismo, los portales Web permiten que los usuarios puedan navegar de una manera sencilla obteniendo rápidamente la información que ellos necesitan y teniendo en cuenta sus preferencias (Collins, 2001; Davydov, 2001; Tatnall, 2007) TIPOS DE PORTALES WEB En la literatura se pueden encontrar diferentes clasificaciones de los portales Web en función de su propósito. Así, de acuerdo con (Zirpins et al., 2001) hay dos clases básicas de portales Web. - Horizontales o de consumidor: ofrecen una amplia cantidad de recursos y servicios en un esfuerzo de convencer a los usuarios para hacer que el portal Web sea su página principal y permitirles que lo usen tantas veces y tan a menudo como deseen. Este tipo de portal Web está dirigido a un gran número de usuarios. - Verticales o vortals: son aquellos que ofrecen contenidos y servicios para un dominio o comunidad específica. Los portales verticales están enfocados a 41

64 3.- Estado del arte usuarios que desean realizar determinadas tareas, a consumidores con los mismos intereses, a personas que viven en un cierto lugar, etc. Los portales verticales se pueden subclasificar en: o De información de empresa (Enterprise Information) o corporativos: son portales Web que integran toda clase de datos y servicios relacionados con una compañía específica. Presentan un punto de entrada común para clientes y empleados. Ofrecen información de soporte, catálogos detallados de los productos y la posibilidad de realizar compras on-line. A su vez estos portales Web pueden ser: De negocio: permiten acceder a un conjunto de empresas mediante un único punto de entrada. Funcionan como si fueran el acceso a un centro comercial que permite entrar a cada una de las tiendas que lo componen. De conocimiento: se centran en datos de negocio e intercambio de información adecuados para tomar decisiones de negocio. o De Intranet: están orientados al personal de una compañía, permitiendo el acceso a los datos de la empresa y proporcionando aplicaciones de negocio frecuentes tales como: grabación de asistencia, procesamiento de gastos de viaje y flujos de trabajo. Ésta no es la única clasificación de portales Web que existe. (Xiao and Dasgupta, 2005; Zirpins et al., 2001) dividen los portales Web en tres tipos en base a las funciones que desarrollan: - Horizontales: proporcionan a los consumidores acceso a un amplio número de sitios tanto en lo que se refiere a contenidos como a funcionalidades de los mismos. Estos portales Web están generalmente enfocadod a consumidores y pueden ser personalizados y adaptados al usuario. Los portales horizontales son también llamados portales generales públicos o mega portales. My Yahoo! y My Excite son ejemplos de portales horizontales. - Verticales: están orientados a una comunidad de usuarios específica que comparten intereses comunes. Estos portales Web están enfocados hacia una pequeña audiencia o una comunidad con intereses específicos, tales como venta al por menor y banca. 42

65 3.- Estado del arte - De empresa (Enterprise) también llamado Corporativo: proporcionan acceso a información perteneciente a una compañía a través de la intranet de la misma, así como a determinadas páginas de Internet previamente seleccionadas. Por ejemplo, a través de un portal de empresa, los empleados pueden acceder a su salario o contribuciones de jubilación. Además (Xiao and Dasgupta, 2005) consideran que hay otros portales especializados basados en la tecnología como son portales WAP que usan tecnología móvil y portales de aplicación como WebTV y OnStar en vehículos. Otra diferenciación de portales Web se puede obtener en función de su misión, sus contenidos y usuarios objetivo (Liu et al., 2009). Según la misión del portal Web, éste puede estar basado en transacciones (diseñado para obtener un beneficio) o basado en información (diseñado para distribuir información). En función de sus contenidos se pueden dividir en horizontales y verticales. Además, los portales Web pueden ser diseñados para uso público o privado, de forma que, el público en general puede acceder a un portal Web público, mientras que el acceso a un portal Web privado está restringido a sus miembros. Concluyendo, (Liu et al., 2009) indican que en general, se pueden diferenciar los portales Web en aquellos destinados a negocios y aquellos que son de tipo general. Los primeros están diseñados para un grupo de usuarios concretos y contienen información vertical, es decir, generalmente están basados en transacciones, mientras que los últimos proporcionan acceso a un amplio rango de información y están basados en información. Independientemente del tipo de portal Web, es necesario satisfacer las preferencias de los usuarios para mantenerse en el mercado y ser más competitivos. Un factor clave para obtener lo anteriormente mencionado es que el portal Web tenga una adecuada calidad de los datos (Domingues et al., 2006). 43

66 3.- Estado del arte CALIDAD DE DATOS La calidad de datos (DQ) es un concepto multidimensional (Cappiello et al., 2004; Pipino et al., 2002; Wang and Strong, 1996) y relativo al contexto en el cual será aplicado (Katerattanakul and Siau, 1999; Shanks and Corbitt, 1999). La investigación en DQ comenzó en el contexto de los sistemas de información (Lee, 2002; Strong et al., 1997) y posteriormente se extendió a otros contextos como sistemas cooperativos (Fugini et al., 2002; Marchetti et al., 2003; Winkler, 2004), almacenes de datos (Bouzeghoub and Kedad, 2001; Zhu and Buchmann, 2002) y/o comercio electrónico (Aboelmeged, 2000; Katerattanakul and Siau, 2001) entre otros. Debido a las características particulares de las aplicaciones Web y sus diferencias de los sistemas de información tradicionales (Pressman, 2001), la comunidad científica ha abordado el tema de la calidad de datos en la Web en general (Gertz et al., 2004). Cada vez más, los usuarios utilizan la información proporcionada en la Web para la realización de sus tareas diarias, y demandan la necesidad de confiar en los datos como se muestra en el informe de Oracle (Oracle, 2008) y en (Bertino et al., 2009), además, las organizaciones consideran la calidad de los datos como un factor determinante para el éxito de su actividad (IDC, 2009). En la literatura, el concepto de Calidad de los Datos o Calidad de la Información es a menudo definido como aptitud para el uso (en inglés, fitness for use ), es decir la capacidad de que un conjunto de datos permita obtener las necesidades del usuario (Cappiello et al., 2004; Strong et al., 1997). En este sentido, se han propuesto muchos modelos de calidad de datos en los últimos años. Incluso, en 2008 se propuso un estandar, denominado ISO/IEC (ISO/IEC-FDIS-25012, 2008). Este estandar ISO/IEC está enfocado a los datos, y pertenece a la familia 2501n la cual propone un modelo de calidad de productos software y es una división del conjunto de Estándares Internacional denominado SQuaRE 4 (Requerimientos y Evaluación de Calidad de Productos Software). Este modelo define 15 características clasificadas en dos puntos de vista: 4 SQuaRE, de las siglas inglesas Software product Quality Requirements and Evaluation. 44

67 3.- Estado del arte - Inherente: se refiere al grado en el que las características de calidad de datos tienen un potencial intrínseco para satisfacer las necesidades implícitas cuando los datos se usan bajo condiciones específicas. - Dependiente del sistema: se refiere al grado en el que la calidad de datos se preserva dentro de un sistema de ordenador cuando los datos se usan bajo condiciones específicas CALIDAD DE DATOS EN PORTALES WEB Dentro del contexto de los portales Web, la calidad de los datos también es importante. Los portales Web deben proporcionar información correcta y útil. Además, los datos aportados tienen que satisfacer las necesidades de los usuarios y poseer un nivel de calidad adecuado. Esto es importante no sólo para los consumidores sino también para los diseñadores y desarrolladores de los portales Web y los gestores de las compañías que ofertan productos, porque de ello depende el aumentar el número de clientes y la fidelización de los mismos. De manera que, si un portal Web ofrece el nivel de calidad de datos requerido por los usuarios, se aumentan las posibilidades de que el usuario vuelva a consultar el portal Web, o que incluso, accedan otros usuarios potenciales. A pesar de los numerosos trabajos existentes relativos a la DQ (como puede verse en el apartado 3.2) muy pocos trabajan con la calidad de los datos en el contexto de portales Web, siendo algunos ejemplos: - (Yang et al., 2005): donde se mide la calidad de la información del servicio, percibido por usuarios, en portales Web. - (Caro et al., 2008): donde destacan que la importancia de la calidad de datos residen en que los usuarios puedan utilizar los datos obtenidos para llevar a cabo sus tareas diarias y les permita tomar decisiones tanto en su trabajo como en su vida personal. Así, cuando el grado de satisfacción se incrementa, el número de consumidores que accede al portal Web aumenta. Además, se propone un conjunto de atributos relevantes para la calidad de datos en portales Web. - (Guerra-García et al., 2011): donde se presentan requisitos de calidad de datos para aplicaciones Web. 45

68 3.- Estado del arte PERFILES DE USUARIO Una vez llegados a este punto, sabiendo que la calidad de los datos en portales Web es importante. También debemos considerar la percepción que los usuarios tienen de los mismos, para ello es preciso tener en cuenta su comportamiento en el uso de Internet. Diversos trabajos en la literatura indican que las personas tienen diferentes perfiles de comportamiento en la Web (Ahn, 2010; Zhang and von Dran, 2001) (Jaillet, 2002; Schubert and Dettling, 2002; Sheehan, 2002). Cada persona accede a un número de páginas Web diferente, realiza dentro de una página un número de descargas y/o utiliza la Web para obtener cualquier información que necesita a diferente velocidad (Huang et al., 2000). De forma que, en función del usuario Web, el número de páginas vistas o descargas realizadas así como el tiempo de duración de un conjunto de sitios visitados varía. Por ello, en función de su comportamiento, se pueden diferenciar usuarios habituales (heavy) y usuarios no habituales (light) (Huang et al., 2007). Los usuarios Web que visitan más sitios y hacen más descargas, es decir, los usuarios habituales, son más propensos a concentrar la mayoría de sus actividades on-line en un pequeño grupo de páginas Web. Por el contrario, los usuarios no habituales, que visitan un número limitado de sitios y realizan pocas descargas suelen distribuir sus actividades on-line más igualadamente entre diversos sitios visitados. Además, los usuarios varían su percepción en función de las caracteristicas de las páginas en Internet. Por ejemplo, (Tombros et al., 2005) se concentran en cómo las características de las páginas Web afectan a la percepción que los usuarios tienen en cuanto a la utilidad de las mismas, cómo la percepción cambia conforme se avanza en la búsqueda de información, cómo los usuarios tienen unas características más en cuenta que otras en función del tipo de tarea que están desarrollando y cómo todo esto puede influir en el diseño de las páginas Web. E incluso, estudios investigan la percepción que las personas tienen sobre la relevancia de la información (Barry, 1998; Maglaughlin and Sonnenwald, 2002). Por ejemplo, (Arazy and Kopak, 2011) investigan cómo diferentes usuarios evalúan dimensiones de calidad de datos. 46

69 3.- Estado del arte Así mismo, consideramos necesario tener en cuenta los diferentes aspectos demográficos de los usuarios para analizar sus preferencias en Internet. Por ejemplo, (Durndell and Haag, 2002; Hupfer and Detlor, 2006) analizan la importancia del género y (Şahin, 2011) el nivel de estudios. Así, respecto del género, las mujeres pasan más tiempo en redes sociales, mensajería instantánea y correo electrónico que los hombres, estando más atraídas por contenidos de salud y sitios sobre comunidades y estilos de vida. Por otro lado, los hombres prefieren buscar información sobre investigaciones que tengan algún tipo de interés personal pero minimizando su esfuerzo en la búsqueda de información (Smith, 2001). Cuando Internet empezó, había una diferencia entre la cantidad de hombres y mujeres que accedian a Internet, pero esto era más bien debido a factores socioeconómicos y a otros como límite de acceso a la tecnología, más que propiamente por motivos de género (Bimber, 2000; Kelan, 2007). Sin embargo, esto ahora está cambiando, de acuerdo con (Komathi and Maimunah, 2009; Munusamy and Ismail, 2009), con el desarrollo de Internet, ambos, hombres y mujeres, lo usan como medio para compartir ideas, construir redes de comunicación y buscar información. Con la igualdad de oportunidades, ambos sexos acceden a Internet con la misma frecuencia. En cuanto al nivel de estudios, (Şahin, 2011) indica que hay mayor nivel de adicción al uso de Internet entre los estudiantes respecto otros grupos de profesionales. Además, el uso de Internet por académicos es muy importante, actualmente en sus vidas, ya que sus tareas están fuertemente ligadas al uso de los ordenadores (Komathi and Maimunah, 2009) y a los servicios de Internet. Con respecto a la edad, el uso de Internet disminuye con la edad aunque ha aumentado el porcentaje de usuarios de mayor edad que se conectan online respecto al pasado (Jones and Fox, 2009). Y en general, (Lenhart et al., 2010) indican que el sexo, la educación e incluso el estatus social influyen en el uso de Internet, principalmente en el acceso inalámbrico. 47

70 3.- Estado del arte Todo ello, nos ha llevado a pensar que es necesario tener en cuenta los aspectos demográficos de los usuarios de portales Web a la hora de determinar la calidad de los datos para los portales Web. De forma que, se pueden definir diferentes perfiles de usuario a partir de distintos aspectos demográficos ESTUDIOS RELACIONADOS CON LA CALIDAD DE DATOS En este punto se pasa a analiza las diferentes fuentes que sirven de base para el desarrollo de nuestro modelo de calidad de datos SPDQM. Estas fuentes se han dividido en cuatro apartados: modelo de calidad de datos basado en la perspectiva de usuario propuesto por (Strong et al., 1997; Wang and Strong, 1996), estándar de calidad de datos ISO/IEC 25012, modelo previo de calidad de datos en portales Web, denominado PDQM, y estudios sobre calidad de datos en Web en general o en portales Web, mediante revisión sistemática de la literatura Modelo de calidad de datos Este modelo es el propuesto por (Strong et al., 1997; Wang and Strong, 1996) que presenta una clasificación por categorías y dimensiones asociadas a la calidad de datos, basándose en la perspectiva del usuario (ver Tabla 2). Categorías de DQ Intrínseca Accesibilidad Contextual Representacional Dimensiones de DQ Exactitud, Objetividad, Credibilidad, Reputación Accesibilidad, Seguridad Relevancia, Valor añadido, Oportunidad, Completitud, Cantidad de Información Interpretabilidad, Fácil entendimiento, Representación Concisa, Representación Consistente Tabla 2.- Categorías y dimensione de Calidad de Datos (Strong et al., 1997) 48

71 3.- Estado del arte Donde se expone que: La calidad de datos Intrínseca refleja el hecho de que la información tiene calidad en sí misma, por ejemplo la exactitud es una de las dimensiones de esta categoría. La calidad de datos Accesibilidad enfatiza la importancia del rol de los Sistemas de Información en cuanto a la accesibilidad y seguridad de los datos. La calidad de datos Contextual se refiere a que los requisitos de calidad de información deben ser considerados en el contexto de la tarea que los maneja. La calidad de datos Representacional está referida a que los sistemas de información deben presentar la información de manera que ésta sea interpretable y fácil de entender ESTÁNDAR DE CALIDAD ISO/IEC El estándar ISO/IEC o estándar SQuaRE (Requisitos y evaluación de la calidad del producto software) es la evolución del estándar ISO/IEC 9126 (ISO/IEC- 9126, 2001) e ISO/IEC En concreto, SQUARE es un conjunto de estándares internacionales que consta de diferentes partes (ver Figura 2). Sección Requisitos de Calidad 2503n Sección Modelo de Calidad 2501n Sección Gestión de Calidad 2500n Sección Medida de la Calidad 2502n Sección Evaluación de la Calidad 2504n Figura 2.- Organización de las normas del estándar SQuaRE Donde: - ISO/IEC 2500n Sección Gestión de la Calidad: define todos los modelos, términos y definiciones comunes a todas las normas de la serie SQuaRe. - ISO/IEC 2501n Sección Modelo de Calidad: presenta un modelo de calidad que incluye características para la calidad interna, externa y en uso. 49

72 3.- Estado del arte - ISO/IEC 2502n Sección Medida de la Calidad: incluye un modelo de referencia para medir la calidad de un producto software, definiciones matemáticas de medidas de calidad y una guía práctica para su aplicación. - ISO/IEC 2503n Sección Requisitos de Calidad: su objetivo es ayudar a especificar los requisitos de calidad. - ISO/IEC 2504n Sección Evaluación de la Calidad: proporciona requisitos, recomendaciones y guías para evaluar los productos software Estándar ISO/IEC De todos los estándares propuestos, para nuestro objetivo sólo es relevante el estándar ISO/IEC que propone un modelo de calidad de datos (ISO/IEC-FDIS , 2008). Este modelo define 15 características de DQ, las cuales son consideradas desde dos puntos de vista: inherente y dependiente del sistema. - Inherente : se refiere al grado en el que las características de calidad de datos tienen un potencial intrínseco para satisfacer las necesidades implícitas cuando los datos se usan bajo condiciones específicas. Dentro de este punto de vista se clasifican las siguientes características: Exactitud: Grado en el que los datos tienen atributos que representan correctamente el verdadero valor de un atributo deseado para un concepto o evento en un contexto de uso específico. Completitud: Grado en el que el dato asociado a una entidad tiene valores para todos los atributos esperados y las instancias de la entidad relacionada en un contexto de uso específico. Coherencia: Grado en el que el dato tiene atributos que están libres de contradicciones y son congruentes con otros datos en un contexto de uso específico. Credibilidad: Grado en el que el dato tiene atributos que son considerados como verdaderos y verosímil por los usuarios en un contexto de uso específico. Actualidad: Grado en el que el dato tiene atributos con fecha correcta en un contexto de uso específico. 50

73 3.- Estado del arte - Dependiente del sistema : se refiere al grado en el que la calidad de datos se preserva dentro de un sistema de ordenador cuando los datos se usan bajo condiciones específicas. Para este punto de vista las características que se identifican son: Disponibilidad: Grado en el que el dato tiene atributos que le permiten ser recuperado por usuarios autorizados y/o aplicaciones en un contexto de uso específico. Portabilidad: Grado en el que el dato tiene atributos que le permiten ser introducido, sustituido o movido de un sistema a otro preservando la calidad existente en un contexto de uso específico. Recuperabilidad: Grado en el que el dato tiene atributos que le permiten mantener y preservar un nivel de operaciones y de calidad específicos, incluso frente a fallos, en un contexto de uso específico. Además, existe un grupo de características que se encuentran clasificados en ambos puntos de vista. Estas características son: Accesibilidad: Grado en el que se accede a los datos en un contexto de uso específico, particularmente por personas que necesitan soporte tecnológico o alguna configuración especial a causa de alguna discapacidad. Conformidad: Grado en el que el dato tiene atributos que cumplen estándares, convenios o regulaciones en vigor y normas similares en relación a la calidad de los datos en un contexto de uso específico. Confidencialidad: Grado en el que el dato tiene atributos que aseguran que es sólo accesible e interpretable por usuarios autorizados en un contexto de uso específico. Eficiencia: Grado en el que el dato tiene atributos que pueden ser procesados y proporcionan los niveles de desarrollo esperados mediante el uso de cantidades y tipos de recursos apropiados en un contexto de uso específico. Precisión: Grado en el que el dato tiene atributos que son exactos o que proporcionan diferenciación en un contexto de uso específico. 51

74 3.- Estado del arte Trazabilidad: Grado en el que el dato tiene atributos que proporcionan un sendero o seguimiento para acceder al dato y a cualquier cambio hecho al dato en un contexto de uso específico. Entendibilidad: Grado en el que el dato tiene atributos que le permiten ser leído e interpretado por los usuarios y están expresados en un lenguaje, símbolos y unidades adecuados en un contexto de uso específico. En la Tabla 3 se presenta el conjunto de características que el estándar identifica para cada punto de vista y las características que son aplicables a ambos puntos de vista. Calidad de datos Características Dependiente Inherente del sistema Exactitud X Completitud X Coherencia X Credibilidad X Actualidad X Accesibilidad X X Conformidad X X Confidencialidad X X Eficiencia X X Precisión X X Trazabilidad X X Entendibilidad X X Disponibilidad X Portabilidad X Recuperabilidad X Tabla 3.- Características del modelo de calidad de datos ISO/IEC PDQM: Portal Data Quality Model PDQM (Portal Data Quality Model) es un modelo de calidad de datos para portales Web enfocado en la perspectiva del consumidor de datos (Caro et al., 2008), este modelo está basado en (Strong et al., 1997; Wang and Strong, 1996). El desarrollo de PDQM se dividió en dos etapas: la definición teórica y la definición operacional del modelo. 52

75 3.- Estado del arte El objetivo de la definición teórica fue determinar el conjunto de características de DQ que eran relevantes para los consumidores de datos cuando evalúan la calidad de datos de cualquier portal Web. Para hacer esto, los autores eligieron de la literatura un conjunto de características que eran apropiadas para el contexto de portales Web. Este conjunto fue empíricamente validado, mediante encuestas, resultando un grupo de características de DQ para portales Web. La versión operacional de PDQM se obtuvo organizando las características en cuatro categorías: - Intrínseca: representa que los datos tienen calidad por derecho propio. - Operacional: destaca la importancia del rol de los sistemas de información en aspectos como accesibilidad, seguridad, personalización, colaboración, etc. - Contextual: destaca la necesidad de establecer que la calidad de datos debe ser considerada en el contexto de la tarea que se está realizando. - Representacional: indica que el sistema debe presentar los datos de tal manera que sean interpretables, fáciles de entender y representados concisa y consistentemente. Una vez que las características de DQ se habían clasificado en esas categorías, el siguiente paso fue determinar las relaciones de influencia entre las características de una misma categoría. Como resultado, crearon una red bayesiana que contenía 33 características de calidad de datos organizada en cuatro fragmentos de la red (uno para cada categoría) (ver Figura 3). Finalmente, este modelo fue implementado a través de una herramienta, pero sólo para la categoría representacional. 53

76 3.- Estado del arte Figura 3.- Red Bayesiana de PDQM Revisión sistemática de la literatura, para trabajos de DQ Con el objetivo de identificar el estado del arte de la calidad de datos para portales Web, se realizó una revisión sistemática de la literatura (RSL), de esta forma se determinaron las características de DQ que afectan a los portales Web. Sin embargo, al realizar una primera búsqueda se observó la existencia de pocas propuestas específicas para calidad de datos en portales Web. Por ello, para la RSL se extendió la búsqueda también a trabajos relacionados con Web en general, no sólo para portales Web. Debido a que para la definición de PDQM, se realizó una revisión sistemática, que cubría hasta 2005, en nuestro caso se comenzó el análisis de la literatura a partir de 2006, puesto que los trabajos previos ya habían sido analizados. Para cada trabajo seleccionado, se estudiaron las siguientes dimensiones (ver Tabla 4): 54

77 3.- Estado del arte Dimensión Características de calidad de datos Perspectiva Contexto Dominio de aplicación Modelo de calidad (Sí/No) Medidas (Sí/No) Herramienta (Sí/No) Descripción Categoría de una propiedad física medible o propiedad abstracta de una entidad que tiene la habilidad de satisfacer necesidades implícitas (ej: Exactitud, Completitud, Coherencia, Credibilidad, etc) Perspectiva de la calidad de datos (ISO/IEC-FDIS-25012, 2008) (ej: gestor, desarrollador, consumidor/usuario) Especifica el entorno donde se han realizado los estudios, indicando si es para Web en general, para un sitio Web o para portales Web. Dominio en el cual las características de la calidad de datos son estudiados (ej: librerias digitales, Wikipedia, e-commerce, e- Learning, etc) Indica si el trabajo define o no un modelo de calidad Indica si hay medidas propuestas Indica si se propone o no una herramienta (ej: con herramienta automática o sin herramienta automática). Tabla 4.- Dimensiones de la clasificación de los artículos De acuerdo con (Kitchenham and Charters, 2007) se llevaron a cabo los siguientes pasos para la realización de la revisión sistemática, como se indica en la sección 2.2: Planificación de la revisión sistemática. Desarrollo de la revisión sistemática. Resultados de la revisión sistemática. A continuación se detalla cada uno de los pasos Planificación de la revisión sistemática En este paso se incluyen las actividades de pre-revisión. a) Identificar la necesidad: En nuestro caso, la necesidad es identificar las características más importantes para la calidad de datos Web. Se define una pregunta global y 6 subpreguntas. Cada una de estas preguntas está asociada a una de las dimensiones presentadas en la Tabla 4. b) Definir las preguntas: Para ello se extrae la información relacionada con las dimensiones asociadas a una pregunta P1, y 6 subpreguntas SP1, SP2, SP3, SP4, SP5 y SP6. (ver Tabla 5). Estas subpreguntas, sirven para conocer más en detalle, cómo analiza, cada propuesta, la calidad de datos. 55

78 3.- Estado del arte Pregunta/Subpreguntas P1: Qué características de calidad de datos Web analizan los investigadores? SP1: Desde qué perspectiva se analiza la calidad de datos Web? SP2: En qué contexto se evalúa la calidad de datos Web? SP3: En qué dominio de aplicación se llevan a cabo las investigaciones? SP4: Se define un modelo de calidad? SP5: Existen medidas para la calidad de datos Web? SP6: Existe una herramienta que soporte la investigación? Descripción Para identificar las características de calidad de datos Web que han sido detectadas o identificadas en la literatura Para determinar si la calidad de datos Web se analiza desde la perspectiva del gestor, el desarrollador o el consumidor/usuario Para identificar si el trabajo está focalizado en Web en general, en un sitio Web o en un portal Web Para determinar el dominio en el que se aplica el estudio (ej: comercio electrónico) Para evaluar si se ha definido un conjunto de características y las relaciones entre ellas Para determinar si se han definido medidas Para determinar si existe una herramienta para medir la calidad de datos Web Tabla 5.- Pregunta y subpreguntas c) Generar el protocolo: Es la tarea más importante, y es la base de la búsqueda de las características. Esta tarea consta de las siguientes subtareas: i) Seleccionar las fuentes: Para el desarrollo de la revisión sistemática se seleccionaron las siguientes librerías digitales donde se realizaron las búsquedas de los trabajos, así como algunas conferencias destacadas: Base de datos de SCOPUS Science@Direct, para el área de Computer Science Wiley InterScience, para el área de Computer Science Librería Digital IEEE Librería Digital ACM 56

79 3.- Estado del arte Literatura gris que es aquella que incluye algunos artículos considerados como relevantes por los expertos y que no están incluidos en las fuentes digitales. Revisión manual de Conferencias de WISE (Web Information Systems Engineering) y ICWE (International Conference on Web Engineering) a partir de ii) Cadenas de búsqueda: Para realizar la búsqueda en las fuentes anteriores, se define una cadena de búsqueda, siguiendo los pasos detallados a continuación: Definición de los términos principales. Identificación de sinónimos o palabras relacionadas. Por ejemplo, en (Caro et al., 2008) Calidad de los datos (Data Quality) y Calidad de la Información (Information Quality) son tratadas como iguales, y en la revisión sistemática se hizo lo mismo. Análisis de las palabras clave de los artículos que se conocen y que versan sobre DQ en Web. Uso del símbolo booleano OR, para indicar palabras alternativas. Uso del símbolo booleano AND, para enlazar palabras. Considerando que las palabras clave eran Data Quality, Information Quality y Web, definimos las siguientes cadenas de búsqueda: - Cadena de búsqueda 1: ( data quality AND web). - Cadena de búsqueda 2: ( information quality AND web). - Cadena de búsqueda 3: ("data quality" AND web) and ("information quality"). - Cadena de búsqueda 4: web AND ("information quality" OR "data quality"). - Cadena de búsqueda 5: ("data quality" AND web) AND (aspect OR dimension OR characteristic OR factor OR criterion OR criteria OR attribute OR model). - Cadena de búsqueda 6: ("information quality" AND web) AND (aspect OR dimension OR characteristic OR factor OR criterion OR criteria OR attribute OR model). 57

80 3.- Estado del arte Cuando una librería digital no permitía usar expresiones de búsqueda booleanas complejas, se realizaban cadenas de búsqueda cortas y se enlazaban los resultados manualmente para obtener los mismos resultados que si se hubiera tenido en cuenta la cadena de búsqueda original. iii) Criterios de inclusión y de exclusión: Definimos unos criterios de inclusión y de exclusión para analizar sólo los artículos que consideramos de utilidad para la revisión sistemática. Por tanto, los criterios de inclusión son: - Escrito en inglés - Publicado después de Identifica un conjunto de características, atributos o medidas útiles para Web Y los criterios de exclusión son: - Trabajos previos a No analizan la calidad de datos en Web - No proponen características de calidad - Los estudios sólo se encuentran en forma de presentación o sólo contienen el resumen - Artículos duplicados (sólo se consideran una vez) - No abordan la calidad, o sólo la mencionan de manera general en el resumen Desarrollo de la revisión sistemática El objetivo de este punto es seleccionar los artículos relevantes y descartar los que no son de utilidad. a) Selección de estudios primarios: Se realiza un proceso de búsqueda en las fuentes mencionadas previamente, obteniendo como resultado 4105 artículos (ver Tabla 6). Muchos artículos se descartaron por obtenerse los mismos resultados usando diferentes cadenas de búsqueda dentro de la misma librería o en diferentes librerías. De forma que, una vez descartados los artículos duplicados, quedaron 1332 artículos. Los cuales fueron analizados, primero revisando el título y el resumen, de forma que se seleccionaron 173 artículos. Tras analizar los artículos completos, se escogieron 69 artículos, que son los realmente útiles para nuestra investigación. 58

81 3.- Estado del arte Fuentes Detectados Sin artículos repetidos Estudios Analizando título y resumen (abstract) (Relevantes) Analizando texto completo (Primarios) % (artículos seleccionados) SCOPUS ,74 WILEY ,35 ScienceDirect ,23 ACM ,49 IEEE ,29 Literatura gris ,90 Total Tabla 6.- Distribución de estudios por fuentes b) Extracción de datos: De los artículos seleccionados, se extrajo la siguiente información relevante: i) Datos del artículo: - Librería (SCOPUS, ScienceDirect, IEEE, ACM, Wiley). - Título. - Año de publicación. - Lugar de publicación (Conferencia, Workshop, Revista). - Autor/es. ii) Datos de las dimensiones: (ver Tabla 4) - Características de calidad. - Perspectiva. - Contexto. - Dominio de aplicación. - Modelo de calidad. - Medidas. - Herramienta Resultados de la revisión sistemática En primer lugar, es preciso decir que una vez realizadas las búsquedas, comprobamos que los resultados obtenidos de las cadenas 3, 4 y 5 (ver paso c) ii) de la 59

82 3.- Estado del arte subsección ), eran muy similares en la mayoría de los casos. Esto implicaba que los términos Data Quality e Information Quality son usados indistintamente en la literatura. Así mismo, también observamos que aunque inicialmente había una amplia cantidad de artículos, muchos de ellos podían descartarse porque estaban duplicados, ya que se obtenía el mismo artículo desde diferentes cadenas de búsqueda. A continuación, la finalidad de esta tarea es responder a la pregunta y subpreguntas formuladas anteriormente en la Tabla 5. a) P1: Qué características de calidad de datos Web analizan los investigadores? Inicialmente se obtuvieron 130 características (63 para Web en general o para sitios Web (ver Tabla 7) y 67 características específicas de portales Web). De las 63 para Web en general o para sitios Web, se descartaron aquellas características que no tenían descripción, ya que sin una definición es imposible determinar su aplicabilidad al contexto de los portales Web. De esta forma, 20 características fueron eliminadas (ver Tabla 8). De manera, que quedaban 43 características. A continuación, se analizan las definiciones, ya que han sido considerados trabajos que estudian la DQ para Web en general y no siempre las características de DQ identificadas son aplicables al contexto de portales Web. Se comprueba que sólo 22 de ellas son útiles para el contexto de portales Web (ver Tabla 9). Además, se seleccionaron directamente las 67 características específicas de portales Web. Adaptability Conformance Installability Portability Significance Trustworthiness Aesthetic Convenience Integrity Provenance Speed Unambiguity Analyzability Correctness Interoperability Readabiliy Stability Up-to-date Authority Changeability Learnability Reasonableness Structure Utility Authorship Design Maturity Recentness Style Veracity Coexistence Ease to use Meaningfulness Recoverability Sufficiency Verifiability Coherence Effectiveness Naturalness Replaceability Suitaility Volatility Cohesiveness Exactly what Neutrality Resource Temporality Well-written you need Utilization Complexity Fault Tolerance Operability Reusability Testability Compliance Functionality Permanence Right Time Time Behaviour Confidentiality Informativeness Personalization Scope Time-to-publish Tabla 7.- Características de DQ para Web en general y para sitios Web 60

83 3.- Estado del arte Adaptability Correctness Installability Operability Resource Utilization Analyzability Changeability Interoperability Portability Suitability Coexistence Fault Tolerance Maturity Recoverability Testability Coherence Functionality Meaningfulness Replaceability Time Behaviour Tabla 8.- Características descartadas Authority Effectiveness Permanence Reasonableness Temporality Verifiability Authorship Exactly what you need Personalization Right Time Trustworthiness Well-written Complexity Informativeness Provenance Speed Up-to-date Ease to use Naturalness Readabiliy Sufficiency Veracity Tabla 9.- Características de DQ aplicables a portales Web Posteriormente, se revisaron las definiciones de las características y se detectó que algunas con diferentes nombres se referían al mismo concepto. Por tanto, estas características se agruparon como se muestra en Tabla 10. Donde en la columna de la izquierda se encuentra el nombre elegido para hacer referencia al concepto, y en la columna de la derecha se muestran los diferentes sinónimos encontrados. Sin embargo, de las características analizadas, no se detectaron características con el mismo nombre que hiciesen referencia a diferente concepto. Nombre de característica Sinónimos Accessibility Access Accuracy Accurate Amount of data Amount of information or Appropriate Amount Attractiveness Detail or Appropriate level of detail or Right level of detail Presentation Believability Credibility Trustworthiness or Trustworthy Informativeness Reasonableness Temporality Veracity Completeness Adequacy Sufficiency Exactly what you need Precision Concise Representation Conciseness Association between values Length of value Consistent representation Logical Consistency or Consistency Currency Currentness Up-to-date or Up-to-dateness Duplicates Duplicity Ease of operation Ease of manipulation Effectiveness Effectively Efficiency Efficiently Interactivity Interactive Organization Navigability or Navigation Readability Human-readable Complexity Relevancy Relevance Reliability Reliable Free-of-error Reputation Authority Authorship Provenance Security Secure Specialization Personalization Timeliness Permanence Right Time Speed Understandability Ease of understanding or Ease to understand Well-written Comprehensiveness or Comprehensive-Coverage Naturalness Usability Ease of use or Ease to use Usefulness Useful Entertainment Value-added Quality of values or Value Tabla 10.- Características con diferente nombre pero el mismo concepto 61

84 3.- Estado del arte Teniendo en cuenta los sinónimos 50 características de DQ fueron descartadas. Por tanto, un total 39 características (67 de portal Web + 22 de sitios Web pero aplicables a portales Web 50 sinónimos) se seleccionaron para evaluar la calidad de datos en portales Web (ver Tabla 11). Las 39 características se organizan en la Tabla 12 del siguiente modo: En la primera columna, se expone el conjunto de características que han sido seleccionadas sólo del modelo PDQM (ver Figura 3) (estas características han sido incluidas en nuestro modelo porque consideramos que son importantes para determinar la calidad de datos de los portales Web). En la segunda, se indican las características obtenidas de la revisión sistemática y que además aparecían en PDQM. Y en la última columna se presentan 6 características nuevas, seleccionadas en la revisión sistemática. Accesibility Completeness Ease of Novelty Response Time Usefulness operation Accuracy Concise Effectiveness Objectivity Security Validity Representation Amount of Consistent Efficiency Organization Specialization Value-added data representation Applicability Currency Expiration Readability Timeliness Verifiability Attractiveness Customer Flexibility Relevancy Traceability Support Availability Documentation Interactivity Reliability Understandability Believability Duplicates Interpretability Reputation Usability Tabla 11.- Características seleccionadas para portales Web Características obtenidas en RSL pero sólo asociadas a Características obtenidas en RSL y en PDQM PDQM Customer Support Accessibility Consistent Reliability Nuevas características obtenidas en RSL pero no en PDQM Effectiveness representation Documentation Accuracy Currency Reputation Efficiency Duplicates Amount of data Ease of operation Security Readability Expiration Applicability Interactivity Specialization Usability Flexibility Attractiveness Interpretability Timeliness Usefulness Response Time Availability Novelty Understandability Verifiability Traceability Believability Objectivity Validity Completeness Organization Value-added Concise Representation Relevancy Tabla 12.- Características por origen Las características seleccionadas de cada artículo se muestran en el APÉNDICE A, donde se marca con X las características con el mismo nombre y con las características que se refieren al mismo concepto pero tienen distinto nombre. Finalmente, en el APÉNDICE B se muestran las referencias. 62

85 3.- Estado del arte Además, es preciso tener en cuenta que para la obtención de las características de DQ se utilizaron los términos en inglés, ya que uno de los criterios de inclusión era que los artículos estuvieran escritos en inglés. Posteriormente, las características de DQ seleccionadas se traducen al castellano, mostrandose la relación entre nombres en el APÉNDICE C. b) SP1: Desde qué perspectiva se analiza la calidad de datos Web? Consideramos que la calidad de datos se puede analizar desde tres perspectivas: gestor, desarrollador y consumidor. En la Figura 4, se detalla el número de artículos para cada perspectiva. Podemos deducir, que la mayoría de los artículos están relacionados con el consumidor/usuario. Esto significa que los investigadores están más interesados en la calidad de los datos que perciben los consumidores. Así mismo, podemos afirmar que también, es necesario hacer un esfuerzo en analizar la calidad de datos desde las otras perspectivas, ya que todas están muy relacionadas. Punto de vista Gestor Desarrollador Consumidor Figura 4.- Artículos según la perspectiva desde la que han sido analizados c) SP2: En qué contexto se evalúa la calidad de datos Web? Para obtener un conocimiento más amplio de las características de calidad de datos, analizamos los siguientes contextos: Web en general, sitios Web y portales Web. Posteriormente, se revisó cada característica y sólo se incluyeron aquellas características aplicables a la calidad de datos en portales Web. En la Figura 5 se encuentra la clasificación de los artículos en función de su contexto. Como se puede apreciar, los sitios Web han sido más estudiados que los portales Web. 63

86 3.- Estado del arte Contexto Web 1 Sitio Web 52 Portal Web Figura 5.- Artículos en función del contexto d) SP3: En qué dominio de aplicación se llevan a cabo las investigaciones? Para analizar la aplicabilidad de los artículos seleccionados, se evaluaron los dominios de aplicación, habiendo dos artículos para cada uno de los siguientes: librerías digitales, e-gobierno, e-learning y e-comercio, un artículo para e-banco, e- portal, e-impresión y e-servicio. 26 artículos no indican a qué naturaleza del sitio Web han aplicado su propuesta, 7 artículos están relacionados con Wiki y los otros 24 se refieren a tipos de diversa naturaleza de sitios Web o de portales Web. e) SP4: Se define un modelo de calidad? Como se muestra en la Figura 6, 41 artículos (es decir en torno al 60%) definen un modelo de calidad. Esto significa que hay una tendencia a cubrir todos los aspectos de la calidad, no sólo definiendo las características sino también estableciendo relaciones entre ellas. Modelo de calidad Sin modelo de calidad Con modelo de calidad Figura 6.- Propuestas con modelo de calidad 64

87 3.- Estado del arte f) SP5: Existen medidas para la calidad de datos Web? Sólo 15 artículos (en torno al 22%) no incluyen medidas, como se muestra en la Figura 7. De esto se concluye que los investigadores se están dando cuenta de la importancia de definir medidas para poder evaluar realmente el nivel de calidad de los datos. Medidas 15 Sin medidas Con medidas 54 Figura 7.- Propuestas con medidas definidas g) SP6: Existe una herramienta que soporte la investigación? Se considera que una propuesta tiene una herramienta cuando los autores indican que se ha creado una nueva herramienta o cuando varias herramientas existentes pueden soportar el propósito expuesto. De modo que sólo 8 de los 69 artículos seleccionados, proporcionan una herramienta de soporte, lo cual representa el 12% del total, como se muestra en la Figura 8. Herramientas 12% Sin herramienta Con herramienta 88% Figura 8.- Herramientas h) Información adicional Además realizamos un estudio de los artículos seleccionados, en relación con el año de publicación, que se muestra en la Figura 9. Observando el incremento del interés hacia la calidad de datos Web. 65

88 3.- Estado del arte Años Figura 9.- Artículos en cada año revisado También estudiamos los artículos por tipo de publicación, concluyendo que 47 artículos fueron publicados en revistas, 19 en conferencias y 3 en workshops. De forma que el 70% de los artículos estaban publicados en revistas. Esto puede ser debido a que hay más revistas especializadas en calidad de datos. Finalmente, en la Figura 10 se muestra el número de veces que cada característica había sido nombrada en los artículos. Figura 10.- Características de calidad de datos Por tanto, como resultado de la revisión sistemática obtuvimos 39 características de DQ de las cuales 33 eran similares a a las características de DQ de PDQM. Las nuevas características de DQ identificadas en la revisión sistemáticas eran: Efficiency, Effectiveness, Readability, Usability, Usefulness y Verifiability (en castellano: Eficiencia, Eficacia, Legibilidad, Usabilidad, Utilidad y Verificabilidad). 66

89 3.- Estado del arte En la sección 4 se presentará el modelo obtenido, utilizando como base las características de DQ para portales Web obtenidas de realizar la revisión RESUMEN En esta sección se ha dado una visión general de los portales Web y se han identificado diferentes tipos de portales Web. Además, se ha mostrado la importancia de la calidad de los datos en general y su aplicación en portales Web. Así mismo, se ha indicado la necesidad de crear perfiles de usuario ya que éstos influyen a la hora de determinar la calidad de los datos en los portales Web. Finalmente, se han analizado diferentes trabajos relacionados con la DQ en el contexto Web y que sirven como base para la creación de nuestro modelo de calidad de datos para portales Web. 67

90

91 4.- PROPUESTA DEL MODELO DE CALIDAD DE DATOS PARA PORTALES WEB 4.- PROPUESTA DEL MODELO DE CALIDAD DE DATOS PARA PORTALES WEB

92

93 4.- Propuesta del modelo de calidad de datos para portales Web INTRODUCCIÓN Como se mostró en el capítulo del estado del arte, existen algunos trabajos relacionados con la DQ en Web en general y en portales Web. De entre estos trabajos destaca el realizado en (Caro et al., 2008) en el que se propone un modelo de DQ para portales Web. Sin embargo este trabajo presenta algunas carencias importantes, entre las que se pueden mencionar: No considera el estándar ISO/IEC 25012, ya que éste es posterior al modelo. Para su adecuada utilización es necesario configurar la red bayesiana para cada contexto particular en que se desee utilizar, es decir, para cada tipo de portal, como por ejemplo: portal bancario, portal de museos, etc. Por lo cual es muy complejo implementarlo para cubrir un mayor número de tipos de portales Web. Dado que el modelo pretende representar el punto de vista del usuario o consumidor de datos en la evaluación de la DQ, cada vez que se configura la red bayesiana para un contexto, es necesario realizar experimentos que comprueben que los resultados de la evaluación son equivalentes a la evaluación que haría el usuario. Esto hace que nos planteemos la necesidad de crear un nuevo modelo que complete al existente. Teniendo esto en cuenta, en este capítulo se muestra el procedimiento llevado a cabo para la creación de la parte teórica del modelo de calidad de datos para portales Web, que hemos denominado SPDQM (Modelo de Calidad de datos para portales Web alineado con SQuaRE), y su operacionalización. La idea es que el modelo, sea útil tanto para consumidores como para diseñadores, desarrolladores y gestores de portales Web SPDQM En primer lugar se ha definido el procedimiento a seguir para la creación del modelo. En este procedimiento se identifican los diferentes pasos a seguir (ver Figura 11): 71

94 4.- Propuesta del modelo de calidad de datos para portales Web Paso 1: Se realiza un estudio de las características de DQ que se obtienen de PDQM, ISO/IEC y las fuentes seleccionadas para la revisión sistemática de la literatura (SCOPUS, Science@Direct, Wiley, IEEE, ACM, literatura gris, WISE, ICWE), de manera que se crea un conjunto inicial de características de DQ. Paso 2: Del conjunto inicial de características de DQ, obtenidas en el paso 1, se seleccionan aquellas que son adecuadas para el contexto de portales Web. Para ello, se ve su aplicabilidad al contexto de portales Web, se analiza si algunas características de DQ significan lo mismo pero tienen distinto nombre o tienen el mismo nombre pero no significan lo mismo, de forma que haya que modificar el nombre de las mismas. Además, se comprueba si unas características de DQ pueden estar incluidas en otras en función de la definición. Paso 3: Con el conjunto final de características de DQ obtenido y ya pertenecientes al contexto de portales Web, se crea el modelo SPDQM y se agrupan sus características de DQ en base a puntos de vista y categorías. Paso 4: Se operacionaliza el modelo mediante un análisis estático o un análisis dinámico. Paso 5: Se implementa el modelo utilizando una herramienta de software libre. Este paso se muestra en la sección 6. 72

95 4.- Propuesta del modelo de calidad de datos para portales Web Paso 1: Estudio de propuestas relacionadas 1.1: Fuentes PDQM características ISO/IEC características RSL características 1.2: Conjunto inicial de características de DQ para portales Web Paso 2: Integración y adaptación al contexto 2.1. Aplicabilidad de las características de DQ en el contexto de portales Web 2.2. Resolución de conflictos 2.3. Selección de características de DQ Paso 3: Estructuración del modelo 3.1: Conjunto final de características de DQ para portales Web Clasificación PDQM categorías 3.2: Organización de las características ISO/IEC categorías 3.3: SPDQM Paso 4: Operacionalización de SPDQM Análisis estático Análisis dinámico Paso 5: Implementación de SPDQM 5.1: Creación de herramienta Figura 11.- Procedimiento utilizado para obtener el modelo SPDQM 73

96 4.- Propuesta del modelo de calidad de datos para portales Web A continuación se detallan las actividades realizadas en cada paso Paso 1: Estudio de propuestas relacionadas El objetivo de este paso es realizar un estudio para obtener el conjunto inicial de características de DQ que se van a tener en cuenta para la construcción del modelo. Para ello se realizan los subpasos que se detallan a continuación Paso 1.1. Fuentes Se determinan los trabajos a utilizar para la obtención de las características de DQ. El modelo de calidad de datos propuesto por (Strong et al., 1997; Wang and Strong, 1996) no se considera porque sirvió como base para la creación de PDQM y sus características de DQ ya están incluidas en el mismo. En concreto, se decidió considerar las características del modelo PDQM, las definidas en el modelo de DQ propuesto en el estándar ISO/IEC 25012, así como las obtenidas de los trabajos seleccionados tras la realización de una revisión sistemática de la literatura, la cual se presentó en la sección Paso 1.2. Conjunto inicial de características de DQ En primer lugar, se aunan las características de DQ obtenidas de las tres fuentes mencionadas anteriormente. Estas características de DQ se muestran en la Tabla 13. Se puede apreciar que el conjunto inicial de características de DQ para portales Web está formado por 15 características de DQ procedentes del estándar ISO/IEC 25012, 33 características de DQ de PDQM y 39 características de DQ de la revisión sistemática de la literatura. Realizando un análisis preliminar se puede observar que existen 33 características de DQ comunes entre las propuestas en PDQM y las encontradas de la RSL. Por tanto, se puede considerar que no se ha incrementado en gran número las características de DQ nuevas a considerar. Con respecto a las características de DQ del estándar ISO/IEC se puede observar que se proponen 5 características de DQ nuevas, no incluidas ni en PDQM ni en la RSL. Estas características son: Compliance, 74

97 4.- Propuesta del modelo de calidad de datos para portales Web Confidentiality, Portability, Precision y Recoverability (en castellano: Conformidad, Confidencialidad, Portabilidad, Precisión y Recuperabilidad). Características de DQ PDQM RSL ISO/IEC Accessibility X X X Accuracy X X X Availability X X X Completeness X X X Consistency Consistent Representation Consistent Representation X Credibility X X X Currentness Currency Currency X Traceability X X X Understandability X X X Compliance X Confidentiality X Portability X Precision X Recoverability X Efficiency X X Amount of data X X Applicability X X Attractiveness X X Concise Representation X X Customer Support X X Documentation X X Duplicates X X Ease of operation X X Expiration X X Flexibility X X Interactive X X Interpretability X X Novelty X X Objectivity X X Organization X X Relevancy X X Reliability X X Reputation X X Response Time X X Security X X Specialization X X Timeliness X X Validity X X Value-added X X Effectiveness X Readability X Usability X Usefulness X Verifiability X Tabla 13.- Clasificación de características de calidad de datos 75

98 4.- Propuesta del modelo de calidad de datos para portales Web Paso 2: Integración y adaptación al contexto Una vez obtenido el conjunto inicial de características de DQ (ver Tabla 13), en este paso, se determina su aplicabilidad al contexto de portales Web. Además, se resuelve cualquier conflicto entre las características de DQ obtenidas de varias fuentes, detectando si existen características de DQ con el mismo nombre y significado distinto o características de DQ con diferente nombre pero el mismo significado, es decir, buscando posibles inconsistencias en cuanto a terminología Paso 2.1. Aplicabilidad de las características en el contexto de calidad de datos de portales Web En este paso, se analiza si las características de DQ inicialmente obtenidas son aplicables al contexto de portales Web. En primer lugar, se puede decir que las características de DQ procedentes de PDQM sí son aplicables a portales Web, por la propia definición del modelo (el cuál fue creado en ese contexto), además, las características de DQ seleccionadas de la RSL también son aplicables a portales Web, pues en la sección se dijo que se descartaban aquellas no aplicables al contexto de portales Web. Por tanto, todas ellas fueron incorporadas al conjunto de características de DQ del modelo SPDQM. Sin embargo, es preciso estudiar la aplicabilidad en el contexto de portales Web para las características de DQ del estándar ISO/IEC que no coincidan con otras fuentes, que como indicamos anteriormente son cinco: - Compliance (Conformidad): Es definida en (ISO/IEC-FDIS-25012, 2008) como el grado en el que los datos tienen atributos que cumplen estándares, convenciones o reglamentos en vigor y normas similares relacionadas con calidad de datos en un contexto de uso específico. Por tanto, está relacionada con estándares y regulaciones a nivel de datos (a diferencia de ISO/IEC 9126 (ISO/IEC-9126, 2001), la conformidad no es específica de cada una de las características de calidad). Dentro del contexto de portales Web puede ser útil para, por ejemplo, determinar si se cumple la Ley Orgánica de Proteción de Datos (LOPD) o convenciones de datos (ej: la diferencia entre. y, para identificar 76

99 4.- Propuesta del modelo de calidad de datos para portales Web las unidades de mil). Por tanto, es una característica aplicable a la calidad de los datos de los portales Web. - Confidentiality (Confidencialidad): De acuerdo con (ISO/IEC-FDIS-25012, 2008), se define como el grado en el que los datos tienen atributos que aseguran que son sólo accesibles e interpretables por usuarios autorizados en un contexto de uso específico. Por tanto, esta característica es aplicable a la calidad de datos de los portales Web ya que es necesaria cuando se quiere limitar la información a un conjunto concreto de usuarios. - Portability (Portabilidad): Es definida en (ISO/IEC-FDIS-25012, 2008) como el grado en el que los datos tienen atributos que les permiten ser introducidos, sustituidos o movidos de un sistema a otro, preservando la calidad existente en el contexto de uso específico. De modo, que esta característica es importante para los portales Web porque los consumidores pueden usar diferentes buscadores y diferentes sistemas operativos o extraer los datos del portal en distintos formatos. - Precision (Precisión): De acuerdo con (ISO/IEC-FDIS-25012, 2008), es el grado en el que los datos tienen atributos que son exactos o que proporcionan diferenciación en un contexto de uso específico. En este caso, por ejemplo, la escala usada para los datos numéricos proporciona distinción a un portal Web lo que podría incrementar la fidelización de los clientes. - Recoverability (Recuperabilidad): Es definida en (ISO/IEC-FDIS-25012, 2008) como el grado en el que los datos tienen atributos que les permiten mantener y preservar un nivel de operaciones y de calidad específicos, incluso en el caso de que ocurra un fallo, en un contexto de uso específico. Así, la capacidad de recuperar datos en un portal Web, incluso en el caso de que ocurra un fallo, incrementa la confianza de los usuarios. Por tanto, es aplicable al contexto de portales Web Paso 2.2. Resolución de conflictos Seguidamente se identifican las características que sin tener el mismo nombre, hacen referencia al mismo concepto o viceversa. Las características de DQ entre las que se detectan conflictos son las siguientes: Completeness, Consistent Representation, Consistency, Currentness y Currency (en castellano: Completitud, Representación 77

100 4.- Propuesta del modelo de calidad de datos para portales Web Consistente, Coherencia y Actualidad, respectivamente) y su procedencia puede observarse en la Tabla 13. Para resolver estos conflictos, analizamos las definiciones de las diferentes características y detectamos lo siguiente: - Completeness (Completitud): Esta característica de DQ es definida en PDQM como el grado en que los datos/información provistos por un portal Web son lo suficientemente amplios, profundos y del ámbito de la tarea a desarrollar (Caro et al., 2008) y en (ISO/IEC-FDIS-25012, 2008) es el grado en que los datos asociados con una entidad tienen valores para todos los atributos esperados y las instancias de entidad relacionadas, en un contexto de uso específico. Por tanto, este término no tiene el mismo significado para ambos contextos, y es necesario cambiar el nombre de uno de ellos. En este caso, debido a que ISO/IEC es un estándar, lo lógico es modificar el nombre de la característica de DQ de PDQM y llamarse de otro modo en SPDQM. De esta forma, la característica denominada Completeness de PDQM pasó a llamarse Scope (Alcance ). - Consistent Representation (Representación Consistente) y Consistency (Coherencia): Fueron inicialmente clasificados como una única característica. Sin embargo, analizando la definición de Consistent Representation (Representación Consistente) que en PDQM es el grado en que los datos/información son representados en forma consistente con otras fuentes, usando siempre el mismo formato, de modo compatible con datos previos y sin contradecirse a sí mismos (Caro et al., 2008), y la definición de Consistency (Coherencia) que en (ISO/IEC-FDIS-25012, 2008) es el grado en el que los datos tienen atributos que están libres de contradicciones y son coherentes unos con otros en un contexto de uso específico, nos dimos cuenta de que aunque aparentemente se referían al mismo concepto, esto no era así, ya que la representación consistente está más relacionada con la compatibilidad y con la consistencia de los datos en cuanto a su formato de presentación y la coherencia, está relacionada con la inexistencia de contradicciones y se refiere a la consistencia semántica entre los atributos de una entidad. Por tanto hemos considerado que son dos características diferentes en SPDQM. 78

101 4.- Propuesta del modelo de calidad de datos para portales Web - Currentness (Actualidad) y Currency (Actualidad): De acuerdo con (ISO/IEC- FDIS-25012, 2008) es el grado en el que los datos tienen atributos con fecha correcta en un contexto de uso específico y en (Caro et al., 2008) Currency (Actualidad) es el grado en que una aplicación Web provee datos/información cuya distancia entre el instante cuando un valor fue actualizado por última vez y el instante cuando el valor es usado (referido sólo a valores de datos que pueden variar en el tiempo) sea la necesaria para no proveer datos obsoletos. Tomando en cuenta la similitud entre ambas definiciones, se decidió considerarlas como una sola (en su versión en inglés, se conservó el nombre currentness dado por ISO/IEC 25012) Paso 2.3. Selección de características de DQ Finalmente, se revisaron las características obtenidas para ver si alguna podía ser eliminada, observando que: - Security (Seguridad) era una característica más genérica que Availability (Disponibilidad) y Confidentiality (Confidencialidad), estando por tanto a más alto nivel. Supuesto que Availability (Disponibilidad) y Confidentiality (Confidencialidad) son consideradas como características en ISO/IEC Se decidió eliminar Security (Seguridad) y dejar las otras dos características y así seguir el estándar ISO/IEC Usability (Usabilidad), contiene Efficiency (Eficiencia) y Effectiveness (Eficacia). Sin embargo, preferimos dejar Efficiency (Eficiencia) y Effectiveness (Eficacia) y eliminar Usability (Usabilidad), porque la característica Usability (Usabilidad) no está definida en ISO/IEC 25012, pero sí está definida la característica Efficiency (Eficiencia). 79

102 4.- Propuesta del modelo de calidad de datos para portales Web Una vez que se ha depurado el conjunto de características de DQ, se obtiene el conjunto final de características de DQ mostrado en la Tabla 14. SPDQM características PDQM RSL ISO/IEC Accessibility X X X Accuracy X X X Availability X X X Credibility X X X Currentness Currency Currency X Traceability X X X Understandability X X X Completeness X Compliance X Confidentiality X Consistency X Portability X Precision X Recoverability X Efficiency X X Amount of data X X Applicability X X Attractiveness X X Concise Representation X X Consistent Representation X X Customer Support X X Documentation X X Duplicates X X Ease of operation X X Expiration X X Flexibility X X Interactive X X Interpretability X X Novelty X X Objectivity X X Organization X X Relevancy X X Reliability X X Reputation X X Response Time X X Scope X X Specialization X X Timeliness X X Validity X X Value-added X X Effectiveness X Readability X Usefulness X Verifiability X Tabla 14.- Características de calidad de datos para SPDQM 80

103 4.- Propuesta del modelo de calidad de datos para portales Web Paso 3: Estructuración del modelo En este paso, se determina cómo clasificar las características de DQ obtenidas previamente Paso 3.1. Conjunto final de características de DQ El conjunto final de características de DQ se muestra en la Tabla 15. SPDQM características Accessibility Portability Duplicates Reputation Accuracy Precision Ease of operation Response Time Availability Recoverability Expiration Scope Credibility Efficiency Flexibility Specialization Currentness Amount of data Interactive Timeliness Traceability Applicability Interpretability Validity Understandability Attractiveness Novelty Value-added Completeness Concise Representation Objectivity Effectiveness Compliance Consistent Representation Organization Readability Confidentiality Customer Support Relevancy Usefulness Consistency Documentation Reliability Verifiability Tabla 15.- Conjunto final de características de calidad de datos para SPDQM Paso 3.2. Organización de las características Teniendo en cuenta el conjunto final de características de DQ de SPDQM, se decidió clasificarlas en las categorías de PDQM: - Intrínseca: representa que los datos tienen calidad por derecho propio. - Operacional: destaca la importancia del rol de los sistemas de información en aspectos como accesibilidad, seguridad, personalización, colaboración, etc. - Contextual: destaca la necesidad de establecer que la calidad de datos debe ser considerada en el contexto de la tarea que se está realizando. - Representacional: indica que el sistema debe presentar los datos de tal manera que sean interpretables, fáciles de entender y representados concisa y consistentemente. 81

104 4.- Propuesta del modelo de calidad de datos para portales Web y desde los puntos de vista de ISO/IEC 25012: - Inherente: se refiere al grado en el que las características de calidad de datos tienen un potencial intrínseco para satisfacer las necesidades implícitas cuando los datos se usan bajo condiciones específicas. - Dependiente del sistema: se refiere al grado en el que la calidad de datos se preserva dentro de un sistema de ordenador cuando los datos se usan bajo condiciones específicas. teniendo en cuenta que: - La categoría Intrínseca de PDQM es similar al punto de vista Inherente de calidad de datos en ISO/IEC 25012, debido a que según las definiciones ambas se refieren a la calidad de los datos en sí mismos. - Las categorías Operacional, Contextual y Representacional de PDQM hacen referencia a elementos del sistema, con lo que se engloban en el punto de vista Dependiente del sistema de calidad de datos de ISO/IEC Por tanto, aunque PDQM sólo permitía clasificar una característica o subcaracterística dentro de cada categoría, en SPDQM, si una característica/subcaracterística está en ambos puntos de vista ( Inherente y Dependiente del sistema en ISO/IEC 25012) se incluirá en más de una categoría Paso 3.3. SPDQM (Modelo de calidad de datos para portales Web alineado con SQuaRE) La Tabla 16 muestra la estructura completa del modelo en este punto, el cual posee cuatro niveles: - El primer nivel se corresponde com los dos puntos de vista del estándar ISO/IEC (Inherente, Dependente del Sistema). - El segundo nivel se corresponde con las categorías adoptadas del modelo PDQM (Intrínseca, Contextual, Representacional, Operacional). - El tercer nivel se corresponde con el conjunto de características de DQ que directamente se incluyen en cada una de las cuatro categorías. 82

105 4.- Propuesta del modelo de calidad de datos para portales Web - Finalmente, el cuarto nivel contiene las sub-características de DQ asociadas con las características de DQ del nivel anterior. Punto de vista Categoría Característica Subcaracterística Exactitud: Credibilidad: Duplicidad Objetividad Reputación Trazabilidad Inherente Intrínseca Actualidad Expiración Completitud Coherencia Accesibilidad Conformidad Confidentialidad Eficiencia Precisión Entendibilidad Disponibilidad: Accesibilidad: Tiempo de respuesta Interactividad Facilidad de operación Dependiente del sistema Operacional Contextual Representacional Verificabilidad Confidencialidad Portabilidad Recuperabilidad Validez: Valor añadido: Relevancia: Especialización Utilidad Eficiencia Eficacia Trazabilidad Conformidad Precisión Representación Concisa Representación Consistente Entendibilidad: Atractivo: Legibilidad Tabla 16.- Estructura inicial de SPDQM Soporte de usuario Confiabilidad Alcance Aplicabilidad Flexibilidad Novedad Novedad Oportunidad Interpretabilidad Cantidad de datos Documentación Organización Organización 83

106 4.- Propuesta del modelo de calidad de datos para portales Web En este punto se vuelve a analizar el modelo para ver si es posible refinarlo más, y se decidió que: Las características deberían aparecer siempre al mismo nivel, por tanto trazabilidad no puede estar a nivel de característica y al nivel de subcaracterística, de manera que nos quedamos con el nivel de característica siguiendo ISO/IEC 25012, que la consideraba característica. Una característica no puede incluir una única subcaracterística, de manera que se engloban bajo el nombre de la característica, pero adaptando su definición. De forma que eliminamos las subcaracterísticas: Duplicidad de Exactitud Tiempo de Respuesta de Disponibilidad Organización de Atractivo Por tanto, la estructura final de SPDQM queda como sigue (ver Tabla 17). Está compuesto por 27 características de DQ y 15 subcaracterísticas de DQ que se dividen en dos puntos de vista (Inherente y Dependiente del Sistema) y cuatro categorías (Intrínseca, Contextual, Representacional, Operacional). 84

107 4.- Propuesta del modelo de calidad de datos para portales Web Punto de vista Categoría Característica Subcaracterística Exactitud Credibilidad: Objetividad Inherente Dependiente del sistema Intrínseca Operacional Contextual Representacional Trazabilidad Actualidad Expiración Completitud Coherencia Accesibilidad Conformidad Confidentialidad Eficiencia Precisión Entendibilidad Disponibilidad Accesibilidad: Verificabilidad Confidencialidad Portabilidad Recuperabilidad Validez: Valor añadido: Relevancia: Especialización Utilidad Eficiencia Eficacia Trazabilidad Conformidad Precisión Representación Concisa Representación Consistente Entendibilidad: Atractivo Legibilidad Tabla 17.- Estructura final de SPDQM Reputación Interactividad Facilidad de operación Soporte de usuario Confiabilidad Alcance Aplicabilidad Flexibilidad Novedad Novedad Oportunidad Interpretabilidad Cantidad de datos Documentación Organización 85

108 4.- Propuesta del modelo de calidad de datos para portales Web Mostrada la estructura final con los niveles correspondientes, resulta la siguiente figura (Figura 12). Figura 12.- Estructura del modelo SPDQM por niveles A continuación en la Tabla 18 se presenta la definición de cada característica/subcaracterística de DQ propuesta en el modelo SPDQM. En la tabla se indica el nombre de la característica/subcaracterística de DQ tanto en castellano como en inglés, su definición así como las referencias utilizadas para realizar la definición. 86

109 4.- Propuesta del modelo de calidad de datos para portales Web Característica en castellano / inglés Accesibilidad / Accessibility Exactitud / Accuracy Cantidad de datos / Amount of data Aplicabilidad / Applicability Atractivo / Attractiveness Disponibilidad / Availability Completitud / Completeness Conformidad / Compliance Representación Concisa / Concise Representation Confidencialidad / Confidentiality Coherencia / Consistency Representación Consistente / Consistent Representation Credibilidad / Credibility Descripción Grado en que un portal Web proporciona mecanismos de navegación para alcanzar, de forma rápida y fácil, los datos deseados, en especial para personas que necesitan soporte tecnológico o una configuración especial a causa de una discapacidad. Grado en que los datos de un portal Web están libres de errores, no contienen duplicados y los datos tienen atributos que presentan correctamente el valor real de los atributos de un concepto o evento. Grado en que la cantidad o volumen de datos entregados por un portal Web es adecuada para la tarea en cuestión, en un contexto de uso específico. Grado en que los datos son útiles y específicos para la comunidad destinataria del portal Web, en un contexto de uso específico. Grado en un portal Web ofrece datos de manera atractiva para sus usuarios, en un contexto de uso específico. Grado en que los datos están disponibles en tiempo y forma por los usuarios y/o aplicaciones autorizadas a través de un portal Web, en un contexto de uso específico. Grado en que los datos de un portal Web satisfacen la necesidad de información de los usuarios, cumpliendo implícitamente otros criterios como la facilidad de comprensión, y que sirven como un indicador de relevancia. Grado en el que los datos de un portal Web están definidos de manera estandarizada para que los usuarios los entiendan, evitando que se induzca a dudas o a diferentes interpretaciones. Grado en que los datos de un portal Web son representados de forma compacta sin elementos superfluos o no relacionados y permite la detección de descripciones incorrectas, en un contexto de uso específico. Grado en el que los datos de un portal Web tienen atributos que aseguran que sólo serán accesibles e interpretables por usuarios autorizados. Grado en que los datos de un portal Web tienen atributos que están libres de contradicciones, son coherentes con otros datos y se presentan en el mismo formato. Grado en que los datos de un portal Web son representados en forma consistente con otras fuentes, usando siempre el mismo formato, de modo compatible con datos previos y sin contradecirse a sí mismos, en un contexto de uso específico. Grado en que los datos de un portal Web tienen atributos que permiten a los usuarios considerarlos verdaderos y correctos. Ref. ([ISO/IEC-FDIS ], 2008; Caro and Calero, 2007; Caro et al., 2008; Chung, 2006) ([ISO/IEC-FDIS ], 2008; Caro and Calero, 2007; Caro et al., 2008; Dondio and Barrett, 2007; Metzger, 2007) (Caro and Calero, 2007; Caro et al., 2008; Chung, 2006) (Caro and Calero, 2007; Caro et al., 2008) (Caro and Calero, 2007; Caro et al., 2008) ([ISO/IEC-FDIS ], 2008; Caro and Calero, 2007; Caro et al., 2008) ([ISO/IEC-FDIS ], 2008; Prestipino et al., 2007) ([ISO/IEC-FDIS ], 2008) (Caro and Calero, 2007; Caro et al., 2008; Chung, 2006; Domingues et al., 2006) ([ISO/IEC-FDIS ], 2008) ([ISO/IEC-FDIS ], 2008; Chung, 2006) (Caro and Calero, 2007; Caro et al., 2008) ([ISO/IEC-FDIS ], 2008; Caro and Calero, 2007; Caro et al., 2008; De Wulf et al., 2006; Robins and Holmes, 2008) 87

110 4.- Propuesta del modelo de calidad de datos para portales Web Característica en castellano / inglés Actualidad / Currentness Soporte de Usuario / Customer Support Documentación / Documentation Facilidad de operación / Ease of operation Eficacia / Effectiveness Eficiencia / Efficiency Expiración / Expiration Flexibilidad / Flexibility Interactividad / Interactive Interpretabilidad / Interpretability Novedad / Novelty Objetividad / Objectivity Organización / Organization Portabilidad / Portability Descripción Grado en que los datos de un portal Web tienen atributos que les permite ser considerados actualizados y no obsoletos. Grado en que un portal Web proporciona datos que sirven de ayuda a los usuarios por medio de texto, y/o dispone de correo electrónico, número de teléfono, etc. Cantidad y utilidad de los documentos con metainformación en un portal Web, en un contexto de uso específico. Grado en que los datos de un portal Web pueden ser manipulados, tratados y gestionados fácilmente, en un contexto de uso específico. Grado en que los datos de un portal Web permiten al usuario alcanzar sus objetivos, en un contexto de uso específico. Grado en que los datos de un portal Web se obtienen con niveles adecuados de rendimiento, es decir, utilizando las cantidades y tipos de recursos apropiados (por ejemplo: empleando el menor número de enlaces posibles a los que hay que acceder). Grado en que se conoce el tiempo hasta que los datos de un portal Web permanecen actualizados. Grado en que los datos de un portal Web pueden adaptarse a diferentes necesidades (por ej. ser integrados en otras plataformas, o presentados en distintos formatos), en un contexto de uso específico. Grado en que los datos de un portal Web pueden ser personalizados y adaptados a las preferencias de los usuarios, en un contexto de uso específico. Grado con que los datos de un portal Web están en un lenguaje, símbolos y unidades apropiados y definiciones claras, acordes con la capacidad del consumidor, en un contexto de uso específico. Grado en que los datos obtenidos de un portal Web son novedosos para el usuario, es decir, aportan nuevos conocimientos, en un contexto de uso específico. Grado con que los datos de un portal Web son imparciales y sin prejuicios, es decir, no llevan a conclusiones incorrectas. Organización, ajuste visual, características tipográficas (por ejemplo, color, texto, fuente, imágenes, etc) y consistencia con que los datos son proporcionados en un portal Web, en un contexto de uso específico. Grado en que los datos de un portal Web pueden ser integrados en otras plataformas, preservando la calidad existente en el contexto de uso específico. Ref. ([ISO/IEC-FDIS ], 2008; Caro and Calero, 2007; Caro et al., 2008; De Wulf et al., 2006; Metzger, 2007) (Caro and Calero, 2007; Caro et al., 2008) (Caro and Calero, 2007; Caro et al., 2008) (Caro and Calero, 2007; Caro et al., 2008; Chung, 2006) (Yen et al., 2007) ([ISO/IEC-FDIS ], 2008; Grigoroudis et al., 2008) (Caro and Calero, 2007; Caro et al., 2008) (Caro and Calero, 2007; Caro et al., 2008) (Caro and Calero, 2007; Caro et al., 2008; De Wulf et al., 2006) (Caro and Calero, 2007; Caro et al., 2008) (Caro and Calero, 2007; Caro et al., 2008) (Caro and Calero, 2007; Caro et al., 2008; Chung, 2006; Metzger, 2007) (Caro and Calero, 2007; Caro et al., 2008) ([ISO/IEC-FDIS ], 2008) 88

111 4.- Propuesta del modelo de calidad de datos para portales Web Característica en castellano / inglés Precisión / Precision Legibilidad / Readability Recuperabilidad / Recoverability Relevancia / Relevancy Confiabilidad / Reliability Reputación / Reputation Alcance / Scope Especialización / Specialization Oportunidad / Timeliness Trazabilidad / Traceability Entendibilidad / Understandability Utilidad / Usefulness Validez / Validity Valor añadido / Value-added Verificabilidad / Verifiability Descripción Grado en que los datos de un portal Web son exactos y concisos. Grado en que el texto es legible y su colocación en un portal Web garantiza una buena legibilidad, en un contexto de uso específico. Grado en que ante un fallo en un portal Web, es posible recuperar los datos contenidos en el mismo, en un contexto de uso específico. Grado en que los datos de un portal Web son aplicables, novedosos y están disponibles en un tiempo oportuno (razonable), en un contexto de uso específico. Grado en que los datos de un portal Web son fiables, en un contexto de uso específico. Grado en que los datos de un portal Web son verdaderos o de alta fiabilidad en función de su fuente o contenido. Grado en que los datos proporcionados por un portal Web tienen el suficiente nivel de detalle para la tarea a desarrollar, en un contexto de uso específico. Grado en que los datos entregados por un portal Web suministran la información adecuada, limitándose a un uso o fin determinado, en un contexto de uso específico. Grado de disponibilidad de los datos de un portal Web en el tiempo, esto es, con las restricciones de tiempo de los consumidores, en un contexto de uso específico. Grado en que los datos proporcionados por un portal Web son verificables y sus autores o fuentes son conocidos. Grado en que los datos de un portal Web son claros, no ambiguos, fáciles de comprender y de interpretar por los usuarios y se expresan en el idioma, con los símbolos y las unidades apropiados. Grado de satisfacción de los usuarios con la utilidad del contenido proporcionado por el portal Web, en un contexto de uso específico. Grado en que el usuario juzga y entiende, desde su perspectiva, los datos/información provistos por un portal Web en un contexto de uso específico. Grado en que los datos de un portal Web son beneficiosos y proporcionan ventajas por su utilización, en un contexto de uso específico. Grado en que los datos de un portal Web muestran referencias a sus fuentes originales, en un contexto de uso específico. Tabla 18.- Definición de las características de DQ del modelo SPDQM Ref. ([ISO/IEC-FDIS ], 2008; Chung et al., 2006) (De Wulf et al., 2006) ([ISO/IEC-FDIS ], 2008) (Caro and Calero, 2007; Caro et al., 2008; Chung, 2006; De Wulf et al., 2006; Domingues et al., 2006) (Caro and Calero, 2007; Caro et al., 2008; De Wulf et al., 2006) (Caro and Calero, 2007; Caro et al., 2008; Chung, 2006) (Caro and Calero, 2007; Caro et al., 2008) (Caro and Calero, 2007; Caro et al., 2008) (Caro and Calero, 2007; Caro et al., 2008; Chung, 2006; Dondio and Barrett, 2007) ([ISO/IEC-FDIS ], 2008; Caro and Calero, 2007; Caro et al., 2008) ([ISO/IEC-FDIS ], 2008; Caro and Calero, 2007; Caro et al., 2008; Chung, 2006) (Cheung and Lee, 2008; Moraga et al., 2006; Stvilia et al., 2008) (Caro and Calero, 2007; Caro et al., 2008) (Caro and Calero, 2007; Caro et al., 2008; Chung, 2006) (Stvilia et al., 2008) Una vez definido el modelo teórico, el siguiente paso es su operacionalización. 89

112 4.- Propuesta del modelo de calidad de datos para portales Web Paso 4: Operacionalización del modelo Para la operacionalización del modelo SPDQM se ha considerado que la calidad puede ser estática (independiente del portal Web) o dinámica (varía para cada portal Web). De sta forma, en función de los requerimientos de cada categoría, ésta se operacionaliza de una manera o de otra. - El análisis estático: se realiza una única vez para cada categoría. En concreto, las categorías a las que se aplica son: Intrínseca y Contextual. Este uso consiste en determinar diferentes perfiles de usuarios de portales Web y sus preferencias en cuanto a las características de DQ que son más relevantes para ellos. Estos perfiles de usuarios se determinan según distintos aspectos demográficos. Estos aspectos demográficos son: o sexo, rango de edad, nivel de estudios, conocimientos informáticos para la categoría Intrínseca y o sexo, rango de edad, nivel de estudios, y tipo de organización a la cual está asociado para la categoría Contextual. Una vez determinados los perfiles de usuario y sus preferencias se crean guías para que los diseñadores y desarrolladores conozcan las características de DQ que son más relevantes para cada tipo de usuario de Web portal. Estas guías, además, indican pautas para satisfacer las preferencias de usuarios y mejorar la DQ de los Web portals y son implementadas mediante una herramienta de software libre. - El análisis dinámico: consiste en determinar el nivel de calidad del portal Web, en un momento específico. Para ello, es necesario definir un conjunto de medidas para cada característica de las categorías en las que este uso es utilizable. En este caso es aplicable a las categorías Representacional y Operacional y los resultados varían dependiendo del portal Web que esté siendo analizado, y por tanto, no es posible generalizar los resultados del análisis. Este uso no es objeto de estudio de esta tesis, por tanto no se entra en más detalle. 90

113 4.- Propuesta del modelo de calidad de datos para portales Web A continuación, se muestran los pasos necesarios para cada análisis (ver Figura 13). Figura 13.- Análisis estático y análisis dinámico del modelo SPDQM El análisis estático del modelo se basa en encuestas y análisis estadístico mientras que el análisis dinámico se hace en base a mediciones sobre los portales Web y estimaciones en base a éstas. Como hemos comentado anteriormente en esta tesis sólo se aplica el análisis estático, que detallamos a continuación ANÁLISIS ESTÁTICO El análisis estático consiste en la obtención de características de DQ que son relevantes para los usuarios de portales Web en función de sus perfiles. Para ello, se tienen en cuenta los siguientes pasos y subpasos: 1) Definición del cuestionario: Creación de un conjunto inicial de preguntas relacionadas con las definiciones de las características de DQ de cada categoría y los aspectos demográficos. Revisión de estas preguntas por un grupo de expertos en análisis estadístico. Modificación de las preguntas con el feedback obtenido de los expertos. 91

114 4.- Propuesta del modelo de calidad de datos para portales Web Envío de una encuesta piloto, a un grupo de prueba que contestará la encuesta. Este grupo estará compuesto por usuarios de portales Web y nos informará si las preguntas son entendibles o hay que hacer revisiones para que éstas sean más comprensibles. Revisión de las preguntas de la encuesta, teniendo en cuenta el feedback del grupo de prueba, de forma que se crea un cuestionario en el que se incluya el conjunto final de preguntas. Las preguntas deberán ser entendibles por cualquier usuario de portales Web. 2) Distribución de encuestas: Distribución del cuestionario mediante formato impreso o vía , a un grupo heterogéneo de usuarios de portales Web. Recogida del cuestionario manualmente o por . 3) Análisis de resultados: Análisis de los resultados obtenidos, eliminando previamente cuestionarios no válidos. Realización de un análisis estadístico para determinar las características de DQ que son más relevantes en función de los perfiles de usuarios. Esto se realiza mediante: Primero (Análisis de correlación): se comprueba si hay relación entre la propia categoría y las características de DQ asociadas a dicha categoría. Para reforzar la idea de que verdaderamente esas características estaban correctamente asociadas con su categoría. Segundo (Análisis estadístico descriptivo): se obtiene el mínimo, el máximo y el valor medio de cada característica de DQ. Esto nos permitirá verificar si, estadísticamente, existen diferencias significativas para las características de DQ del modelo SPDQM, y determinar si todas ellas son realmente importantes para los usuarios de portales Web. Tercero (Análisis de la varianza): se determina si hay diferencias significativas para cada característica de DQ en función los aspectos demográficos (por ejemplo: para hombres y mujeres). Cuarto (Análisis factorial): se utiliza el conjunto inicial de características de DQ para crear grupos homogéneos de características de DQ (denominados factores). Estos factores resumen y sintetizan la información reduciendo la 92

115 4.- Propuesta del modelo de calidad de datos para portales Web cantidad inicial de variables (características de DQ). Los grupos se forman conteniendo aquellas características de DQ que tienen correlación considerable entre ellas. Además, cada grupo debe ser independiente de los demás. Quinto (Análisis de cluster): se hace uso de los resultados obtenidos del análisis factorial para construir grupos de factores (denominados clusters). Estos clusters se combinan con los aspectos demográficos mediante tablas de contingencia para determinar tipos de usuarios que denominaremos perfiles. De esta forma se agruparán las características de DQ que son más importantes para diferentes perfiles de usuarios. Creación de guías que contengan recomendaciones para diseñadores y desarrolladores de portales Web, que les permitirán conocer las preferencias de los usuarios. Teniendo en cuenta la definición y los pasos del análisis estático, se puede concretar que, el análisis estático: Se aplica sólo a las categorías Intrínseca y Contextual. Se hace para tipos de portales Web en general, no para uno sólo, siguiendo la opinión del usuario. Es decir, los resultados son aplicables a los portales Web en general sin ser específico como ocurre con el análisis dinámico donde se aplican medidas. Permite determinar las características de DQ que son más importantes en función del perfil de usuario, para ello se hace uso de encuestas. Se proporcionan indicaciones a tener en cuenta para el desarrollo del portal Web. Es decir, se da información sobre qué características de DQ son relevantes en función de los usuarios que vayan a utilizar el portal Web, de forma que, permita saber qué aspectos se deben cuidar mientras se diseña o se desarrolla. Está enfocado, principalmente, a los diseñadores y desarrolladores de portales Web, que quieren hacer un portal Web competitivo no sólo desde el punto de vista de aspectos funcionales sino dándole el valor añadido de los aspectos no funcionales (es decir, los de la calidad de los datos) de manera que les permitan obtener ventajas competitivas. 93

116 4.- Propuesta del modelo de calidad de datos para portales Web A continuación, se indican los pasos seguidos para la aplicación del análisis estático ) Definición del cuestionario Puesto que el análisis estático se aplica tanto para la categoría Intrínseca como para la categoría Contextual, es necesario desarrollar dos encuestas aunque ambas siguen el mismo procedimiento. Por tanto, en este apartado se presentan de forma conjunta ambas. Para las encuestas se decide utilizar encuestas no supervisadas ya que van a ser distribuidas pero no va a haber ningún investigador que resuelva sus dudas, por ello, al principio de la encuesta se explica el objetivo y lo que se espera obtener con ellas. Además, las preguntas son sencillas, de manera que no es necesaria la participación de un investigador y antes de las preguntas se indica cómo contestar (ver APÉNDICE D, APÉNDICE E). Para la creación del cuestionario se siguen las actividades propuestas por (Kitchenham and Pfleeger, 2002d; Kitchenham and Pfleeger, 2002c; Kitchenham and Pfleeger, 2002b; Kitchenham and Pfleeger, 2002a; Kitchenham and Pfleeger, 2003; Pfleeger and Kitchenham, 2001) y que fueron presentadas en la sección 2.3. Estas actividades se integran en los pasos y subpasos del análisis estático Establecer objetivos medibles y específicos El objetivo de ambas encuestas fue definido como: Determinar, cuáles son las características de DQ más relevantes para los usuarios cuando evalúan la DQ en portales Web e identificar si éstas varían dependiendo del perfil de los usuarios. El conjunto de características de DQ es diferente para cada categoría. 94

117 4.- Propuesta del modelo de calidad de datos para portales Web Objetivos para la categoría Intrínseca: En la categoría Intrínseca, el objetivo definido es independiente del tipo de portal Web seleccionado de forma que se obtiene un conjunto de características de DQ para cualquier tipo de portal Web Objetivos para la categoría Contextual: En el caso de la categoría Contextual, es importante distinguir el tipo de portal Web. En esta categoría, las características de DQ que se consideran más importantes pueden variar en función del tipo de portal Web que se esté considerando, pues estas características de DQ están definidas en función del contexto. En este caso el contexto es el tipo de portal Web, por ello, en primer lugar se deben identificar los diferentes tipos de portales Web que se van a estudiar. Tipos de portales Web: En la literatura se han propuesto diversas clasificaciones de portales Web, como por ejemplo la clasificación de (Guruge, 2003) (ver Figura 14), (Davydov, 2001) (ver Figura 15) o (Liu et al., 2009). En este estudio se ha considerado la clasificación de (Liu et al., 2009) para definir los tres tipos de portales Web a considerar. Portales Portales públicos Portales corporativos Interés general Contenido especializado Abierto al público Privado Colaboradore Sólo empleados Portales horizontales Portales verticales Figura 14.- Clasificación de portales Web de Guruge 95

118 4.- Propuesta del modelo de calidad de datos para portales Web Figura 15.- Clasificación de portales Web de Davydov (Liu et al., 2009) proponen una clasificación considerando que un portal Web tiene diferentes propiedades en función de su misión, sus contenidos y sus usuarios objetivo. Ellos proponen que, según la misión del portal Web pueden ser basados en transacción (diseñados para obtener un beneficio) o basados en información (diseñados para distribuir información). En función de sus contenidos se pueden dividir en horizontales o hortal - ofrecen una amplia variedad de contenidos y servicios a un gran número de usuarios - y verticales o vortal - proporciona contenidos específicos para un grupo particular de usuarios. Con respecto a sus usuarios objetivo, se considera que los portales Web pueden ser diseñados para uso público o privado. De forma que, el público en general puede acceder a un portal Web público, mientras que el acceso a un portal Web privado está restringido a sus miembros. Y concluyendo, indican que en general, los portales Web se pueden dividir en dos grupos: los destinados a negocios y los de tipo general. Estando los primeros diseñados para un grupo de usuarios y conteniendo información vertical, es decir, los que son generalmente basados en transacción, mientras que los últimos proporcionan acceso a un amplio rango de información y son por tanto basados en información. Para la categoría Contextual, se adopta la distinción que (Liu et al., 2009) hacen con respecto a la misión de los portales Web (basados en transacciones o basados en información). Pero, además se consideró la necesidad de distinguir un tercer tipo que 96

119 4.- Propuesta del modelo de calidad de datos para portales Web identifique los portales Web basados en el intercambio de datos entre personas (ver Figura 16): Figura 16.- Tipos de portales Web De esta forma, consideramos los siguientes tipos de portales Web: - Búsqueda y lectura de información (basado en información): definido como aquel que el usuario utiliza únicamente para obtener información (por ej. Portal de un canal de TV para conocer la programación, Portal de un Cine para conocer la cartelera, Portal de un periódico, etc.). Es por tanto meramente informativo. - Interacción comercial (basado en transacción): determinado por aquel que el usuario utiliza para realizar algún tipo de transacción de manera on-line (en línea a través de Internet) como por ejemplo, realizar compras de billetes de tren o avión, realizar descargas legales, transferir dinero, realizar pagos, etc. Es por tanto de carácter transaccional. - Interacción con otras personas: donde lo que importa es la capacidad de relacionarse o estar en contacto con otras personas tanto conocidas como no. Por ejemplo, las redes sociales. Es por tanto del tipo intercambio de datos. Una vez determinados los tipos de portales Web a considerar es necesario tenerlos en cuenta para la encuesta de la categoría Contextual. 97

120 4.- Propuesta del modelo de calidad de datos para portales Web Planificar la encuesta Considerando el objetivo de la encuesta, ésta se dirigió a usuarios de portales Web, en general. Concretamente, se encuestó a un grupo heterogéneo de usuarios de portales Web con distintos aspectos demográficos: - Diferentes edades, sexo, nivel de estudio y conocimientos informáticos para la categoría Intrínseca. - Diferentes edades, sexo, nivel de estudio y tipo de organización al que pertenece el usuario para la categoría Contextual Asegurar que están disponibles los recursos apropiados Se considera que es posible crear el instrumento, ya que se dispone de usuarios de portales Web disponibles a contestar la encuesta y además se tiene la herramienta estadística necesaria para analizar los resultados. Por tanto, creemos que se tienen todos los recursos necesarios para desarrollar la encuesta Diseñar la encuesta Teniendo en cuenta el objetivo de la encuesta, se selecciona un diseño descriptivo del tipo sección transversal, de manera que se pregunta a los participantes acerca de información en un momento concreto en el tiempo, para obtener una fotografía de los resultados Preparar el instrumento de colección de datos Para preparar el cuestionario de la categoría Intrínseca y de la categoría Contextual es preciso considerar el propósito y el objetivo de las encuestas (Kitchenham and Pfleeger, 2002c). 98

121 4.- Propuesta del modelo de calidad de datos para portales Web Montaje del cuestionario: Los cuestionarios están formados por un conjunto de preguntas que se utilizan para contestar a las encuestas. De forma que se pregunta a los usuarios sobre aquella información que es necesaria para el objetivo del estudio y que se detalla continuación. a) Montaje para categoría Intrínseca El cuestionario para esta encuesta está formado por un total de 20 preguntas (ver APÉNDICE D): - 16 relacionadas con las características de DQ de la categoría Intrínseca (donde está incluida una pregunta relacionada con la definición de propio término Intrínseca ). - 4 relacionadas con aspectos demográficos (sexo, rango de edad, nivel de estudios y conocimientos informáticos). Para recoger la importancia que el usuario le da a las características de DQ se utiliza, en las respuestas, la escala Likert de 1 a 5. Donde: 1 es Nada importante 3 es Neutro 5 es Muy importante b) Montaje para categoría Contextual En esta encuesta, el cuestionario está compuesto de un total de 24 preguntas (ver APÉNDICE E): - 17 preguntas relacionadas con las características de la DQ para la categoría Contextual (donde está incluida una pregunta relacionada con la definición de propio término Contextual ). Estas preguntas se realizan para cada uno de los tipos de portales Web (Búsqueda y lectura de información, Interacción comercial e Interacción con otras personas). - 7 preguntas de tipo general: o 4 preguntas se corresponden con aspectos demográficos (sexo, rango de edad, nivel de estudios y tipo de organización). 99

122 4.- Propuesta del modelo de calidad de datos para portales Web o 3 preguntas se relacionan con aspectos de uso, es decir, orden de utilización de cada tipo de portal Web, frecuencia de utilización de los portales Web y tipo de recurso utilizado para acceder a portales Web (ordenador fijo, ordenador portátil, ipad o similar, teléfono móvil o PDA). En este caso utilizamos la escala Likert de 11 puntos, numerada de 0 a 10. Donde: 0 es Nada importante 5 es Neutro 10 es Muy importante Como puede observarse se han utilizado diferentes escalas para la categoría Intrínseca y para la categoría Contextual. Esto es debido a que las encuestas se realizan en momentos distintos de tiempo, habiendo realizado antes la encuesta para la categoría Intrínseca, de forma, que se consideró que se podrían refinar los resultados y obtener mayor información si se ampliaba la escala Likert a 11 puntos Validar el instrumento Cada instrumento fue validado, mediante una encuesta piloto, la cual fue enviada a un grupo de prueba compuesto por 10 participantes de diferente sexo, edad, nivel de estudios, conocimientos informáticos y tipo de organización a la que pertenecían. Este grupo se encargó de informar si las preguntas eran comprensibles o si debían ser revisadas para hacerlas más entendibles. A continuación, las preguntas fueron revisadas en función de los consejos del grupo de prueba Seleccionar los participantes Para seleccionar a los sujetos que van a contestar la encuesta, se utiliza un método no probabilístico de muestreo por conveniencia (Kitchenham and Pfleeger, 2002a). La muestra considera grupos heterogéneos de usuarios de portales Web pertenecientes a Europa y a Latino-América para cada categoría. El número de usuarios 100

123 4.- Propuesta del modelo de calidad de datos para portales Web seleccionados se considera apropiado porque incluye sujetos que cubren los distintos aspectos demográficos que se necesitan para este estudio. Hay que tener en cuenta que, como se ha comentado antes, las encuestas se realizan en momentos distintos de tiempo, por ello varía el número de usuarios a los que se entrevista Selección para categoría Intrínseca Las encuestas se distribuyen a un grupo de usuarios de portales Web con diferente edad, sexo, nivel de estudios y conocimiento informático. En este caso, muchas de las encuestas se entregan en el entorno universitario de las escuelas de informática porque se considera interesante conocer la opinión de los usuarios de portales Web y en este entorno se pueden encontrar los sujetos que cumplan este requisito. Aún así, esto no afecta en la utilidad de los resultados Selección para categoría Contextual Las encuestas se reparten a un grupo heterogéneo de usuarios de portales Web con diferentes aspectos demográficos (sexo, rango de edad, nivel de estudios y tipo de organización con la que está vinculad@). De forma que hay diversidad de participantes entre cada uno de los aspectos demográficos, anteriormente mencionados ) Distribución de encuestas Este paso del análisis estático se corresponde con la actividad 8 del procedimiento que se está utilizando (ver sección 2.3.8). 101

124 4.- Propuesta del modelo de calidad de datos para portales Web Documentar la encuesta y aplicación del cuestionario Documentar la encuesta La información sobre la documentación de la encuesta se muestra en esta tesis y se informa directamente a los usuarios que desean saber sobre: objetivos del estudio, quiénes fueron los responsables y los encuestados, cómo se llevó a cabo el procedimiento de seguimiento, cómo fueron procesados los cuestionarios completados y una descripción del proceso de evaluación Aplicación del cuestionario El cuestionario se entrega directamente a los sujetos en formato impreso o mediante . En ambos casos, se pide a los usuarios que lean las instrucciones detenidamente. Así mismo, la recogida de los datos se realiza por los mismos medios ) Análisis de resultados Este paso del análisis estático se corresponde con la actividad 9 (ver sección 2.3.9) del procedimiento que se está utilizando y donde además mostraremos información sobre la actividad 10 (ver sección ) Analizar los datos Esta actividad se corresponde con el análisis de los resultados recogidos. 102

125 4.- Propuesta del modelo de calidad de datos para portales Web Análisis de datos para categoría Intrínseca Para la categoría Intrínseca, se entregan 150 encuestas de las cuales se recogen 137, obteniendo un 91.34% de ratio de respuesta. Del total de 137 encuestas recibidas, una se descartó porque no tenía todas las preguntas contestadas. De forma que 136 encuestas se procesan y analizan. Lo que supone un 90.6%. Es preciso tener en cuenta que sólo se seleccionan aquellas encuestas que han sido correctamente respondidas, y se descartan las que tienen respuestas incorrectas (por ejemplo, preguntas no contestadas o múltiples respuestas). Aspectos demográficos Para conocer los porcentajes de las personas que responden la encuesta de la categoría Intrínseca, se analizan las respuestas correspondientes a los aspectos demográficos. En la Tabla 19 se muestran los porcentajes de los aspectos demográficos con las respuestas correctas recibidas. Aspecto demográfico Variable Porcentaje (%) Total (%) Sexo Rango de edad Nivel de estudios Conocimientos informáticos Mujer 35 Hombre 65 < de 25 años 15 Entre 25 y 45 años 55 > de 45 años 30 Graduado escolar / ESO 7 Formación profesional 20 Universitario 73 Básico 16 Intermedio 35 Avanzado 49 Tabla 19.- Porcentajes de la muestra para categoría Intrínseca Como puede observarse en la Tabla 19, el 35% de la muestra corresponde a mujeres y el 65% corresponde a hombres. Este hecho es debido a que muchas de las encuestas se distribuyen en el entorno universitario de las escuelas de informática, donde, hay una mayor proporción de estudiantes del sexo masculino, como muestran los autores en (Hill et al., 2010)

126 4.- Propuesta del modelo de calidad de datos para portales Web Análisis de datos para categoría Contextual Para la categoría Contextual, de las 200 encuestas entregadas se respondieron 192, obteniendo un 96% de ratio de respuesta. De las 192 encuestas recibidas, se eliminaron 4 porque tenían preguntas sin contestar. De manera que se procesan 188 del total. Lo que se corresponde con el 94%. Es preciso tener en cuenta que sólo se seleccionan aquellas encuestas que han sido correctamente respondidas, y se descartan las que tienen respuestas incorrectas (por ejemplo, preguntas no contestadas o múltiples respuestas). Para conocer los porcentajes de las personas que responden la encuesta de la categoría Contextual, se analizan las respuestas correspondientes a los aspectos demográficos y aspectos de uso. a) Aspectos demográficos En la Tabla 20 se muestran los porcentajes de los aspectos demográficos con las respuestas correctas recibidas. Aspecto demográfico Variable Porcentaje (%) Total (%) Sexo Hombre 50.5 Mujer < de Entre 25 y Rango de edad Entre 35 y Entre 45 y Entre 55 y > a Graduado escolar / ESO 18 Nivel de estudios Formación profesional Universitario 54.3 Postgrado 11.7 Educación 40.4 Industrial 1.6 Tipo de organización Comercial 2.1 con la que está vinculad@ Sector Servicios 30.3 Financiera Otros 21.9 Tabla 20.- Porcentaje de la muestra para categoría Contextual 104

127 4.- Propuesta del modelo de calidad de datos para portales Web Analizando los resultados, se observa que, el porcentaje de usuarios en función del sexo es prácticamente el mismo. Cuando Internet empezó había bastante diferencia entre la cantidad de hombres y de mujeres que accedían online, pero esto se debía más a factores socio-económicos y a limitación de acceso a la tecnología que a motivos del sexo en sí mismo (Bimber, 2000; Kelan, 2007). Sin embargo, esta situación está cambiando y en condiciones de igualdad de medios para acceder a Internet, ambos sexos acceden al mismo indistintamente. Además, con la evolución de Internet, tanto hombres como mujeres tienen una dependencia incuestionable de Internet como medio para compartir ideas, construir redes de comunicación y buscar información (Komathi and Maimunah, 2009; Munusamy and Ismail, 2009). En cuanto a la edad, en nuestro caso el mayor porcentaje está en el rango de 25 a 35 años, y en general, todos los rangos de usuarios menores de 55 años son representativos. Sin embargo a partir de esa edad, tenemos menor representación. Por tanto, decidimos agrupar, los dos últimos rangos, en uno sólo, que identificaremos como grupo de usuarios mayores de 55 años, con un 6.4%. Esto es coherente con respecto al uso de Internet, ya que normalmente su uso disminuye al aumentar la edad aunque se ha incrementado el porcentaje de usuarios de mayor edad que se conectan online respecto al pasado (Jones and Fox, 2009). Respecto al nivel de estudios, hay más representación de usuarios con estudios universitarios, aunque los otros niveles son también representativos, teniendo los usuarios con estudios básicos y con formación profesional porcentajes similares. En cuanto al tipo de organización, los usuarios vinculados a la educación y al sector servicios son más representativos, mientras que las organizaciones industrial, comercial and financiera tienen menor porcentaje, por lo que a partir de ahora, estas últimas se agruparán como una única variable. En resumen, los grupos de usuarios para el rango de edad han sido reagrupados en: menor de 25, entre 25 y 35 años, entre 35 y 45 años y mayores de 55. Así mismo, los grupos para el tipo de organización son ahora: educación, sector servicios, industrial-comercial-financiera y otros. 105

128 4.- Propuesta del modelo de calidad de datos para portales Web Los resultados de la Tabla 20, con la nueva agrupación y expresados en forma de diagrama de barras se muestran en la Figura 17. Sexo (%) Rango de edad (%) 50,6 50,4 50, , ,2 27,7 20,2 25,5 49,8 49,6 49,4 49,2 49 Hombre 49,5 Mujer ,4 Menor de 25 Entre 25 y 35 Entre 35 y 45 Entre 45 y 55 Mayor de 55 Nivel de estudios (%) Tipo de organización (%) Graduado escolar / ESO Formación profesional 54,3 Universitario 11,7 Postgrado ,4 30,3 7,4 Educación Sector Servicios Industrial- Comercial- Financiera 21,9 Otros Figura 17.- Porcentaje de la muestra b) Aspectos de uso El detalle de los resultados relacionados con los aspectos de uso, se muestra en la Figura 18. Frecuencia de uso de portales Web Acceso al portal Web como primera opción ,6 Dispositivo móvil 2,2% ,8 2,1 0,5 Diariamente Dos veces por semana Una vez por semana Una vez al mes Ordenador portátil 47,3% Ordenador fijo 50,5% a) Frecuencia de uso b) Acceso al portal Web Figura 18.- Aspectos de uso Para la pregunta relacionada con el tipo de recurso utilizado para acceder a portales Web, las respuestas relacionada con ipad o similar, teléfono móvil y PDA se han 106

129 4.- Propuesta del modelo de calidad de datos para portales Web agrupado en un solo resultado que denominamos Dispositivo móvil, ya que cada una de esas respuestas de manera independiente eran poco representativas. En cuanto a la frecuencia de uso de portales Web, se obtiene un alto porcentaje de usuarios (92,6%) que los utilizan diariamente (ver Figura 18a). Por otro lado, hay un 50.5% que utilizan el ordenador fijo como primera opción para acceder a portales Web, seguido de un 47.3% de los usuarios que acceden mediante ordenador móvil. Finalmente, un 2.2% usa cualquier otro tipo de dispositivo móvil (ver Figura 18b). Esta tendencia está cambiando día a día donde cada vez más los usuarios, sobre todo los jóvenes, utilizan el teléfono móvil para estar conectado online. c) Cómo los aspectos demográficos afectan a los aspectos de uso? Una vez que se tienen estos datos, se decide ver cómo los aspectos demográficos influyen en los aspectos de uso. Con respecto a la frecuencia de uso de los portales Web, no hay diferencias significativas entre hombres y mujeres. Y el tipo de organización tampoco influye en este aspecto de uso, pues la mayoría de los encuestados acceden a los portales Web diariamente. En cuanto a los medios utilizados para acceder a los portales Web, los hombres usan los dispositivos móviles más que las mujeres, y las mujeres hacen mayor uso de los ordenadores portátiles. Esto coincide con los autores en (Lenhart et al., 2010), que consideran que las mujeres usan más las conexiones portátiles, mientras que los hombres acceden más a Internet vía teléfonos móviles. En función de la edad, los usuarios menores de 25 años y los usuarios entre 25 y 35 años son los que más frecuentemente utilizan los ordenadores portátiles, los teléfonos móviles y otros dispositivos electrónicos (como ipad s o PDA s) para acceder a los portales Web. Esto coincide con los autores en (Lenhart et al., 2010), que indican que los adultos jóvenes utilizan más los ordenadores portátiles que los ordenadores fijos y 107

130 4.- Propuesta del modelo de calidad de datos para portales Web que los adolescentes acceden a Internet más frecuentemente mediante teléfonos móviles. Analizando la frecuencia de uso de los portales Web en función del rango de edad, se observa que hay una diferencia significativa, ya que cuanto mayor es la edad de los usuarios menos frecuente es el uso de portales Web. d) Cómo el perfil de usuario afecta las preferencias de unas características de DQ respecto a otras? Una vez que se dispone de los aspectos demográficos de las personas que responden la encuesta, y que se tienen los grupos de estudio, en la siguiente sección se estudia más en detalle el análisis del resto de resultados obtenidos de la encuesta para responder a esta pregunta planteada Métodos estadísticos Una vez que se obtiene el conjunto final de datos de las encuestas, se realiza un análisis estadístico de los resultados (Norusis, 2002). Ésto permite determinar qué características son las que los usuarios consideran más relevantes para la calidad de datos de las categorías Intrínseca y Contextual en función de los perfiles de usuario. Este análisis se realiza mediante una herramienta de análisis estadístico, SPSS (Statistical Package for the Social Sciences) siguiendo los pasos que se detallan a continuación (ver Figura 19): 108

131 4.- Propuesta del modelo de calidad de datos para portales Web Figura 19.- Pasos del análisis de resultados Primero (Análisis de correlación): se lleva a cabo para verificar si hay relación entre: la propia definión de categoría Intrínseca y las características de DQ asociadas a esa categoría. la propia definión de categoría Contextual y las características de DQ asociadas a esa categoría. Segundo (Análisis estadístico descriptivo): se obtiene el mínimo, el máximo y el valor medio de cada característica de DQ. Esto permite determinar si todas ellas son realmente importantes para los usuarios de portales Web. Tercero (Análisis de la varianza): se determina si se da preferencia a unas característica de DQ respecto a otras en función de cada aspecto demográfico (por ejemplo: para hombres y mujeres). Cuarto (Análisis factorial): se utiliza el conjunto inicial de características de DQ para crear grupos homogéneos de características de DQ (denominados factores). Estos factores resumen y sintetizan la información reduciendo la cantidad inicial de variables (características de DQ). Los grupos se forman por aquellas características de DQ que tienen correlación considerable entre ellas. Además, cada grupo debe ser independiente de los demás. Quinto (Análisis de cluster): se hace uso de los resultados obtenidos del análisis factorial para construir grupos de factores (denominados clusters). Estos clusters determinan la importancia que se le da a cada factor. 109

132 4.- Propuesta del modelo de calidad de datos para portales Web Una vez realizados estos pasos, es preciso relacionar los cluster con los aspectos demográficos, mediante tablas de contingencia. Estas tablas permiten determinar perfiles de usuario y conjunto de características de DQ asociadas a esos perfiles. Para la realización de los pasos anteriormente detallados se hace uso de la herramienta SPSS. Debido a la complejidad de los análisis estadísticos, éstos serán presentados en la sección Informar los resultados Una vez que se han obtenido los resultados, éstos se muestran en diferentes artículos y a lo largo de esta tesis. Además, estos resultados sirven para la creación de guías que pueden ser consultadas en la herramienta libre PoDQA (Portal Data Quality Assessment) disponible en RESUMEN En esta sección se ha detallado la obtención del modelo de calidad de datos para portales Web, utilizando fuentes ya existentes. El conjunto final de características de DQ está compuesto por 27 características y 15 subcaracterísticas, divididas en puntos de vista (Inherente y Dependiente del Sistema) y categorías (Intrínseca, Contextual, Representacional, Operacional). Como puede observarse, por un lado, el punto de vista Inherente está directamente relacionado con la categoría Intrínseca y por otro lado, el punto de vista Dependiente del Sistema engloba las otras tres categorías. Además, se exponen los diferentes análisis (estático y dinámico) que se pueden utilizar para operacionalizar el modelo. En este caso, se profundiza en el análisis estático ya que es el objetivo de esta tesis y se muestran los pasos seguidos para la creación de encuestas que fueron necesarias para llevar a cabo este análisis estático. 110

133 5.- VALIDACIÓN DEL MODELO 5.- ANÁLISIS DE RESULTADOS

134

135 5.- Análisis de resultados INTRODUCCIÓN Una vez definido el modelo de calidad, donde se dispone de un conjunto de características de DQ, se considera que el siguiente paso es mostrar su utilidad y hacerlo aplicable, es decir, se pasa a la operacionalización del mismo. Para ello, se desarrolla una encuesta para la categoría Intrínseca y otra encuesta para la categoría Contextual, que incluye preguntas para los tres tipos de portales Web (como se mostró en la sección 4.4.1). Donde para la categoría Intrínseca, se recoge un total de 136 encuestas correctas, de las cuales el 65% fueron contestadas por hombres y el resto por mujeres, el rango más alto de edad era el comprendido entre 25 y 45 años, y predominaban los usuarios con estidos universitarios y conocimientos informáticos avanzados. Y obteniendo para la categoría Contextual, 188 encuentas válidas, contestadas en un 50.5% por hombres y el resto por mujeres. También está bastante equitativo el rango de edad de usuarios que contestan las encuestas y predomina el nivel de estudios universitarios y pertenecientes a la educación. En esta sección, para la operacionalización, es necesario, en primer lugar, determinar la fiabilidad de los resultados de la encuesta. Para ello, se calcula el alfa de Cronbach, obteniendo un valor de 0.856, para las respuestas de la categoría Intrínseca, y para las respuestas asociadas a cada tipo de portal Web de la categoría Contextual, los valores se muestran en la Tabla 21: Tipo de Portal Web Alfa de Cronbach Búsqueda y lectura de información Interacción comercial Interacción con otras personas Tabla 21.- Alfa de Cronbach para análisis de fiabilidad en la categoría Contextual (George and Mallery, 2003) proporcionan las siguientes recomendaciones para evaluar el alfa de Cronbach: _ > 0.9 excelente, _ > 0.8 bueno, _ > 0.7 aceptable, _ > 0.6 cuestionable, _ > 0.5 poble y _ < 0.5 inaceptable. Por tanto, puesto que estos valores son superiores a 0.8, se puede afirmar que hay buena consistencia interna y por tanto la información es fiable. 113

136 5.- Análisis de resultados A continuación, se muestra el análisis estadístico de los datos recogidos de la encuesta, siguiendo el método descrito gráficamente en la Figura 19 (ver sección ), y que se detalla a continuación: Paso 1. Análisis de correlación: se lleva a cabo para verificar si hay relación entre: la propia definión de categoría Intrínseca y las características de DQ asociadas a esa categoría. la propia definión de categoría Contextual y las características de DQ asociadas a esa categoría. Paso 2. Análisis estadístico descriptivo: se obtiene el mínimo, el máximo y el valor medio de los resultados obtenidos a partir de las encuestas, de cada característica de DQ. Esto permite verificar si, estadísticamente, existen diferencias significativas para las características de DQ de las categorías Intrínseca y Contextual del modelo SPDQM, y determinar si todas ellas son realmente importantes para los usuarios de portales Web. Paso 3. Análisis de la varianza: se determina si hay diferencias significativas para cada característica de DQ en función de cada aspecto demográfico (por ejemplo: para hombres y mujeres). Paso 4. Análisis factorial: se crean factores, es decir, grupos homogéneos de características de DQ que tienen correlación entre ellas. Estos factores resumen y sintetizan la información reduciendo la cantidad inicial de variables (características de DQ). Además, cada factor debe ser independiente de los demás. Paso 5. Análisis de cluster: se hace uso de los resultados obtenidos del análisis factorial para construir grupos de factores (denominados clusters). Estos clusters permiten determinar las características de DQ que son más importantes para cada uno de ellos. - Paso 5.1. Tabla de contingencia: se relacionan los cluster con los aspectos demográficos para determinar perfiles de usuario. De forma que, estas tablas permiten determinar qué características de DQ son más importantes para cada perfil de usuario. 114

137 5.- Análisis de resultados A partir de este punto, se detallan estos pasos distinguiendo entre los resultados obtenidos para las características de DQ de la categoría Intrínseca y la categoría Contextual. Así mismo, también se dividen los resultados de la categoría Contextual, en función del tipo de portal Web. En la categoría Intrínseca, los resultados son válidos para todos los portales Web, mientras que en la categoría Contextual, los resultados varían en función de tipo de portal Web. Esto es debido a que las características de DQ de esta categoría son función del contexto de uso específico. Este contexto viene definido por el tipo de actividad que se realiza en el portal Web, y cada tipo de actividad se ha agrupado en un tipo de portal Web (ver Figura 16, en la sección ) ANÁLISIS DE RESULTADOS PARA LA CATEGORÍA INTRÍNSECA Paso 1. Análisis de correlación En este paso se realiza un análisis de correlación de Spearman para comprobar si todas las características de DQ están bien clasificadas. Se utiliza este método porque es el más apropiado para datos ordinales o intervalos de datos que no satisfacen el supuesto de normalidad, como es nuestro caso. Este análisis nos permite analizar la correlación entre las características de DQ (consideradas variables dependientes) y la propia categoría Intrínseca (que es la variable independiente). 115

138 5.- Análisis de resultados Características Coeficiente de correlación Sig Conformidad Trazabilidad Reputación Objetividad Credibilidad Exactitud Coherencia Accesibilidad Confidencialidad Actualidad Expiración Entendibilidad Eficiencia Completitud Precisión Tabla 22.- Análisis de correlación de Spearman para categoría Intrínseca La correlación se comprueba en base al nivel de significación (Sig), donde el límite es de 0.05, de manera que los valores por debajo indican que existe correlación significativa. Como puede observarse en la Tabla 22, el nivel de significación es menor de 0.05 para todas las características de DQ, por tanto todas correlacionan significativamente con la categoría Intrínseca, observando que Reputación, Exactitud, Actualidad, Entendibilidad, Completitud y Precisión son las características de DQ que tienen mayor correlación con la categoría Intrínseca Paso 2. Análisis estadístico descriptivo A continuación se muestra el mínimo, el máximo y el valor medio de las características de DQ, observando que las valoraciones de las características de DQ podían variar entre 1 y 5 y en media todas están por encima del valor 4 (ver Tabla 23). 116

139 5.- Análisis de resultados Características Min Máx Media Conformidad Trazabilidad Reputación Objetividad Credibilidad Exactitud Coherencia Accesibilidad Confidencialidad Actualidad Expiración Entendibilidad Eficiencia Completitud Precisión Tabla 23.- Resultado del análisis estadístico descriptivo para categoría Intrínseca Los resultados muestran que los valores de las medias para todas las características de DQ están próximos a 4. Como dato adicional, se observa que Credibilidad (datos correctos), Accesibilidad (datos accesibles particularmente por personas discapacitadas) y Reputación (datos verdaderos) tienen los valores más altos de media y únicamente Trazabilidad (datos bien documentados) tiene su valor de media por debajo de 4, pues es de Debido a que las características de DQ tienen valores de media próximos a 4 podemos decir que todas ellas se consideran importantes para los usuarios de portales Web Paso 3. Análisis de la varianza En este paso se determina si hay diferencias significativas para cada característica de DQ en función de cada aspecto demográfico (por ejemplo: para hombres y mujeres). Para ello se realiza un análisis de la varianza (ANOVA). De los datos obtenidos y que se muestran a continuación, es preciso fijarse en la columna que indica el nivel de significación (Sig). Para este análisis, se seleccionan sólo las características de DQ cuyo valor Sig es menor que 0.1, ya que para el resto de valores se considera que no hay diferencias significativas. 117

140 5.- Análisis de resultados En las siguientes subsecciones se muestra el análisis de ANOVA para cada característica de DQ en función de cada aspecto demográfico ANOVA para el aspecto demográfico sexo Para el aspecto demográfico sexo, como se muestra en la Tabla 24, se tienen diferencias significativas para las características de DQ: Objetividad y Entendibilidad, ya que éstas son las que tienen un nivel de significación menor que 0.1. Estas características de DQ están más altamente valoradas por mujeres que por hombres, debido a que, éstas dan un mayor valor de media a dichas características de DQ. 118

141 5.- Análisis de resultados Característica de DQ Conformidad Trazabilidad Reputación Objetividad Credibilidad Exactitud Coherencia Accesibilidad Confidencialidad Actualidad Expiración Entendibilidad Eficiencia Completitud Precisión Variable Media Desviación Típica Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Valor F Sig Tabla 24.- ANOVA para el aspecto demográfico sexo para categoría Intrínseca ANOVA para el aspecto demográfico rango de edad En el caso del aspecto demográfico rango de edad, se observa en la Tabla 25, que sólo hay diferencias significativas para las características de DQ: Conformidad y Expiración, ya que su nivel de significación es menor que 0.1. Así mismo, observando como antes el valor de media, se puede comprobar que estas características de DQ están más altamente valoradas por los usuarios de portales Web mayores de 45 años. 119

142 5.- Análisis de resultados Característica de DQ Variable Media Desviación Típica Valor F Sig Conformidad Trazabilidad Reputación Objetividad Credibilidad Exactitud Coherencia Accesibilidad Confidencialidad Actualidad Expiración Entendibilidad Eficiencia Completitud Precisión < de 25 años Entre 25 y 45 años > de 45 años < de 25 años Entre 25 y 45 años > de 45 años < de 25 años Entre 25 y 45 años > de 45 años < de 25 años Entre 25 y 45 años > de 45 años < de 25 años Entre 25 y 45 años > de 45 años < de 25 años Entre 25 y 45 años > de 45 años < de 25 años Entre 25 y 45 años > de 45 años < de 25 años Entre 25 y 45 años > de 45 años < de 25 años Entre 25 y 45 años > de 45 años < de 25 años Entre 25 y 45años > de 45 años < de 25 años Entre 25 y 45 años > de 45 años < de 25 años Entre 25 y 45 años > de 45 años < de 25 años Entre 25 y 45 años > de 45 años < de 25 años Entre 25 y 45 años > de 45 años < de 25 años Entre 25 y 45 años > de 45 años Tabla 25.- ANOVA para el aspecto demográfico rango de edad para categoría Intrínseca 120

143 5.- Análisis de resultados ANOVA para el aspecto demográfico nivel de estudios A continuación se realiza el análisis de ANOVA para el aspecto demográfico nivel de estudios, donde se comprueba que hay más características de DQ con diferencias significativas: Trazabilidad, Exactitud, Coherencia, Accesibilidad y Expiración, donde Trazabilidad y Accesibilidad son más valoradas por usuarios con Formación profesional y el resto de características de DQ para los usuarios con estudios universitarios (ver Tabla 26). 121

144 5.- Análisis de resultados Característica de DQ Variable Media DesviaciónTípica Valor F Sig Conformidad Trazabilidad Reputación Objetividad Credibilidad Exactitud Coherencia Accesibilidad Confidencialidad Actualidad Expiración Entendibilidad Eficiencia Completitud Precisión Graduado escolar / ESO Formación profesional Universitario Graduado escolar / ESO Formación profesional Universitario Graduado escolar / ESO Formación profesional Universitario Graduado escolar / ESO Formación profesional Universitario Graduado escolar / ESO Formación profesional Universitario Graduado escolar / ESO Formación profesional Universitario Graduado escolar / ESO Formación profesional Universitario Graduado escolar / ESO Formación profesional Universitario Graduado escolar / ESO Formación profesional Universitario Graduado escolar / ESO Formación profesional Universitario Graduado escolar / ESO Formación profesional Universitario Graduado escolar / ESO Formación profesional Universitario Graduado escolar / ESO Formación profesional Universitario Graduado escolar / ESO Formación profesional Universitario Graduado escolar / ESO Formación profesional Universitario Tabla 26.- ANOVA para el aspecto demográfico nivel de estudios para categoría Intrínseca 122

145 5.- Análisis de resultados ANOVA para el aspecto demográfico conocimientos informáticos Para el último aspecto demográfico analizado que se corresponde con conocimientos informáticos se distingue que Objetividad y Credibilidad se valoran más por usuarios con conocimientos informáticos a nivel básico y Confidencialidad si los usuarios tienen conocimientos informáticos avanzados (ver Tabla 27). 123

146 5.- Análisis de resultados Característica de DQ Variable Media DesviaciónTípica Sig Conformidad Trazabilidad Reputación Objetividad Credibilidad Exactitud Coherencia Accesibilidad Confidencialidad Actualidad Expiración Entendibilidad Eficiencia Completitud Precisión Básico Intermedio Avanzado Básico Intermedio Avanzado Básico Intermedio Avanzado Básico Intermedio Avanzado Básico Intermedio Avanzado Básico Intermedio Avanzado Básico Intermedio Avanzado Básico Intermedio Avanzado Básico Intermedio Avanzado Básico Intermedio Avanzado Básico Intermedio Avanzado Básico Intermedio Avanzado Básico Intermedio Avanzado Básico Intermedio Avanzado Básico Intermedio Avanzado Tabla 27.- ANOVA para el aspecto demográfico conocimientos informáticos para categoría Intrínseca 124

147 5.- Análisis de resultados A modo de resumen, en la Tabla 28 se muestran los resultados obtenidos. Aspecto demográfico Variable Característica de DQ Sexo Mujer Objetividad, Entendibilidad Rango de edad > de 45 Conformidad, Expiración Formación profesional Trazabilidad, Accesibilidad Nivel de estudios Exactitud, Coherencia, Universitario Expiración Conocimiento Básico Objetividad, Credibilidad informático Avanzado Confidencialidad Tabla 28.- Resumen de análisis de varianza para categoría Intrínseca Paso 4. Análisis factorial Los análisis realizados en este paso, junto con los que obtienen en el paso 5, se utilizan para determinar si unas características de DQ son más importantes que otras en función de diferentes perfiles de usuario. Consecuentemente, lo primero fue determinar si era adecuado realizar un análisis factorial. Para esto, se calculó la medida de adecuación muestral KMO (Kaiser-Meyer- Olkin). Esta medida contrasta si las correlaciones parciales entre las variables son suficientemente pequeñas y permite comparar la magnitud de los coeficientes de correlación observados con la magnitud de los coeficientes de correlación parcial. El estadístico KMO varía entre 0 y 1. Si KMO 0.75 la idea de realizar un análisis factorial es buena, si 0.75 > KMO 0.5 la idea es aceptable y si KMO < 0.5 es inaceptable. En nuestro caso, KMO tiene un valor de 0.804, por tanto, se decide realizar el análisis factorial. El análisis factorial se realiza para determinar si existe una estructura de factores que permita explicar de forma resumida la relación entre las variables (características de DQ) consideradas. Este análisis factorial es una técnica de reducción que nos permite determinar el mínimo número de características de DQ que puede explicar el máximo de información. 125

148 5.- Análisis de resultados Mediante el análisis factorial se crean grupos homogéneos de características de DQ. Estos grupos (denominados factores) se forman por aquellas características de DQ que tienen un nivel considerable de correlación entre ellas, siendo cada grupo independiente de los demás. En nuestro caso, se restringe el número de grupos a 3 (ver Tabla 29), ya que es un número suficiente para diferenciar las características de DQ. Estos grupos representan el 52.9% de la varianza total, lo cual se interpreta como un porcentaje aceptable. Factor 1 Factor 2 Factor 3 Conformidad Trazabilidad Reputación Objetividad Credibilidad Exactitud Coherencia Accesibilidad Confidencialidad Actualidad Expiración Entendibilidad Eficiencia Completitud Precisión Tabla 29.- Análisis factorial para categoría Intrínseca El factor 1 representa el 35.1% de la varianza total y en él se da más importancia a que los datos sean claros, no ambiguos y fáciles de comprender e interpretar (Entendibilidad), estén actualizados y no obsoletos (Actualidad), sean exactos (Precisión), estén definidos según regulaciones y estándares (Conformidad), se obtengan utilizando una apropiada cantidad de recursos (Eficiencia), satisfaciendo las necesidades de los usuarios (Completitud) y sólo accesibles por usuarios autorizados (Confidencialidad). El factor 2 representa el 10.4% de la varianza total y considera más relevante que los datos sean correctos (Credibilidad), verdaderos (Reputación), imparciales (Objetividad), libres de errores (Exactitud) y coherentes (Coherencia). 126

149 5.- Análisis de resultados El factor 3 representa el 7.4% de la varianza total y con las características de DQ que indican que los datos estén bien documentados (Trazabilidad), accesibles particularmente por personas discapacitadas (Accesibilidad) y se conozca el tiempo hasta el cual los datos están actualizados (Expiración). Además, se realiza el alfa de Cronbach de cada factor para determinar los resultados son fiables. Obteniendo, para el factor 1, el valor de 0.763, para el factor 2, un valor de y para el factor 3, un valor de Esto significa que los valores son aceptables y por tanto, los resultados fiables Paso 5. Análisis de cluster Como resultado del paso anterior, las características de DQ están organizadas en factores (ver Tabla 29). A continuación, se realiza el análisis de cluster de forma que en cada cluster tenemos uno o varios factores en función de la importancia que en cada cluster se le da a cada factor. En la Tabla 30, se muestran los factores de cada cluster. Cluster 1 2 Factor 1 Factor 2 Factor 3 Tabla 30.- Análisis de cluster para categoría Intrínseca Ahora es preciso determinar qué usuarios pertenecen a cada cluster, para ello se utilizan las tablas de contingencia Paso 5.1. Tabla de contingencia Una vez que en cada cluster se saben las características de DQ a las que se da más importancia, se pasa a realizar las tablas de contingencia. De esta forma se relaciona los clusters con los aspectos demográficos para obtener los perfiles de usuario (ver Tabla 31). 127

150 Aspecto demográfico Sexo Edad Nivel de estudios Conocimiento informático 5.- Análisis de resultados Variable Cluster (%) 1 2 Mujer 28% 40% Hombre 72% 60% < de 25 años 11% 18% Entre 25 y 45 años 67% 46% > de 45 años 22% 36% Graduado escolar / ESO 6% 8% Formación profesional 20% 20% Universitario 74% 72% Básico 13% 18% Intermedio 30% 39% Avanzado 57% 43% Tabla 31.- Tabla de contingencia para categoría Intrínseca Para determinar la relación entre los aspectos demográficos y cada cluster, se definió el siguiente procedimiento: (i) Se determina el valor más alto de cada aspecto demográfico para cada cluster. Para el cluster 1 y aspecto demográfico: sexo : el valor más alto es 72 que se corresponde con la variable hombre edad : el valor más alto es 67 que pertenece a la variable entre 25 y 45 años nivel de estudios : el valor más alto es 74 que pertenece a la variable universitario conocimientos informáticos : el valor más elevado es 57 de la variable avanzado Para el cluster 2 y aspecto demográfico: sexo : el valor más alto es 60 que se corresponde con la variable hombre edad : el valor más alto es 46 que pertenece a la variable entre 25 y 45 años nivel de estudios : el valor más alto es 72 que pertenece a la variable universitario conocimientos informáticos : el valor más elevado es 43 de la variable avanzado 128

151 5.- Análisis de resultados (ii) Los valores obtenidos en el paso anterior se comparan y si en ambos clusteres coincide la variable que tiene el valor más alto, se selecciona el valor más alto y su cluster correspondiente (los valores se muestran en negrita). Para la variable: hombre : se selecciona 72 del cluster 1 entre 25 y 45 años : se selecciona 67 del cluster 1 universitario : se selecciona 74 del cluster 1 avanzado : se selecciona 57 del cluster 1 (iii) Si para algún aspecto demográfico, el valor más elevado perteneciera a una variable distinta en cada cluster, se seleccionarían esas variables con su correspondiente cluster. Pero este no es el caso en la Tabla 31. (iv) Para aquellas variables que no han sido ya seleccionadas, se escoge el valor más alto de su fila (los valores están en cursiva). Por ejemplo: para la variable básico cuyos valores son 13, y 18 en los clusters 1 y 2 respectivamente, se escoge el valor 18 que está en el cluster 2. (v) Para aquellas variables cuyos valores más altos son iguales en varios clusters se seleccionan en esos clusters (los valores están en cursiva y subrayados). Por ejemplo: para la variable formación profesional el valor es 20 para ambos clusters, por tanto se selecciona en los dos. Por tanto, siguiendo estos pasos anteriores se obtienen los valores sombreados en la Tabla 31. Estos valores nos permitieron establecer los diferentes perfiles de usuario que han sido creados para cada cluster en función de los aspectos demográficos. Estos perfiles se muestran en la Tabla

152 Perfil/ Cluster Facto r , 2 Característica s de DQ Trazabilidad, Accesibilidad, Expiración Conformidad, Confidencialid ad, Actualidad, Entendibilidad, Eficiencia, Completitud, Precisión, Reputación, Objetividad, Credibilidad, Exactitud, Coherencia 5.- Análisis de resultados Aspectos demográficos Sexo Rango de Nivel de edad estudios Formación Hombre Entre 25 y 45 profesional Universitario Mujer Menor de 25 Mayor de 45 Graduado escolar/eso Formación profesional Tabla 32.- Resumen de tabla de contingencia para categoría Intrínseca Conocimientos informáticos Avanzado Básico Intermedio Los perfiles son: Perfil 1 (perteneciente al cluster 1): contiene usuarios principalmente hombres, entre 25 y 45 años con formación profesional o estudios universitarios y con conocimientos informáticos altos, dando más prioridad a las características de DQ del factor 3. Perfil 2 (perteneciente al cluster 2): formado principalmente por mujeres, menores de 25 años o mayores de 45 años, con nivel de estudios básicos (graduado escolar/eso) o formación profesional y con bajos o intermedios conocimientos informáticos, dando más importancia a las características de DQ de los factores 1 y 2. En la sección 6 se darán más detalles de todo esto, indicando las guías que se entregarán a los diseñadores y desarrolladores de portales Web para que tengan en cuenta estos resultados ANÁLISIS DE RESULTADO PARA LA CATEGORÍA CONTEXTUAL A continuación se realiza el análisis de los resultados para cada tipo de portal Web de las características de DQ de la categoría Contextual. 130

153 5.- Análisis de resultados Paso 1. Análisis de correlación En este paso se realiza un análisis de correlación de Spearman para comprobar si todas las características de DQ están bien clasificadas. Al igual que para la categoría Intrínseca, se utiliza este método porque es el más apropiado para datos ordinales o intervalos de datos que no satisfacen el supuesto de normalidad, como es nuestro caso. Este análisis permite analizar la correlación entre las características de DQ (consideradas variables dependientes) y la propia categoría Contextual (que es la variable independiente). Tipo de portal Búsqueda y lectura de Interacción con Web Interacción comercial información otras personas Características Coeficiente Coeficiente Coeficiente de de DQ de Sig Sig de correlación correlación correlación Sig Alcance Confiabilidad Validez Trazabilidad Conformidad Especialización Flexibilidad Aplicabilidad Novedad Valor añadido Oportunidad Relevancia Utilidad Eficiencia Precisión Eficacia Tabla 33.- Análisis de correlación para categoría Contextual 131

154 5.- Análisis de resultados La correlación se comprueba en base al nivel de significación (Sig), donde el límite es de 0.05, de manera que los valores por debajo indican que existe correlación significativa. Como puede observarse en la Tabla 33, el nivel de significación es para todas las características de DQ, por tanto todas correlacionan significativamente con la categoría Contextual en todos los tipos de portales Web Paso 2. Análisis estadístico descriptivo Este análisis permite verificar que todas las características de DQ de la categoría Contextual son importantes desde la perspectiva de los usuarios de portales Web. Mediante un análisis descriptivo de los datos, se muestran los valores mínimo, máximo y valor medio para todas las características de DQ y valor de media para todas las características de DQ, pudiendo observar que las valoraciones de las características de DQ podían variar entre 0 y 10 y en media todas están por encima del valor 5 (ver Tabla 34). 132

155 5.- Análisis de resultados Tipo de portal Web Búsqueda y lectura de información Interacción comercial Interacción con otras personas Características de DQ Min Máx Media Min Máx Media Min Máx Media Alcance Confiabilidad Validez Trazabilidad Conformidad Especialización Flexibilidad Aplicabilidad Novedad Valor añadido Oportunidad Relevancia Utilidad Eficiencia Precisión Eficacia Tabla 34.- Análisis estadístico descriptivo para categoría Contextual Análisis estadístico descriptivo. Tipo de portal: Búsqueda y lectura de información Como puede verse en la Tabla 34, se obtienen 10 características de DQ con valor de media sobre 8, mientras que otras tienen el valor de media entre 7.57 y 8, estando todas por encima de 7.5. El valor más elevado es para Eficacia (los datos son realmente los que el usuario está buscando) y el menor es para Flexibilidad (capacidad de adaptar los datos a las diferentes necesidades de los usuarios, por ejemplo, integrarse en distintas plataformas o modificar su formato). 133

156 5.- Análisis de resultados Por tanto, se observa que los valores de media dados por los usuarios son bastante altos (más cerca del valor máximo que es 10 que del valor intermedio que es 5). Esto significa que todas las características de DQ para la categoría Contextual y portales Web de Búsqueda y lectura de información son importantes) Análisis estadístico descriptivo. Tipo de portal: Interacción comercial Las características de DQ que obtienen mayor valor de media son Confiabilidad, Oportunidad y Eficacia (ver Tabla 34). Esto implica que tener datos fiables (Confiabilidad), en el menor tiempo posible (Oportunidad) y siendo estos datos los que realmente el usuario requiere (Eficacia) son los aspectos más altamente valorados por los encuestados. Sin embargo, le dan poca importancia a que los datos sean novedosos (Novedad). Por otro lado, todas las características de DQ son valoradas por encima del valor de media de 7.2, por lo que podemos concluir que todas son importantes para analizar la calidad de los datos de la categoría Contextual para los portales Web de Interacción Comercial Análisis estadístico descriptivo. Tipo de portal: Interacción con otras personas Según se observa en la Tabla 34 el valor de media de todas las características de DQ se encuentra entre 6.57 y Esto nos permite deducir que todas tienen aproximadamente la misma importancia para los usuarios de portales Web del tipo Interacción con otras personas. Dentro de este margen el valor más reducido es 6.57 para Novedad (datos novedosos) y el más elevado de 7.37 es para Eficacia (los datos son realmente los que el usuario está buscando). Por tanto, todo esto indica que los usuarios están menos preocupados por tener datos novedosos y más por que los datos sean los que realmente buscan. 134

157 5.- Análisis de resultados Paso 3. Análisis de la varianza En este paso se muestra el análisis de la varianza (ANOVA), que permite determinar si hay diferencia significativa para cada característica de DQ en función de cada aspecto demográfico (por ejemplo: para hombres y mujeres). Como en el caso de la categoría Intrínseca, se seleccionan sólo las características de DQ cuyo valor en el nivel de significación es menor de 0.1, ya que para el resto de valores se considera que no hay diferencias significativas. En las siguientes subsecciones se muestran sólo las características de DQ que han sido relevantes tras realizar el análisis de ANOVA, en función del tipo de portal Web y cada aspecto demográfico, esto se ha realizado para evitar largas tablas con información no relevante para nuestro estudio ANOVA para el aspecto demográfico sexo La Tabla 35 y Tabla 36 muestran las características de DQ (segunda columna) con nivel de significación (Sig) menor que 0.1 para las variables (cuarta columna) del aspecto demográfico sexo y las medias obtenidas (quinta columna). ANOVA para el aspecto demográfico sexo. Tipo de portal: Búsqueda y lectura de información Tipo de portal Web Característica de DQ Especialización Búsqueda y lectura de información Valor añadido Aspecto demográfico Sexo Sexo Variable Media Desviación Típica Hombre Mujer Hombre Mujer Mujer Tabla 35.- ANOVA para el aspecto demográfico sexo para categoría Contextual y Búsqueda y lectura de información Como se puede ver en la Tabla 35, las características de DQ Especialización y Valor añadido tienen mayor valor de media para las mujeres que para los hombres. Sig

158 5.- Análisis de resultados ANOVA para el aspecto demográfico sexo. Tipo de portal: Interacción comercial Para el tipo de portal Web Interacción comercial no hay características de DQ, debido a que, ninguna característica de DQ tenía un nivel de significación menor que 0.1 para el aspecto demográfico sexo. ANOVA para el aspecto demográfico sexo. Tipo de portal: Interacción con otras personas Tipo de portal Web Interacción con otras personas Característica de DQ Alcance Confiabilidad Validez Trazabilidad Conformidad Especialización Flexibilidad Novedad Valor añadido Oportunidad Relevancia Utilidad Eficiencia Precisión Eficacia Aspecto demográfico Sexo Sexo Sexo Sexo Sexo Sexo Sexo Sexo Sexo Sexo Sexo Sexo Sexo Sexo Sexo Variable Media Desviación Típica Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Hombre Mujer Tabla 36.- ANOVA para el aspecto demográfico sexo para categoría Contextual e Interacción con otras personas Sig De los datos obtenidos en la Tabla 36 se deduce que todas las características de DQ con excepción de Aplicabilidad son consideradas más importantes por mujeres que por hombres. 136

159 5.- Análisis de resultados ANOVA para el aspecto demográfico rango de edad Siguiendo las mismas pautas que para el aspecto demográfico sexo, se muestra a continuación el ANOVA para el aspecto demográfico rango de edad con las características de DQ relevantes para cada tipo de portal Web. ANOVA para el aspecto demográfico rango de edad. Tipo de portal: Búsqueda y lectura de información Tipo de portal Web Búsqueda y lectura de información Característica de DQ Validez Utilidad Eficiencia Precisión Eficacia Aspecto demográfico Rango de edad Rango de edad Rango de edad Rango de edad Rango de edad Variable Media Desviación Típica Menor de 25 años Entre 25 y 35 años Entre 35 y 45 años Entre 45 y 55 años Mayor de 55 años Menor de 25 años Entre 25 y 35 años Entre 35 y 45 años Entre 45 y 55 años Mayor de 55 años Menor de 25 años Entre 25 y 35 años Entre 35 y 45 años Entre 45 y 55 años Mayor de 55 años Menor de 25 años Entre 25 y 35 años Entre 35 y 45 años Entre 45 y 55 años Mayor de 55 años Menor de 25 años Entre 25 y 35 años Entre 35 y 45 años Entre 45 y 55 años Mayor de 55 años Tabla 37.- ANOVA para aspecto demográfico rango de edad para categoría Contextual y Búsqueda y lectura de información Sig Con respecto al rango de edad, se observa en la Tabla 37 que, los usuarios entre 25 y 35 años dan más importancia a Utilidad y Precisión que el resto de usuarios, mientras que aquellos entre 35 y 45 años consideran Eficiencia y Eficacia como más importantes y aquellos entre 45 y 55 años valoran más Validez. 137

160 5.- Análisis de resultados Para los usuarios menores de 25 años y los mayores de 55 años no hay ninguna característica de DQ con diferencia significativa que tenga mayor valor de media respecto del resto de rangos. ANOVA para el aspecto demográfico rango de edad. Tipo de portal: Interacción comercial Tipo de portal Web Interacción comercial Característica de DQ Alcance Confiabilidad Validez Trazabilidad Conformidad Especialización Aplicabilidad Oportunidad Aspecto demográfico Rango de edad Rango de edad Rango de edad Rango de edad Rango de edad Rango de edad Rango de edad Rango de edad Variable Media Desviación Típica Menor de 25 años Entre 25 y 35 años Entre 35 y 45 años Entre 45 y 55 años Mayor de 55 años Menor de 25 años Entre 25 y 35 años Entre 35 y 45 años Entre 45 y 55 años Mayor de 55 años Menor de 25 años Entre 25 y 35 años Entre 35 y 45 años Entre 45 y 55 años Mayor de 55 años Menor de 25 años Entre 25 y 35 años Entre 35 y 45 años Entre 45 y 55 años Mayor de 55 años Menor de 25 años Entre 25 y 35 años Entre 35 y 45 años Entre 45 y 55 años Mayor de 55 años Menor de 25 años Entre 25 y 35 años Entre 35 y 45 años Entre 45 y 55 años Mayor de 55 años Menor de 25 años Entre 25 y 35 años Entre 35 y 45 años Entre 45 y 55 años Mayor de 55 años Menor de 25 años Entre 25 y 35 años Entre 35 y 45 años Entre 45 y 55 años Mayor de 55 años Sig

161 Tipo de portal Web Característica de DQ Relevancia Utilidad Eficiencia Precisión Eficacia 5.- Análisis de resultados Aspecto demográfico Rango de edad Rango de edad Rango de edad Rango de edad Rango de edad Variable Media Desviación Típica Menor de 25 años Entre 25 y 35 años Entre 35 y 45 años Entre 45 y 55 años Mayor de 55 años Menor de 25 años Entre 25 y 35 años Entre 35 y 45 años Entre 45 y 55 años Mayor de 55 años Menor de 25 años Entre 25 y 35 años Entre 35 y 45 años Entre 45 y 55 años Mayor de 55 años Menor de 25 años Entre 25 y 35 años Entre 35 y 45 años Entre 45 y 55 años Mayor de 55 años Menor de 25 años Entre 25 y 35 años Entre 35 y 45 años Entre 45 y 55 años Mayor de 55 años Tabla 38.- ANOVA para aspecto demográfico rango de edad para categoría Contextual e Interacción comercial Sig En la Tabla 38 se observa que con respecto al rango de edad, los usuarios entre 25 y 35 años le dan más importancia a las características de DQ Alcance, Utilidad, mientras que los usuarios entre 35 y 45 años consideran más importantes las características de DQ Confiabilidad, Validez, Trazabilidad, Conformidad, Especialización, Oportunidad, Relevancia, Eficiencia, Precisión, Eficacia. Teniendo la característica de DQ Aplicabilidad el mismo valor de media para estos dos rangos de edad. 139

162 5.- Análisis de resultados ANOVA para el aspecto demográfico rango de edad. Tipo de portal: Interacción con otras personas Para el tipo de portal Web Interacción con otras personas no hay características de DQ, debido a que, ninguna característica de DQ tenía un nivel de significación menor que 0.1 para el aspecto demográfico rango de edad ANOVA para el aspecto demográfico nivel de estudios Para este aspecto demográfico los resultados para cada tipo de portal Web se muestran a continuación. ANOVA para el aspecto demográfico nivel de estudios. Tipo de portal: Búsqueda y lectura de información Tipo de portal Web Búsqueda y lectura de información Característica de DQ Oportunidad Eficiencia Precisión Eficacia Aspecto demográfico Nivel de estudios Nivel de estudios Nivel de estudios Nivel de estudios Variable Media Desviación Típica Graduado escolar / ESO Formación profesional Universitario Postgrado Graduado escolar / ESO Formación profesional Universitario Postgrado Graduado escolar / ESO Formación profesional Universitario Postgrado Graduado escolar / ESO Formación profesional Universitario Postgrado Tabla 39.- ANOVA para aspecto demográfico nivel de estudios para categoría Contextual y Búsqueda y lectura de información Sig Para el nivel de estudios, se muestra en la Tabla 39 que Oportunidad tiene un valor significativamente más elevado de valor de la media para usuarios con formación profesional, mientras que Eficiencia, Precisión y Eficacia tienen valor de media más elevado para usuarios con postgrado. 140

163 5.- Análisis de resultados ANOVA para el aspecto demográfico nivel de estudios. Tipo de portal: Interacción comercial Tipo de portal Web Interacción comercial Característica de DQ Alcance Confiabilidad Validez Trazabilidad Conformidad Especialización Aplicabilidad Utilidad Eficiencia Aspecto demográfico Nivel de estudios Nivel de estudios Nivel de estudios Nivel de estudios Nivel de estudios Nivel de estudios Nivel de estudios Nivel de estudios Nivel de estudios Variable Graduado escolar / ESO Formación profesional Universitario Postgrado Graduado escolar / ESO Formación profesional Universitario Postgrado Graduado escolar / ESO Formación profesional Universitario Postgrado Graduado escolar / ESO Formación profesional Universitario Postgrado Graduado escolar / ESO Formación profesional Universitario Postgrado Graduado escolar / ESO Formación profesional Universitario Postgrado Graduado escolar / ESO Formación profesional Universitario Postgrado Graduado escolar / ESO Formación profesional Universitario Postgrado Graduado escolar / ESO Formación profesional Universitario Postgrado Media Desviación Típica Sig

164 Tipo de portal Web Característica de DQ Precisión Eficacia Aspecto demográfico Nivel de estudios Nivel de estudios 5.- Análisis de resultados Variable Graduado escolar / ESO Formación profesional Universitario Postgrado Graduado escolar / ESO Formación profesional Universitario Postgrado Media Desviación Típica Tabla 40.- ANOVA para aspecto demográfico nivel de estudios para categoría Contextual e Interacción comercial Sig En la Tabla 40 se muestra que las características de DQ Validez y Especialización son más relevantes para los usuarios con formación profesional mientras que Alcance, Confiabilidad, Trazabilidad, Conformidad, Aplicabilidad, Utilidad, Eficiencia, Precisión y Eficacia son importantes para los usuarios con estudios de postgrado. ANOVA para el aspecto demográfico nivel de estudios. Tipo de portal: Interacción con otras personas Tipo de portal Web Interacción con otras personas Característica de DQ Alcance Aspecto demográfico Nivel de estudios Variable Media Desviación Típica Graduado escolar / ESO Formación profesional Universitario Sig Postgrado Graduado escolar / ESO Confiabilidad Nivel de estudios Formación profesional Universitario Postgrado Graduado escolar / ESO Validez Nivel de estudios Formación profesional Universitario Postgrado Graduado escolar / ESO Conformidad Nivel de estudios Formación profesional Universitario Postgrado

165 5.- Análisis de resultados Tipo de portal Web Característica de DQ Aspecto demográfico Variable Media Desviación Típica Sig Graduado escolar / ESO Flexibilidad Nivel de estudios Formación profesional Universitario Postgrado Graduado escolar / ESO Aplicabilidad Nivel de estudios Formación profesional Universitario Postgrado Graduado escolar / ESO Novedad Nivel de estudios Formación profesional Universitario Postgrado Graduado escolar / ESO Valor añadido Nivel de estudios Formación profesional Universitario Postgrado Graduado escolar / ESO Oportunidad Nivel de estudios Formación profesional Universitario Postgrado Graduado escolar / ESO Relevancia Nivel de estudios Formación profesional Universitario Postgrado Graduado escolar / ESO Utilidad Nivel de estudios Formación profesional Universitario Postgrado Graduado escolar / ESO Eficiencia Nivel de estudios Formación profesional Universitario Postgrado Graduado escolar / ESO Precisión Nivel de estudios Formación profesional Universitario Postgrado Tabla 41.- ANOVA para aspecto demográfico nivel de estudios para categoría Contextual e Interacción con otras personas 143

166 5.- Análisis de resultados Como se muestra en la Tabla 41, en el caso del aspecto demográfico nivel de estudios, la variable Formación profesional es la que tiene más características de DQ que considera más importantes (por tener mayor valor de media) respecto al resto. Sin embargo la variable Universitario carece de características de DQ que considere más relevantes ANOVA para el aspecto demográfico tipo de organización Con respecto a este aspecto demográfico los resultados para cada tipo de portal Web se detallan a continuación. ANOVA para el aspecto demográfico tipo de organización. Tipo de portal: Búsqueda y lectura de información Tipo de portal Web Búsqueda y lectura de información Característica de DQ Alcance Validez Aspecto demográfico Tipo de organización Tipo de organización Variable Media Desviación Típica Educación Industrial- Comercial Financiera Sector servicios Otro Educación Industrial- Comercial- Financiera Sector servicios Otro Tabla 42.- ANOVA para aspecto demográfico tipo de organización para categoría Contextual Sig Finalmente, en la Tabla 42, se observa que Alcance y Validez son más valoradas en valor de media por aquellos usuarios que no están vinculados a las organizaciones Educación, Industrial, Comercial, Financiera ni Sector Servicios. 144

167 5.- Análisis de resultados ANOVA para el aspecto demográfico tipo de organización. Tipo de portal: Interacción comercial Para el tipo de portal Web Interacción comercial no hay características de DQ, debido a que, ninguna característica de DQ tenía un nivel de significación menor que 0.1 para el aspecto demográfico tipo de organización. ANOVA para el aspecto demográfico tipo de organización. Tipo de portal: Interacción con otras personas Para los portales Web del tipo Interacción con otras personas no hay ninguna característica de DQ en los aspectos demográficos tipo de organización porque para todas ellas en nivel de significación es superior a

168 5.- Análisis de resultados Resumen de ANOVA Por tanto, los resultados obtenidos se resumen en la Tabla 43. Tipo de portal Web Búsqueda y lectura de información Interacción comercial Interacción con otras personas Aspecto demográfico Variable Característica de DQ Sexo Mujeres Especialización, Valor añadido Entre 25 y 35 años Utilidad, Precisión Rango de edad Entre 35 y 45 años Eficiencia, Eficacia Entre 45 y 55 años Validez Nivel de estudios Formación profesional Oportunidad Postgrado Eficiencia, Precisión, Eficacia Tipo de organización Otros Alcance, Validez Entre 25 y 35 años Aplicabilidad, Alcance, Utilidad Aplicabilidad, Confiabilidad, Rango de edad Validez, Trazabilidad, Entre 35 y 45 años Conformidad, Especialización, Oportunidad, Relevancia, Eficiencia, Precisión, Eficacia Formación profesional Validez, Especialización Alcance, Confiabilidad, Nivel de estudios Trazabilidad, Conformidad, Postgrado Aplicabilidad, Utilidad, Eficiencia, Precisión, Eficacia Alcance, Confiabilidad, Validez, Trazabilidad, Conformidad, Especialización, Flexibilidad, Sexo Mujer Novedad, Valor añadido, Oportunidad, Relevancia, Utilidad, Eficiencia, Precisión, Eficacia Graduado escolar / ESO Novedad Alcance, Confiabilidad, Validez, Conformidad, Flexibilidad, Valor Nivel de estudios Formación profesional añadido, Oportunidad, Relevancia, Utilidad, Eficiencia, Precisión Postgrado Aplicabilidad Tabla 43.- Resumen de análisis de varianza para categoría Contextual Con este análisis se han obtenido las características de DQ de la categoría Contextual que se consideran más importantes para cada tipo de portal Web si sólo se tuviera en cuenta cada aspecto demográfico de forma independiente, pero lo que nos interesa es determinar perfiles de usuario que tengan en cuenta, simultáneamente, los cuatro aspectos demográficos que se estan considerando. Por ello, se realizan a continuación los pasos 4 y

169 Paso 4. Análisis factorial 5.- Análisis de resultados Los análisis realizados en este paso, junto con los que se realizan en el paso 5, se utilizan para determinar si unas características de DQ son más importantes que otras en función de diferentes perfiles de usuario. Consecuentemente, lo primero es determinar si era adecuado realizar un análisis factorial. Para esto, se calculó la medida de adecuación muestral KMO (Kaiser-Meyer- Olkin) para cada tipo de portal Web (ver Tabla 44). Tipo de Portal Web KMO Búsqueda y lectura de información 0.94 Interacción comercial Interacción con otras personas Tabla 44.- Medida de adecuación muestral KMO Así, y puesto que estos valores son aceptables, por estar por encima de 0.5 se decidió llevar a cabo este tipo de análisis. Para los tres tipos de portales Web, se definieron tres factores (ver Tabla 45). Cada factor contiene grupos homogéneos de características de DQ que tienen correlación entre ellas. Estos factores han sido determinados con un mínimo de correlación de 0.5 entre las características de cada grupo. Además, cada grupo es independiente de los demás. 147

170 5.- Análisis de resultados Tipo de portal Web Búsqueda y lectura de información Interacción comercial Interacción con otras personas Características de DQ Factor Factor Factor Alcance X X X Confiabilidad X X X Validez X X X Trazabilidad X X X Conformidad X X X Especialización X X X Flexibilidad X X X Aplicabilidad X X X Novedad X X X Valor añadido X X X Oportunidad X X X Relevancia X X X Utilidad X X X Eficiencia X X X Precisión X X X Eficacia X X X Tabla 45.- Análisis factorial por cada tipo de portal Web Análisis factorial. Tipo de portal: Búsqueda y lectura de información En este caso, se han definido tres factores, que combinados explican el 66.78% de la varianza total, lo cual puede interpretarse como un porcentaje aceptable. El factor 1 representa el 53.48% de la varianza total y considera importante las características de DQ que indican que los datos sean fiables (Confiabilidad), 148

171 5.- Análisis de resultados entendibles para las personas que los van a utilizar (Validez), estén definidos según regulaciones y estándares (Conformidad), estén detallados para facilitar la tarea a desarrollar (Alcance), suministren la información adecuada, limitándose a un uso o fin determinado (Especialización), se adapten a las diferentes necesidades de los usuarios, por ejemplo, integrarse en distintas plataformas o modificar su formato (Flexibilidad) y además consideran relevante conocer el autor y la fuente de la que proceden los datos (Trazabilidad). El factor 2 representa el 7.47% de la varianza total y presta más atención a que los datos sean exactos (Precisión), satisfagan las necesidades de los usuarios (Utilidad) y los usuarios encuentren lo que están buscando (Eficacia) utilizando una apropiada cantidad de recursos (Eficiencia). En cuanto al factor 3, éste representa el 5.83% de la varianza total y sus características de DQ tienen en cuenta que los datos sean aplicables e innovadores (Relevancia), novedosos (Novedad), aporten valor (Valor añadido), estén disponibles en el menor tiempo posible (Oportunidad), y estén orientados a la comunidad de destino (Aplicabilidad). Además, se calculó el alfa de Cronbach obteniendo los valores 0.874, y para los factores 1, 2 y 3 respectivamente, con lo cual los resultados son fiables Análisis factorial. Tipo de portal: Interacción comercial En cuanto al tipo de portal Web de Interacción comercial distinguimos también tres factores, que combinados representan el 70.01% de la varianza total, lo cual se interpreta como un porcentaje aceptable. El factor 1 representa el 56.80% de la varianza total y como se muestra en la Tabla 45, en él se prioriza que los datos estén detallados para facilitar la tarea a desarrollar (Alcance), sean fiables (Confiabilidad), sean entendibles para las personas que los van a utilizar (Validez), suministren la información adecuada, limitándose a un uso o fin determinado (Especialización), también es importante conocer el autor y la fuente de la 149

172 5.- Análisis de resultados que proceden los datos (Trazabilidad), además, es adecuado que los datos estén definidos según regulaciones y estándares (Conformidad), se obtengan utilizando una apropiada cantidad de recursos (Eficiencia) y que los usuarios encuentren lo que están buscando (Eficacia). El factor 2 representa el 8.18% de la varianza total, y en él lo que tienen en cuenta es que debería ser posible adaptar los datos a las diferentes necesidades de los usuarios, por ejemplo, integrarse en distintas plataformas o modificar su formato (Flexibilidad), además, los datos deberían estar orientados a la comunidad de destino (Aplicabilidad), aportar valor (Valor añadido) y satisfacer las necesidades de los usuarios (Utilidad). El factor 3 representa el 5.03% de la varianza total y en este caso, es más importante que los datos sean novedosos (Novedad), estén disponibles en el menor tiempo posible (Oportunidad), sean aplicables e innovadores (Relevancia) y sean exactos (Precisión). Además, se realizó el alfa de Cronbach obteniendo 0.925, y para los factores 1, 2 y 3 respectivamente. Esto significa que los valores obtenidos son buenos y los resultados son por tanto, fiables Análisis factorial. Tipo de portal: Interacción con otras personas En la Tabla 45 se muestran las características de DQ pertenecientes a cada factor. Estos factores combinados, explican el 70.8% de la varianza total, lo cual es un porcentaje aceptable. El factor 1 representa el 57.7% de la varianza total e incluye las características de DQ que consideran relevante que los datos sean exactos (Precisión), estén orientados a la comunidad de destino (Aplicabilidad), suministren la información adecuada, limitándose a un uso o fin determinado (Especialización), satisfagan las necesidades de los usuarios (Utilidad) y que los usuarios encuentren lo que están buscando (Eficacia) utilizando una apropiada cantidad de recursos (Eficiencia). El factor 2 representa el 8.1% de la varianza total y da más importancia a que los datos estén detallados para facilitar la tarea a desarrollar (Alcance), sean fiables 150

173 5.- Análisis de resultados (Confiabilidad), sean entendibles para las personas que los van a utilizar (Validez), estén definidos según regulaciones y estándares (Conformidad) y además se considera relevante conocer el autor y la fuente de la que proceden los datos (Trazabilidad). Finalmente, el factor 3 representa el 5% de la varianza total y contiene las características de DQ que indican que los datos sean novedosos (Novedad), aporten valor (Valor añadido), sean aplicables e innovadores (Relevancia), estén disponibles en el menor tiempo posible (Oportunidad) y se adapten a las diferentes necesidades de los usuarios, por ejemplo, integrarse en distintas plataformas o modificar su formato (Flexibilidad), Además, se obtiene el alfa de Cronbach con los valores 0.922, y para los factores 1, 2 y 3, respectivamente. Por lo que, los resultados obtenidos son fiables Paso 5. Análisis de cluster Como resultado del paso anterior, las características de DQ están organizadas en factores. A continuación, se realizó el análisis de cluster de forma que en cada cluster tenemos uno o varios factores en función de la importancia que en cada cluster se le da a cada factor. En la Tabla 46, se muestran los factores de cada cluster para cada uno de los tipos de portales Web. Búsqueda y lectura de Interacción con otras Interacción comercial información personas Cluster Cluster Cluster Factor 1 Factor 1 Factor 1 Factor 2 Factor 2 Factor 2 Factor 3 Factor 3 Factor 3 Factor 3 Tabla 46.- Análisis de cluster para cada tipo de portal Web considerando los factores obtenidos 151

174 5.- Análisis de resultados Paso 5.1. Tablas de contingencia Una vez que en cada cluster se saben las características de DQ a las que se da más importancia, se pasa a realizar las tablas de contingencia. De esta forma se relaciona los clusters con los aspectos demográficos para obtener los perfiles de usuario (ver Tabla 47). Aspecto demográfico Sexo Rango de edad Nivel de estudios Tipo de organización Porcentaje (%) Búsqueda y Interacción Interacción con lectura de comercial otras personas Variable información Cluster Cluster Cluster Hombre Mujer Menor de 25 años Entre 25 y 35 años Entre 35 y 45 años Entre 45 y 55 años Mayor de 55 años Graduado escolar / ESO Formación profesional Universitario Postgrado Educación Industrial-Comercial- Financiera Sector servicios Otro Porcentaje de muestra perteneciente al cluster Tabla 47.- Tabla de contingencia para categoría Contextual Para obtener la relación entre los aspectos demográficos y cada cluster, se definió el mismo procedimiento que para la categoría Intrínseca (ver sección ), aplicado para cada tipo de portal Web. 152

175 5.- Análisis de resultados Tabla de contingencia. Tipo de portal: Búsqueda y lectura de información El cluster 1 es poco representativo ya que del total de usuarios encuestados, este grupo sólo consta del 16.5% de la muestra. El cluster 2 tiene una representatividad del 23.5% de la muestra y el más representativo es el cluster 3 con un 60% del total de la muestra. Además, para determinar la relación entre los aspectos demográficos y cada cluster, se utilizaron los resultados de la Tabla 47 y el procedimiento descrito previamente. Estos valores permiten establecer los diferentes perfiles de usuario que han sido creados para cada cluster en función de los aspectos demográficos. Estos perfiles se muestran en la Tabla 48. Perfil/ Cluster Factor , Characteristicas de DQ Utilidad, Eficiencia, Precisión, Eficacia Alcance, Confiabilidad, Validez, Trazabilidad, Conformidad, Especialización, Flexibilidad, Aplicabilidad, Novedad, Valor añadido, Oportunidad, Relevancia Aplicabilidad, Novedad, Valor añadido, Oportunidad, Relevancia Sexo Hombre Rango de edad Entre 25 y 35 Entre 35 y 45 Menor de 25 Mayor de 55 Mujer Entre 45 y 55 Aspecto demográfico Nivel de estudios Estudios de Postgrado Graduado escolar / ESO Formación Profesional Estudios Universitarios Tabla 48.- Resumen de tabla de contingencia Búsqueda y lectura de información Tipo de organización Educación Industrial Comercial Financiera Sector Servicios Otro 153

176 5.- Análisis de resultados Como resultado los perfiles identificados para los portales del tipo Búsqueda y lectura de información son: Perfil 1 (pertenece al cluster 1): hombres entre 25 y 45 años con estudios de postgrado y vinculados a la educación. Le dan más prioridad a las características de DQ del factor 2 (Utilidad, Eficiencia, Precisión y Eficacia). Perfil 2 (pertenece al cluster 2): usuarios menores de 25 años o mayores de 55 años con graduado escolar/eso y vinculados a organizaciones industrial, comercial o financiera. Dan prioridad a las características de DQ del factor 1 (Alcance, Confiabilidad, Validez, Trazabilidad, Conformidad, Especialización y Flexibilidad) y factor 3 (Aplicabilidad, Novedad, Valor añadido, Oportunidad y Relevancia). Perfil 3 (pertenece al cluster 3): mujeres entre 45 y 55 años con formación profesional o estudios universitarios del sector servicios u otro (que no sea educación, industrial, comercial ni financiero). Priorizan las características de DQ del factor 3 (Aplicabilidad, Novedad, Valor añadido, Oportunidad y Relevancia). Tabla de contingencia. Tipo de portal: Interacción comercial El mayor porcentaje de la muestra se encuentra en el cluster 3. En este caso, con un 60.6% del total. Y el cluster 1 y 2 tienen un 14.9% y 24.5% de representatividad, respectivamente. A continuación se siguen los mismos pasos que el caso anterior, resumiendo los resultados en la Tabla

177 5.- Análisis de resultados Perfil/ Cluster Factor Characterísticas de DQ Flexibilidad, Aplicabilidad, Valor añadido, Utilidad Alcance, Confiabilidad, Validez, Trazabilidad, Conformidad, Especialización, Eficiencia, Eficacia Novedad, Oportunidad, Relevancia, Precisión Sexo Hombre Rango de edad Entre 25 y 45 Mayor de 55 Menor de 25 Mujer Entre 45 y 55 Aspecto demográfico Nivel de estudios Estudios Universitarios Estudios de Postgrado Graduado escolar / ESO Formación Profesional Tabla 49.- Resumen tabla de contingencia Interacción comercial Tipo de organización Sector Servicios Industrial Comercial Financiera Educación Otro Los perfiles son: Perfil 1 (pertenece al cluster 1): hombres entre 25 y 45 años o mayores de 55 años con estudios universitarios y/o de postgrado y vinculados al sector servicios Le dan más prioridad a las características de DQ del factor 2 (Flexibilidad, Aplicabilidad, Valor añadido y Utilidad). Perfil 2 (pertenece al cluster 2): usuarios menores de 25 años con graduado escolar/eso y vinculados a organizaciones industrial, comercial o financiera. Dan prioridad a las características de DQ del factor 1 (Alcance, Confiabilidad, Validez, Trazabilidad, Conformidad, Especialización, Eficiencia y Eficacia). Perfil 3 (pertenece al cluster 3): mujeres entre 45 y 55 años con formación profesional vinculadas a la educación u otro (que no sea educación, industrial, comercial ni financiero). Priorizan las características de DQ del factor 3 (Novedad, Oportunidad, Relevancia y Precisión). 155

178 5.- Análisis de resultados Tabla de contingencia. Tipo de portal: Interacción con otras personas El cluster 1 es el menos representativo con 17.6% del total y estando los otros dos clusters más representados con un 48.9% y 33.5% del total para los clusters 2 y 3 respectivamente El mayor porcentaje de la muestra se encuentra en el cluster 2. En este caso siguiendo igualmente los pasos detallados al principio de la subsección se obtienen los resultados resumidos en la Tabla 50. Perfil/ Cluster Factor Characterísticas de DQ Especialización, Aplicabilidad, Utilidad, Eficiencia, Precisión, Eficacia Flexibilidad, Novedad, Valor añadido, Oportunidad, Relevancia Alcance, Confiabilidad, Validez, Trazabilidad, Conformidad Sexo Hombre Mujer Rango de edad Entre 35 y 45 Mayor de 55 Entre 25 y 35 Mayor de 55 Menor de 25 Entre 45 y 55 Aspecto demográfico Nivel de estudios Estudios Universitarios Estudios de Postgrado Graduado escolar / ESO Formación Profesional Tabla 50.- Resumen tabla de contingencia Interacción con otras personas Tipo de organización Educación Otro Sector Servicios Industrial Comercial Financiera Otro Los perfiles son: Perfil 1 (pertenece al cluster 1): hombres entre 35 y 45 años o mayores de 55 años con estudios universitarios y/o de postgrado y vinculados a la educación u otro (que no sea educación, industrial, comercial ni financiero). Le dan más prioridad a las características de DQ del factor 1 (Especialización, Applicability, Utilidad, Eficiencia, Precisión y Eficacia). Perfil 2 (pertenece al cluster 2): usuarios entre 25 y 35 años o mayores de 55 con graduado escolar/eso y vinculados al sector servicios. Dan prioridad a las características de DQ del factor 3 (Flexibilidad, Novedad, Valor añadido, Oportunidad y Relevancia). 156

179 5.- Análisis de resultados Perfil 3 (pertenece al cluster 3): mujeres menores de 25 años o entre 45 y 55 años con formación profesional vinculados a organizaciones industrial, comercial o financiera u otro (que no sea educación, industrial, comercial ni financiero). Priorizan las características de DQ del factor 2 (Alcance, Confiabilidad, Validez, Trazabilidad y Conformidad). De esta forma se ha comprobado que unas características de DQ son más importantes que otras en función de diferentes perfiles de usuario y varían en función del tipo de portal Web al que se accede. Como hemos comentado en la categoría Intrínseca, en la sección 6 se dará también más detalle de todo esto para la categoría Contextual, indicando las guías que se entregarán a los diseñadores y desarrolladores de portales Web para que tengan en cuenta estos resultados RESUMEN En esta sección se han analizado los datos procedentes de las encuestas recogidas tanto para la categoría Intrínseca como para la categoría Contextual. Para ello, se han realizado estudios estadísticos de forma que se ha comprobado, primero, que todas las características de DQ eran importantes para los usuarios de portales Web. En segundo lugar, se han obtenido diferentes perfiles de usuario en cada una de ellas, donde se comprobó que para cada perfil se daba más importancia a unas características de DQ respecto a otras. 157

180

181 6.- SPDQM EN LA PRÁCTICA 6.- SPDQM EN LA PRÁCTICA

182

183 6.- SPDQM en la práctica INTRODUCCIÓN Para aumentar la utilidad de los resultados, se han creado unas guías de desarrollo que pueden ser útiles para diseñadores y desarrolladores de portales Web. Con estas guías se orienta sobre las características de DQ que deben ser consideradas en un portal Web, en función del perfil de usuario al que va dirigido dicho portal Web y el tipo de portal Web (en el caso de las características de DQ para la categoría Contextual). Para ello, utilizamos los resultados obtenidos en la Tabla 32 para la categoría Intrínseca y en la Tabla 48, Tabla 49 y Tabla 50 para la categoría Contextual y tipo de portal Web Búsqueda y lectura de información, Interacción comercial e Interacción con otras personas respectivamente. En estas tablas se definen las características de DQ a las que se da más importancia en función de los perfiles de usuario. De esta forma si, por ejemplo, un portal Web va orientado a mujeres de edad entre 25 y 35 años, las características de DQ a las que hay que dar más importancia es diferente que si va orientado a hombres entre 35 y 45 años. Sin embargo, no siempre se crean portales Web para los perfiles definidos y es posible que sólo sea importante alguna de las variables de los aspectos demográficos, por ejemplo, si el portal Web está orientado a personas entre de 45 y 55 años, independientemente del sexo, nivel de estudios y tipo de organización a la que pertenece. Por ello, consideramos que era necesario definir un proceso de creación de guías que sea genérico, y cuyos pasos se muestran a continuación: Se selecciona la variable o variables del aspecto demográfico o aspectos demográficos a los que va orientado el portal Web. De cada variable se observa el perfil al que pertenece. Si todas las variables se encuentran en el mismo perfil, las características de DQ pertenecientes a ese perfil, serán las que se tendrán en cuenta. Si un perfil aparece más veces que el resto, hay que prestar más atención a las características de DQ de ese perfil. Si hay dos perfiles que son los más importantes, consideramos ambos y sus características de DQ. 161

184 6.- SPDQM en la práctica Si todos los perfiles son diferentes, deben considerarse todas las características de DQ de esos perfiles. Todo esto ha sido implantado en PoDQA, herramienta que permite obtener guías que son útiles para conocer las características de calidad de datos que los usuarios de portales Web consideran más importantes en función del perfil al que pertenezcan PROCEDIMIENTO DE OBTENCIÓN DE GUÍAS PARA LA CATEGORÍA INTRÍNSECA Y LA CATEGORÍA CONTEXTUAL En este apartado presentamos el procedimiento para la obtención de guías que después se muestran mediante la herramienta PoDQA Ejemplo de procedimiento de obtención de guías para características de categoría Intrínseca Para crear las guías de las características de DQ para la categoría Intrínseca se utilizan los resultados obtenidos en la Tabla 32. En esta tabla se definen las características de DQ de cada perfil. Sabiendo que cada cluster se corresponde con un perfil. Podemos decir que los usuarios que pertenecen al perfil 1 dan más importancia a las características de DQ del factor 3, es decir, les preocupa que los datos estén bien documentados (Trazabilidad), estén accesibles particularmente por personas discapacitadas (Accesibilidad) y se conozca el tiempo hasta el cual los datos están actualizados (Expiración). Mientras que los usuarios del perfil 2 consideran más relevantes las características de DQ de los factores 1 y 2, es decir, los datos deben ser claros, no ambiguos y fáciles de comprender e interpretar (Entendibilidad) pero sólo por usuarios autorizados (Confidencialidad), ser exactos (Precisión), estar actualizados y no obsoletos (Actualidad) y definirse según regulaciones y estándares (Conformidad) satisfaciendo las necesidades de los usuarios (Completitud) y utilizando las cantidades y tipos de recursos apropiados (Eficiencia). Además, los datos deben ser verdaderos (Reputación), imparciales (Objetividad), correctos (Credibilidad), libres de errores (Exactitud) y coherentes (Coherencia). 162

185 6.- SPDQM en la práctica Teniendo en cuenta el proceso de creación de guías, se van a llevar a cabo diferentes ejemplos: Ejemplo 1: se desea crear un portal Web para hombres, menores de 25 años, con graduado escolar / ESO y conocimientos informáticos básicos. En este caso, se analizan los perfiles asociados para cada variable: Hombre: perfil 1. Menor de 25 años: perfil 2. Graduado escolar / ESO: perfil 2. Conocimientos informáticos básicos: perfil 2. De forma que se observa que predomina el perfil 2, que se corresponde con los factores 1 y 2, por tanto a las características de DQ que se encuentran en esos factores es a las que hay que prestar más atención. Es decir, Conformidad, Confidencialidad, Actualidad, Entendibilidad, Eficiencia, Completitud y Precisión (factor 1) y Reputación, Objetividad, Credibilidad, Exactitud y Coherencia (factor 2). Ejemplo 2: se desea crear un portal Web para mujeres, entre 25 y 45 años, con estudios universitarios y conocimientos informáticos avanzados. Para este ejemplo, Mujer: perfil 2. Entre 25 y 45 años: perfil 1. Estudios universitarios: perfil 1. Conocimientos informáticos avanzados: perfil 1. De modo que predominan los aspectos demográficos del perfil 1, que se corresponden con el factor 3, por tanto los diseñadores y desarrolladores deben prestar más atención a las características de DQ Trazabilidad, Accesibilidad y Expiración. 163

186 6.- SPDQM en la práctica Ejemplo 3: un portal Web destinado a hombres, entre 25 y 45 años, con graduado escolar / ESO y conocimientos informáticos básicos, tenemos que los perfiles asociados para cada variable son: Hombre: perfil 1. Entre 25 y 45 años: perfil 1. Graduado escolar / ESO: perfil 2. Conocimientos informáticos básicos: perfil 2. En este caso, se encuentran en igual cantidad aspectos demográficos del perfil 1 y del perfil 2, de modo que predominaran los tres factores en igual proporción, por tanto debe prestarse atención a todas las características de DQ de la categoría intrínseca. Por tanto, a partir de los perfiles o de las variables de los aspectos demográficos que se tengan en cuenta, se obtendrá la información correspondiente a las características de DQ a las que se debe prestar más atención Procedimiento de obtención de guías para características de categoría Contextual El procedimiento a seguir es el mismo que para la categoría intrínseca. Pero en este caso, como se ha comentado con anterioridad en la categoría contextual, es necesario tener en cuenta el tipo de portal Web, por ello, se muestra la creación de guías para cada uno de ellos. En este caso, se aplican los mismos ejemplos para los tres tipos de portales Web: Ejemplo 1: Un tipo de portal Web orientado principalmente hacia hombres entre 35 y 45 años, con estudios universitarios pertenecientes a la educación. Ejemplo 2: Un tipo de portal Web orientado principalmente hacia mujeres menores de 25 años, con graduado escolar / ESO pertenecientes al sector servicios. 164

187 6.- SPDQM en la práctica Ejemplo de procedimiento de obtención de guías para el tipo de portal Web Búsqueda y lectura de información El primer paso es identificar el tipo de portal Web, que en este caso es Búsqueda y lectura de información, por tanto se utilizan los resultados de la Tabla 48. A continuación, se sigue el proceso de creación de guías detallado anteriormente. Para ello, se determina el perfil al que pertenece cada aspecto demográfico. Obteniendo: Para el ejemplo 1: Hombres: perfil 1. Entre 35 y 45 años: perfil 1. Estudios universitarios: perfil 3. Educación: perfil 1. Para el ejemplo 2: Mujeres: perfil 3. Menores de 25 años: perfil 2. Graduado escolar / ESO: perfil 2. Sector servicios: perfil 3. Finalmente se decide las características de DQ a las que se debe prestar más atención en función de los resultados obtenidos. De forma que: Para el ejemplo 1: se debe prestar más atención a las características de DQ del perfil 1 (Utilidad, Eficiencia, Precisión y Eficacia) ya que la mayoría de los aspectos demográficos se corresponden con este perfil. Para el ejemplo 2: se deben tener en cuenta las características de DQ del perfil 2 y del perfil 3, observando en este caso que las características de DQ del perfil 3 están contenidas en el perfil 2 (Alcance, Confiabilidad, Validez, Trazabilidad, Conformidad, Especialización, Flexibilidad, Aplicabilidad, Novedad, Valor añadido, Oportunidad y Relevancia). 165

188 6.- SPDQM en la práctica Ejemplo de procedimiento de obtención de guías para el tipo de portal Web Interacción comercial En este caso se utilizan los resultados obtenidos en la Tabla 49 y se sigue el mismo método y los mismos ejemplos, para comprobar que las características de DQ a las que hay que prestar atención para este tipo de portal Web son diferentes. Seguidamente se realiza la obtención de perfil para cada variable de cada aspecto demográfico: Para el ejemplo 1: Hombres: perfil 1. Entre 35 y 45 años: perfil 1. Estudios universitarios: perfil 1. Educación: perfil 3. Para el ejemplo 2: Mujeres: perfil 3. Menores de 25 años: perfil 2. Graduado escolar / ESO: perfil 2. Sector servicios: perfil 1. Por tanto, las características de DQ a las que los diseñadores y desarrolladores de estos portales Web deben prestar atención son: Para el ejemplo 1: se debe prestar más atención a las características de DQ del perfil 1 (Flexibilidad, Aplicabilidad, Valor añadido y Utilidad). Para el ejemplo 2: se deben tener en cuenta las características de DQ del perfil 2 (Alcance, Confiabilidad, Validez, Trazabilidad, Conformidad, Especialización, Eficiencia y Eficacia) Ejemplo de procedimiento de obtención de guías para el tipo de portal Web Interacción con otras personas Como en los casos anteriores, se identifica el tipo de portal Web que en este caso es Interacción con otras personas, por lo que, se utilizan los resultados de la Tabla

189 6.- SPDQM en la práctica A continuación se realiza la obtención de perfil cada variable de cada aspecto demográfico: Para el ejemplo 1: Hombres: perfil 1. Entre 35 y 45 años: perfil 1. Estudios universitarios: perfil 1. Educación: perfil 1. Para el ejemplo 2: Mujeres: perfil 3. Menores de 25 años: perfil 3. Graduado escolar / ESO: perfil 2. Sector servicios: perfil 2. En este caso, las características de DQ a las que los diseñadores y desarrolladores de estos portales Web deben prestar atención son: Para el ejemplo 1: se debe prestar más atención a las características de DQ del perfil 1 (Especialización, Aplicabilidad, Utilidad, Eficiencia, Precisión y Eficacia). Para el ejemplo 2: se deben tener en cuenta las características de DQ del perfil 2 (Flexibilidad, Novedad, Valor añadido, Oportunidad y Relevancia) y del perfil 3 (Alcance, Confiabilidad, Validez, Trazabilidad y Conformidad). En la Tabla 51, se muestra un resumen de los resultados para los tres tipos de portales Web, comprobando que algunas características de DQ a las que hay que prestar más atención son diferentes para cada tipo de portal Web. 167

190 6.- SPDQM en la práctica Tipo de portal Web Búsqueda y lectura de información Interacción comercial Interacción con otras personas características de DQ Ejemplo 1 Ejemplo 2 Ejemplo 1 Ejemplo 2 Ejemplo 1 Ejemplo 2 Alcance X X X Confiabilidad X X X Validez X X X Trazabilidad X X X Conformidad X X X Especialización X X X Flexibilidad X X X Aplicabilidad X X X Novedad X X Valor añadido X X X Oportunidad X X Relevancia X X Utilidad X X X Eficiencia X X X Precisión X X Eficacia X X X Tabla 51.- Resultados de los ejemplos para los tres tipos de portales Web HERRAMIENTA PoDQA Para hacer accesible SPDQM a los diseñadores y desarrolladores de portales Web, se hace uso de la herramienta PoDQA. Esta herramienta fue creada en un primer momento para determinar el nivel de calidad de los portales Web, con respecto a las 168

191 6.- SPDQM en la práctica características de calidad de datos correspondientes a la categoría Representacional, de un modelo anterior denominado PDQM. Actualmente, esta utilidad se ha ampliado y se ha incluido la posibilidad de generar guías útiles para diseñadores y desarrolladores de portales Web. La herramienta se llamó PoDQA por las siglas en inglés de Portal Data Quality Assessment, y pretende alcanzar los siguientes nuevos objetivos: - Demostrar la aplicabilidad de SPDQM en la evaluación de la DQ en portales Web. - Demostrar la utilidad de SPDQM para guiar a diseñadores y desarrolladores de portales Web. - Dejar SPDQM al alcance de los diseñadores y desarrolladores de datos de portales Web. En esta subsección se describen las características generales de la herramienta, la forma en que trabaja y cómo puede ser utilizada tanto por los consumidores de datos como por diseñadores y desarrolladores de portales Web. A la herramienta puede accederse desde Características generales de PoDQA Para la construcción de PoDQA se utilizó una arquitectura de tres capas para separar los componentes de presentación, aplicación y almacenamiento, usando la tecnología Visual Basic. A través de la capa de presentación, la herramienta presenta una interfaz por medio de la cual los usuarios pueden desarrollar diferentes tareas, tanto en castellano como en inglés: - Consultar qué es PoDQA y cómo funciona. - Consultar las categorías de SPDQM y las características/subcaracterísticas contenidas en cada una. 169

192 6.- SPDQM en la práctica - Determinar el perfil o los aspectos demográficos que interesan para obtener las guías de la categoría Intrínseca. - Determinar el tipo de portal Web que se desea seleccionar para la categoría Contextual. - También es posible obtener información adicional acerca de otros sitios de interés y sobre los creadores de la herramienta. La capa de aplicación está compuesta por las guías que se mostrarán en función a los datos de perfil o aspectos demográficos seleccionados, para la categoría Intrínseca y la categoría Contextual. La capa de almacenamiento es la base de datos que almacena la información sobre los resultados de las distintas consultas desarrolladas, junto con toda la información necesaria para una buena gestión de la herramienta Bases de Datos de PoDQA Las bases de datos de PoDQA almacenan para la categoría Intrínseca y la categoría Contextual: - Guías: que entrega la herramienta en función del perfil o aspecto demográfico seleccionado para la categoría Intrínseca y además teniendo en cuenta el tipo de portal Web para la categoría Contextual. Con respecto a la categoría Representacional, almacena datos acerca de los portales Web evaluados, los usuarios, los resultados de cada evaluación, las recomendaciones entregadas e información de gestión de la herramienta. Las entidades más importantes son las siguientes: - Portales Web: almacena información acerca de los portales Web evaluados. Por cada uno se almacena su URL y el dominio al que pertenece, de este modo se controla que un portal Web pertenezca a un solo dominio. - Usuarios: almacena la información acerca de los usuarios que han solicitado una evaluación en PoDQA. Básicamente la información pedida a los usuarios corresponde a datos de contacto (nombre, ). 170

193 6.- SPDQM en la práctica - Dominios: almacena los dominios de los portales Web habilitados en la herramienta. Esta entidad será usada para mostrar a los usuarios cuáles son los dominios disponibles para seleccionar en una evaluación. - Evaluaciones: almacena las evaluaciones solicitadas a PoDQA. Por cada evaluación se almacenarán los valores calculados para los indicadores y los resultados finales de la evaluación entregados. Un mismo portal puede ser evaluado muchas veces aunque deben pasar al menos dos semanas entre evaluación y evaluación. Este período de tiempo se seleccionó porque se considera adecuado para que se hayan podido realizar cambios en el portal Web evaluado. Una evaluación se distinguirá de otra por la fecha en que fue solicitada. - Sugerencias y recomendaciones: almacena las recomendaciones de mejora que entrega la herramienta, dependiendo de los resultados de la evaluación desarrollada Usuarios de PoDQA PoDQA es una herramienta que usa unos parámetros fijos definidos para mostrar guías válidas para la DQ de la categoría Intrínseca y tiene en cuenta el tipo de portal Web para mostrar las guías de la DQ de la categoría Contextual Para el caso de la categoría Intrínseca y de la categoría Contextual los resultados son automáticos y sólo varían en función de los aspectos demográficos seleccionados y del tipo de portal Web para la categoría Contextual. En el caso de la categoría Representacional los resultados son públicos; esto significa que un usuario puede consultar los resultados obtenidos, tanto de sus solicitudes como de las solicitudes de otro usuario. PoDQa no evalúa la DQ en línea, ya que éste es un proceso que puede tomar mucho tiempo dependiendo del tamaño del portal Web. El proceso se realiza cada dos días. Cuando un usuario solicita una evaluación, se le requiere que ponga la dirección de de manera que se le pueda avisar por correo electrónico una vez terminada la evaluación que solicitó, para que pueda consultarla al 171

194 6.- SPDQM en la práctica sitio Web de la herramienta. La dirección de se maneja de forma privada y por tanto no se publicará junto con los resultados de las evaluaciones (ver Figura 20). Los resultados de una evaluación son almacenados en la base de datos; si un portal Web es evaluado múltiples veces cada una de las evaluaciones será almacenada por separado. Esto permitirá a los usuarios consultar no sólo la última evaluación existente de un portal Web sino que, si lo desea, podrá ver todas las evaluaciones que se han hecho, con lo cual podrá chequear si ha habido una evolución de la DQ de un portal Web en el tiempo. Adicionalmente, si el usuario lo solicita, PoDQA puede entregar una lista de recomendaciones para mejorar la DQ del portal Web evaluado. Estas recomendaciones se elaboran en base a los resultados de las medidas calculadas, tratando de mejorar aquellos aspectos que han sido evaluados como deficientes. Figura 20.- Interacción de usuarios con PoDQA Aplicación Web. Acceso y pantallas principales A continuación se describe la aplicación Web a través de la cual los usuarios acceden a PoDQA. Se dispone de la versión en castellano y en inglés. 172

195 6.- SPDQM en la práctica Consultar qué es PoDQA y cómo funciona En la parte de Inicio, se indica una breve definición de qué es PoDQA y de cómo funciona (ver Figura 21 y Figura 22). Figura 21.- Qué es PoDQA En cuanto a su funcionamiento, distinguimos entre Funcionamiento estático y Funcionamiento dinámico. En el funcionamiento estático se encuentran los resultados obtenidos para la categoría Intrínseca y la categoría Contextual, ya que en estos casos los resultados son siempre los mismos independientemente del portal Web, viendose sólo influenciados por los aspectos demográficos seleccionados, y además, por el tipo de portal Web en el caso de la categoría Contextual. 173

196 6.- SPDQM en la práctica Figura 22.- Cómo funciona PoDQA Consultar las categorías de SPDQM y las características/subcaracterísticas contenidas en cada una En la parte de modelo de Calidad de Datos, se muestran las características/subcaracterísticas de cada categoría (ver Figura 23, Figura 24, Figura 25 y Figura 26). 174

197 6.- SPDQM en la práctica Figura 23.- Características/Subcaracterísticas de la categoría Intrínseca Figura 24.- Características/Subcaracterísticas de la categoría Contextual 175

198 6.- SPDQM en la práctica Figura 25.- Características/Subcaracterísticas de la categoría Representacional Figura 26.- Características/Subcaracterísticas de la categoría Operacional 176

199 6.- SPDQM en la práctica Aplicación del modelo En la parte de Aplicando el Modelo distinguimos entre el funcionamiento estático y el funcionamiento dinámico Determinar las guías de la categoría Intrínseca Para determinar las guías de la categoría Intrínseca sólo es preciso seleccionar un perfil o uno o varios aspectos demográficos (ver Figura 27 y Figura 28). Figura 27.- Perfiles de la categoría Intrínseca 177

200 6.- SPDQM en la práctica Figura 28.- Aspectos demográficos de la categoría Intrínseca Pantallazos de la herramienta PoDQA para el ejemplo 1 para la categoría Intrínseca Ejemplo 1: se desea crear un portal Web para hombres, menores de 25 años, con graduado escolar / ESO y conocimientos informáticos básicos (ver Figura 29). En este caso, se analizan los perfiles asociados para cada variable: Hombre: perfil 1. Menor de 25 años: perfil 2. Graduado escolar / ESO: perfil 2. Conocimientos informáticos básicos: perfil 2. De forma que se observa que predomina el perfil 2, que se corresponde con los factores 1 y 2, por tanto a las características de DQ que se encuentran en esos factores es a las que hay que prestar más atención. Es decir, Conformidad, Confidencialidad, Actualidad, Entendibilidad, Eficiencia, Completitud y Precisión (factor 1) y Reputación, Objetividad, Credibilidad, Exactitud y Coherencia (factor 2) (ver Figura 30 y Figura 31). 178

201 6.- SPDQM en la práctica Figura 29.- Aspectos demográficos seleccionados para ejemplo 1 de categoría Intrínseca Figura 30.- Primera parte de guías para el ejemplo 1 de la categoría Intrínseca 179

202 6.- SPDQM en la práctica Figura 31.- Segunda parte de guías para el ejemplo 1 de la categoría Intrínseca Pantallazos de la herramienta PoDQA para el ejemplo 2 para la categoría Intrínseca Ejemplo 2: se desea crear un portal Web para mujeres, entre 25 y 45 años, con estudios universitarios y conocimientos informáticos avanzados (ver Figura 32). Para este ejemplo, Mujer: perfil 2. Entre 25 y 45 años: perfil 1. Estudios universitarios: perfil 1. Conocimientos informáticos avanzados: perfil 1. De modo que predominan los aspectos demográficos del perfil 1, que se corresponden con el factor 3, por tanto los diseñadores y desarrolladores deben prestar más atención a las características de DQ Trazabilidad, Accesibilidad y Expiración (ver Figura 33). 180

203 6.- SPDQM en la práctica Figura 32.- Aspectos demográficos seleccionados para ejemplo 2 de categoría Intrínseca Figura 33.- Guías para el ejemplo 2 de la categoría Intrínseca Pantallazos de la herramienta PoDQA para el ejemplo 3 para la categoría Intrínseca Ejemplo 3: un portal Web destinado a hombres, entre 25 y 45 años, con graduado escolar / ESO y conocimientos informáticos básicos, tenemos que los perfiles asociados para cada variable son: 181

204 6.- SPDQM en la práctica Hombre: perfil 1. Entre 25 y 45 años: perfil 1. Graduado escolar / ESO: perfil 2. Conocimientos informáticos básicos: perfil 2. Para el caso del ejemplo 3, destinado a hombres, entre 25 y 45 años, con graduado escolar / ESO y conocimientos informáticos básicos, como se indica en la sección 6.2.1, se debe prestarse atención a todas las características de DQ de la categoría intrínseca, por tanto aparecen las características de DQ de la Figura 30, Figura 31 y Figura Determinar las guías de la categoría Contextual Para determinar las guías de la categoría Contextual es preciso primero seleccionar el tipo de portal Web (ver Figura 34). Figura 34.- Selección de tipo de portal Web en la categoría Contextual 182

205 6.- SPDQM en la práctica Pantallazos de la herramienta PoDQA para el ejemplo 1 del tipo de portal Web Búsqueda y lectura de información para categoría Contextual Para el tipo de portal Web Búsqueda y lectura de información, en el ejemplo 1 de la sección , orientado principalmente hacia hombres entre 35 y 45 años, con estudios universitarios pertenecientes a la educación (ver Figura 35). Se debe prestar más atención a las características de DQ: Utilidad, Eficiencia, Precisión y Eficacia (ver Figura 36). Figura 35.- Aspectos demográficos seleccionados para ejemplo 1 de la categoría Contextual y tipo de portal Web Búsqueda y lectura de Información 183

206 6.- SPDQM en la práctica Figura 36.- Guías para el ejemplo 1 de la categoría Contextual y tipo de portal Web Búsqueda y lectura de Información Pantallazos de la herramienta PoDQA para el ejemplo 2 del tipo de portal Web Búsqueda y lectura de información para categoría Contextual Para el el tipo de portal Web Búsqueda y lectura de información, en el ejemplo 2 de la sección , orientado principalmente hacia mujeres menores de 25 años, con graduado escolar / ESO pertenecientes al sector servicios (ver Figura 37). Se deben tener en cuenta las características de DQ: Alcance, Confiabilidad, Validez, Trazabilidad, Conformidad, Especialización, Flexibilidad, Aplicabilidad, Novedad, Valor añadido, Oportunidad y Relevancia (ver Figura 38 y Figura 39). 184

207 6.- SPDQM en la práctica Figura 37.- Aspectos demográficos seleccionados para ejemplo 2 de la categoría Contextual y tipo de portal Web Búsqueda y lectura de Información Figura 38.- Primera parte de las guías para el ejemplo 2 de la categoría Contextual y tipo de portal Web Búsqueda y lectura de Información 185

208 6.- SPDQM en la práctica Figura 39.- Segunda parte de las guías para el ejemplo 2 de la categoría Contextual y tipo de portal Web Búsqueda y lectura de Información Pantallazos de la herramienta PoDQA para el ejemplo 1 del tipo de portal Web Interacción comercial para categoría Contextual Para el el tipo de portal Web Interacción comercial, en el ejemplo 1 de la sección orientado principalmente hacia hombres entre 35 y 45 años, con estudios universitarios pertenecientes a la educación (ver Figura 40), los diseñadores y desarrolladores de estos portales Web deben prestar más atención a las características de DQ: Flexibilidad, Aplicabilidad, Valor añadido y Utilidad (ver Figura 41). Figura 40.- Aspectos demográficos seleccionados para ejemplo 1 de la categoría Contextual y tipo de portal Web Interacción comercial 186

209 6.- SPDQM en la práctica Figura 41.- Guías para el ejemplo 1 de la categoría Contextual y tipo de portal Web Interacción comercial Pantallazos de la herramienta PoDQA para el ejemplo 2 del tipo de portal Web Interacción comercial para categoría Contextual Para el el tipo de portal Web Interacción comercial, en el ejemplo 2 de la sección , orientado principalmente hacia mujeres menores de 25 años, con graduado escolar / ESO pertenecientes al sector servicios (ver Figura 42), se debe prestar más atención a las características de DQ: Alcance, Confiabilidad, Validez, Trazabilidad, Conformidad, Especialización, Eficiencia y Eficacia (ver Figura 43). 187

210 6.- SPDQM en la práctica Figura 42.- Aspectos demográficos seleccionados para ejemplo 2 de la categoría Contextual y tipo de portal Web Interacción comercial Figura 43.- Guías para el ejemplo 2 de la categoría Contextual y tipo de portal Web Interacción comercial 188

211 6.- SPDQM en la práctica Pantallazos de la herramienta PoDQA para el ejemplo 1 del tipo de portal Web Interacción con otras personas para categoría Contextual Para el el tipo de portal Web Interacción con otras personas, en el ejemplo 1 de la sección , orientado principalmente hacia hombres entre 35 y 45 años, con estudios universitarios pertenecientes a la educación (ver Figura 44), los diseñadores y desarrolladores de estos portales Web, deben prestar atención en las características de DQ: Especialización, Aplicabilidad, Utilidad, Eficiencia, Precisión y Eficacia (ver Figura 45). Figura 44.- Aspectos demográficos seleccionados para ejemplo 1 de la categoría Contextual y tipo de portal Web Interacción con otras personas 189

212 6.- SPDQM en la práctica Figura 45.- Guías para el ejemplo 1 de la categoría Contextual y tipo de portal Web Interacción con otras personas Pantallazos de la herramienta PoDQA para el ejemplo 2 del tipo de portal Web Interacción con otras personas para categoría Contextual Para el el tipo de portal Web Interacción con otras personas, en el ejemplo 2 de la sección , orientado principalmente hacia mujeres menores de 25 años, con graduado escolar / ESO pertenecientes al sector servicios (ver Figura 46), se deben tener en cuenta las características de DQ: Alcance, Confiabilidad, Validez, Trazabilidad, Conformidad, Flexibilidad, Novedad, Valor añadido, Oportunidad y Relevancia (ver Figura 47). 190

213 6.- SPDQM en la práctica Figura 46.- Aspectos demográficos seleccionados para ejemplo 2 de la categoría Contextual y tipo de portal Web Interacción con otras personas Figura 47.- Guías para el ejemplo 2 de la categoría Contextual y tipo de portal Web Interacción con otras personas Obtener información adicional En cuanto a la información adicional, se puede conocer más sobre otros sitios de interés y los creadores de la herramienta (ver Figura 48 y Figura 49). 191

GUÍA TÉCNICA PARA LA DEFINICIÓN DE COMPROMISOS DE CALIDAD Y SUS INDICADORES

GUÍA TÉCNICA PARA LA DEFINICIÓN DE COMPROMISOS DE CALIDAD Y SUS INDICADORES GUÍA TÉCNICA PARA LA DEFINICIÓN DE COMPROMISOS DE CALIDAD Y SUS INDICADORES Tema: Cartas de Servicios Primera versión: 2008 Datos de contacto: Evaluación y Calidad. Gobierno de Navarra. evaluacionycalidad@navarra.es

Más detalles

DE VIDA PARA EL DESARROLLO DE SISTEMAS

DE VIDA PARA EL DESARROLLO DE SISTEMAS MÉTODO DEL CICLO DE VIDA PARA EL DESARROLLO DE SISTEMAS 1. METODO DEL CICLO DE VIDA PARA EL DESARROLLO DE SISTEMAS CICLO DE VIDA CLÁSICO DEL DESARROLLO DE SISTEMAS. El desarrollo de Sistemas, un proceso

Más detalles

Capítulo 5: METODOLOGÍA APLICABLE A LAS NORMAS NE AI

Capítulo 5: METODOLOGÍA APLICABLE A LAS NORMAS NE AI Capítulo 5: METODOLOGÍA APLICABLE A LAS NORMAS NE AI La segunda fase del NIPE corresponde con la adecuación de las intervenciones de enfermería del sistema de clasificación N.I.C. (Nursing Intervention

Más detalles

SÍNTESIS Y PERSPECTIVAS

SÍNTESIS Y PERSPECTIVAS SÍNTESIS Y PERSPECTIVAS Los invitamos a observar, a identificar problemas, pero al mismo tiempo a buscar oportunidades de mejoras en sus empresas. REVISIÓN DE CONCEPTOS. Esta es la última clase del curso.

Más detalles

Cumpliendo con las Necesidades de la Salud Sexual y Reproductiva de Jóvenes Vulnerables: Una Caja de Herramientas para Monitoreo y Evaluación

Cumpliendo con las Necesidades de la Salud Sexual y Reproductiva de Jóvenes Vulnerables: Una Caja de Herramientas para Monitoreo y Evaluación Cumpliendo con las Necesidades de la Salud Sexual y Reproductiva de Jóvenes Vulnerables: Una Caja de Herramientas para Monitoreo y Evaluación 3A. Pasos Claves para la Implementación de una Encuesta Este

Más detalles

Elementos requeridos para crearlos (ejemplo: el compilador)

Elementos requeridos para crearlos (ejemplo: el compilador) Generalidades A lo largo del ciclo de vida del proceso de software, los productos de software evolucionan. Desde la concepción del producto y la captura de requisitos inicial hasta la puesta en producción

Más detalles

Caso práctico de Cuadro de Mando con Tablas Dinámicas

Caso práctico de Cuadro de Mando con Tablas Dinámicas 1 Caso práctico de Cuadro de Mando con Tablas Dinámicas Luis Muñiz Socio Director de SisConGes & Estrategia Introducción Hay una frase célebre que nos permite decir que: Lo que no se mide no se puede controlar

Más detalles

1.1. Introducción y conceptos básicos

1.1. Introducción y conceptos básicos Tema 1 Variables estadísticas Contenido 1.1. Introducción y conceptos básicos.................. 1 1.2. Tipos de variables estadísticas................... 2 1.3. Distribuciones de frecuencias....................

Más detalles

Test de Idioma Francés. Manual del evaluador

Test de Idioma Francés. Manual del evaluador Test de Idioma Francés Manual del evaluador 1 CONTENIDO Introducción Qué mide el Test de idioma francés? Qué obtienen el examinado y el examinador? Descripción de los factores Propiedades psicométricas

Más detalles

Enginyeria del Software III

Enginyeria del Software III Enginyeria del Software III Sessió 3. L estàndard ISO/IEC 15504 Antònia Mas Pichaco 1 Introducción El proyecto SPICE representa el mayor marco de colaboración internacional establecido con la finalidad

Más detalles

Contenidos. INFORME ENCUESTA TELEFÓNICA. Curso 2009 10

Contenidos. INFORME ENCUESTA TELEFÓNICA. Curso 2009 10 ENCUESTA DE OPINIÓN DEL ALUMNADO SOBRE LA ACTUACIÓN DOCENTE DEL PROFESORADO UNIVERSIDAD DE SEVILLA Curso 2009-2010 ENCUESTA TELEFÓNICA Contenidos Introducción.... 4 El Cuestionario... 5 El muestreo...

Más detalles

CAPITULO III A. GENERALIDADES

CAPITULO III A. GENERALIDADES CAPITULO III INVESTIGACION DE CAMPO SOBRE EL DISEÑO DE UN SISTEMA AUTOMATIZADO DE CONTROL INVENTARIO Y EXPEDIENTES DE MENORES DE EDAD PARA EL CENTRO DE DESARROLLO INTEGRAL LA TIENDONA EN LA ZONA METROPOLITANA

Más detalles

Para optimizar este proceso lo dividiremos en etapas y deberemos tener bien claro el objetivo que debemos alcanzar en cada una de ellas:

Para optimizar este proceso lo dividiremos en etapas y deberemos tener bien claro el objetivo que debemos alcanzar en cada una de ellas: ETAPAS DEL PROCESO DE SELECCIÓN DE PERSONAL EN LAS EMPRESAS FAMILIARES En la actualidad muchas empresas familiares han evolucionado intentando aplicar técnicas adecuadas para el proceso de Selección de

Más detalles

EL PROCESO DE BENCHMARKING

EL PROCESO DE BENCHMARKING EL PROCESO DE BENCHMARKING Michael J. Spendolini El benchmarking es un proceso sistemático y continuo para evaluar los productos, servicios y procesos de trabajo de las organizaciones que son reconocidas

Más detalles

ÍNDICE 1. INTRODUCCIÓN... 4 2. PARTICIPANTES... 5. 2.1. Participantes por sector... 5. 2.2. Participantes por edad... 6

ÍNDICE 1. INTRODUCCIÓN... 4 2. PARTICIPANTES... 5. 2.1. Participantes por sector... 5. 2.2. Participantes por edad... 6 INFORME DE RESULTADOS DEL ESTUDIO DE SATISFACCIÓN DE USUARIOS UNIVERSIDAD DE ALMERÍA 2012 SERVICIO DE PLANIFICACIÓN, EVALUACIÓN Y CALIDAD CALIDAD DE LOS SERVICIOS ENERO 2013 ÍNDICE 1. INTRODUCCIÓN...

Más detalles

RESULTADOS CONSULTA CIUDADANA VIRTUAL. Consulta Laboral en Línea

RESULTADOS CONSULTA CIUDADANA VIRTUAL. Consulta Laboral en Línea RESULTADOS CONSULTA CIUDADANA VIRTUAL Consulta Laboral en Línea Septiembre, 2015 1 Agradecimientos Ponemos a disposición de ustedes los resultados de la Consulta Ciudadana Virtual, efectuada en julio de

Más detalles

Metodología básica de gestión de proyectos. Octubre de 2003

Metodología básica de gestión de proyectos. Octubre de 2003 Metodología básica de gestión de proyectos Octubre de 2003 Dentro de la metodología utilizada en la gestión de proyectos el desarrollo de éstos se estructura en tres fases diferenciadas: Fase de Éjecución

Más detalles

Es de aplicación a todas aquellas situaciones en las que se necesita desplegar un objetivo para obtener una visión clara de cómo debe ser alcanzado.

Es de aplicación a todas aquellas situaciones en las que se necesita desplegar un objetivo para obtener una visión clara de cómo debe ser alcanzado. DIAGRAMA DE AÁRBOL 1.- INTRODUCCIÓN Este documento describe el proceso de construcción de un Diagrama de Árbol, mediante el cual se dispone de una metodología simple y sistemática para la identificación

Más detalles

1 http://www.sencilloyrapido.com/

1 http://www.sencilloyrapido.com/ 1 Contenido Introducción 3 Que son las encuestas pagadas por internet?. 5 Como ganar dinero con las encuestas pagadas por internet. 7 Pueden las encuestas pagadas generarte un ingreso decente?.. 9 Conclusión.

Más detalles

Módulo: Indicadores de Eficacia y Eficiencia en los Procesos

Módulo: Indicadores de Eficacia y Eficiencia en los Procesos Diplomatura en Lean Manufacturing (Manufactura Esbelta) Módulo: Indicadores de Eficacia y Eficiencia en los Procesos Docente: Javier Mejía Nieto MANUAL DE INDICADORES DE PRODUCTIVIDAD Ministerio de trabajo

Más detalles

Profunda comprensión de que valores son o podrían ser percibidos por los clientes.

Profunda comprensión de que valores son o podrían ser percibidos por los clientes. Estrategias de retención de clientes para servicios El valor concebido por el cliente de servicio se basa en una estrategia de conocimientos, ya que con el conocimiento que posee la empresa, puede emplear

Más detalles

INTRODUCCIÓN: Una Visión Global del Proceso de Creación de Empresas

INTRODUCCIÓN: Una Visión Global del Proceso de Creación de Empresas INTRODUCCIÓN: Una Visión Global del Proceso de Creación de Empresas 1 INTRODUCCIÓN. Una visión global del proceso de creación de empresas Cuando se analiza desde una perspectiva integral el proceso de

Más detalles

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas.

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas. El primer paso en el diseño de una base de datos es la producción del esquema conceptual. Normalmente, se construyen varios esquemas conceptuales, cada uno para representar las distintas visiones que los

Más detalles

CMMI (Capability Maturity Model Integrated)

CMMI (Capability Maturity Model Integrated) CMMI (Capability Maturity Model Integrated) El SEI (software engineering institute) a mediados de los 80 desarrolló el CMM (modelo de madurez de la capacidad de software). CMMI: CMM integrado, una mezcla

Más detalles

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual Introducción Algunas de las personas que trabajan con SGBD relacionales parecen preguntarse porqué deberían preocuparse del diseño de las bases de datos que utilizan. Después de todo, la mayoría de los

Más detalles

Diseño de un estudio de investigación de mercados

Diseño de un estudio de investigación de mercados Diseño de un estudio de investigación de mercados En cualquier diseño de un proyecto de investigación de mercados, es necesario especificar varios elementos como las fuentes a utilizar, la metodología,

Más detalles

Gestión y Desarrollo de Requisitos en Proyectos Software

Gestión y Desarrollo de Requisitos en Proyectos Software Gestión y Desarrollo de Requisitos en Proyectos Software Ponente: María Jesús Anciano Martín Objetivo Objetivo Definir un conjunto articulado y bien balanceado de métodos para el flujo de trabajo de Ingeniería

Más detalles

PROYECTO GESTIÓN POR PROCESOS: INFORME DE AUTOEVALUACIÓN MEDIANTE CUESTIONARIO

PROYECTO GESTIÓN POR PROCESOS: INFORME DE AUTOEVALUACIÓN MEDIANTE CUESTIONARIO PROYECTO GESTIÓN POR PROCESOS: INFORME DE AUTOEVALUACIÓN MEDIANTE CUESTIONARIO UNIDAD: TÉCNICOS DE LABORATORIOS DE DEPARTAMENTOS, CENTROS E INSTITUTOS DE INVESTIGACIÓN (UTLA). Fecha de realización: DICIEMBRE

Más detalles

determinar la competencia necesaria de las personas que realizan, bajo su control, un trabajo que afecta a su desempeño ambiental;

determinar la competencia necesaria de las personas que realizan, bajo su control, un trabajo que afecta a su desempeño ambiental; Soporte 6Claves para la ISO 14001-2015 BLOQUE 7: Soporte La planificación, como elemento fundamental del Ciclo PDCA (plan-do-check-act) de mejora continua en el que se basa el estándar ISO 14001, resulta

Más detalles

Sistemas de Gestión de Calidad. Control documental

Sistemas de Gestión de Calidad. Control documental 4 Sistemas de Gestión de Calidad. Control documental ÍNDICE: 4.1 Requisitos Generales 4.2 Requisitos de la documentación 4.2.1 Generalidades 4.2.2 Manual de la Calidad 4.2.3 Control de los documentos 4.2.4

Más detalles

Tratamiento del Riesgo

Tratamiento del Riesgo Tratamiento del Riesgo 1 En que consiste el tratamiento de los riesgos? 2. Cuando debemos enfrentarnos a los riesgos? 3. Estrategias de tratamiento de riesgos 4. Modelo de Análisis de Riesgos 5. Qué pasos

Más detalles

INVESTIGACIÓN DE MERCADOS

INVESTIGACIÓN DE MERCADOS INVESTIGACIÓN DE MERCADOS UDELAR RRII 2011 LIC. (MAG) IGNACIO BARTESAGHI INVESTIGACIÓN DE MERCADO (1) Definición de Schoell y Guiltinan: La investigación de mercados es la función que enlaza al consumidor,

Más detalles

CONCLUSIONES. De la información total que acabamos de facilitar al lector podemos realizar el siguiente resumen:

CONCLUSIONES. De la información total que acabamos de facilitar al lector podemos realizar el siguiente resumen: CONCLUSIONES De la información total que acabamos de facilitar al lector podemos realizar el siguiente resumen: 1º. Ha habido un incremento en el número total de consultas y reclamaciones ante las asociaciones

Más detalles

Los principales conceptos para mejorar la gestión de Marketing: preguntas clave

Los principales conceptos para mejorar la gestión de Marketing: preguntas clave Los principales conceptos para mejorar la gestión de Marketing: preguntas clave Luis Muñiz Economista y Consultor en sistemas de información y estrategia Nos puede describir que es la gestión de Marketing

Más detalles

www.fundibeq.org Además se recomienda su uso como herramienta de trabajo dentro de las actividades habituales de gestión.

www.fundibeq.org Además se recomienda su uso como herramienta de trabajo dentro de las actividades habituales de gestión. TORMENTA DE IDEAS 1.- INTRODUCCIÓN Este documento sirve de guía para la realización de una Tormenta de Ideas, también llamado "Brainstorming o Lluvia de ideas, la herramienta por medio de la cual se puede

Más detalles

K2BIM Plan de Investigación - Comparación de herramientas para la parametrización asistida de ERP Versión 1.2

K2BIM Plan de Investigación - Comparación de herramientas para la parametrización asistida de ERP Versión 1.2 K2BIM Plan de Investigación - Comparación de herramientas para la parametrización asistida de ERP Versión 1.2 Historia de revisiones Fecha VersiónDescripción Autor 08/10/2009 1.0 Creación del documento.

Más detalles

PLAN DE MEJORAS. Herramienta de trabajo. Agencia Nacional de Evaluación de la Calidad y Acreditación

PLAN DE MEJORAS. Herramienta de trabajo. Agencia Nacional de Evaluación de la Calidad y Acreditación PLAN DE MEJORAS Herramienta de trabajo Agencia Nacional de Evaluación de la Calidad y Acreditación Índice 1 Introducción...3 2 Pasos a seguir para la elaboración del plan de mejoras...5 2.1 Identificar

Más detalles

0. Introducción. 0.1. Antecedentes

0. Introducción. 0.1. Antecedentes ISO 14001:2015 0. Introducción 0.1. Antecedentes Conseguir el equilibrio entre el medio ambiente, la sociedad y la economía está considerado como algo esencial para satisfacer las necesidades del presente

Más detalles

CAPITULO III MARCO METODOLÓGICO. Desde la perspectiva de Hurtado de Barrera (2008), el tipo de

CAPITULO III MARCO METODOLÓGICO. Desde la perspectiva de Hurtado de Barrera (2008), el tipo de CAPITULO III MARCO METODOLÓGICO 1. TIPO DE INVESTIGACIÓN Desde la perspectiva de Hurtado de Barrera (2008), el tipo de investigación que propone soluciones a una situación determinada a partir de un proceso

Más detalles

Mantenimiento de Sistemas de Información

Mantenimiento de Sistemas de Información de Sistemas de Información ÍNDICE DESCRIPCIÓN Y OBJETIVOS... 1 ACTIVIDAD MSI 1: REGISTRO DE LA PETICIÓN...4 Tarea MSI 1.1: Registro de la Petición... 4 Tarea MSI 1.2: Asignación de la Petición... 5 ACTIVIDAD

Más detalles

E 6.3-2 Evaluación de pilotos. : Versión: 0.1 Fecha: 07/02/13 Autor: Pablo Martín Email: Pablo.martin@logica.com

E 6.3-2 Evaluación de pilotos. : Versión: 0.1 Fecha: 07/02/13 Autor: Pablo Martín Email: Pablo.martin@logica.com E 6.3-2 Evaluación de pilotos : Versión: 0.1 Fecha: 07/02/13 Autor: Pablo Martín Email: Pablo.martin@logica.com Historial de cambios Versión Fecha Autor Cambios 0.1 10/12/12 Pablo Martín Blanco Versión

Más detalles

Este documento enumera los diferentes tipos de Diagramas Matriciales y su proceso de construcción. www.fundibeq.org

Este documento enumera los diferentes tipos de Diagramas Matriciales y su proceso de construcción. www.fundibeq.org DIAGRAMA MATRICIAL 1.- INTRODUCCIÓN Este documento enumera los diferentes tipos de Diagramas Matriciales y su proceso de construcción. Muestra su potencial, como herramienta indispensable para la planificación

Más detalles

Cómo sistematizar una experiencia?

Cómo sistematizar una experiencia? Cómo sistematizar una experiencia? Una sistematización puede llevarse a cabo de múltiples formas, y además puede ser llevada a cabo por cualquier persona sin necesidad de ser especialista en la materia.

Más detalles

EDI. por dónde empezar? Intercambio Electrónico de Datos (EDI), Intercambio Electrónico de Datos (EDI), Intercambio Electrónico de Datos (EDI)

EDI. por dónde empezar? Intercambio Electrónico de Datos (EDI), Intercambio Electrónico de Datos (EDI), Intercambio Electrónico de Datos (EDI) EDI por dónde empezar? Intercambio Electrónico de Datos (EDI), Intercambio Electrónico de Datos (EDI), Intercambio Electrónico de Datos (EDI) El EDI (Electronic Data Interchange) es el sistema electrónico

Más detalles

ANEXO 26-A COMITÉ PERMANENTE DE INTERPRETACIÓN SIC N 32 ACTIVOS INTANGIBLES COSTOS DE SITIOS WEB. (Modificada en 2008) (IV Difusión)

ANEXO 26-A COMITÉ PERMANENTE DE INTERPRETACIÓN SIC N 32 ACTIVOS INTANGIBLES COSTOS DE SITIOS WEB. (Modificada en 2008) (IV Difusión) ANEXO 26-A COMITÉ PERMANENTE DE INTERPRETACIÓN SIC N 32 ACTIVOS INTANGIBLES COSTOS DE SITIOS WEB (Modificada en 2008) (IV Difusión) Interpretación SIC-32 Activos Intangibles - Costos de Sitios Web Referencias

Más detalles

CAPITULO I. Introducción. En la actualidad, las empresas están tomando un papel activo en cuanto al uso de sistemas y

CAPITULO I. Introducción. En la actualidad, las empresas están tomando un papel activo en cuanto al uso de sistemas y CAPITULO I Introducción 1.1 Introducción En la actualidad, las empresas están tomando un papel activo en cuanto al uso de sistemas y redes computacionales. La tecnología ha ido evolucionando constantemente

Más detalles

Operación 8 Claves para la ISO 9001-2015

Operación 8 Claves para la ISO 9001-2015 Operación 8Claves para la ISO 9001-2015 BLOQUE 8: Operación A grandes rasgos, se puede decir que este bloque se corresponde con el capítulo 7 de la antigua norma ISO 9001:2008 de Realización del Producto,

Más detalles

Mejora de la Calidad de Servicio al Cliente

Mejora de la Calidad de Servicio al Cliente Soluciones Profiles Coaching&Conmunications La experiencia del cliente influye en su fidelización Un Cliente satisfecho no siempre es un cliente leal bien la satisfacción es importante, no es suficiente

Más detalles

MANEJO DE QUEJAS Y RECLAMOS

MANEJO DE QUEJAS Y RECLAMOS MANEJO DE QUEJAS Y RECLAMOS Derechos reservados ICONTEC- 1 OBJETIVO GENERAL Proponer una metodología para la planeación, diseño, operación, mantenimiento y mejora de un proceso para el manejo de los reclamos

Más detalles

Análisis y cuantificación del Riesgo

Análisis y cuantificación del Riesgo Análisis y cuantificación del Riesgo 1 Qué es el análisis del Riesgo? 2. Métodos M de Análisis de riesgos 3. Método M de Montecarlo 4. Modelo de Análisis de Riesgos 5. Qué pasos de deben seguir para el

Más detalles

LA LOGÍSTICA COMO FUENTE DE VENTAJAS COMPETITIVAS

LA LOGÍSTICA COMO FUENTE DE VENTAJAS COMPETITIVAS LA LOGÍSTICA COMO FUENTE DE VENTAJAS COMPETITIVAS Los clientes compran un servicio basandose en el valor que reciben en comparacion con el coste en el que incurren. Por, lo tanto, el objetivo a largo plazo

Más detalles

GUIA GENERAL PARA LA EVALUACION DE PROGRAMAS

GUIA GENERAL PARA LA EVALUACION DE PROGRAMAS GUIA GENERAL PARA LA EVALUACION DE PROGRAMAS A. Introducción La evaluación de un programa supone la colección sistemática de datos y el análisis e interpretación de los mismos, con el propósito de determinar

Más detalles

Programa de Criminología UOC

Programa de Criminología UOC Programa de Criminología UOC Trabajo Final de Grado Presentación Descripción La asignatura en el conjunto del plan de estudios Campos profesionales en que se proyecta Conocimientos previos Objetivos y

Más detalles

Parte I: Introducción

Parte I: Introducción Parte I: Introducción Introducción al Data Mining: su Aplicación a la Empresa Cursada 2007 POR QUÉ? Las empresas de todos los tamaños necesitan aprender de sus datos para crear una relación one-to-one

Más detalles

Metodología de la Investigación. Dr. Cristian Rusu cristian.rusu@ucv.cl

Metodología de la Investigación. Dr. Cristian Rusu cristian.rusu@ucv.cl Metodología de la Investigación Dr. Cristian Rusu cristian.rusu@ucv.cl 6. Diseños de investigación 6.1. Diseños experimentales 6.1.1. Diseños preexperimentales 6.1.2. Diseños experimentales verdaderos

Más detalles

PERFIL DEL PUESTO POR COMPETENCIAS Sepa cómo construirlo y evitar bajos desempeños posteriores

PERFIL DEL PUESTO POR COMPETENCIAS Sepa cómo construirlo y evitar bajos desempeños posteriores PERFIL DEL PUESTO POR COMPETENCIAS Sepa cómo construirlo y evitar bajos desempeños posteriores Martha Alicia Alles Es contadora pública nacional, doctora por la Universidad de Buenos Aires en la especialidad

Más detalles

Este documento proporciona la secuencia de pasos necesarios para la construcción de un Diagrama de Flujo. www.fundibeq.org

Este documento proporciona la secuencia de pasos necesarios para la construcción de un Diagrama de Flujo. www.fundibeq.org DIAGRAMA DE FLUJO 1.- INTRODUCCIÓN Este documento proporciona la secuencia de pasos necesarios para la construcción de un Diagrama de Flujo. Muestra la importancia de dos aspectos clave en este proceso:

Más detalles

REPORTE DE CUMPLIMIENTO ISO 17799

REPORTE DE CUMPLIMIENTO ISO 17799 Diseño de Reporte de Auditoría A continuación se presenta una plantilla del informe de auditoría de conformidad con la norma ISO 17799 que genera el sistema. REPORTE DE CUMPLIMIENTO ISO 17799 UNIDAD AUDITADA

Más detalles

-OPS/CEPIS/01.61(AIRE) Original: español Página 11 5. Estructura del programa de evaluación con personal externo

-OPS/CEPIS/01.61(AIRE) Original: español Página 11 5. Estructura del programa de evaluación con personal externo Página 11 5. Estructura del programa de evaluación con personal externo 5.1 Introducción Esta sección presenta la estructura del programa de evaluación con personal externo. Describe las funciones y responsabilidades

Más detalles

FUENTES SECUNDARIAS INTERNAS

FUENTES SECUNDARIAS INTERNAS FUENTES SECUNDARIAS INTERNAS Las fuentes secundarias son informaciones que se encuentran ya recogidas en la empresa, aunque no necesariamente con la forma y finalidad que necesita un departamento de marketing.

Más detalles

Introducción. Definición de los presupuestos

Introducción. Definición de los presupuestos P o r q u é e l p r e s u p u e s t o d e b e s e r e l c a m i n o a s e g u i r p a r a g a r a n t i z a r e l é x i t o d e s u e m p r e s a? Luis Muñiz Economista Introducción El aumento de la incertidumbre

Más detalles

MIRAR AFUERA PARA CONSTRUIR ADENTRO

MIRAR AFUERA PARA CONSTRUIR ADENTRO MIRAR AFUERA PARA CONSTRUIR ADENTRO El principal problema de muchos emprendedores se centra en la manera de hacer realidad su idea de negocio. La gran mayoría antepone su criterio y gustos personales en

Más detalles

Validation. Validación Psicométrica. Validation. Central Test. Central Test. Centraltest CENTRAL. L art de l évaluation. El arte de la evaluación

Validation. Validación Psicométrica. Validation. Central Test. Central Test. Centraltest CENTRAL. L art de l évaluation. El arte de la evaluación Validation Validación Psicométrica L art de l évaluation Validation Central Test Central Test Centraltest L art de l évaluation CENTRAL test.com El arte de la evaluación www.centraltest.com Propiedades

Más detalles

Planificación de Sistemas de Información

Planificación de Sistemas de Información Planificación de Sistemas de Información ÍNDICE DESCRIPCIÓN Y OBJETIVOS...1 ACTIVIDAD 1: INICIO DEL PLAN DE SISTEMAS DE INFORMACIÓN...4 Tarea 1.1: Análisis de la Necesidad del...4 Tarea 1.2: Identificación

Más detalles

M.T.I. Arturo López Saldiña

M.T.I. Arturo López Saldiña M.T.I. Arturo López Saldiña Hoy en día, existen diversas aproximaciones al tema de cómo hacer que las personas trabajen dentro de una organización de manera colaborativa. El problema se vuelve más difícil

Más detalles

INFORME DE ANÁLISIS DE ENCUESTAS DE SATISFACCIÓN DE USUARIOS PERÍODO 2009-2010

INFORME DE ANÁLISIS DE ENCUESTAS DE SATISFACCIÓN DE USUARIOS PERÍODO 2009-2010 INFORME DE ANÁLISIS DE ENCUESTAS DE SATISFACCIÓN DE USUARIOS PERÍODO 2009-2010 UNIDAD FUNCIONAL DE TÉCNICOS DE LABORATORIOS DOCENTES UNIVERSIDAD PABLO DE OLAVIDE. SEVILLA Sevilla, Diciembre de 2010 1 1.

Más detalles

Planificación de Sistemas de Información

Planificación de Sistemas de Información Planificación de Sistemas de Información ÍNDICE DESCRIPCIÓN Y OBJETIVOS... 1 ACTIVIDAD 1: INICIO DEL PLAN DE SISTEMAS DE INFORMACIÓN... 4 Tarea 1.1: Análisis de la Necesidad del... 4 Tarea 1.2: Identificación

Más detalles

Módulo 7: Los activos de Seguridad de la Información

Módulo 7: Los activos de Seguridad de la Información Módulo 7: Los activos de Seguridad de la Información Se explica en este tema cómo deben abordarse la elaboración de un inventario de activos que recoja los principales activos de información de la organización,

Más detalles

II. Estudio de satisfacción de los titulados y empleadores respecto al desempeño laboral de los profesionales de la UBB Introducción

II. Estudio de satisfacción de los titulados y empleadores respecto al desempeño laboral de los profesionales de la UBB Introducción II. Estudio de satisfacción de los titulados y empleadores respecto al desempeño laboral de los profesionales de la UBB Introducción Una de las finalidades del Convenio de Desempeño hace referencia a mejorar

Más detalles

1 ENCUESTA DE CUESTIONARIO

1 ENCUESTA DE CUESTIONARIO 1 ENCUESTA DE CUESTIONARIO 1.1 Por qué utilizar esta herramienta en evaluación? La encuesta de cuestionario es una herramienta de observación que permite cuantificar y comparar la información. Esta información

Más detalles

TALLER BÁSICO DE EXPERIMENTOS CONTROLADOS ALEATORIOS

TALLER BÁSICO DE EXPERIMENTOS CONTROLADOS ALEATORIOS TALLER BÁSICO DE EXPERIMENTOS CONTROLADOS ALEATORIOS 1. INTRODUCCIÓN Y JUSTIFICACIÓN Este Taller Básico de Experimentos Controlados Aleatorios (ECA) está dirigido a profesionales de la salud interesados

Más detalles

Criterio 2: Política y estrategia

Criterio 2: Política y estrategia Criterio 2: Política y estrategia Definición. Cómo implanta el servicio su misión, y visión mediante una estrategia claramente centrada en todos los grupos de interés y apoyada por políticas, planes, objetivos,

Más detalles

ANEXO : PERFILES. Guía de Comunicación Digital para la Administración General del Estado. ANEXO PERFILES

ANEXO : PERFILES. Guía de Comunicación Digital para la Administración General del Estado. ANEXO PERFILES ANEXO : PERFILES Guía de Comunicación Digital para la Administración General del Estado. ANEXO PERFILES ANEXO: PERFILES. 3 1. REQUISITOS ANTES DE TENER EL SITIO WEB. 4 1.1 TOMA DE REQUISITOS. 4 1.2 ANÁLISIS

Más detalles

de la empresa Al finalizar la unidad, el alumno:

de la empresa Al finalizar la unidad, el alumno: de la empresa Al finalizar la unidad, el alumno: Identificará el concepto de rentabilidad. Identificará cómo afecta a una empresa la rentabilidad. Evaluará la rentabilidad de una empresa, mediante la aplicación

Más detalles

Guía de los cursos. Equipo docente:

Guía de los cursos. Equipo docente: Guía de los cursos Equipo docente: Dra. Bertha Patricia Legorreta Cortés Dr. Eduardo Habacúc López Acevedo Introducción Las organizaciones internacionales, las administraciones públicas y privadas así

Más detalles

Gestión de la Configuración

Gestión de la Configuración Gestión de la ÍNDICE DESCRIPCIÓN Y OBJETIVOS... 1 ESTUDIO DE VIABILIDAD DEL SISTEMA... 2 ACTIVIDAD EVS-GC 1: DEFINICIÓN DE LOS REQUISITOS DE GESTIÓN DE CONFIGURACIÓN... 2 Tarea EVS-GC 1.1: Definición de

Más detalles

Gestión de Configuración del Software

Gestión de Configuración del Software Gestión de Configuración del Software Facultad de Informática, ciencias de la Comunicación y Técnicas Especiales Herramientas y Procesos de Software Gestión de Configuración de SW Cuando se construye software

Más detalles

Administración del conocimiento y aprendizaje organizacional.

Administración del conocimiento y aprendizaje organizacional. Capítulo 2 Administración del conocimiento y aprendizaje organizacional. 2.1 La Importancia Del Aprendizaje En Las Organizaciones El aprendizaje ha sido una de las grandes necesidades básicas del ser humano,

Más detalles

ISO 9001:2000 DOCUMENTO INFORMATIVO DOCUMENTO ELABORADO POR CHRISTIAN NARBARTE PARA EL IVECE

ISO 9001:2000 DOCUMENTO INFORMATIVO DOCUMENTO ELABORADO POR CHRISTIAN NARBARTE PARA EL IVECE ISO 9001:2000 DOCUMENTO INFORMATIVO DOCUMENTO ELABORADO POR CHRISTIAN NARBARTE PARA EL IVECE MARZO 2007 Este documento contesta las preguntas más frecuentes que se plantean las organizaciones que quieren

Más detalles

Valores cuantitativos estimados para los indicadores y su justificación.

Valores cuantitativos estimados para los indicadores y su justificación. RESULTADOS PREVISTOS Valores cuantitativos estimados para los indicadores y su justificación. Las estimaciones realizadas proceden del análisis de la tendencia de estos valores en años anteriores. Intentamos

Más detalles

Planeación del Proyecto de Software:

Planeación del Proyecto de Software: Apéndice A. Cuestionarios del Sistema Evaluador Nivel2. Requerimientos de Administración: Goal 1: Los requerimientos del sistema asociados a software están bien controlados y existe un estándar para los

Más detalles

CONSULTORES EN GESTIÓN DE LA CALIDAD. INSTRUCCIONES PARA SU EMPLEO.

CONSULTORES EN GESTIÓN DE LA CALIDAD. INSTRUCCIONES PARA SU EMPLEO. CONSULTORES EN GESTIÓN DE LA CALIDAD. INSTRUCCIONES PARA SU EMPLEO. Por Giancarlo Colferai. La decisión de implementar un SGC puede ser el primer contacto real de la organización con el Mundo de la ISO

Más detalles

NORMA INTERNACIONAL DE AUDITORÍA 520 PROCEDIMIENTOS ANALÍTICOS

NORMA INTERNACIONAL DE AUDITORÍA 520 PROCEDIMIENTOS ANALÍTICOS NORMA INTERNACIONAL DE AUDITORÍA 520 PROCEDIMIENTOS ANALÍTICOS (NIA-ES 520) (adaptada para su aplicación en España mediante Resolución del Instituto de Contabilidad y Auditoría de Cuentas, de 15 de octubre

Más detalles

Master en Gestion de la Calidad

Master en Gestion de la Calidad Master en Gestion de la Calidad 3. La Calidad en la Actualidad La calidad en la actualidad 1 / 9 OBJETIVOS Al finalizar esta unidad didáctica será capaz: Conocer la calidad en la actualidad. La familia

Más detalles

PROPUESTA METODOLOGICA PARA LA EDUCCIÓN DE REQUISITOS EN PROYECTOS DE EXPLOTACIÓN DE INFORMACIÓN

PROPUESTA METODOLOGICA PARA LA EDUCCIÓN DE REQUISITOS EN PROYECTOS DE EXPLOTACIÓN DE INFORMACIÓN PROPUESTA METODOLOGICA PARA LA EDUCCIÓN DE REQUISITOS EN PROYECTOS DE EXPLOTACIÓN DE INFORMACIÓN Paola Britos 1,2, Enrique Fernandez 1,2, Ramón García-Martinez 1,2 Centro de Ingeniería del Software e Ingeniería

Más detalles

Capitulo 3: Metodología de Investigación.

Capitulo 3: Metodología de Investigación. Capitulo 3: Metodología de Investigación. 3.1 Introducción. Con el propósito de describir el sector económico en el cual se pretende incursionar y ayude para una correcta realización del plan de negocios

Más detalles

Técnicas de valor presente para calcular el valor en uso

Técnicas de valor presente para calcular el valor en uso Normas Internacionales de Información Financiera NIC - NIIF Guía NIC - NIIF NIC 36 Fundación NIC-NIIF Técnicas de valor presente para calcular el valor en uso Este documento proporciona una guía para utilizar

Más detalles

ISO9001:2015. Todos los certificados emitidos en este periodo tienen una fecha de caducidad de 15 de septiembre de 2018.

ISO9001:2015. Todos los certificados emitidos en este periodo tienen una fecha de caducidad de 15 de septiembre de 2018. ISO9001:2015 PLAN DE TRANSICIÓN Tras la publicación de la nueva versión de la norma ISO9001 el pasado mes de septiembre se inicia un periodo de convivencia entre las dos versiones de la norma. Este periodo

Más detalles

Empresa de telefonía celular: Transintelcel

Empresa de telefonía celular: Transintelcel Empresa de telefonía celular: Transintelcel El proceso metodológico de esta investigación de mercados está dividido en las siguientes etapas: 1. Datos generales de la empresa 2. Planteamiento del problema

Más detalles

Decisión: Indican puntos en que se toman decisiones: sí o no, o se verifica una actividad del flujo grama.

Decisión: Indican puntos en que se toman decisiones: sí o no, o se verifica una actividad del flujo grama. Diagrama de Flujo La presentación gráfica de un sistema es una forma ampliamente utilizada como herramienta de análisis, ya que permite identificar aspectos relevantes de una manera rápida y simple. El

Más detalles

MEDICION DEL TRABAJO

MEDICION DEL TRABAJO MEDICION DEL TRABAJO Habíamos dicho al comenzar el curso que habían 4 técnicas que permiten realizar una medición del trabajo 1 Técnicas Directas: - Estudio de tiempos con cronómetro - Muestreo del trabajo

Más detalles

Trabajo lean (1): A que podemos llamar trabajo lean?

Trabajo lean (1): A que podemos llamar trabajo lean? Trabajo lean (1): A que podemos llamar trabajo lean? Jordi Olivella Nadal Director de Comunicación del Instituto Lean Management Este escrito inicia una serie de artículos sobre la organización en trabajo

Más detalles

Guía EMPRESA INTELIGENTE 2.0 para la PYME

Guía EMPRESA INTELIGENTE 2.0 para la PYME Guía EMPRESA INTELIGENTE 2.0 para la PYME Consejos para desarrollar la gestión del cambio, tomar decisiones de manera ágil y eficaz y planificar estrategias atendiendo a los procesos como célula básica

Más detalles

COMPETENCIAS. Máster universitario en Gestión y Dirección de Empresas e Instituciones Turísticas (GDEIT)

COMPETENCIAS. Máster universitario en Gestión y Dirección de Empresas e Instituciones Turísticas (GDEIT) COMPETENCIAS Máster universitario en Gestión y Dirección de Empresas e Instituciones Turísticas (GDEIT) COMPETENCIAS GENERALES Y BÁSICAS En términos amplios, el Máster en GDEIT se dirige a profundizar

Más detalles

2 EL DOCUMENTO DE ESPECIFICACIONES

2 EL DOCUMENTO DE ESPECIFICACIONES Ingeniería Informática Tecnología de la Programación TEMA 1 Documentación de programas. 1 LA DOCUMENTACIÓN DE PROGRAMAS En la ejecución de un proyecto informático o un programa software se deben de seguir

Más detalles

Conceptos articuladores para el desarrollo de los proyectos del programa de Estudio. 1. Formulación de la situación problema.

Conceptos articuladores para el desarrollo de los proyectos del programa de Estudio. 1. Formulación de la situación problema. Conceptos articuladores para el desarrollo de los proyectos del programa de Estudio. El Programa de Educación Tecnológica propone una metodología de trabajo para los alumnos y alumnas basada en el desarrollo

Más detalles

Prácticas ITIL para un mejor flujo de trabajo en el helpdesk

Prácticas ITIL para un mejor flujo de trabajo en el helpdesk Prácticas ITIL para un mejor flujo de trabajo en el helpdesk Se diferencia tres partes de gestión para mejorar la resolución de las incidencias de soporte técnico según el marco ITIL: 1. Gestión de Incidencias

Más detalles

MANUAL DE SEGUIMIENTO Y EVALUACIÓN

MANUAL DE SEGUIMIENTO Y EVALUACIÓN MANUAL DE SEGUIMIENTO Y EVALUACIÓN INDICE 1. INTRODUCCIÓN Pág. 3 2. QUÉ ES ACTIVE PROGRESS? Pág. 6 3. FASES DEL PROCESO DE EVALUACIÓN Pág. 9 4. SUBCOMITÉ DE SEGUIMIENTO Pág.12 5. CUESTIONARIOS DE SEGUIMIENTO

Más detalles

Adaptación del producto

Adaptación del producto Adaptación del producto 3 Muchas empresas comienzan su proceso de internacionalización buscando mercados extranjeros para sus productos o servicios existentes. La decisión de entrada se basa en informaciones

Más detalles

Curso: Arquitectura Empresarial basado en TOGAF

Curso: Arquitectura Empresarial basado en TOGAF Metodología para desarrollo de Arquitecturas (ADM) El ADM TOGAF es el resultado de las contribuciones continuas de un gran número de practicantes de arquitectura. Este describe un método para el desarrollo

Más detalles