Mineria de Grafos en Redes Sociales usando MapReduce



Documentos relacionados
ARQUITECTURA DE DISTRIBUCIÓN DE DATOS

Capítulo 1. Propósito del proyecto

Aprendiendo con las redes sociales

Colección de Tesis Digitales Universidad de las Américas Puebla. Morales Salcedo, Raúl

CAPITULO 1. INTRODUCCIÓN

Licenciatura en Computación

Modelos y Bases de Datos

NORMA TÉCNICA DE AUDITORÍA SOBRE CONSIDERACIONES RELATIVAS A LA AUDITORÍA DE ENTIDADES QUE EXTERIORIZAN PROCESOS DE ADMINISTRACIÓN

Diseño Estructurado de Algoritmos

UNA LECCIÓN DE ESTEREOMETRÍA ASISTIDA POR COMPUTADORA

GLOSARIO DE PREGUNTAS DE SELECCIÓN DE PERSONAL BASADA EN COMPETENCIAS

32 - CÓMO PROGRAM A R AC T I V I D A D E S E N

Conclusiones. Particionado Consciente de los Datos

REGLAMENTO DE PRACTICAS PRE-PROFESIONALES EN LA CARRERA DE INGENIERÍA CIVIL EN COMPUTACION. Introducción

Electrificación en zonas rurales mediante sistemas híbridos

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK.

CARRERA DE CIECNIAS DE LA COMPUTACIÓN PROGRAMA DE ESTUDIO. Teóricos: 2 Práctico: 2 Total 4

CAPITULO 1 INTRODUCCIÓN. Puesta en Evidencia de un circulo virtuoso creado por los SRI entre los Mercados Financieros y las Empresas

Propuesta de Trabajo. nuestro proyecto emprendedor I

Estructuras de Control - Diagrama de Flujo

Gestión de la evaluación en el Aprendizaje Basado en Proyectos

Infraestructura Tecnológica. Sesión 12: Niveles de confiabilidad

AHORRO ENERGÉTICO DOMÉSTICO. NIVEL DE IMPLANTACIÓN.

Tarea 7 Soluciones. Sol. Sea x el porcentaje que no conocemos, entonces tenemos la siguiente. (3500)x = 420. x = = 3 25

Revisión del Universo de empresas para la Estimación de los Datos Del Mercado Español de Investigación de Mercados y Opinión.

ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL Facultad de Ingeniera en Electricidad y Computación

CAMPUS FUNDACIÓN VALENCIA CF

Su éxito se mide por la pertinencia y la oportunidad de la solución, su eficacia y eficiencia.

VALORES CORPORATIVOS GRIFOLS

1. Introducción al evaluación de proyectos

PRÁCTICA TECNOLOGÍAS DE LA INFORMACIÓN. Objetivos

DINÁMICAS PARA GRUPOS MULTICULTURALES. Las dinámicas que aportamos ofrecen posibilidades didácticas para desarrollar con grupos multiculturales.

02. Cuáles son los objetivos específicos? 03. A qué audiencias se dirige? Cuál es/son el/los público/s objetivo?

VENTAJAS Y DESVENTAJAS DE LAS TECNOLOGIAS

CAPITULO I INTRODUCCION Y ANALISIS DEL SISTEMA CNC

Jugamos al Bingo matemático

Tema: Gestión del Conocimiento y Comercio Electrónico. Profesor: Lic. Rosa Oralia Saenz Hernández.

FACULTAD DE CIENCIAS EMPRESARIALES PROYECTO INTEGRADOR TEC. GESTION EMPRESARIAL

Actividades para mejoras. Actividades donde se evalúa constantemente todo el proceso del proyecto para evitar errores y eficientar los procesos.

MUNICIPALIDAD DE ROSARIO SECRETARIA DE SERVICIOS PUBLICOS Y MEDIO AMBIENTE DIRECCION GENERAL DE POLÍTICA AMBIENTAL PROGRAMA SEPARE

Equipos de Innovación en: Con el apoyo de: Newsletter Noviembre e+ i emoción + innovación. Artez Euskara Zerbitzua, Koop E

Calendarios: cuando la agenda se complica

PONENTE ING. JORGE MARTINEZ RODRIGUEZ ONE-CUBA

PRUEBAS DE SOFTWARE TECNICAS DE PRUEBA DE SOFTWARE

Semana de la Informática y la Tecnología. Laureate International Universities

CONCLUSIONES: REFLEXIONES Y RECOMENDACIONES. A lo largo de éste trabajo se realizó una investigación acerca del papel que el UNICEF,

Determinar el tiempo de realizar las diferentes actividades para la implementación del sistema EVECP.

LAS NUEVAS TECNOLOGÍAS DE LA INFORMACIÓN Y DE LA COMUNICACIÓN (TIC) EN LA EDUCACIÓN.

Documento de Arquitectura de Software. KunaySoft. Autores: Juan Camilo González Vargas. Javier Leonardo Parra Laguna

Secuencia didáctica Adaptada. Almudena Ruiz Padilla

Plan de Estudios. Maestría en Matemáticas Aplicadas y Tecnologías Educativas

Capítulo II. Marco teórico.

GUÍA DEL ALUMNO. 1.- Estructura y contenido de la página web. 2.- Cómo usar esta página web. 3.- Contenidos. 4.- Metodología didáctica.

Escuela de Organización Industrial

SEGUNDO FORO INTERNACIONAL SOBRE LOS DERECHOS HUMANOS DE LAS PERSONAS MAYORES. Experiencias nacionales sobre derechos humanos de personas mayores

CAPÍTULO 1: INTRODUCCIÓN. El presente capítulo muestra una introducción al problema de Optimizar un Modelo de

Elementos requeridos para crearlos (ejemplo: el compilador)

CAPITULO 2: MARCO TEÓRICO

Bases de Datos Especializadas

IV JORNADAS DE INNOVACIÓN EDUCATIVA Y ENSEÑANZA VIRTUAL EN LA UNIVERSIDAD DE MÁLAGA

LAS NUEVAS METODOLOGIAS DIDACTICAS BASADAS EN INTERNET COMO FACTOR CLAVE PARA EL DESARROLLO DE LA TELEFORMACION

Proyecto MONO. Juantomás García. 1. Introducción. GNOME Hispano

PROGRAMA DE IMPLANTACIÓN PROGRESIVA DE LA COEDUCACIÓN EN EDUCACIÓN INFANTIL

Las instituciones privadas de educación se caracterizan por brindar una. formación integral a la sociedad; la propuesta educativa que se hace a la

TRABAJO COOPERATIVO EN ROBOTS

INFORMACIÓN ACADÉMICA

Artículo V522. Introducción a Google Analytics

6.2. e-learning como sustituto o como complemento a la educación presencial Plataformas e-learning en Primaria.

CUESTIONARIO PARA LA EVALUACIÓN DE CURSOS APOYADOS EN TECNOLOGÍAS DE LA INFORMACIÓN Y LA COMUNICACIÓN

Los cursos virtuales no son exitosos para todos: se requiere madurez y compromiso

Evaluación de políticas públicas con enfoque de género: 29 de septiembre Ponencia Susan W. Parker.

Transparencia Salamanca: Portal de Transparencia en pequeños municipios.

Arquitectura de sistema de alta disponibilidad

PRODUCTIVIDALIA. Mejora de la productividad y eficiencia energética

Qué es lo que su empresa necesita? Productividad? Organización? Eficiencia? Ahorro? Control? Seguridad?

LOS ANCIANOS Y LA SOLEDAD

PROPUESTA DE PLAN DE COMUNICACIÓN PARA LA CÁMARA DE COMERCIO E INDUSTRIA DE EL SALVADOR.

Cuestionario sobre marketing 2.0

Servicio de estadísticas de Alojamiento Fecha de revisión: 19/09/2005

Vicerrectoría Académica PROGRAMA DE APOYO ESTUDIANTIL

El outsourcing o tercerización u operador logístico

Material preparado por: C.P. Raúl H. Vallado Fernández, M.F. Rhvf.

En cualquier caso, tampoco es demasiado importante el significado de la "B", si es que lo tiene, lo interesante realmente es el algoritmo.

SAQQARA. Correlación avanzada y seguridad colaborativa_

Antecedentes. Objetivo general

Programa Institucional de Asesorías

Simulador Interactivo para Sistemas de Generación Distribuida Basados en Energías Renovables

Syllabus Geomarketing. Master Universitario en Gestión Comercial y Máster en Dirección de Marketing

LA REVOLUCIÓN DE LOS SISTEMAS DE INFORMACIÓN (S.I.) Introducción PORQUÉ SISTEMAS DE INFORMACIÓN? El Competitivo Entorno de los Negocios

WHITE PAPER. Encuesta: Los Periodistas de México y las Redes Sociales

DIAGRAMA DE CLASES EN UML

e-commerce, es hacer comercio utilizando la red. Es el acto de comprar y vender en y por medio de la red.

Descripción y tabla de especificaciones para prueba formativa Área Matemática Año 2014

GUÍA TÉCNICA PARA LA DEFINICIÓN DE COMPROMISOS DE CALIDAD Y SUS INDICADORES

PDA Personal Development Analysis. Manual de Feedback PDA Grupal

Guía de usuario web. [EL RECUERDO DE LA TIERRA Y EL AMOR A NUESTRA VIRGEN DEL MAR]

ÁREA DE CIENCIAS SOCIALES

El reto de la escuela del siglo XXI

LINEAMIENTOS BASICOS PARA EL DISEÑO Y ESTABLECIMIENTO DE SISTEMAS DE ALERTA TEMPRANA Juan Carlos Villagrán De León CIMDEN-VILLATEK, Guatemala

Como lo expresamos cuando describimos el problema objeto de

Transcripción:

Mineria de Grafos en Redes Sociales usando MapReduce Jose Gamez 1 and Jorge Pilozo 1 Carrera de Ingeniería en Sistemas Computacionales Universidad de Guayaquil 1. Introduccion a la Problematica Recordemos que en la actualidad estamos viviendo en la era o en la epoca de los datos.vivir en esta epoca ha sido gracias a los avances de las tecnologias de la informacion y de la comunicación que nos permite colectar y almacenar informacion de actividades comerciales;academicas; cientificas y de la vida cotidiana de cada individuo de esta epoca; que se lo realiza de manera facil y economica la recoleccion de la informacion anteriormente mencionada. Tambien debemos destacar o recalcar que el creciente desarrollo paulatino de la tecnologia en el campo de la educacion en la actualidad; esta contribuyendo en la mejora del aprendizaje academico del estudiante; donde se hace mas notable en la Educacion a Distancia; cuando se crearon las herramientas que facilitan la comunicación y la creacion del trabajo grupal; adicional con el uso de metodologias y tenicas que permite evaluar el uso de dichas herramientas mencionadas;proporcionando un relavente y significativo conocimiento con el descubrimiento de patrones que sirve para la toma de decisiones y por lo consiguiente, con el planteamiento de estrategias que nos permitan mejorar el proceso de enseñanza-aprendizaje entre los alumnos y el profesor que cada materia que se este estudiando. A nuestro grupo nos toca el tema a exponer sobre la Mineria de Grafos en redes sociales; donde no hemos abarcado durante todo el curso o le hemos orientado en el area de la educacion universitaria para ser mas especificos nuestro grupo lo hemos enfocado para la Universidad de Guayaquil de la carrera de Ingenieria en Sistemas Computacionales y Networking con sus respectivos alumnos o estudiantes de cada una de las carreras anteriormente mencionadas. 2. Antecendentes El campo que vamos abarcar sobre los antecendentes de Mineria de Grafos de Redes Sociales; es como en años anteriores los estudiantes de las carreras de Ingeniera en Sistemas Computacionales y Networking como han mejorado sustancialmente sus notas academicas o evaluaciones academicas desde se introdujo la famosa y potente red social llamada Facebook; se debe recalcar en los inicios de nuestra nuestra era dificil el acceso al internet por obvias razones conocidas. 3. Motivacion Es sobre el estudio de tecnicas para solucionar lo sigte: Obtener los nodos mas importantes 1

Determinar la influencia de estos nodos sobre el grafo Encontrar los patrones cercanos para alcanzar el maximo rendimiento 4. Datos, Gráficas o Análisis Estadísticos de las Variables Se ha planteado durante todo el curso las siguientes variables que hemos estando usando en el tema de la Minería de Grafos de Redes Sociales que son: Planteamiento y resolución de dudas sobre la asignatura Materias más buscadas por su difícil comprensión o temas no comprendidos en clase En el primer punto que se trata sobre el Planteamiento y resolución de dudas sobre la asignatura; quiere decir sobre las dudas puntuales que un estudiante de cualquiera de las dos carreras tienen sobre una materia en específico como por ejemplo: cuando uno estudiante no comprendió en clases el tema de Herencia de Clases en Java y entre otros ejemplo similares que podrían presentarles al estudiantado. El segundo tema que vamos a tratar es Materias más buscadas por su difícil comprensión o temas no comprendidos en clase; nos referimos a que materias que ha visto o esta viendo algún estudiante de cualquiera de las dos carreras se le ha complicado comprenderla; ya que puede presentar varias circunstancias que se le complicaría al estudiante; sea por el grado de complejidad de la misma materia; por falta de tiempo; por inasistencia a la curso; por cruce de materias entre otras alternativas que se le puede presentar al estudiante. Temática fotos y frecuencia Frecuencia de consulta del grupo de Facebook de la asignatura Percepción de mejora del estudiante gracias al grupo de Facebook 5. Metodología Las metodologías, técnicas o algoritmos que estamos usando son los siguientes: El primer algoritmo que hemos usado para realizar el emparejamiento de patrones o elementos característicos (repetitivos) es el método o algoritmo Subdue y con los resultados que nos dio el Subdue al encontrar los patrones repetitivos; aplicaríamos el algoritmo MapReduce A continuación daremos una pequeña introducción o explicación de que se trata la metodología Subdue; se conoce como un Sistema de Aprendizaje entre relaciones que es usado para 2

encontrar subestructuras que aparecen o se presentan repetidamente en la representación gráfica basada en los grafos dentro de una base de datos. Subdue tiene la capacidad de realizar un proceso interno llamado macheo inexacto que es el encargado de encontrar o descubrir las subestructuras con pequeñas variaciones. Adicional el Subdue también usa un algoritmo de búsqueda Donde el algoritmo de búsqueda consta con dos principales componentes que son : Espacio de búsqueda La estrategia de control El algoritmo MapReduce es conocido en el mundo de la informática como un ambiente y un ambiente de programación desarrollado por la empresa de Google; donde su principal funcionalidad es de procesar grandes volúmenes de datos; donde este procesamiento se lo realiza de manera en párelo en un clúster compuesto por computadoras u ordenadores de uso general. Debemos destacar que el MapReduce no requiere una programación en paralelo por parte del usuario. MapReduce brinda las siguientes ventajas: Mayor escalabilidad (soporta miles de nodos) Tolerancia a fallas a gran escala. Flexibilidad en el manejo de datos no estructurados Las funciones Map y Reduce se ejecutan de manera en paralela y distribuida en un cluster. Replica las funciones Map y Reduce en los nodos del cluster; de tal manera que la replicación de las dos funciones se ejecuten al mismo tiempo en nodos distintos 3

4

6. Resultados Daremos una pequeña desventajas que hemos visto al usar la metodología MapReduce que podría afectar nuestros resultados que estemos buscando en la Mineria de Grafos en Redes Sociales. 1. NO hay lenguaje de alto nivel.el usuario debe decodificar sus operaciones en las funciones Map y Reduce. 1. No tiene esquemas ni índices 1. Flujo de datos fijos 1. Baja eficiencia En el siguiente esquema se muestra una tabla de indicadores de aprendizaje cooperativo El desarrollo de la investigación inicia con una inspección estadística del uso general de las herramientas colaborativas en el entorno virtual, con el fin de tener una proyección de los datos a cuantificar por las diferentes técnicas de análisis. A continuación se muestra una contextualización del problema, describiendo el entorno y las herramientas Clasificación de los medios de colaboración En la siguiente tabla y su respectiva grafica donde se muestra el numero total de interacciones en el foro En la siguiente tabla y su respectiva grafica donde se muestra de usuario participativos en el foro 7. Bibliografia https://jcasasr.files.wordpress.com/2010/12/tfm-jordi-casas.pdf http://fernandosantamaria.com/blog/tag/analisis-de-redes-sociales/ http://docplayer.es/3987429-contenido-septiembre-2014.html https://unpocodejava.wordpress.com/category/bigdata/page/9/ 5

6

7

8

9