Discourse and sentiment analysis using social networking websites

Documentos relacionados
Understanding social protest in Costa Rica,

Social networks: closing the gap between research and practice

Pew Research Center s Global Attitudes Project 2013 Spring Survey Topline Results February 13, 2014 Release

PROGRAMA ANALÍTICO DE ASIGNATURA

Computer Science. Support Guide First Term Fourth Grade. Agustiniano Ciudad Salitre School. Designed by Mary Luz Roa M.

PIZARRA VIRTUAL BASADA EN REALIDAD AUMENTADA

GECI Y EL MEDIO AMBIENTE

USER MANUAL VMS FOR PC VMS PARA PC English / Español

Sistema de Información n de

CSOs participation in trade policy processes: lessons from Peru. August 7 th,

BOLETÍNBIBLIOGRÁFICO

@LIS LA-KLEMS Iniative

CAPITAL SAFETY facebook campaign. Voltimum Portugal November 2014 Voltimum

FORMAT B2 SPEAKING EXAM

Panama - Encuesta de Niveles de Vida 2003

Cancer Incidence in Latin America: An Overview

Management and Environmental Policy

SIHI México, S. de R.L. de C.V. Pricing Guide

Español AP Lengua Nombre Fecha P.

Trade union strategy on Agenda 2030

Measuring Poverty at the Municipal Level

United States Border Patrol Southwest Family Unit Subject and Unaccompanied Alien Children Apprehensions Fiscal Year 2016

Ecuador - Encuesta Condiciones de Vida 1995

UNIVERSIDAD INCA GARCILASO DE LA VEGA ESCUELA DE POST GRADO

Mortgage Statistics (M) March Provisional data

Grado 3 Vocabulario/ Representación Vocabulario Descripción Representación

Higher Technical School of Agricultural Engineering UPCT APPLIED STATISTICS

PLAN DE ESTUDIOS Español 1 SEMANA 11 (WEEK 11) (del 21 de marzo al 25 de marzo) Día 1

(1-S1-C1) Observe, ask questions, and make predictions. (1-S1-C2) Participate in planning and conducting investigations, and recording data

ESCUELA PREPARATORIA OFICIAL

Level 1 Spanish, 2013

Dr. Orlando Landrove. Jefe del Programa Nacional de ECNT. Minsap, Cuba

Centro Andaluz de Innovación y Tecnologías de la Información y las Comunicaciones - CITIC

Greetings. Lists and TPR Sheets The Enlightened Elephant


Modelos y métodos avanzados para la logística del contenedor. Aplicación al puerto de Valencia

Answering/Asking Different Levels of Questions

UNIVERSIDAD NACIONAL DEL CALLAO

UNIT ONE: Vocabulary and grammar-verb To Be. UNIT TWO : grammar; simple present- present progressive

Gestión de la Seguridad y Salud en el Trabajo Basado en el Comportamiento de los Trabajadores de una Empresa de Transmisión de Energía Eléctrica

Safe Harbor Statement

SIASAR Information System for Rural Water and Sanitation. WASH Sustainability Forum Amsterdam, June 30,

Microsoft Access Diseño y manejo de tablas

Agustiniano Ciudad Salitre School Computer Science Support Guide Second grade First term

Español 2-Beginners Tarea del verano (summer homework) Teléfono ext Código para clase de Google una280

SQL. Business Intelligence Presentación

Creating your Single Sign-On Account for the PowerSchool Parent Portal

FACULTAD DE CIENCIAS EMPRESARIALES

A Mexican owned information system to follow up the Sustainable Development Goals. Enrique Ordaz February 27, 2015

The Power of the Makigami Wall

UNIVERSIDAD ANDINA DEL CUSCO FACULTAD DE INGENIERIA Y ARQUITECTURA

9- PHP, update records

T'inkazos. Revista Boliviana de Ciencias Sociales ISSN: Programa de Investigación Estratégica en Bolivia.

Los nombres originales de los territorios, sitios y accidentes geograficos de Colombia (Spanish Edition)

Introducción al CDA Clinical Document Architecture

Zotero Quick Access Guide / Guía de acceso rápido para Zotero

Bilingual Parent Education Night Math Curriculum February 7, 2017

Mortgage Statistics (M) December 2017 and Year Provisional data

SISTEMA INTEGRAL DE GESTIÓN DE UN MUNDO VIRTUAL EN INTERNET.

OSH: Integrated from school to work.

No usa una envolvente constante, con cambios de amplitud al cambiar la fase para pasar de un estado a otro.

Spanish - Grade 7. MIDTERM - Parts 2, 3, 4

Gifted and Talented Program Parent Checklist

CONTROLADORA PARA PIXELS CONPIX

Asignar y seguir el progreso del curso en línea de Seguridad de los alimentos de ServSafe International

Microsoft Office Word

MOTOR DE ANÁLISIS DE DATOS NUTRICIONALES RESUMEN DEL PROYECTO

Propuesta de Mejora para la Gestión de Proyectos en la Consultora GREEN S.A.C. para la Elaboración del EIA del Proyecto Minero la Cumbre

Higher Technical School of Agricultural Engineering UPCT. Economic Valuation of Agricultural Assets

Environmental taxes increased by 3.0% in 2017 reaching 21,382 million euros

The monthly variation of the Retail Trade Index at constant prices is 0.9% after seasonal and calendar adjustment

Instituto de Estadísticas de Puerto Rico Estado Libre Asociado de Puerto Rico

Cuenca Experience in Emerging and Sustainable Cities Initiative (ESCI) of the IDB

Nombre: Fecha: Hora: Unit 6: Stem-changing Verb NOTES Gramática 1

39 TECHNICAL COMMITTEE MEETING REPORT

Guatemala Tourist visa Application

Go to: Select Tickets Festival Passes. Ir a la página:

Inversión I Inversion

Needs assessment on medical equipment

Nombre: Fecha: Período Día Avancemos: Lección preliminar: Parte 2. Lunes,, Miércoles,,,, Qué día fue ayer (yesterday)? Ayer fue

CONTROL DE ACCESO ACC4.NET

Para tener un gobierno. tú y yo iremos a votar. Elegir nuestro gobierno. significa libertad. Derechos y responsabilidades. son de todos por igual,

USER MANUAL LOGAN CAM VIEW FOR PC LOGAN CAM VIEW PARA PC English / Español

CIRCUIT ORPHANS COURT FOR, MARYLAND City/County TRIBUNAL DE CIRCUITO TESTAMENTARIO PARA, MARYLAND Ciudad/Condado

Agenda de Acción / Action Agenda

Paper Reference. Paper Reference(s) 4440/01 London Examinations IGCSE Spanish Paper 1: Listening

RESUMEN. Memoria. Resumen 7. Objetivos del proyecto.

Behavior Modeling State Diagrams

January 1, Paula C. Holder 1234 Main St Any Town, USA Dear Member,

Gaia en las universidades españolas y los centros de inves3gación

PRE SPEAKING ACTIVITY GUIDE

FICHA MEMORIA DOCENTE Curso Académico 2006/ 07

INFODAY Programa LIFE de mayo, 2018 / Valladolid. Tabla de indicadores. Consejos prácticos

HOUSING FOR TEACHERS AND CHILDREN S SCHOOL BIXQUERT Y VICENTE, IRENE PR2-T4

Estación Uno: Date, Weather, and How you feel

Equidad de género en el Perú. Qué hacer en el mundo del trabajo, la educación, y los hogares?

Diseño de un directorio Web de diseñadores gráficos, ilustradores y fotógrafos.

PROGRAMA. Operaciones de Banca y Bolsa SYLLABUS BANKING AND STOCK MARKET OPERATIONS

Transcripción:

Discourse and sentiment analysis using social networking websites State of the Nation Program Esteban Durán Monge CBS-UT Data Camp 2016

The experience and challenges in the State of Nation Program Data: Population Census, Agricultural Census, employment surveys, administrative records, science and technoloy indicators, exports, patents... No "Big Data" data sets Big Data and Sustaniable Human Development Experience: Text Mining

Parties manifestos analysis using text mining Number of references by topic in manifestos, by political party. 2014 Poverty and inequality FA ML PAC PASE PLN PUSC RC 30 953 Productivity and employment Politics Environment Fiscal

Social Network Analysis -Relationship analysis -Edges density -Precense of topics in parties proposals Productivity and employment Fiscal

Data camp project proposal: Discourse and sentiment analysis using social networking websites Data levels: -Monitor government and opinion makers speech and sentiments Government -Monitor people sentimets and reactions to the discourse Citizens Opinion makers -Real time data -Data source: Facebook and Twitter -Text mining

Research questions What are the main topics included in the government's and opinion makers political discourse? What is the attitude of these actors to specific issues? What are the trends in people's reactions to sensitive topics for the country? Is it possible to use information from social networks to analyze the tones of political discourse over time

Methods and data Text mining with R: RFacebook, SocialMediaLab, TM, SnowballC, ggplot2, wordcloud Data source: -President's facebook page -Collection of 3519 posts for 2012-2016 period

Data set structure Variables: -Id -User name -Message -Creation time -Type -Link -Likes count -Comments count -Shares count -Reactions

Gathering and processing text data 1. Access Facebook API: Rfacebook 2. Subset the data needed for the analysis 3. Cleaning data (remove punctuation, special characters, white spaces, numbers and lowercase) 4. Word stemming: collapse words to a common root to aid vocabulary comparison 5. Transform the data into a term document matrix

First results and findings

Facebook page main trends 14K President's assumed office Comments Shares Likes 12K 10K 8K Popularity increase 3 months prior to elections 6K 4K 2K 0K 2013 2014 2015 2016 2017

Text mining first results: wordcloud -First glance -Lots of spare words -Issues with the standard too available in R

má costa rica paí añ nacion gobierno hoy millon proyecto costarricens persona desarrollo toda cada nuevo trabajo mejor inversión nueva vamo compromiso esta mañana familia dí social san accion gran mujer gracia educación obra mayor pública infraestructura ruta alegrí comunidad zona esfuerzo cambio centro mucha empleo día colon ley propuesta semana vez con política pobreza derecho gent primera sector seguridad 0 500 1,000 1,500 Word frequency plot

Word frequency plot 1,500 -Identify words with higher semantic charge -Focus on important data 1,000 500 0 má costa rica paí añ nacion gobierno hoy millon proyecto costarricens persona desarrollo toda cada nuevo trabajo mejor inversión nueva vamo compromiso esta mañana familia dí social san accion gran mujer gracia educación obra mayor pública infraestructura ruta alegrí comunidad zona esfuerzo cambio centro mucha empleo día colon ley propuesta semana vez con política pobreza derecho gent primera sector seguridad

-Identify words with high semantics -Create a reference dictionary by topic -Focus on specific information based on context -Discover text and discourse meaning Creation of a reference dictionary

Political discourse by topic Poverty and inequality Productivity and employment First approach: using political program dictionary Environment Main topics and priorities in the discourse: information flows Politics Fiscal Semantics in a general level: discourse intention Possibilities for improvement

Semantic sense and trends over time 15 10 5 Change Select specific tokens or combination 0 15 10 5 0 10 5 0 Fiscal Social 2013 2014 2015 2016 2017 2013 2014 2015 2016 2017 2013 2014 2015 2016 2017 Analyse political discourse over time Information flows are weaker or stronger for some topics o tokens? Words versus actions Abstract versus policy

Further steps and challenges Create optimized dictionary Use machine learning to create a dictionary using an automatized procedure Sentiment and discourse analysis by topic, tokens or combination of tokens Escalate this analysis to the other levels: citizens and opinion makers Create data visualization to present results: combine all the information in the same dashboard

Discourse and sentiment analysis using social networking websites Programa Estado de la Nación CBS-UT Data Camp 2016