Carlos Alberto Francisco Cruz Juan Francisco Islas Aguirre Jorge Lara Álvarez. Noviembre 13, 2014

Documentos relacionados
Concentrado de cursos impartidos y población atendida a través de las Juntas Ejecutivas Locales y Distritales Enero-Junio, 2005.

Ingreso laboral per cápita por entidad federativa

EDUCACIÓN SUPERIOR ALUMNOS, DOCENTES Y ESCUELAS TOTAL Primera parte ENTIDAD

Indicadores demográficos para los adultos mayores por entidad federativa,

Informe de víctimas de homicidio, secuestro y extorsión

LA INSEGURIDAD EN 2002 (ANEXO ESTADÍSTICO)

Plantas de tratamiento, en operación, capacidad instalada y gasto tratado de agua residual municipal

Plantas de tratamiento de agua residual industrial

Sistema Nacional de Investigadores

SISTEMA NACIONAL PARA EL DESARROLLO INTEGRAL DE LA FAMILIA UNIDAD DE ENLACE

Panorama Estatal de Ocupaciones

Año Escuelas en que se aplica Alumnos a los que se aplica

Muertes por Diabetes Mellitus tipo muertes por cada 100 mil habitantes. Promedio Estados DATOS A DESTACAR

Informe de víctimas de homicidio, secuestro y extorsión

Anexo A. Índices de intensidad migratoria México-Estados Unidos a nivel nacional

Informe de víctimas de homicidio, secuestro y extorsión 2016

SUBDIRECCIÓN GENERAL DE ESQUEMAS FINANCIEROS PRESUPUESTO INFONAVIT 2013

Informe de víctimas de homicidio, secuestro y extorsión 2015

LEGISLACIÓN ESTATAL EN MATERIA DE IGUALDAD

UMA (Unidades de manejo para la conservación de la vida silvestre) registradas

Resumen para Presidente Proceso Electoral a nivel Nacional por Entidad Federativa

Encuesta Nacional de Victimización y Percepción sobre Seguridad Pública. ENVIPE 2013

Vigilancia Epidemiológica de casos de VIH/SIDA en México Registro Nacional de Casos de SIDA Actualización al 30 de junio de 2013 (CENSIDA)

Trabajadores Totales Asegurados en el IMSS 2. Trabajadores Asegurados en el IMSS, según Actividad Económica 4

SECRETARIADO EJECUTIVO DEL SISTEMA NACIONAL DE SEGURIDAD PÚBLICA SUELDOS DE POLICÍAS ESTATALES Y MUNICIPALES

AUTOTRANSPORTE FEDERAL DE TURISMO

Trabajadores Totales Asegurados en el IMSS 2. Trabajadores Asegurados en el IMSS, según Sexo 4

Julio de

Mejorar. Resultados Prueba ENLACE 2011

Estructura del Archivo de Excel para Importar los Datos Generales de los Comprobantes

Trabajadores Totales Asegurados en el IMSS 2. Trabajadores Asegurados en el IMSS, según Sexo 4

Situación del Empleo en el Sector de la Construcción CENTRO DE ESTUDIOS ECONÓMICOS DEL SECTOR DE LA CONSTRUCCIÓN

Secretaría de Economía Reporte del Programa Anual de Obras Pública y Servicios relacionados con las mismas (PAOP) 2008

PROGRAMA DE ESTÍMULOS A LA INNOVACIÓN 2014 SECTORES ESTRATÉGICOS POR ENTIDAD FEDERATIVA

INEGI. México y sus municipios

PROGRAMA OPORTUNIDADES

Chihuahua Ley De Ganadería Para El Estado De Chihuahua Ley Para La Regularización De Colonias Agrícolas Y Mancomunes Agropecuarios De Régimen Estatal

Lista Nominal de Electores

TRIBUNAL ELECTORAL DEL ESTADO DE GUERRERO BIBLIOTECA IGNACIO MANUEL ALTAMIRANO INVENTARIO

PROGRAMA DE ESTÍMULOS A LA INNOVACIÓN 2013 SECTORES ESTRATÉGICOS POR ENTIDAD FEDERATIVA

IPRO. Iniciativa para el fortalecimiento de la institucionalidad de los programas sociales. Balance al 31 de Mayo 2010

Capacidad instalada total en plantas de tratamiento de agua residual municipal (litros por segundo)

Oaxaca de Juárez, Oaxaca, a 7 de agosto de Secretaría de Finanzas

AUTOTRANSPORTE FEDERAL DE PASAJE

Estadísticas de Población en México

Cómo elegir la mejor opción para abrir un restaurante

SECRETARIA DE HACIENDA Y CREDITO PUBLICO

LAS MIGRACIONES PERMANENTES DE MEXICANOS Y EL PADRÓN ELECTORAL

Pollo entero en canal

Empresas autorizadas para la recolección y transporte de residuos peligrosos industriales

SEGUNDA SECCION PODER EJECUTIVO SECRETARIA DE ECONOMIA

Instituto Federal de Acceso a la información Pública

SECRETARIA DE ECONOMIA

SECRETARIA DE ECONOMIA

COORDINACIÓN DE CAPACITACIÓN A DISTANCIA - STPS PERSONAS CON DISCAPACIDAD BENEFICIADAS CON EL PROCADIST EN 2010

Martes 30 de septiembre de 2014 DIARIO OFICIAL (Primera Sección) 31

CAPÍTULO I Jóvenes y adultos en condición de rezago educativo

CUARTA VISITADURÍA GENERAL PROGRAMA DE ASUNTOS DE LA MUJER Y DE IGUALDAD ENTRE MUJERES Y HOMBRES

CRUZADA NACIONAL CONTRA EL HAMBRE ELEMENTOS CONSTITUTIVOS

Nueva metodología del IDH. Cambios metodológicos. Elasticidad de las dimensiones. Tendencias internacionales,

CONAVI. Comisión Nacional Mixta de Desarrolladores y Constructores. 29 de Agosto de 2012

Contenido Patentes solicitadas y otorgadas en México ( ) Patentes solicitadas y otorgadas en México por millón de habitantes ( )

Ranking del ITEI en el entorno nacional FEBRERO 2009

Programa de la Reforma Educativa: avances y pendientes

Entidad Federativa Porcentaje Monto Porcentaje Monto

CERTIFICACIÓN DE NACIMIENTOS, IMPLEMENTACIÓN, RESULTADOS Y DESAFÍOS

Foro Sobre el Manejo Integral de Riesgo de Desastres Perspectivas del Consorcio de Corredores que coloca el programa del FONDEN Federal

CÁPSULA SEMANAL DE OPINIÓN PÚBLICA TEMAS. No.229. Deuda de estados y municipios. Percepción sobre el incremento en los niveles de pobreza

Total de municipios del estado de Nayarit, estratificados por grado de marginación 2000 y 2005

Nunca es Tarde para Estudiar. Subdirección General de Sustentabilidad Social

ANEXO FORMA Y TÉRMINOS PARA LA PRESENTACIÓN DE LA SOLICITUD PARA LA AUTORIZACIÓN DE AGENTES PROVISIONALES

Pago de Tenencias y Refrendos 2013

Incidencia Delictiva Del Fuero Común

A. Movimiento de alta Página 2. B. Modificación salarial Página 9. C. Movimiento de baja Página 11. D. Movimiento de Reingreso Página 13

Dirección de Estudios Económicos de la Vivienda Índice SHF de Precios de la Vivienda en México: Primer trimestre del 2015

SUBSECRETARÍA DE EMPLEO Y PRODUCTIVIDAD LABORAL MÉXICO

Avances del Programa Federal Centros Estatales de Información y Documentación

CORPORACIÓN ÁNGELES VERDES EN EL FUTURO INMEDIATO

Cancelación de solicitudes de trámite (artículo 199, párrafos 1 al 5 del COFIPE)

EL PODER ADQUISITIVO DEL INGRESO DE LOS HOGARES AUMENTÓ 8% ENTRE EL TERCER TRIMESTRE DE 2014 Y EL TERCER TRIMESTRE DE 2016

ACERTADÍSTICO. Estadísticas CONACYT Becas

Estadística del Programa de Carrera Magisterial

SEGUNDA SECCION PODER EJECUTIVO SECRETARIA DE HACIENDA Y CREDITO PUBLICO

ACCIDENTES PERSONALES. Programa Escolar

Mortalidad Materna en México

Anticoncepción. INEGI. Chiapas : panorama sociodemográfico. 1996

TEMPORADA DE INFLUENZA

Algunas clasificaciones en la construcción

l. Inscripción total y existencias en educación básica, a

LOS ONCE TRÁMITES MÁS SOLICITADOS EN AGUASCALIENTES AL 31 DE DICIEMBRE DE 2012

Estadísticas Municipales HACIENDA MUNICIPAL ABRIL-JUNIO

1. Emitir una sola convocatoria por entidad para el ingreso a las instituciones formadoras de docentes públicas y particulares.

REPORTE DE EMPLEO EN SINALOA: DATOS COMPARATIVOS DE ENERO DEL 2009 CON RESPECTO A ENERO DEL 2008

I. Características demográficas

Incidencia Delictiva del Fuero Común

Perspectiva Meteorológica para Incendios Forestales

PROGRAMAS DE APOYO AL EMPLEO Y A LA CAPACITACIÓN

El costo de la nómina educativa (primer trimestre 2015)

EVOLUCIÓN DEL GASTO EN EDUCACIÓN EN MÉXICO

EN 2008, 3.1 MILLONES DE ADULTOS MAYORES SE ENCONTRABAN EN POBREZA MULTIDIMENSIONAL

Transcripción:

La unión de bases de datos en ausencia de un identificador: El caso del Padrón de Beneficiarios de la SAGARPA (años) y el VII Censo Agrícola, Ganadero y Forestal 2007 Carlos Alberto Francisco Cruz Juan Francisco Islas Aguirre Jorge Lara Álvarez Noviembre 13, 2014

Motivación Realizar una evaluación de impacto de los Programas de la Sagarpa requiere de elementos mínimos: Padrón de beneficiarios: Se tienen registros administrativos en diferentes bases de datos que no era posible vincular debido a la ausencia de un identificador en común. Listado de posibles contrafactuales: Se determino que el VII Censo Agrícola, Ganadero y Forestal 2007 como una fuente viable para obtener información de personas no beneficiarias de los programas pero que podrían serlo.

Motivación Tareas establecidas para la evaluación de impacto: 1. Conformar un padrón de beneficiarios de la SAGARPA 2. Vincular el padrón con el VII Censo Agrícola, Ganadero y Forestal 2007 y así obtener posibles controles para la evaluación de impacto

Limitante principal: No se tiene un identificador que permita unir ambas bases de datos Base de datos 1 Nombre A. Paterno A. Materno Entidad Municipio Localidad Ma. Guadalupe Hernández Cruz Chiapas Arriaga Arriaga José Bautista Soto Sonora Agua Prieta Agua Prieta Base de datos 2 Nombre A. Paterno A. Materno Entidad Municipio Localidad ALBERTO RAMÍREZ ALTAMIRANO GUANAJUATO GUANAJUATO GUANAJUATO MARIA GUADALUPE HERNANDEZ CRUZ CHIAPAS ARRIAGA ARRIAGA

Otras limitantes para lograr la vinculación Variaciones por deletreo. Ejemplo: Leydi vs Lady. Variaciones por pronunciación. Ejemplo: Carla vs Karla. Nombres compuestos. Ejemplo: Maria Guadalupe vs Ma. Guadalupe Nombres alternativos. Ejemplo: José vs Pepe Nombres sólo indicados con la primera letra. Ejemplo: José Juan vs J. J.

Alternativa para unir bases de datos: Hacer uso de información contenida en las bases de datos Stata tiene el comando Reclink que permite realizar el vinculo de información entre dos bases de datos a partir de cadenas de texto con base en un bigrama. Un bigrama es utilizado como base para el análisis estadístico de texto y permite realizar la comparación entre textos a partir de su reconocimiento de voz. El bigrama proporciona la probabilidad condicional de una palabra (W n ) dada una palabra precedente (W n 1 ): P W n W n 1 = P(W n, W n 1 ) P(W n 1 ) Genera una probabilidad de similitud entre una cadena de texto de una base de datos en relación a otra cadena de texto de otra base de datos

reclink varlist using filename, option idmaster(varname): identificador numérico de la primer base idusing(varname) : identificador numérico de la segunda base gen(newvar): Genera una nueva variable con la probabilidad de similitud wmatch(match weight list) : Asigna pesos a cada una de las variables de texto (1 a 20) wnomatch(non-match weight list): Cuando no logre vincular un dato se puede utilizar una asignación de pesos alternativa (1 a 20). required(varlist): Indica las variables que deben ser idénticas en ambas bases orblock(varlist): Indica que las observaciones deben ser idénticas en alguna de las variables señaladas exclude(filename) : Excluye observaciones de otra bases de datos minscore(#) : Especifica el valor mínimo para establecer el vinculo (0 a 1) minbigram(#): Especifica el valor del bigrama mínimo para declarar como similares dos cadenas de texto (0 a 1)

Etapas para realizar la vinculación de las bases de datos a través del Reclink I. Pre-Proceso: Eliminar duplicados y quitar caracteres especiales (,, #, $, %, &, (, =,?,,., : ) II. III. IV. Grupos o bloques: Si se trata de bases de datos con un número importante de observaciones es recomendable hacer grupos o bloques. Comparación: Se hace uso del Reclink para la vinculación de las bases de datos Clasificación: Se realiza una revisión de los registros vinculados a partir de la probabilidad generada por el Reclink V. Fusión: Una vez depurada los resultados obtenidos se procede a vincular las bases de datos.

Padrón de Beneficiarios de la SAGARPA Se conformaron más de 30 componentes de los programas vigentes de la Sagarpa haciendo uso de las variables: Nombre, CURP, RFC, entidad, municipio y localidad; En suma los componentes tenían más de 3.5 millones de registros. La vinculación obtuvo un padrón de beneficiarios de 2,683,713 beneficiarios.

75.3% Hombres 24.6% Mujeres La información permite identificar a los beneficiarios de más de 2 componentes. Aproximadamente el 4% de los beneficiarios tiene más de 2 componentes Entidad Beneficiario % % Acum Oaxaca 301,761 11.24 11.24 Chiapas 259,752 9.68 20.92 Veracruz 228,404 8.51 29.43 Puebla 175,775 6.55 35.98 Guerrero 160,602 5.98 41.96 México 144,796 5.40 47.36 Michoacán 132,234 4.93 52.29 Zacatecas 129,014 4.81 57.1 Hidalgo 117,839 4.39 61.49 Guanajuato 107,105 3.99 65.48 Jalisco 106,333 3.96 69.44 San Luis Potosí 99,336 3.70 73.14 Durango 91,171 3.40 76.54 Sinaloa 81,264 3.03 79.57 Chihuahua 74,068 2.76 82.33 Tamaulipas 68,621 2.56 84.89 Yucatán 50,952 1.90 86.79 Nayarit 45,180 1.68 88.47 Tabasco 40,717 1.52 89.99 Tlaxcala 39,205 1.46 91.45 Campeche 36,095 1.34 92.79 Coahuila 34,688 1.29 94.08 Querétaro 28,751 1.07 95.15 Morelos 25,787 0.96 96.11 Quintana Roo 24,462 0.91 97.02 Sonora 23,024 0.86 97.88 Nuevo León 21,853 0.81 98.69 Aguascalientes 14,538 0.54 99.23 Colima 8,008 0.30 99.53 Baja California 6,603 0.25 99.78 Baja California Sur 2,441 0.09 99.87 Distrito Federal 2,224 0.08 99.95 Total 2,683,713 100

Gráfica 1: Beneficiarios de otros componentes que a su vez tienen Procampo (%) 20 40 60 80 0 Diésel Agropecuario Focaf Progan Tarifas Eléctricas

VII Censo Agrícola, Ganadero y Forestal 2007 Tiene 5,548,845 unidades de producción dedicadas a actividades agrícolas, pecuarias o forestales. Se realizó el vinculo del padrón de beneficiarios con el Censo, lo que implico un cruce de información de 2,683,713 contra 5,548,845 de registros.

Gráfica 2: Porcentaje de Beneficiarios identificados en el Censo 20 40 60 80 0 Focaf Procampo Progan