Programa Nacional de Vigilancia Tecnológica e Inteligencia Competitiva - Programa VINTEC HERRAMIENTAS Y FUENTES DE INFORMACIÓN PARA LA PRÁCTICA DE LA VTeIC Ing. Miguel Guagliano, 31 de Agosto de 2011 Buenos Aires
Indice Ciclo de vigilancia Interrogantes Herramientas de vigilancia Fuentes de información
Ciclo de vigilancia Planificación y dirección Acciones Fuentes formales Difusión resultados Fuentes informales Obtención de información Análisis Procesamiento Fuente: Adaptado a partir de Bernhardt (1994)
Preguntas!!! De acuerdo con esto, tendríamos que saber: si se necesita herramientas para todo el ciclo: búsqueda y organización de información, procesamiento, análisis, presentación y difusión. Y en particularidades, sobre cada fase, saber por ejemplo: qué tipo de información se buscará (patentes, normas, artículos científico-técnicos, social, media, etc.) qué tipo de procesamiento o análisis necesitarían hacer cómo se requiere presentar la información cómo se requiere difundir la información (a un público masivo, vía web, correo electrónico, si se demanda interacción del usuario o no, etc.). y de acuerdo con esto, saber si ya tienen resuelto el tema de las fuentes de información en sí.
Preguntas!!! Con respecto a las herramientas: se trata de estudios puntuales ("productos" concretos de IC sobre un tema, por ejemplo un estudio de tendencias de la I +D+i sobre una industria, tecnología o producto) de boletines periódicos de vigilancia, como noticias o alertas sobre un sector o industria? o quizá de ambas cosas? el equipo estaría haciendo todo, incluido el desarrollo de una plataforma de vigilancia o sería preferible contratar servicios de una compañía externa, asesoría y plataforma incluidos?
Necesidad de vigilar Proveedores Productos Clientes Oportunidades/ Amenazas Tecnologías Competidores Entorno Normativo
En la Universidad. Nos interesa saber sobre?: Cuáles son los retos tecnológicos del futuro? Proyectos de I+D que han sido y están siendo financiados x instituciones de C+T+I en países y regiones líderes? Temáticas emergentes de investigación? Tendencias Grupos de investigación e Investigadores relevantes? Universidades y centros líderes y emergentes? Países líderes y emergentes? Redes de colaboración entre Grupos de Inv. y Universidades?
El costo de no vigilar Según estadísticas: Al año 1994: las empresas europeas pierden más de 25.000 millones de Euros en investigar y desarrollar productos ya patentados Al año 2009: las empresas europeas pierden más de 60.000 millones de Euros en investigar y desarrollar productos ya patentados Pregunta: qué sucede en Argentina?
Información de libre disposición La información y la capacidad de las instituciones en la gestión de la información es uno de los elementos clave de la competitividad. El 90% de la información necesaria para una institución (patentes, mercados, competencias, etc.) es de libre disposición. Instrumentar los mecanismos adecuados de localización y análisis para que repercuta de forma útil en las decisiones estratégicas.
Herramientas para las actividades de VTeIC Herramienta para búsqueda y vigilancia: herramientas para la búsqueda de información, configuración de alertas, detectores de cambios en páginas webs. Herramienta para el almacenamiento de la información: por ej., herramientas de bases de datos, de almacenamiento local de páginas web, etc., permiten conservar y organizar la información importante para la empresa. Herramienta de tratamiento y análisis de la información: por ej., herramientas de data-mining (minería de datos), cartografía, etc., permiten también optimizar los recursos de la empresa. La posibilidad de acceder a la información en forma de representaciones gráficas facilita su comprensión. Herramienta para la difusión de la información: por ej., herramientas de mensajería instantánea, correo electrónico, foros, intranets. Ofrecen rapidez en el intercambio de la información y posibilidades de comunicación e interacción muy interesantes.
Herramientas por etapa del ciclo de VTeIC Planificación: Matheo, Tetralogie 6.0, GoldFire, etc. Búsqueda: podemos incluir diferentes tipos de buscadores (Google, Vivísimo, Bing, yahoo etc), metabuscadores generalista en internet, incluyendo portales con información de interés, y aquellas herramientas que pueden acceder a bases de datos, incluidas las bases de patentes (All4one, Metacrawler, Web Crawler, Vivísimo, Grokker, Touch Graph, Eyeplorer, Ixquick, Dogpile). Importante el acceso a la internet oculta, otro tipo de herramientas muy utilizados para esta etapa son los rastreadores de noticias, los trackers o detectores de nuevo contenidos (Clusty, Kartoo, Iboogie, Copernic Agent, etc). Análisis y tratamiento de la información: desde herramientas de análisis estadístico general (análisis multivariante, coocurrencia de términos, componentes principales, etc.), hasta herramientas más específicas. Se pueden nombrar los siguientes productos de utilidad en esta fase: BizInt, Delphion PatentLabII, Delphion Clustering, Delphion citation Link, MapIT, Excalibur, VantagePoint, Goldfire Innovator, Tetralogie, Matheo Software, Tetralogie,etc. Puesta en valor: visualización con diagramas de diferente tipos, mapas tecnológicos, etc. Ejemplos de herramientas de visualización pueden ser: Kartoo, Grokker, Touchgraph, Tetralogie, Matheo, etc.
Búsqueda de la información Algunos de los buscadores más comunes: Ejemplos de metabuscadores All4one, Metacrawler, Web Crawler, Vivísimo, Grokker, Touch Graph, Eyeplorer, Ixquick, Dogpile.
Búsqueda de la información Los rastreadores de noticias son herramientas que permiten buscar de forma ordenada, lógica y sistemática noticias relacionadas con una palabra o expresión determinada que escojamos. Ejemplos: My New online, Iconoce, Imente, Google News, Acceso, Cyberalert. Los metabuscadores son programas clientes que realizan la búsqueda simultánea en varios buscadores de primera generación (aquellos que no presentan una forma personalizada u ordenada en función a la formulación de búsqueda). Se utilizan para búsquedas amplias sobre un tema. Ejemplos: Clusty, Kartoo, Iboogie, Copernic Agent, Website-Watcher (Detector de nuevo contenido), Update petrol (Detector de nuevo contenido), InfoMinder, TrackEngine, WhatthatPage.
Buscadores Gráficos * Pago
Buscador de buscadores * Pago
Buscador de buscadores
Trackers (Website-Watcher) * Gratis
Rastreadores de noticias (Imente) * Gratis
Mapeador de noticias http://newsmap.jp/ Un algoritmo noticioso de 14 países que se renueva cada 10 min. desde Google news * Gratis
RSS RSS es una familia de formatos de fuentes web codificados en XML. Su función más habitual es suministrar a suscriptores de información actualizada frecuentemente. El formato permite distribuir contenido sin necesidad de un navegador.
Tratamiento y análisis de la información Data Mining La minería de datos (Data Mining) es el proceso de extracción de una base de datos estructurada de la información relevante, su análisis e interpretación, tomando como base los propósitos de la organización. Text Mining La minería de textos o Text Mining se considera una forma particular de la minería de datos o Data Mining, que permite la extracción de conocimiento de grandes repositorios de información, estructurada o no, y en formato texto. Es el proceso de aplicación de métodos automáticos para analizar y estructurar datos de texto con el objetivo de crear un conocimiento útil a partir de información estructurada y no estructurada. Bibliometría y Cienciometría La Bibliometría estudia la gestión de libros y revistas científicas: comprender actividades de comunicación de la info. La Cienciometría analiza los contenidos de los documentos redactados por los investigadores y técnicos (artículos y patentes): aspectos cuantitativos de la creación, difusión y utilización de la info.
Tratamiento y análisis de la información Las herramientas y plataformas que existen actualmente en el mercado para brindar apoyo en la etapa de tratamiento y análisis de la información son las siguientes: 1- Software: Matheo Analyzer, Patent, Web TetralogieXerka Vantage Point Vigtech Temis Golfire Innovator Digimind 2- Plataformas: Vigiale Denodo Intelligence Suite (Miniera) Cosmos
Software Matheo Patent: Es un software de uso personal (monopuesto) diseñado para automatizar las tareas de búsqueda, recuperación y análisis de patentes de las bases de datos de la Oficina de Patentes de los EE.UU. (USPTO) y de la Oficina Europea de Patentes (EPO). Matheo Analyzer: Es una herramienta avanzada para profesionales especializados/as en el análisis de informaciones obtenidas de bases de datos. Matheo Web: Busca y analiza información (estadísticas, etc), ordenando la misma por host, autor, meta tag y grupo fecha-palabra_ clave y genera informes automátivos. Tetralogie: Es un software que permite realizar recuentos simples de frecuencia a través de indicadores bibliográficos (palabras en el título de las patentes, palabras sobre un área del conocimiento, nombres de empresas, inventores, etc) permite hacer cálculos de coocurrencia. Estos cálculos permiten establecer relaciones entre tecnologías, competidores, etc.
Software Tecnologías-aplicaciones solicitudes Fuente: Matheo software
Software XerKa: Es una solución software que apoya los procesos de Vigilancia Tecnológica e Inteligencia Competitiva de la empresa. Busca, filtra, analiza y clasifica información para proporcionar al usuario una base documental constantemente alimentada con información relevante para la toma de decisiones estratégicas. Vantage Point: Es una herramienta que permita analizar rápidamente la búsqueda de resultados de bases de datos bibliográficas y literatura I+D. A diferencia de otras herramientas de minería de textos, Vatage Point está específicamente diseñada para interpretar búsquedas de resultados de BD de ciencia y tecnología.
Tratamiento y análisis de la información Buscadores con tratamiento de resultados Gopubmed http://www.gopubmed.org/ * Gratis
Tratamiento y análisis de la información Algunas BD ofrecen tratamiento básico ISI web of Knowlege * Pago
Análisis y tratamiento de la información Engineering Village * Pago
Plataformas de VTeIC VIGIALE MINIERA - Estudios de VteIC que contemplan: Recolección y tratamiento de la información Data mining y text mining Realización de mapas tecnológicos Realización de gráficos estadísticos Gestión y mantenimiento de informes de vigilancia -Alertas a través del monitoreo y seguimiento de información publicada en sitios Web - Mira: Rastreo y filtrado de información (RSS, páginas, web, etc) Minería de datos Gestión de contenidos Realización de gráficos Acceso a distintitas BD Sistemas de alertas - Intelligence suite: Análisis de datos Captura y análisis de información Publicación de informes Estudios de VteIC Análisis y seguimiento del entorno Sistemas de alertas
Plataformas de VTeIC DENODO http://www.denodo.com/ Trabaja con información procedente tanto de entornos corporativos (bases de datos, hojas de cálculo, aplicaciones, sistemas de ficheros y cualquier otro repositorio de información no estructurada) como de Internet (sitios Web de entidades socias, empresas proveedoras, clientes y competidoras e información Web accesible sobre datos y noticias de mercado, regulaciones, ayudas, oportunidades, etc).
Vigiale http://www.vigiale.com/ * Pago
Miniera www.miniera.es/ * Pago
Fuentes de información Información actual Crecimiento exponencial información 2.000.000 artículos 60.000 revistas 1.000.000 patentes/año 7.000.000 páginas web/día Globalización de la información Heterogeneidad de las fuentes Infoxicación Saturación Ruido informativo
Vigilancia avanzada Afortunadamente, en los últimos años la vigilancia a tenido un fuerte impulso gracias a diversos factores que se han desarrollado simultáneamente: Bases de datos (artículos técnicos, patentes...) Internet Invisible Minería de datos, minería de textos...
Web invisible o profunda Búsquedas con buscadores tradicionales Web Invisible 80%
Web invisible Razones por las que un motor no accede a una parte de la Web: 1. Cuando los documentos o las bases de datos son demasiado voluminosos para que puedan indexarse completamente. 2. Cuando las páginas están protegidas por su autor. 3. Cuando las páginas se generan dinámicamente, por ejemplo, a consecuencia de una solicitud. 4. Cuando las páginas están protegidas por un identificador login y una contraseña. 5. Cuando los motores de búsqueda no reconocen el formato de los documentos. 6. Cuando las páginas no tienen enlaces con otras.
Fuentes de información
Fuentes de información
Bases de datos útiles para VTeIC MEDLINE: Contiene aproximadamente ocho millones de referencias bibliográficas sobre temas relacionados con la medicina( incluye referencias sobre veterinaria, Bioquímica, Microbiología, Biotecnología, Toxicología). Se añaden anualmente unas 300.000 referencias. La información procede de 3.400 publicaciones de más de 70 países (aunque las fuentes en lengua inglesa representan el 75 % de los registros). INSPEC: (International Information Services for the Physics and Engineering Communities) es una base de datos que ofrece un amplio espectro de información de conferencias, tesis y revistas sobre temas científicos y tecnológicos, especialmente en los ámbitos de la electricidad, la electrónica, la informática y las telecomunicaciones, aunque incluye también otras materias (materiales, física, etc). CHEMICAL ABSTRACT: Contiene información de más de 150 países en 50 lenguas. La información original está formada por 14.000 revistas científicas y técnicas, patentes, conferencias, informes técnicos. Cada año se añaden a la base 500.000 referencias.
Fuentes de interés Fuentes de información científica: http://www.gopubmed.com/ http://www.scirus.com/ http://www.biomedexperts.com/ http://www.scopus.com/ http://www.sciencedirect.com/ Fuentes de información tecnológica: www.uspto.gov/ http://lp.espacenet.com/ http://www.jpo.go.jp/ http://www.dpma.de/ www.inpi.gov.ar/.../patentes.asp Buscadores generales: http://polymeta.com/ http://www.quintura.com/ http://www.yebol.com/
Proveedores de Bases de datos
Delphion * Pago
Cuadro comparativo de softwares
Cuadro comparativo de softwares
Dirección Nacional de Estudios Subsecretaría de Estudios y Prospectiva Secretaría de Planeamiento y Políticas MUCHAS GRACIAS!!! Ecuador 873 2º Piso (C1214ACM) CABA (54 11) 4891 8742 int. 7852 vintec@mincyt.gov.ar