Plataforma computacional de Alto rendimiento para la gestión y análisis de datos clínico-genéticos

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Plataforma computacional de Alto rendimiento para la gestión y análisis de datos clínico-genéticos"

Transcripción

1 Plataforma computacional de Alto rendimiento para la gestión y análisis de datos clínico-genéticos Proyecto de Excelencia Junta de Andalucía (TIC 06108) Título: Número: D1.1 Caracterización Clínico-Genética del sistema Responsable: Universidad de Málaga (UMA) Área 1: Oswaldo Trelles Análisis preliminar Fecha: M6 Junio 2011 Entrega: Junio 2012 Distribución: Pública Naturaleza: Contenidos Informe 1.- Análisis Preliminar 1.1 Caracterización Clínico-Genética del sistema Mecanismos biológicos de respuesta del orgnanismo a RAM Identificación de las fuentes de datos existentes y las modalidades de explotación a) Situación actual de las bases de datos de alergenos b) Inventario internacional de alergenos. c) Fuentes de datos nacionales Descripción de los datos y sus relaciones Aspectos legales de control, acceso y protección de datos (Ley Oficial de Protección de Datos, LOPD).

2 1.- Análisis Preliminar 1.1 Caracterización Clínico-Genética del sistema Mecanismos biológicos de respuesta del orgnanismo a RAM. El proyecto Plataforma computacional de Alto rendimiento para la gestión y análisis de datos clínico-genéticos ha popuesto desarrollar un sistema bioinformático para organizar, gestionar y explotar la información clínica de pacientes con respuesta hipersensible a fármacos asociados a sus datos moleculares de secuencias de ADN y de expresión génica. El sistema proporcionará herramientas computacionales para: (a) la gestión de datos clínicos y moleculares de los pacientes; (b) el ensamblaje de secuencias (secuenciación de alto rendimiento); (c) la normalización de los datos de expresión génica y (d) la extracción de conocimiento en la forma de genes marcadores, SNP (polimorfismos de un solo nucleótido) y CNV (variaciones en el número de copias de fragmentos de ADN) asociados a las respuestas a fármacos y tratamientos. Estas herramientas serán desarrolladas con técnicas de computación de alto rendimiento para ser ejecutadas en equipos multiprocesadores de bajo coste (many-core y multi-core) o en modalidades de alquiler de recursos computacionales masivos (computación en nube o cloud computing). El primer punto del Análisis preliminar aborda la Definición formal del mecanismo biológico de respuesta del organismo a RAM. Esta parte se ha realizado en colaboración con la Red Temática de Investigación Cooperativa de Reacciones Adversas a Alérgenos y Fármacos en España (RIRAAF), que es una asociación de grupos de investigación de diferentes Administraciones, Instituciones y Comunidades Autónomas, que comparten líneas y objetivos de investigación para el estudio de las reacciones adversas causadas por alérgenos y fármacos, con el objetivo de promover la complementariedad de actuaciones, desarollando y potenciando una estructura estable de investigación cooperativa en Red para integrar y coordinar la investigación de excelencia en este campo de la Biomedicina en España. Los alergenos son proteínas a las que habitualmente están expuestos los individuos y que inducen reacciones inmunológicas que se etiquetan como reacciones alérgicas. Estas pueden ser anticuerpo dependientes, generalmente IgE, o mediadas por linfocitos T. En general lo que es reconocido en la proteína alergénica es el determinante antigénico llamado también determinante alergénico y mas exactamente epítopo que está formado por una secuencia de aminoácidos que de forma lineal o conformacional son reconocidos como tales estructuras. El reconocimiento es específico de tal forma que, cambios mínimos en la estructura en sólo un aminoácido pueden originar la aparición de una especificidad diferente y por tanto falta de reconocimiento. El organismo está expuesto a una serie de proteínas presentes en el exterior y que acceden a través de alimentos, contacto con animales, inhalación de pólenes, ácaros, esporas de hongos y medicamentos fundamentalmente. Forman un número extenso de proteínas (varias decenas de miles) frente a las que los individuos pueden sensibilizarse. En general estas sustancias son inocuas y bien toleradas por los individuos aunque en sujetos alérgicos dan lugar a diferentes tipos de reacciones. En la actualidad diferentes estudios

3 muestran que hasta el 40% de la población adulta presenta respuestas alérgicas a algún tipo de alergeno. El número de individuos afectados por este amplio espectro de sustancias se estima en millones. El conocimiento lo mas completo posible de todos estas proteínas que actúan como alergenos permitiría establecer cuales son todos los posibles agentes nocivos que causan estas enfermedades y en los casos de mayor importancia decidir intervenciones terapéuticas, bien en forma de prevención para evitar la exposición o, en caso de no poder conseguir ésta, desarrollar mecanismos de tolerancia inmunológica, a través de vacunas, mejorando de esta forma la calidad de vida de los ciudadanos. Las patologías a considear en este estudio se producen tras una respuesta biológica anormal a agentes no infecciosos, no cancerigenos y no tóxicos directos, y en apariencia inocuos, pero que causan patologías con una gran morbilidad. En ellas se incluyen reacciones a proteínas exógenas de origen animal o vegetal (alergenos) ingeridas como componentes de la dieta o inhaladas, así como a fármacos que generalmente son sustancias químicas de bajo peso molecular. Esta patología afecta a una parte variable de la población expuesta, que responden a unas concentraciones que generalmente se consideran inofensivas. Esto se traduce en que millones de pacientes, en el caso de alergenos, y como mínimo miles en reacciones a fármacos pueden estar afectados. En este proyecto se estudiará el comportamiento de proteínas como alergenos y/o antígenos en la inducción de una respuesta alérgica o de tolerancia. Con respecto a los medicamentos se consideraran las manifestaciones adversas idiosincrásicas (Tipo B), que están ligadas a una respuesta dependiente del individuo, dentro de las cuales se incluyen las reacciones de hipersensibilidad. El plan estratégico que se presenta pretende crear una plataforma de investigadores y centros, que coordine la actividad de clínicos, que son los que detectan, definen y clasifican las entidades y los problemas a estudiar, para posteriormente interactuar con múltiples disciplinas, que incluyen desde la genética a la bioquímica, conectadas todas ellas con una plataforma bioinformática que permite una interacción horizontal para abordar los distintos objetivos, desarrollar las metodologías pertinentes y resolver con la tecnología actualmente disponible el máximo número de problemas posibles. En lo que concierne a las reacciones alérgicas a proteínas, se considerarán alergenos presentes en los alimentos y también inhalantes ambientales, cuyo mecanismo responsable está ligado a la participación de anticuerpos IgE, que reconocen a estas estructuras induciendo una respuesta que puede estar localizada en vías respiratorias, tracto gastrointestinal, piel o diferentes órganos simultáneamente. Aunque los mecanismos que actúan van más allá de la participación de la IgE, se suelen clasificar estas entidades como atópicas. El inventario actual de alergenos, si bien incompleto, es extenso y creciente, existiendo en la actualidad más de 5000 proteinas, con presencia y distribución ubicua, de diferente naturaleza y que tienen entre sí un grado de parentesco variable. Un grupo de ellas están presentes tanto en el mundo vegetal como animal, conociéndose como panalergenos. En los últimos años se va obteniendo un mayor conocimiento de su estructura molecular, existiendo en la actualidad diferentes bases de datos que

4 proporcionan información al respecto: Varios de los grupos integrados en esta propuesta han contribuido de forma significativa a la identificación y caracterización de algunos de los alergenos mayores presentes en los pólenes de olivo (Rodríguez R. Int Arch Allergy Immunol 2001)) y alergenos vegetales (Salcedo G. Clin Exp Allergy 2004) que mas afectan a la población española. En resumen los logros conseguidos se centran en tres tipos de estudios: a) Identificación, aislamiento y caracterización (estructural e inmunológica): En este sentido, se han caracterizado proteínas de las familias de LTPs (transferidoras de lípidos), profilinas, quitinasas, taumatinas, albúminas 2S, globulinas 11S, vicilinas, 1,3- - glucanasas, polcalcinas, y miembros de otras familias menos conocidas; estos alergenos han sido estudiados en numerosas fuentes alergénicas: tanto procedentes de alimentos, como frutas melocotón, melón, kiwi, cítricos, frutos secos, especias, etc-, como de pólenes olivo, parietaria, gramíneas, artemisia, plantago, plátano de sombra, fresno, aligustre, lila, girasol, quenopodiáceas, entre otras. b) Diseño y utilización de protocolos para la expresión recombinante de muchos de esos alergenos: Esto permite disponer de moléculas homogéneas y puras en cantidades ilimitadas, tanto para realizar estudios científicos con ellas como para su producción industrial y empleo en diagnóstico, e incluso inmunoterapia cuando la legislación lo permita. c) Estudios de análisis de la estructura tridimensional de proteínas alergénicas: Se han realizado fundamentalmente, aunque no solo, mediante resonancia magnética nuclear, técnica que ha permitido determinar en nuestro país las estructuras de varias albúminas 2S alergénicas de mostaza, girasol y ricino-, así como de varios alergenos del polen de olivo. Además de un incremento de la población afectada, que se refleja en diferentes estudios de incidencia y prevalencia (Vegetalia 2005), el número de alergenos responsables ha aumentado de una forma considerable, comprendiendo proteínas de origen vegetal, como pueden ser de las frutas o componentes del polen inhalado. El grado de caracterización de las mismas es variable, unas estudiadas en extenso, otras caracterizadas parcialmente, quedando todavía una parte importante por caracterizar. Los alimentos son la primera y mayor carga antigénica con la que se enfrenta el sistema inmunológico, siendo la tolerancia la respuesta fisiológica. Sin embargo pueden inducir reacciones adversas de base inmunológica que son las que se engloban bajo el término general de alergia alimentaria. De todas las respuestas inmunológicas a los alimentos, son las mediadas por anticuerpos IgE (hipersensibilidad inmediata o de tipo I) las mejor conocidas y las que serán objeto de estudio de la RIRAAF. La población general percibe la alergia a los alimentos como un problema de salud importante, aunque menos de un tercio de las reacciones referidas por los pacientes se pueden confirmar tras realizar un estudio alergológico completo incluyendo provocaciones orales. De acuerdo con estudios poblacionales recientes se estima que la alergia a los alimentos afecta del 1% al 3% de la población, siendo más frecuente en los niños menores de 3 años en los que la prevalencia puede llegar hasta el 8%.

5 En el año 2005 la Sociedad Española de Alergología e Inmunología Clínica realizó un estudio epidemiológico nacional (Alergologica 2005) entrevistando 5000 pacientes que acudían por primera vez a un alergólogo. Se diagnosticó alergia a los alimentos en el 7,4%, siendo la quinta patología alergológica por orden de frecuencia, después de la rinoconjuntivitis, el asma, la hipersensibilidad a medicamentos y la urticaria/angioedema. En un estudio de similar diseño realizado en 1992 (Alergológica 1992) la prevalencia de pacientes diagnosticados de alergia a alimentos fue del 3,6%, lo que indica que se ha producido un aumento significativo en nuestra población en poco más de una década. Estudios realizados en población americana y de otros países europeos encuentran también un aumento de la frecuencia de la alergia a los alimentos en intervalos de tiempo similares. Los principales alimentos inductores de reacciones alérgicas varían de unos países a otros, y de la población infantil a los adultos, dependiendo entre otros factores de los hábitos alimentarios y de la aerobiología local. La implicación de factores genéticos en las diferencias geográficas no ha sido hasta ahora estudiada. Según los resultados de Alergológica 2005 la alergia a la leche y el huevo son las más prevalentes en niños menores de 3 años. Estas generalmente son transitorias desarrollando tolerancia hacia los 5 años de edad una gran parte de los niños afectos. La alergia a pescados y legumbres aparece a partir de los 2-3 años, siendo más persistentes y manteniéndose en la edad adulta. La alergia a frutos secos, frutas y mariscos debutan generalmente en la segunda infancia y adolescencia, son persistentes y se mantienen toda la vida. Considerándolo globalmente los principales alimentos inductores de reacciones alérgicas en nuestra población son las frutas, seguidas por los frutos secos y los mariscos. Es relevante considerar que la alergia a alimentos vegetales está frecuentemente asociada a la alergia a pólenes y, en menor medida, al látex, y que la alergia a los crustáceos se asocia a la alergia respiratoria a los ácaros, produciéndose en muchos casos la sensibilización primaria por vía respiratoria a alergenos inhalantes, y apareciendo posteriormente las reacciones tras la ingestión de alimentos que contienen alergenos con reactividad cruzada. Por ello, no se puede realizar una evaluación correcta de la alergia a los alimentos sin investigar la alergia a inhalantes, aspecto que se también se considerará en nuestro proyecto. Los alimentos pueden inducir todo un espectro de manifestaciones clínicas, desde síntomas leves localizados en el territorio orofaríngeo, hasta reacciones graves con compromiso vital como la anafilaxia. En la actualidad no disponemos de ningún tratamiento curativo para la alergia a los alimentos, de manera que sólo se puede recomendar a los pacientes una evitación estricta del alimento. Es fácil de comprender lo difícil (y estresante) que puede resultar llevar a cabo una dieta correcta de evitación, y que las reacciones accidentales sean frecuentes, afectando la vida escolar, laboral, y social de los pacientes y sus familiares más cercanos. Sin tener en cuenta esta vertiente de la alergia alimentaria no se puede comprender su verdadera magnitud como problema de salud. La importancia del tema es tal que ha sido un área prioritaria en diferentes programas de proyectos europeos. En otro orden y aunque comparte características similares con lo anteriormente expresado, las reacciones adversas a medicamentos constituyen un problema sanitario importante. Estas escapan a los estudios de pre-comercialización, que no identifican

6 reacciones que ocurren con una frecuencia inferior al 0.1-1% de la población expuesta. Debido a que en la post-comercialización millones de individuos están expuestos, el número total de pacientes con RAM no es desdeñable. Las RAM se han convertido en objeto de un enorme y creciente interés, debido por una parte a la frecuencia de los problemas de salud que originan y por otra a la importancia de los costes económicos derivados. De hecho, algunas reacciones adversas han generado alertas sanitarias y han dado lugar a la adopción de medidas reguladoras relevantes: este fue el caso de la cerivastatina, un fármaco utilizado para disminuir los niveles de colesterol en el plasma, que se asoció en su día con la aparición de miopatías graves en algunas de las personas tratadas lo que motivó su retirada del mercado. Cabría señalar que las repercusiones de estos problemas trascienden en ocasiones el ámbito sanitario y dan lugar a lo que se ha dado en llamar alarma social : En el caso particular de la cerivastatina la importancia del problema ocasionado, del que se hicieron amplio eco los medios de comunicación de masas, dio lugar a una interpelación parlamentaria sobre el particular y aún está en curso el proceso judicial donde las personas afectadas han planteado una demanda de compensación económica a la compañía farmacéutica comercializadora ( Los dispositivos de farmacovigilancia en España articulados como Sistema Español de Farmacovigilancia tienen un recorrido de más de 20 años de actividad y han demostrado una gran eficiencia en cuanto a la identificación, cuantificación y valoración de los problemas asociados al uso de los medicamentos. Por otra parte, la investigación en materia de seguridad de medicamentos abarca un espectro amplio que va desde la investigación epidemiológica (farmacoepidemiológica) hasta la investigación experimental en distintos niveles incluidos el molecular. En España no existe una articulación de la investigación en este campo y las iniciativas existentes están dispersas y sin coordinación entre ellas. La articulación, coordinación y orientación de la actividad investigadora en este campo podrían ser de gran interés por si mismas y podría incrementarse este interés si los dispositivos investigador y de vigilancia epidemiológica tuvieran alguna suerte de encaje mediante la constitución de una red de las características que se propone en este proyecto y que coordinase la investigación en materia de seguridad de medicamentos, tanto experimental como clínica y epidemiológica, y estableciera una relación de cooperación a este respecto con el Sistema Español de Farmacovigilancia. La red de vigilancia epidemiológica de reacciones adversas a medicamentos por su parte podría beneficiarse de una actividad investigadora organizada sobre los mecanismos de producción y otros aspectos de interés de estas reacciones. El conocimiento en profundidad de estos mecanismos no sólo tendría interés para comprender la etiopatogenia o la fisiopatología de esas lesiones o para procurar un mejor desarrollo de nuevas moléculas con posible utilidad terapéutica, sino que también tendría un interés práctico inmediato para establecer los nexos de causalidad de las asociaciones entre fármacos y reacciones adversas que se identifiquen eventualmente. Las reacciones adversas a medicamentos se agrupan en dos bloques fundamentales: Tipo A que están ligadas a la acción del medicamento per se y las Tipo B, ligadas a una respuesta dependiente del individuo. Dentro de las reacciones de tipo B, idiosincráticas, se encuadran las que generalmente se conocen como reacciones alérgicas, en donde participan sistemas que liberan mediadores inflamatorios

7 interviniendo mecanismos inmunológicos específicos u otros sistemas que sin ningún reconocimiento especifico de estructuras pueden producir los mismos efectos. En un 30% de los casos el sistema inmunológico está implicado activándose uno o varios sistemas efectores. A estas generalmente se les suele designar como reacciones adversas a fármacos con base inmunológica o alérgica. La heterogeneidad de manifestaciones clínicas que se producen es un reflejo de los diferentes mecanismos patogénicos implicados. Se pueden clasificar en tres grandes categorías: a) mediadas por anticuerpos, fundamentalmente IgE, b) dependientes de linfocitos T y c) formadas por aquellas en las que existiendo una liberación de diferentes mediadores inflamatorios, no actúan mecanismos inmunológicos específicos. Estas últimas abarcan un grupo heterogéneo, de las cuales las más importantes están relacionadas con los analgésicos anti-inflamatorios no esteroideos, que de acuerdo con la teoría clásica ampliamente aceptada, estaría relacionado con la interferencia que estos fármacos producen en diferentes puntos de las vías de las prostaglandinas y leucotrienos. No se descarta la participación de otros sistemas como el complemento, sistema de las quininas y producción de oxido nítrico. En ocasiones es difícil o virtualmente imposible establecer cual es el mecanismo que interviene en las reacciones. En los últimos diez años, con los avances de la biología molecular, la inmunologia y la geonómica, se han hecho progresos importantes en este campo, fundamentalmente en Europa. En la actualidad las iniciativas que se desarrollan se llevan a cabo fundamentalmente por un número reducido de grupos de investigación, que son pequeños y poco conectados entre sí, lo que se traduce en una marcada insuficiencia para estudiar adecuadamente estas entidades. Se trata de un problema mundial, donde España, a pesar de estar bien posicionada en algunas áreas de esta investigación, carece de una interacción adecuada entre la investigación clínica y la básica, existiendo actualmente el consenso de que el abordaje idóneo de esta problemática debe ser multidisciplinar. Por ello, con este proyecto se pretende integrar a diferentes grupos (a través de la red RIRAAF) que incluyen alergólogos, farmacólogos y otros grupos clínicos que conectado con investigadores básicos de las áreas de epidemiología, proteómica, bioquímica, inmunología, farmacología y geonómica le daría un componente de aproximación multidisciplinar. Su organización y desarrollo con interacciones bidireccionales implicará consolidar y optimizar una red de identificación y captación de casos integrando grupos que participan en el sistema de Farmacovigilancia español, así como la evaluación de aquellos pacientes en los que ya están imputados los medicamentos. Una vez establecida la causalidad del fármaco se desarrollarán interacciones que se dirigirán hacia la parte nuclear (investigadores básicos). La información generada por los básicos retornará hacia los clínicos para que estos puedan mejorar sus métodos diagnósticos y apliquen test predictivos que identifiquen los individuos susceptibles. Existen dos aproximaciones no excluyentes para el diagnóstico y manejo de esta problemática: Algoritmos de causalidad y protocolos de evaluación que incluyen procedimientos in vivo y/o in vitro. La causalidad del fármaco implicado no siempre es fácil establecer de manera inequívoca, especialmente cuando concurren varios medicamentos y otros agentes administrados de forma simultánea y los tests diagnósticos tanto in vivo como in vitro carecen de la suficiente sensibilidad y capacidad de discriminación si se

8 comparan con la mayoría de los test utilizados en la práctica médica con fines diagnósticos. Esto implica que en ocasiones se recurra a la realización de pruebas de administración controlada del fármaco con el coste y riesgo que conllevan. Una entidad clínica en la que están implicados tanto alergenos alimentarios y como fármacos es la anafilaxis, con una incidencia creciente, siendo un problema de salud no desdeñable. Recientemente se ha publicado que existe un aumento en las admisiones hospitalarias por anafilaxis (RR de 7.5, IC de 6.6 a 8.6) y alergia alimentaria (RR de 5.8, IC de 5.1 a 6.8). La anafilaxis a alimentos es mas frecuente en niños y la de medicamentos en adultos. En el Canadian Pediatric Surveillance Program se encontró que el 81% de los casos de anafilaxia en niños fue de origen alimentario. Los datos de anafilaxia por medicamentos son más escasos. Recientemente en Italia se ha publicado que el 2.7% de todas las reacciones adversas a medicamentos corresponden a anafilaxia. Un aspecto importante es que en un porcentaje no despreciable de casos no se encuentra el agente inductor, existiendo evidencia de que son fenómenos mediados por IgE. Datos no publicados indican que en un 25% de los casos no se consigue identificar el agente inductor a pesar de que si se detecta en sangre periférica una elevación de los niveles de triptasa y un patrón de citoquinas tipo Th2. Un segmento importante en este proyecto lo constituye la población infantil, que merece consideración especial dado que son escasos los datos del perfil de seguridad de cualquier medicamento previa comercialización, debido a restricciones éticas y legales para su inclusión en ensayos clínicos. Los sistemas de vigilancia post-comercialización deberían centrar la atención para generar alertas acerca de fármacos de los que se tiene poca experiencia en pediatría, y de los que pueden surgir reacciones adversas a medicamentos imprevistas una vez se comercializan y comienzan a ser utilizados en pacientes que difieren de los individuos de los ensayos clínicos. Sin embargo, en ocasiones, debido a que los cofactores que actúan durante la reacción no están presentes, fundamentalmente virus, la administración controlada del fármaco no resulta la solución adecuada. En lo que concierne a la alergia a alimentos en la infancia, se trata de una patología dinámica, que puede evolucionar de diferentes formas. En los casos positivos, una vez instaurada una dieta de evitación, el paciente debe de revisarse de forma regular para verificar como y cuando se adquiere la tolerancia. En el seguimiento de este curso evolutivo se dispone de diferentes pruebas que nos informan sobre el estadio de la enfermedad. Estas han demostrado limitaciones a la hora de predecir la tolerancia, por lo que en la mayoría de las ocasiones es necesaria una provocación oral con el alimento para confirmar estado alérgico o tolerancia. La provocación oral doble ciego controlada con placebo, que constituye la prueba de oro de la alergia a alimentos, consume muchos recursos y no está exenta de riesgos para el paciente. La solución a esta cuestión sería el desarrollo de nuevas tecnologías diagnósticas in vitro que nos permitiesen predecir que pacientes alcanzaran la tolerancia.

9 Identificación de las fuentes de datos existentes y las modalidades de explotación a) Situación actual de las bases de datos de alergenos El inventario actual de alergenos, si bien incompleto, es extenso y creciente, existiendo en la actualidad más de 5000 proteínas, con presencia y distribución ubicua, de diferente naturaleza y que tienen entre sí un grado de parentesco variable. Un grupo de ellas están presentes tanto en el mundo vegetal como animal, conociéndose como panalergenos. En los últimos años se ha ido obteniendo un mayor conocimiento de su estructura molecular, existiendo en la actualidad diferentes bases de datos nacionales e internacionales que proporcionan información al respecto [1][2][3]. [ 1 ] Aalbarse RC. Strcutural bases of allergens. J Allergy Clin Immunol 2000;106: [ 2 ] Stewart GA, McWillian AS. Endogenous function and biological significance of aeroallergens. An update. Curr Opin Allergy Clin Immunol 2000;30: [ 3 ] E. NowakWegrzyn A, Ssmpson HA. Adverse reactions to foods.med Clin North Am 2006;90: b) Inventario internacional de alergenos. Entre las bases de datos e alergenos de referencia internacional citamos (sólo se presenta información de referencia).: La International Union of Immunological Societies (IUIS: que dispone de una lista única y desambigua de moléculas que producen alergia, manteniendo una lista oficial. Contiene los alérgenos cuya reactividad IgE es mayor del 5%, o aquellos cuya reactividad a IgE está en más de 5 pacientes. Este proyecto trabaja bajo los auspicios de la Unión Internacional de Sociedades Alérgicas (I.U.I.S) y de la OMS. Se actualiza dos o tres veces al año con control de calidad. Contiene únicamente información relativa a los alérgenos basándose sobretodo en la nomenclatura de estos y clasificándolos según tipos. Para cada uno, contiene referencias a pubmed, Genbank, Uniprot, etc. Sin embargo, entre sus datos no contiene información sobre alérgenos relacionados con medicamentos, y en sus servicios no proporciona buscadores ni herramientas de explotación. Sobre pacientes hay una pequeña descripción por cada alérgeno pero sin referencia a fechas ni datos específicos. Es de libre acceso. All-Allergy ( es un portal sobre asma, alergia e intolerancias, con información pública y de diseminación como artículos, noticias, publicaciones, links a organizaciones, productos etc. Basado en una lista de enlaces a sitios públicos y organizaciones privadas. Contiene una base de datos de alérgenos con más de 4500 entradas, con una lista de alérgenos por categorías (eg. Cerales, pescado, fruta, polen, etc). Dispone también de información sobre alérgenos químicos con información comparada con IUIS o PROTALL. Los usuarios pueden obtener descripciones en lenguaje natural, reacciones adversas, reacciones cruzadas, familia y relaciones taxonomicas. Además de información útil para evaluar pacientes. Todo en lenguaje natural. La información viene dada de la base de datos comercial Allergy Advisor Database. Es de libre acceso.

10 La BD Allergome Italy ( se basa en un listado de moleculas de alergenos, con información biologica sobre rutas de exposición (routes of exposure), epidemiología (prevalencia), diagnostico, citaciones inmunológicas y información sobre diagnósticos reactivos. Es la única base de datos que lista fuentes de alergias con moléculas que aun no han sido identificadas. Es de acceso privado mediante usuario/contraseña. La BD AllergoPharma. Alemania. ( ) contiene información extendida sobre alérgenos pero sin datos moleculares. Esta BD está enfocada en comprender patrones de exposición. A pesar de su nombre, no contiene información sobre alergia a medicamentos. Por cada alérgeno muestra información de sus denominaciones, imágenes, descripción general, ocurrencia, especies relacionadas, vía de entrada, sinónimos y épocas en las que suele afectar. Es de libre acceso. La BD Allergen Online USA (Searchable Allergen Online Protein Database contiene mas de 650 secuencias únicas de alérgenos conocidos extraídos de GenBank, EMBL, PIR, PDB y Swissprot. Las proteínas de la BD se han conglomerado (clusters) en grupos basados en taxonomías e identidad de secuencia. Para cada alérgeno muestra el nombre de origen, común y la nomenclatura y el código de acceso (accession number) asociado a la BD ENTREZ. Este portal contiene herramientas bioinformáticas para comparar cualquier secuencia de proteínas con esta BD. Es de libre acceso. Protall, UK ( Esta BD se creó para integrar estudios clínicos especializados en alergias a alimentos. Contiene datos sobre potenciales alérgenos de comidas vegetales, estructura molecular y actividad biológica, información química y clínica, además de general sobre el alérgeno: nombre, nomenclatura, accesión number en varias BD, propiedades del alérgeno, peso molecular, función de la proteína, estructura, epitopos, estabilidad, reactividad cruzada, información de la purificación y referencias. Existen datos clínicos como provocación oral, test cutáneos, determinación de IgE, historia clínica, etc. Terminó en 2001 y pasó a ser parte de InformALL. InformALL UK ( ) ha extendido y sustituido a la primera versión de la base de datos PROTALL. Contiene información sobre alérgenos de plantas y animales, para diferentes tipos de audiencias, datos clínicos y datos bioquímicos. Es uno de las pocas bases de datos que es revisada por un panel de expertos. Es más divulgativo que científico. Aunque contiene datos clínicos y bioquímicos en lenguaje natural. Es de libre acceso Allermatch ( es un portal donde permiten comparar secuencias de aminoácidos con alguna proteína de alérgenos que sea de interés. Realiza predicciones de alergenicidad potencial de proteínas mediante métodos bioinformaticos recomendados por el Codex alimentarious and FAO/WHO. La base de datos Asthma & Allergy & Gene Database Germany proporciona acceso a datos de estudios de linaje y mutaciones en asma y alergia ( Incluye mas de estudios de linaje y más de 480 estudios de mutaciones. Puede ser consultada por número de

11 cromosoma, tipo de estudio, tipo de salida y significancia estadística. Cada estudio de linaje tiene una posición en un cromosoma, un marcador con un enlace a la BD del genoma humano, p-value, fenotipo y las características del estudio. Cada mutación contiene información sobre el nombre del gen, tipo de mutación, tipo de asociación, fenotipo y características del estudio. Biotecnology Information for Food Safery (BIFS) ( gestiona una lista no redundante de proteínas alérgicas para facilitar comparaciones de secuencias con proteínas potencialmente alérgicas en alimentos. Son tablas planas que contienen proteínas de alimentos, no alimentos y harinas (gluten) con un nombre, nomenclatura del alérgeno, referencias en la literatura, secuencia, AN de GenPept, SwissProt y PIR. Contiene 340 entradas correspondientes a más de 20 proteínas distintas de más de 80 especies. CSL allergen database ( ). Es una BD que permite la búsqueda de alérgenos mantenido por Food Safety and Qualityu Directotate of the Central Science Laboratory at Sand Hutton York,UK. Contiene 469 entradas de alérgenos con más de 1200 enlaces a secuencias isomórficas. Las entradas contienen: nomenclatura, especies, tipo de alérgeno y descripción textual. Enlaza con las fichas de las secuencias peptídicas, datos estructurales de PDB, o referencias a PubMed. Esta BD contiene entradas de SwissProt, PIR, GenPept, RefSeq, PRF y PDB. Puede ser consultada por palabras clave (keyword) y obtener una lista de alérgenos por tipo. Latex Allergens Japan ( es una lista de alérgenos relacionados con el látex con enlaces a diferentes sitios web relacionados con alérgenos. European Bioinformatics Institute. UK ( es un centro de investigación y servicios bioinformáticos, gestionando y ofreciendo acceso público a diversas BD moleculares que incluyen secuencias de ADN, de proteínas y estructuras moleculares. SWISS-PROT Switzerland ( almacena las bases de datos de proteínas con referencias cruzadas a otras 30 bases de datos moleculares. c) Fuentes de datos nacionales Actualmente el proyecto RIRAAF (financiado por el instituto de salud Carlos III) lleva a cabo, bajo la coordinación del socio HCH (Dr. Blanca) de este proyecto, actividades de investigación coordinada y con recursos útiles para la identificación de pacientes de interés, entre ellos: la base de datos del Sistema Español de Farmacovigilancia (FEDRA), que integra los esfuerzos de las Administraciones sanitarias, central y autonómicas, para dotar a nuestro país de una fuente de información eficiente que permita la identificación precoz de los riesgos asociados a los medicamentos. Contiene información sobre más de casos de problemas asociados a medicamentos; BIFAP es una base de datos de

12 registros médicos de Atención Primaria de salud que incluye información anonimizada de pacientes pertenecientes a 1236 médicos colaboradores (1029 Médicos Generales y 207 Pediatras) de toda España para la realización de estudios farmacoepidemiológicos. BIFAP es un proyecto de la Agencia Española del Medicamento y Productos Sanitarios (AEMPS) ( EMPOGEH (información genética y clínica sobre hemorragias digestivas basada en estudios de casos y controles). Las reacciones alérgicas a alimentos han aumentado en los últimos años, sobre todo en los países industrializados. Se estima que el 8 por ciento de los menores de cuatro años y el 2 por ciento de los adultos sufren alguna reacción alérgica a alimentos. Dicha alergia es la que causa más cuadros de anafilaxis y provoca una clara disminución de la calidad de vida del paciente. Los alimentos vegetales, frutas y frutos secos, son la causa más frecuente de alergia a los alimentos en población española. Estas alergias han sido estudiadas específicamente en la Red Vegetalia (G03/094) puesta en marcha por la SEAIC, en la que además se estableció el perfil de sensibilización molecular a alérgenos de pólenes y alimentos vegetales.

13 Inventario internacional de alergenos. Pais URL International Union of Immunological Societies (IUIS) All-Allergy International South Africa Allergome Italy Italia AllergoPharma, Alemania Alemania Allergen Online USA Searchable Allergen Online Protein Database USA Protall UK InformALL UK Allermatch Holland Asthma & Allergy & Gene Database Alemania Biotecnology Information for Food Safery (BIFS) USA CSL allergen database UK Latex Allergens Japon European Bioinformatics Institute UK Swiss-Prot Switzerland Fuentes de datos nacionales Sistema Español de Farmacovigilancia (FEDRA). BIFAP Agencia Española del Medicamento y Productos Sanitarios (AEMPS) EMPOGEH: información genética y clínica sobre hemorragias digestivas España España España Red Vegetalia España Inventario de bases de datos y sitios Web con información relativa a alergenos

14 Descripción de los datos y sus relaciones. Datos Clínicos Es clara la necesidad de aunar esfuerzos para la gestión de información sobre patologías que se producen tras una respuesta biológica anormal a agentes no infecciosos, no cancerígenos y no tóxicos directos, y en apariencia inocuos, pero que causan patologías con una gran morbilidad. Esta colección integrada de datos debe incluir reacciones a proteínas exógenas de origen animal o vegetal (alérgenos) ingeridas como componentes de la dieta o inhaladas, así como a fármacos que generalmente son sustancias químicas de bajo peso molecular. Estas patologías afectan a una parte importante de la población, con prevalencias del orden del 30-40% según los últimos estudios [4, 5], que responden a unas concentraciones que generalmente se consideran inofensivas, pero que se traducen en que millones de pacientes, en el caso de alérgenos, y como mínimo miles en reacciones a fármacos puedan estar afectados. En este marco, se presentan diversas situaciones en las que una plataforma de gestión de la información unificada de alérgenos encuentra potencial utilidad. [ 4 ] A.: Björkstén B, Clayton T, Ellwood P, Stewart A, Strachan D; ISAAC Phase III Study Group. Worldwide time trends for symptoms of rhinitis and conjunctivitis: Phase III of the International Study of Asthma and Allergies in Childhood. Pediatr Allergy Immunol Mar;19(2): [ 5 ] Asher MI, Montefort S, Björkstén B, Lai CK, Strachan DP, Weiland SK, Williams H; ISAAC Phase Three Study Group. Worldwide time trends in the prevalence of symptoms of asthma, allergic rhinoconjunctivitis, and eczema in childhood: ISAAC. Phases One and Three repeat multicountry cross -sectional surveys. Lancet Aug 26;368(9537): En el apartado que sigue se enumera los datos y se les dá significado, pero el modelo de datos que refleja las reclaciones entre ellos- se detallará en e informa computacional de esta etapa preliminar La base de datos (BD) a implementar deberá unificar los datos de pacientes, muestras biológicas, entidades clínicas, Test diagnósticos y agentes de los distintos centros asociados. Los datos de pacientes son especialmente sensibles a términos legales con lo que se deberán seguir las directrices de la Ley Oficial de Protección de datos. Las especificaciones del diseño de la base de datos y la implementación final son el resultado de numerosas reuniones con el nodo de coordinación y con el consorcio del proyecto. El paciente será uno de los puntos de información central en la BD, no se podrán almacenar sus datos personales pero si los datos que sean valiosos para estadísticas o estudios avanzados, teniendo en cuenta las cuestiones de confidencialidad De forma general, el sistema puede dividirse en cuatro grandes módulos, todos ellos conectados entre sí:

15 Agentes: Se ha unificado las entidades causantes de alergia en el término al que denominaremos Agente, este término engloba tantos a alérgenos como a áptenos y se refiere a lo que en última instancia produce la alergia. Los alérgenos pueden referirse tanto a alimentos como a polen o cualquier otro tipo, igual ocurre con los áptenos, por tanto alérgenos y áptenos están clasificados jerárquicamente. En el modelo inicial de desarrollo no incluye información extendida de cada agente, pero esta podrá ser incorporada en sucesivas extensiones del sistema.

16 Vista de los alérgenos y haptenos considreados inicialmente en el proyecto pueden referirse tanto a alimentos como a polen o cualquier otro tipo, igual ocurre con los áptenos, por tanto alérgenos y áptenos están clasificados jerárquicamente

17 Pacientes: El paciente es uno de los puntos de información central en la base de datos, no podremos almacenar sus datos personales pero si los datos que sean valiosos para estadísticas o estudios. La anonimización se ha basado en información de Agencia Española de Protección de datos, obteniendo respuesta por parte de esta de los siguientes pasos a seguir. Se ha llegado al acuerdo de que no se mantendrá información relacionable con un paciente real en la base de datos ni de los médicos que introducen esta información. Ambas relaciones se mantendrán almacenadas en bases de datos locales en el nodo coordinador de la red, que será el encargado aplicar la LOPD a esos datos. En el modulo de paciente deberán considerarse distintos grupos de información: - Historia personal y familiar del paciente: Cada paciente podrá tener almacenada una historia personal y familiar. Esta historia personal contendrá observaciones, si el paciente es alérgico a alimentos, medicamentos e inhalantes. Además de registrar los agentes que el paciente ha indicado durante diferentes evaluaciones médicas. - Datos del paciente: contiene los datos de paciente válidos para estadísticas, así como el identificador del médico responsable y el hospital al que pertenece. - Muestras: Los pacientes puede tener muestras biológicas extraídas, está. Para cada muestra se almacena el código de esta, el tipo (DNA, RNA, Serum, Secrecciones nasales, etc..) y la fecha de extracción.

18 Episodio Alérgico: Una reacción alérgica o episodio se define como sensibilidades a sustancias (agentes) que se adquieren por contacto a través de la piel, inhalación a través de los pulmones, ingestión o por medio de inyecciones y que producen síntomas específicos. Para un paciente es posible almacenar varios episodios alérgicos, cada episodio alérgico tendrá asociado: Varios agentes y para cada uno de ellos, una vía, dosis y número de veces que se ha ingerido. Una lista de síntomas que se referenciarán mediante un nombre, un porcentaje y una descripción de texto libre. Estos síntomas están categorizados según su procedencia: nasales, oculares, bronquiales, cardiovasculares etc. Aspectos temporales tales como días de duración, tiempo de la reacción desde la exposición, tiempo de evaluación y periodo (primavera, verano, etc.) Varios diagnósticos iniciales y finales. Test: Existen numerosos tipos de test: test reacción inmediata, test reacción tardía, test basofilos, test IGE total, etc. Un paciente puede tener varios o ningún test realizado, en base a esto se irá completando información con distinto grado de detalle. En el caso de los test se ha realizado una ficha donde se indica en el caso de que sean unos agentes fijos los valores que deberían anotarse para cada agente, también existen test en los que pueden incluirse cualquier agente. Estos test también se encuentran categorizados, debido a la gran variedad de test y a la velocidad que surgen nuevos, los test se definen por medio de la interfaz del sistema.

19 Implementación Se implementarán al menos dos aplicaciones software (ver infome D.1.2): - Aplicación distribuida de base de datos. - Aplicación para anonimizar datos Aspectos legales de control, acceso y protección de datos (Ley Oficial de Protección de Datos, LOPD). El paciente será uno de los puntos de información central en la base de datos, no podremos almacenar sus datos personales pero si los datos que sean valiosos para estadísticas o estudios avanzados, y teniendo en cuenta las cuestiones de confidencialidad. Basándonos en el texto de la Agencia Española de Protección de datos: Para entender que se efectúa una correcta disociación o anonimización es necesario que se efectúe el correspondiente procedimiento de disociación definido por el artículo 3 f) de la Ley Orgánica como Todo tratamiento de datos personales de modo que la información que se obtenga no pueda asociarse a persona identificada o identificable Esta definición se vuelve a reiterar en el artículo 5 del Real Decreto 1720/2007, de 21 de diciembre, por el que se desarrolla la Ley Orgánica, donde en su apartado p) define el Procedimiento de disociación: Todo tratamiento de datos personales que permita la obtención de datos disociados

20 Y en el apartado e) concreta que es un Dato disociado: aquél que no permite la identificación de un afectado o interesado. En consecuencia, para entender que se ha efectuado correctamente la disociación, es necesario que no se permita por ningún medio identificar al paciente. Del tenor de la consulta se desprende que cada médico introduce previa disociación los datos de sus pacientes, estos datos podrán ser consultados por los demás médicos sin poder identificar al sujeto afectado. La única duda que se nos plantea en el supuesto de hecho planteado en la consulta, es si el nombre del médico que ha introducido los datos de sus pacientes, aparece en dicha base de datos. Para el supuesto de no incluirse el nombre del médico, la base de datos estaría totalmente anonimizada y por tanto quedaría excluida de ámbito de aplicación de la Ley Orgánica 15/1999 y su Reglamento que lo desarrolla. En consecuencia, no debería de notificarse el fichero al Registro General de Protección de Datos, ni obtenerse el consentimiento informado ni adoptar las medidas de seguridad previstas en el Real Decreto 1720/2007, de 21 de diciembre. Si por el contrario, el nombre del médico aparece en la base de datos, está queda sometida en su integridad a la Ley Orgánica 15/1999. Debiendo notificar el fichero a través del sistema Nota que es gratuito y se puede obtener de la página web de la Agencia Asimismo debe informar a los médicos de que sus datos se van a incorporar a dicho fichero, y que éstos dan su consentimiento al tratamiento de sus datos, consentimiento que se entenderá otorgado por la voluntad de participar en la base de datos, y por último se exige implantar las medidas de seguridad previstas en el Reglamento de desarrollo de la Ley Orgánica 15/1999. Se ha llegado al acuerdo de que no se mantendrá información relacionable con un paciente real en la base de datos ni de los médicos que introducen esta información. Ambas relaciones se mantendrán almacenadas en bases de datos locales en el nodo coordinador de la red, que será el encargado de si es necesario, aplicar la LOPD a esos datos. Cuando la información a almacenar esté consensuada se efectuará una consulta a la Agencia Española de Protección de datos con los datos de este proyecto para asegurarnos y que quede constancia escrita que lo almacenado está cumpliendo la Ley.