Estamos observando millones de años de evolución para diagnosticar enfermedades raras
popEVE ordena variantes genéticas por gravedad analizando patrones conservados en el árbol de la vida, desde gusanos hasta ballenas, mejorando la precisión diagnóstica. El modelo combina datos de especies animales y población humana, evitando sesgos de poblaciones europeas y siendo accesible para hospitales con recursos limitados.
- popEVE ordena variantes genéticas por gravedad analizando patrones conservados desde gusanos hasta ballenas
- El modelo combina datos de especies animales y población humana, evitando sesgos de poblaciones europeas
- Colaboración activa con hospitales en Senegal para explorar diversidad genética africana poco estudiada
- Caso de éxito: niño con enfermedad neuromuscular diagnosticado mediante popEVE, tratado con suplementación vitamínica
Investigadores del CRG de Barcelona desarrollan popEVE, un modelo computacional que analiza millones de años de evolución para identificar variantes genéticas causantes de enfermedades raras, acelerando diagnósticos que actualmente tardan años.
Cuando un paciente llega a la consulta con síntomas extraños que ningún médico logra explicar, comienza una carrera contra el tiempo. En las enfermedades raras, esa carrera puede durar años. El genoma de cada persona contiene miles de variantes genéticas, y encontrar cuál de ellas está causando la enfermedad es, en palabras de Mafalda Dias, investigadora del Centre de Regulació Genòmica de Barcelona, "como buscar una aguja en un pajar". Ahora, un nuevo modelo computacional llamado popEVE promete cambiar esa ecuación, utilizando una estrategia inesperada: analizar millones de años de evolución para diagnosticar enfermedades en el presente.
Dias llegó a la biología computacional desde un camino poco convencional. Doctora en Física Teórica por la Universidad de Sussex, trabajó en cosmología y en el Sincrotrón Alemán de Electrones antes de redirigir su carrera hacia la genómica. En el CRG codirige un laboratorio de genómica computacional y modelos de aprendizaje automático. El equipo presentó popEVE en la revista Nature Genetics como respuesta a un problema fundamental: la secuenciación genómica ha revolucionado cómo entendemos las enfermedades raras, pero la mayoría de pacientes sigue sin obtener un diagnóstico claro o a tiempo.
El modelo se construye sobre los cimientos de un trabajo anterior llamado EVE, que aprendió a detectar patrones conservados en proteínas comparando especies muy distintas, desde gusanos hasta ballenas. La lógica es elegante: si una variante genética rompe un patrón que ha sido preservado durante millones de años de evolución, probablemente afecta la función de la proteína y puede estar asociada a enfermedad. Pero EVE tenía una limitación crítica: analizaba proteína por proteína y no permitía comparar la severidad relativa entre variantes diferentes. PopEVE nace precisamente para resolver eso, ordenando variantes según su gravedad analizando el proteoma completo, el conjunto entero de proteínas que produce un organismo.
El funcionamiento de popEVE combina dos tipos de información: lo que se observa en especies animales y lo que se observa en poblaciones humanas, con el objetivo de capturar la severidad real de cada variante. Cuando un paciente llega al hospital, el médico ya tiene sospechas sobre ciertos genes según los síntomas. PopEVE no reemplaza el diagnóstico clínico, pero lo acelera ofreciendo evidencia adicional basada en principios evolutivos. La ventaja de analizar el proteoma completo es que muchas veces no se sabe de antemano qué gen está implicado. En enfermedades raras puede que solo existan diez casos descritos en el mundo o que sea el primero jamás documentado. Si se analizan únicamente genes ya conocidos, pueden pasarse por alto variantes relevantes. Una visión completa permite identificar incluso genes que nunca antes se habían relacionado con una enfermedad.
Un aspecto crucial del modelo es cómo evita reproducir los sesgos que caracterizan la investigación genética actual. La mayoría de datos genómicos provienen de personas blancas y europeas, lo que puede distorsionar los diagnósticos en otras poblaciones. PopEVE resuelve esto porque aprende del árbol de la vida, observando qué funciones proteicas han sido seleccionadas en especies muy distintas, no en una población humana concreta. Además, el modelo no analiza la frecuencia exacta de las variantes, sino simplemente si están presentes o no, evitando que haga sobreajuste sobre una población específica. Esta característica es especialmente relevante porque el equipo ya está colaborando con hospitales en Senegal, donde descubrieron que existe un vacío enorme de información genética. Trabajando con el médico Pedro Rodríguez en Dakar, observan que incluso en patologías compartidas con pacientes europeos, la base genética puede ser completamente distinta.
En el estudio publicado, el equipo describe el caso de un niño con una enfermedad neuromuscular. Con modelos anteriores no conseguían encontrar la variante que provocase claramente la enfermedad. Con popEVE identificaron una que destacaba como mucho más patogénica que el resto. Y de manera excepcionalmente positiva, se trataba de una enfermedad con tratamiento muy sencillo: una suplementación vitamínica. Ese caso encapsula lo que el modelo promete: no solo identificar la causa, sino hacerlo lo suficientemente rápido para que el paciente acceda al tratamiento.
Dias enfatiza que popEVE está diseñado para ser accesible incluso para hospitales con pocos recursos. Los datos que alimentan el modelo provienen de recursos públicos que contienen secuencias completas de organismos muy diversos. El equipo está entrando en proyectos que quieren secuenciar todas las especies eucariotas del planeta. Estamos analizando la diversidad del ADN y usando esa información para comprender enfermedades humanas, lo que es, en palabras de Dias, un recordatorio de la importancia de proteger la biodiversidad. El proyecto está en fase de mejora de su aplicación clínica junto a hospitales como Sant Joan de Déu y colaboradores en Senegal. El siguiente paso es ampliar el modelo hacia enfermedades complejas, donde intervienen muchas variantes y factores de riesgo, y entender no solo si una variante es patogénica, sino en qué órgano afecta, en qué etapa de la vida y mediante qué mecanismo.
Citas Notables
Como buscar una aguja en un pajar— Mafalda Dias, sobre el desafío de identificar variantes causantes entre miles de posibilidades
Creemos que este tipo de herramientas puede ayudar a hacer el diagnóstico genético más justo y democrático— Mafalda Dias, sobre la accesibilidad de popEVE para hospitales con recursos limitados
La Conversación del Hearth Otra perspectiva de la historia
¿Por qué recurrir a la evolución para diagnosticar enfermedades modernas? Parece un rodeo.
No es un rodeo. La evolución es el registro más largo de lo que funciona en biología. Si una proteína ha mantenido la misma estructura durante millones de años en especies distintas, es porque esa estructura es crítica. Una variante que la rompe probablemente causa daño.
Pero ¿cómo sabe el modelo cuál de miles de variantes es la culpable?
Compara patrones. Busca cuál variante rompe un patrón que ha sido preservado. Es como si tuvieras un edificio que ha permanecido en pie durante siglos y alguien cambia un ladrillo específico. Ese ladrillo es probablemente importante.
¿Y si el patrón que rompe no es el que causa la enfermedad?
Por eso popEVE no reemplaza el diagnóstico clínico. Ofrece evidencia adicional que acelera el proceso. El médico sigue siendo quien decide. Pero ahora tiene una brújula.
Mencionan un caso de un niño con enfermedad neuromuscular. ¿Qué hizo popEVE diferente?
Identificó una variante que destacaba como mucho más patogénica que el resto. Los modelos anteriores no podían ordenar variantes por gravedad. PopEVE sí. Y en ese caso, el diagnóstico llevó a un tratamiento simple: vitaminas.
¿Qué pasa con los sesgos en los datos? La mayoría de genomas secuenciados son europeos.
PopEVE aprende del árbol de la vida, no de una población específica. Observa qué ha sido seleccionado en gusanos, peces, pájaros, mamíferos. Eso es universal. Por eso funciona en Senegal igual que en Barcelona.
¿Cuál es el siguiente paso?
Entender no solo si una variante es patogénica, sino cómo actúa. En qué órgano, en qué momento de la vida, por qué mecanismo. Eso abre la puerta a terapias más precisas.