Las proteínas son como Spider-Man en el multiverso .
La historia subyacente es la misma: cada componente básico de una proteína se basa en un código de ADN de tres letras. Sin embargo, si cambia una letra, la misma proteína se convierte en una versión diferente de sí misma. Si tenemos suerte, algunos de estos mutantes aún pueden realizar sus funciones normales.
Cuando tenemos mala suerte, un solo cambio en una letra del ADN desencadena una gran variedad de trastornos hereditarios, como la fibrosis quística y la anemia de células falciformes. Durante décadas, los genetistas han buscado estas mutaciones que causan enfermedades examinando genes compartidos en árboles genealógicos. Una vez encontradas, las herramientas de edición de genes como CRISPR están comenzando a ayudar a corregir errores tipográficos genéticos y a brindar curas que cambian vidas.
¿El problema? Hay más de 70 millones de posibles intercambios de letras de ADN en el genoma humano. Incluso con la llegada de la secuenciación de ADN de alto rendimiento, los científicos han descubierto minuciosamente sólo una pequeña cantidad de mutaciones potenciales relacionadas con enfermedades.
Esta semana, Google DeepMind trajo una nueva herramienta a la mesa: AlphaMissense. Basado en AlphaFold , su exitoso algoritmo para predecir estructuras de proteínas, el nuevo algoritmo analiza secuencias de ADN y determina qué intercambios de letras de ADN probablemente conduzcan a enfermedades.
La herramienta solo se centra en cambios de una sola letra del ADN llamados “mutaciones sin sentido”. En varias pruebas, clasificó el 89 por ciento de las decenas de millones de posibles errores tipográficos genéticos como benignos o patógenos, dijo DeepMind.
AlphaMissense amplía el trabajo de DeepMind en biología. En lugar de centrarse únicamente en la estructura de las proteínas, la nueva herramienta va directamente al código fuente: el ADN. Sólo una décima parte por ciento de las mutaciones sin sentido en el ADN humano se han mapeado utilizando tácticas de laboratorio clásicas. AlphaMissense abre un nuevo universo genético en el que los científicos pueden explorar objetivos para enfermedades hereditarias.
“Este conocimiento es crucial para un diagnóstico más rápido”, escribieron los autores en una publicación de blog, y para llegar a la “causa raíz de la enfermedad”.
Por ahora, la compañía sólo publica el catálogo de predicciones de AlphaMissense, en lugar del código en sí. También advierten que el algoritmo no está destinado a diagnósticos. Más bien, debería verse más como una pista sobre mutaciones que causan enfermedades. Los científicos deberán examinar y validar cada punta utilizando muestras biológicas.
“En última instancia, esperamos que AlphaMissense, junto con otras herramientas, permita a los investigadores comprender mejor las enfermedades y desarrollar nuevos tratamientos que salven vidas”, dijeron los autores del estudio Žiga Avsec y Jun Cheng de DeepMind.
Hablemos de proteínas
Una rápida introducción a las proteínas. Estas moléculas están formadas a partir de instrucciones genéticas en nuestro ADN representadas por cuatro letras: A, T, C y G. La combinación de tres de estas letras codifica el componente básico de una proteína: un aminoácido. Las proteínas se componen de 20 tipos diferentes de aminoácidos.
La evolución programó la redundancia en el proceso de traducción de ADN a proteína. Múltiples códigos de ADN de tres dígitos crean el mismo aminoácido. Incluso si algunas letras del ADN mutan, el cuerpo aún puede producir las mismas proteínas y enviarlas a sus estaciones de trabajo normales sin problemas.
El problema surge cuando un solo cambio de letra arrasa con toda la operación.
Los científicos saben desde hace mucho tiempo que estos errores sin sentido tienen consecuencias devastadoras para la salud. Pero cazarlos ha requerido años de tedioso trabajo. Para hacer esto, los científicos editan manualmente secuencias de ADN en un gen sospechoso, letra por letra, las convierten en proteínas y luego observan sus funciones biológicas para localizar la mutación sin sentido. Con cientos de posibles sospechosos, identificar una sola mutación puede llevar años.
¿Podemos acelerarlo? Introduzca las mentes de las máquinas.
ATCG de aprendizaje de IA
DeepMind se une a un campo floreciente que utiliza software para predecir mutaciones que causan enfermedades.
En comparación con los métodos computacionales anteriores, AlphaMissense tiene una ventaja. La herramienta aprovecha lo aprendido de su algoritmo predecesor, AlphaFold. Conocido por resolver la predicción de la estructura de proteínas, un gran desafío en este campo, AlphaFold está en el salón de la fama de la biología algorítmica.
AlphaFold predice las estructuras de las proteínas, que a menudo determinan la función, basándose únicamente en secuencias de aminoácidos. Aquí, AlphaMissense utiliza la “intuición” de AlphaFold sobre las estructuras de las proteínas para predecir si una mutación es benigna o perjudicial, dijo el autor del estudio y vicepresidente de investigación de DeepMind, el Dr. Pushmeet Kohli, en una conferencia de prensa.
La IA también aprovecha el enfoque del modelo de lenguaje grande. En este sentido, es un poco como GPT-4, la IA detrás de ChatGPT, sólo que reajustada para decodificar el lenguaje de las proteínas. Estos editores algorítmicos son excelentes para localizar variantes de proteínas y señalar qué secuencias son biológicamente plausibles y cuáles no. Para Avsec, ese es el superpoder de AlphaMissense. Ya conoce las reglas del juego de las proteínas, es decir, sabe qué secuencias funcionan y cuáles fallan.
Como prueba de concepto, el equipo utilizó una base de datos estandarizada de variantes sin sentido, llamada ClinVar , para desafiar su sistema de inteligencia artificial. Estos tipos genéticos conducen a múltiples trastornos del desarrollo. AlphaMissense superó los modelos existentes para identificar mutaciones que causan enfermedades.
¿Un cambio de juego?
Predecir las estructuras de las proteínas puede resultar útil para estabilizar los fármacos proteicos y determinar otras propiedades biofísicas. Sin embargo, resolver por sí solo la estructura “en general ha sido de poco beneficio” cuando se trata de predecir variantes que causan enfermedades, dijeron los autores.
Con AlphaMissense, DeepMind quiere cambiar el rumbo.
El equipo está lanzando al público toda su base de datos de posibles mutaciones causantes de enfermedades. En general, buscaron el 32 por ciento de todas las variantes sin sentido que probablemente desencadenan enfermedades y el 57 por ciento que probablemente sean benignas. El algoritmo se une a otros en el campo, como PrimateAI , lanzado por primera vez en 2018 para detectar mutantes peligrosos.
Para ser claros: los resultados son sólo predicciones. Los científicos tendrán que validar estas pistas generadas por la IA en experimentos de laboratorio. AlphaMissense proporciona “sólo una prueba”, dijo la Dra. Heidi Rehm del Broad Institute, que no participó en el trabajo.
Sin embargo, el modelo de IA ya ha generado una base de datos que los científicos pueden aprovechar “como punto de partida para diseñar e interpretar experimentos”, dijo el equipo.
En el futuro, AlphaMissense probablemente tendrá que abordar complejos proteicos , dijeron Marsh y Teichmann. Estas sofisticadas arquitecturas biológicas son fundamentales para la vida. Cualquier mutación puede romper su delicada estructura, provocar un mal funcionamiento y provocar enfermedades. El laboratorio del Dr. David Baker en la Universidad de Washington, otro pionero en la predicción de la estructura de las proteínas, ya ha comenzado a utilizar el aprendizaje automático para explorar estas catedrales de proteínas .
Por ahora, no se puede confiar en ninguna herramienta única que prediga las mutaciones del ADN que causan enfermedades para diagnosticar enfermedades genéticas, ya que los síntomas a menudo resultan tanto de mutaciones hereditarias como de señales ambientales. Esto también se aplica a AlphaMissense. Pero a medida que el algoritmo (y la interpretación de sus resultados) avance, su uso en la “odisea del diagnóstico seguirá mejorando”, dijeron.
Crédito de la imagen: Google DeepMind / Unsplash
Fuente:
Fan, S. (2023, 21 septiembre). DeepMind AI hunts down the DNA mutations behind genetic disease. Singularity Hub. https://singularityhub.com/2023/09/21/deepmind-ai-hunts-down-the-dna-mutations-behind-genetic-disease/