La IA lo ha vuelto a hacer.
Después de resolver uno de los misterios más grandes de la biología, la predicción de la estructura de las proteínas , descifró cómo las proteínas se unen en complejos y soñó con nuevas estructuras de proteínas que, en última instancia, pueden convertirse en medicamentos para controlar nuestra biología básica, salud y vida.
Sin embargo, cuando se enfrentó a enormes complejos de proteínas, la IA vaciló. Hasta ahora. En una hazaña alucinante, un nuevo algoritmo descifró la estructura en el corazón de la herencia: un complejo masivo de aproximadamente 1000 proteínas que ayudan a canalizar las instrucciones del ADN al resto de la célula. El modelo de IA se basa en AlphaFold por DeepMind y RoseTTAfold del laboratorio del Dr. David Baker en la Universidad de Washington, ambos lanzados al público para experimentar más.
Nuestros genes están alojados en una estructura similar a un planeta, denominada núcleo, para su protección. El núcleo es un castillo de alta seguridad: solo se permite la entrada y salida de moléculas específicas para entregar instrucciones de ADN al mundo exterior, por ejemplo, a las fábricas de proteínas en la célula que traducen las instrucciones genéticas en proteínas.
En el corazón de la regulación de este tráfico están los complejos de poros nucleares, o NPC (guiño a los jugadores). Son como puentes levadizos extremadamente intrincados que monitorean estrictamente los entresijos de los mensajeros moleculares. En los libros de texto de biología, los NPC a menudo se ven como miles de baches caricaturescos salpicados en un globo terráqueo. En realidad, cada NPC es una maravilla arquitectónica masivamente compleja en forma de rosquilla y uno de los complejos de proteínas más grandes de nuestro cuerpo.
¿Por qué cuidar? Como resolver un enorme rompecabezas, resolver la estructura de NPC es gratificante por sí solo. Pero debido a que controlan cómo se transmite la información del ADN al resto de la célula, los NPC son esenciales para la terapia génica, las vacunas de tipo ARNm, CRISPR y potencialmente otros tratamientos genéticos que aún no hemos imaginado.
“NPC [is] un punto de acceso para las mutaciones asociadas a la enfermedad y las interacciones huésped-patógeno”, dijo el Dr. Di Jiang, editor senior de Science , en una inmersión profunda en los NPC para su último número. “El trabajo aquí presentado representa un triunfo de la biología estructural experimental”.
Un enigma estructural
“Poros nucleares” suena como algo de un video de cuidado de la piel. Pero para los biólogos celulares, son un enigma de décadas. “Los NPC son esenciales para la vida”, explicó el Dr. Francis Collins, exdirector de los Institutos Nacionales de Salud (NIH).
Nuestras hebras de ADN están enrolladas alrededor de un carrete de proteína. Luego son secuestrados dentro del núcleo, que protege el ADN de químicos, virus u otra basura potencialmente dañina. Imagínese envolver agujeros de donas en una envoltura de plástico de doble capa: esa es la envoltura nuclear. Ahora haz algunos agujeros en el envoltorio: esos son los NPC.
Estos “agujeros en la pared” aparentemente simples son guardianes críticos del control genético en las células. Nuestras células funcionan traduciendo el código de ADN en proteínas para construir tejidos físicos o controlar funciones biológicas básicas: decirle a una célula cuándo dividirse o morir, equilibrar el metabolismo y protegerse de los invasores virales.
Pero el ADN está secuestrado dentro del núcleo. Cientos de mensajeros proteicos necesitan ingresar al santuario nuclear para transcribir las instrucciones del ADN en ARNm y transportarlo de regreso a las fábricas de producción de proteínas de la célula. Cada ejecución tiene que pasar por alto a los NPC, que actúan como guardias y canales en una estructura.
Los científicos han buscado durante mucho tiempo decodificar la estructura de NPC, usando magia bioquímica para alterar su función normal o rayos X para escanear su estructura cristalina. El trabajo fue absolutamente minucioso. A partir de esos datos, los científicos encontraron dos tipos principales de proteínas que forman la puerta.
El primer tipo construye el andamio de compuerta. Estas proteínas, denominadas NUP (nucleoporinas), se unen para alinear el túnel. El segundo tipo actúa como barro vivo para paneles de yeso. Estas proteínas son mucho más flexibles, se pegan a lo largo de las proteínas de andamiaje y se extienden hacia el canal central, donde pueden agarrarse físicamente a la carga para ayudarla a moverse.
Compuesto por casi 1000 proteínas que forman aproximadamente 30 “muelles” diferentes, las estructuras NPC son difíciles de resolver porque cambian dinámicamente. Múltiples proteínas, por ejemplo, actúan como bisagras interconectadas para cambiar la configuración o el tamaño de los poros. Debido a que toda la estructura “abraza íntimamente” la envoltura nuclear, los NPC no se pueden estudiar de forma aislada, explicó el equipo, dirigido por los Dres. Gerhard Hummer y Martin Beck en el Instituto Max Planck de Biofísica, y el Dr. Jan Kosinski en el Laboratorio Europeo de Biología Molecular. Hasta ahora, incluso con medios bioquímicos de última generación, los científicos solo han resuelto el 46 por ciento de la estructura NPC.
“Es como cuando desmontas y vuelves a montar un dispositivo electrónico. Siempre quedarán algunos tornillos, y simplemente no sabes dónde se supone que deben estar”, dijo Kosinski. Pero gracias a la IA, “finalmente logramos adaptar la mayoría de ellos y ahora sabemos exactamente dónde están, qué hacen y cómo”.
Ingrese IA
El equipo primero aprovechó y mejoró un método popular para analizar NPC llamado análisis cryo-ET . El método saltó a la fama en 2015 cuando resolvió estructuras celulares hasta una escala casi atómica. Uno de los problemas para resolver la estructura de NPC es la falta de resolución de conjuntos de datos anteriores, explicó el equipo. Aquí, recopilaron un “conjunto de datos aproximadamente cinco veces más grande” que en su intento anterior y utilizaron un nuevo método informático para analizar los datos.
Al observar los mapas recién dibujados, el equipo pudo distinguir entre la envoltura nuclear, o “envoltura” de ADN, cuando estaba en un estado restringido y uno más relajado. Profundizando más, el equipo aprovechó AlphaFold y RoseTTAfold para predecir un conjunto completo de modelos para proteínas NPC. El dúo funcionó bien: el análisis pudo modelar la mayoría de las proteínas nucleares con gran confianza y comparó los datos de los métodos tradicionales de análisis microscópico.
Luego vino la parte difícil. Al igual que los muelles de un astillero, los NPC están fuertemente vinculados con las vías de tráfico de proteínas, que a menudo son difíciles de modelar en 3D. Usando su modelo, el equipo asignó “puntos de anclaje” de conectores de proteínas al túnel principal de NPC. El modelado adicional construyó un “mapa de Google” para saber cómo se conectan los enlazadores. Como un astillero bien organizado, cada uno ayuda a mantener la estructura de NPC.
Hackeando el corazón de la herencia
El uso de IA para resolver estructuras de proteínas se ha promocionado como el avance de la década. Este estudio es uno de los primeros en mostrar el poder del algoritmo en entornos desordenados y complicados del mundo real.
“Este trabajo ejemplifica cómo, en el futuro, la biología estructural adoptará la biología celular para crear modelos atómicos de ensamblajes de moléculas cada vez más grandes que realizan diferentes funciones en diferentes partes de la célula”, dijo Beck.
La revolución ya está en camino. En la misma edición de la revista, un equipo separado dirigido por el Dr. Hao Wu en la Escuela de Medicina de Harvard combinó imágenes de microscopía con AlphaFold para resolver parte de la estructura de NPC utilizando los huevos de Xenopus laevis, la rana con garras africana que es un favorito en la investigación bioquímica.
Pero la IA aún no es el salvador. Como señaló el Dr. Thomas Schwartz del MIT, que no participó en los estudios, los NPC son criaturas vivas que cambian su configuración. Por ejemplo, sus canales tienden a ser más anchos cuando están felizmente ubicados dentro de la envoltura nuclear, en comparación con después de que se extraen para estudiarlos bajo un microscopio. En otras palabras, los complejos de proteínas son difíciles de descifrar y controlar. Pero la IA está de nuestro lado.
“Ahora podemos pensar en construir un modelo dinámico completo del NPC y simular el transporte nuclear en detalle atómico”, dijo. Con la predicción de proteínas basada en IA en marcha, aún más emocionante es lo que está por venir.
Crédito de la imagen: V. Altounian/ Ciencia