Diseñar una proteína es un poco como hacer un gabinete. El primer paso es construir la columna vertebral que mantiene unida a la proteína. Pero luego viene la parte difícil: averiguar dónde instalar las bisagras en el andamio, es decir, encontrar los mejores “puntos de acceso” para colocar puertas, estantes y otros accesorios que, en última instancia, hacen que el gabinete sea completamente funcional.
En cierto modo, las proteínas también tienen puntos calientes incrustados en sus estructuras. Fieles a su nombre, “sitios funcionales”, estos rincones y grietas intrigantes forman muelles intrincados para que otras proteínas o medicamentos se agarren. Los sitios son fundamentales para realizar la mayoría de nuestros procesos biológicos básicos. También son una enorme mina de oro para diseñar nuevos tratamientos y medicamentos.
¿El problema? Los sitios funcionales son difíciles de mapear. Tradicionalmente, los científicos tenían que mutar áreas sospechosas en una proteína una por una, cambiando un aminoácido por otro, para concretar puntos de unión precisos. Como un detective que examina a cientos de sospechosos, de los cuales podría haber muchos, es extremadamente tedioso.
Un nuevo estudio en Science echó por tierra todo el libro de juegos. Dirigido por el Dr. David Baker de la Universidad de Washington, un equipo aprovechó la “imaginación” de una IA para idear una miríada de sitios funcionales desde cero. Es la “creatividad” de una mente de máquina en su máxima expresión: un algoritmo de aprendizaje profundo que predice el área general del sitio funcional de una proteína, pero luego esculpe aún más la estructura.
Como prueba de la realidad, el equipo usó el nuevo software para generar medicamentos que combaten el cáncer y diseñar vacunas contra virus comunes, aunque a veces mortales. En un caso, la mente digital ideó una solución que, cuando se probó en células aisladas, fue una combinación perfecta para un anticuerpo existente contra un virus común. En otras palabras, el algoritmo “imaginó” un punto de acceso de una proteína viral, haciéndolo vulnerable como objetivo para diseñar nuevos tratamientos.
El algoritmo es la primera incursión del aprendizaje profundo en la construcción de proteínas en torno a sus funciones, lo que abre una puerta a tratamientos que antes eran inimaginables. Pero el software no se limita a los puntos críticos de proteínas naturales. “Las proteínas que encontramos en la naturaleza son moléculas asombrosas, pero las proteínas diseñadas pueden hacer mucho más”, dijo Baker en un comunicado de prensa. El algoritmo está “haciendo cosas que ninguno de nosotros pensó que sería capaz de hacer”.
El punto caliente de la proteína
El equipo de Baker no es ajeno a la predicción de proteínas con mentes artificiales. Hace unos años, sacudieron el campo de la biología estructural al lanzar Rosetta, un software que puede predecir la estructura 3D de una proteína basándose únicamente en su secuencia de aminoácidos. Además, mapearon complejos de proteínas y diseñaron “destornilladores” de proteínas desde cero para separar las interacciones de proteínas no deseadas. A fines del año pasado, lanzaron una red de aprendizaje profundo denominada trRosetta, un “arquitecto” de IA que generaliza cómo las cadenas de aminoácidos se organizan en estructuras intrincadas a nanoescala.
Retrocedamos.
Es fácil imaginar las proteínas como el ala de pollo carnosa y nervuda que estoy mordiendo mientras escribo esta oración. Pero a nivel molecular, son mucho más elegantes. Imagine varios bloques de Lego (aminoácidos) unidos por una cuerda. Ahora gírelo, girando la cadena hasta que algunos bloques encajen entre sí. Esto forma una estructura delicada que a menudo parece una hélice o sábanas arrugadas. En algunas proteínas, estos componentes básicos se ensamblan aún más en complejos, por ejemplo, creando un canal que atraviesa la membrana protectora de una célula como una autopista interestatal patrullada.
Las proteínas impulsan todos los procesos biológicos, a menudo a través de una cascada de interacciones con otras proteínas o fármacos que, dependiendo de la pareja, pueden desencadenar consecuencias completamente diferentes: ¿una célula debe vivir o morir? ¿Atacar a un invasor potencial o retirarse? En otras palabras, las proteínas son los componentes básicos de la vida, y analizar su estructura es la forma en que podemos piratear la vida.
Aquí está la cosa: no todas las partes de una proteína son iguales. Si una proteína es un cuerpo humano, los sitios funcionales son sus “manos”, donde se agarra a otra proteína o fármaco, provoca reacciones enzimáticas o lucha contra los patógenos invasores. Incrustados directamente en la estructura de la proteína, estos sitios son difíciles de precisar y aún más difíciles de recrear.
El nuevo estudio abordó el problema con una versión de Rosetta: con algunos conocimientos previos, ¿es posible que una computadora sueñe con una cadena de aminoácidos que naturalmente se pliegan en un sitio funcional?
El soñador y el realista
El problema puede parecer exótico, pero hay un ejemplo anterior, en un campo diferente. Usando una red neuronal, OpenAI creó una amplia gama de imágenes solo a partir de subtítulos de texto. El algoritmo DALL·E, derivado del generador de texto con IA de rockstar GPT-3 , generó imágenes fantásticas pero de aspecto realista basadas en indicaciones de texto simples mediante la detección de patrones a partir de su entrenamiento. “Toma los rincones más profundos y oscuros de su imaginación y los convierte en algo inquietantemente pertinente”, dijo el Dr. Hany Farid de UC Berkeley después del lanzamiento inicial de la herramienta.
La construcción de un sitio funcional de proteína es similar. Aquí, los aminoácidos son las letras y el sitio funcional de la proteína es la imagen. “La idea es la misma: las redes neuronales se pueden entrenar para ver patrones en los datos. Una vez entrenado, puede darle un aviso y ver si puede generar una solución elegante”, dijo el Dr. Joseph Watson, autor principal del nuevo trabajo. Excepto que en lugar de escribir una novela, el algoritmo podría ayudar a reescribir la vida.
El equipo comenzó con una creación anterior, trRosetta. Es una red neuronal diseñada originalmente para idear nuevas proteínas basadas en secuencias de aminoácidos y poder predecir su estructura, algunas tan ajenas a las naturales que el equipo denominó “alucinación” al funcionamiento interno del aprendizaje profundo. El algoritmo parecía perfecto: podía predecir tanto la secuencia de aminoácidos de una proteína como su estructura.
¿El hipo? Realmente no funcionó. Por el contrario, el OG de predicción de estructura de proteínas, RoseTTAFold , se desempeñó como un campeón. El poder del algoritmo proviene de su diseño: modelar cada aminoácido a nanoescala, proporcionando coordenadas a cada átomo. Al igual que fijar un sitio geográfico usando Google Maps, esto proporciona un nivel de verdad básica para una estructura en la que una IA puede modificar más, una especie de “alucinación restringida”.
¿Traducción? RoseTTAFold puede predecir una estructura funcional, específica para el problema en cuestión, y generar un boceto aproximado como diseño final.
Luego vino otro ingenioso truco, denominado “repintar”. Aquí, el equipo ocultó partes de la secuencia o estructura de la proteína. El software tuvo que aprender a descifrar la información de lo que es esencialmente una intercepción de radio ruidosa, donde solo puedes escuchar las primeras palabras pero tratas de entender su significado completando los espacios en blanco. RoseTTAFold abordó el “problema de recuperación de información faltante” con entusiasmo, completando automáticamente tanto las secuencias de aminoácidos como las estructuras para construir una región funcional dada con alta fidelidad.
RoseTTAFold puede abordar los problemas de construir secuencias de aminoácidos y generar una columna vertebral para el sitio al mismo tiempo. Es como poner palabras en un papel: el escritor se asegura de que cada letra esté en el lugar correcto, mientras verifica que la gramática y el significado tengan sentido.
Cuestionando la naturaleza de la realidad
Al poner a prueba su nueva creación, el equipo generó varios diseños de medicamentos y vacunas que podrían combatir los virus y el cáncer o ayudar con problemas de salud bajos en hierro.
Para el autor principal, el Dr. Jue Wang, el algoritmo se volvió inesperadamente pertinente. Mientras trabajaba en el proyecto, su hijo de dos años fue hospitalizado en la unidad de emergencia debido a una infección pulmonar por RSV (Respiratory Syncytial Virus), un virus que normalmente presenta síntomas similares a los del resfriado, pero que puede ser mortal en los jóvenes y los niños. anciano.
En ese momento, Wang estaba usando el algoritmo para diseñar nuevos tratamientos, que incluían sitios potenciales en RSV para probar más vacunas y medicamentos. Es una estructura relativamente bien trazada. El software alucinó diseños que recapitulaban dos sitios para que las vacunas se unieran potencialmente. Las pruebas que utilizan proteínas alucinadas, reconstruidas en bacterias, se aferraron rápidamente a los anticuerpos existentes, una señal de que son funcionales y que el enfoque de aprendizaje profundo funciona.
El incidente “me hizo darme cuenta de que incluso los problemas de ‘prueba’ en los que estábamos trabajando eran bastante significativos”, dijo Wang.
En varias pruebas adicionales, el equipo diseñó sitios funcionales para una enzima, proteínas de unión a proteínas y proteínas que se adhieren a los iones metálicos, básicamente, cómo se absorbe el hierro y otros metales importantes.
Aunque poderoso, hay espacio para el crecimiento. El método abre la puerta a la desmitificación de las proteínas naturales, pero también al diseño potencial de otras nuevas para la biología sintética. “Estos son nuevos enfoques muy poderosos, pero todavía hay mucho margen de mejora”, dijo Baker.
En conjunto, es otra victoria para el aprendizaje profundo y una muestra fascinante de cómo la IA y la biología pueden crear sinergias. “El aprendizaje profundo transformó la predicción de la estructura de proteínas en los últimos dos años, ahora estamos en medio de una transformación similar del diseño de proteínas”, dijo Baker.
Crédito de la imagen: Ian C. Haydon/ Instituto UW para el Diseño de Proteínas . El nuevo software de inteligencia artificial entrenado en estructuras de proteínas puede generar proteínas funcionales, incluidas estas vacunas candidatas para el virus respiratorio RSV, en segundos.
Fan, S. (2022j, julio 26). Protein-Designing AI Opens Door to Medicines Humans Couldn’t Dream Up. Singularity Hub. Recuperado 27 de julio de 2022, de https://singularityhub.com/2022/07/26/protein-designing-ai-opens-door-to-medicines-humans-couldnt-dream-up/