Durante su discurso de aceptación del Premio Nobel de Química en 2018, Frances Arnold dijo: “Hoy en día podemos, a todos los efectos prácticos, leer, escribir y editar cualquier secuencia de ADN, pero no podemos componerla”.
Eso ya no es cierto.
Desde entonces, la ciencia y la tecnología han progresado tanto que la inteligencia artificial ha aprendido a componer ADN y, con bacterias genéticamente modificadas, los científicos están en camino de diseñar y fabricar proteínas a medida.
El objetivo es que con los talentos de diseño de la IA y las capacidades de ingeniería de la edición genética, los científicos puedan modificar las bacterias para que actúen como minifábricas que produzcan nuevas proteínas que puedan reducir los gases de efecto invernadero, digerir plásticos o actuar como pesticidas específicos de la especie.
Como profesor de química y químico computacional que estudia la ciencia molecular y la química ambiental, creo que los avances en inteligencia artificial y edición genética hacen que esto sea una posibilidad realista.
Secuenciación genética: leyendo las recetas de la vida
Todos los seres vivos contienen material genético (ADN y ARN) que proporciona la información hereditaria necesaria para replicarse y fabricar proteínas. Las proteínas constituyen el 75 por ciento del peso seco humano. Forman músculos, enzimas, hormonas, sangre, cabello y cartílago. Comprender las proteínas significa comprender gran parte de la biología. El orden de las bases de nucleótidos en el ADN, o ARN en algunos virus, codifica esta información, y las tecnologías de secuenciación genómica identifican el orden de estas bases.
El Proyecto Genoma Humano fue un esfuerzo internacional que secuenció todo el genoma humano entre 1990 y 2003. Gracias a la rápida mejora de las tecnologías, se necesitaron siete años para secuenciar el primer 1 por ciento del genoma y otros siete años para el 99 por ciento restante. En 2003, los científicos tenían la secuencia completa de 3.000 millones de pares de bases de nucleótidos que codifican los 20.000 a 25.000 genes del genoma humano.
Sin embargo, comprender las funciones de la mayoría de las proteínas y corregir sus disfunciones sigue siendo un desafío.
La IA aprende proteínas
La forma de cada proteína es fundamental para su función y está determinada por la secuencia de sus aminoácidos, que a su vez está determinada por la secuencia de nucleótidos del gen. Las proteínas mal plegadas tienen una forma incorrecta y pueden causar enfermedades como enfermedades neurodegenerativas, fibrosis quística y diabetes tipo 2. Para comprender estas enfermedades y desarrollar tratamientos es necesario conocer las formas de las proteínas.
Antes de 2016, la única forma de determinar la forma de una proteína era mediante cristalografía de rayos X , una técnica de laboratorio que utiliza la difracción de rayos X por cristales individuales para determinar la disposición precisa de átomos y moléculas en tres dimensiones en una molécula. En ese momento, se había determinado la estructura de unas 200.000 proteínas mediante cristalografía, con un coste de miles de millones de dólares.
AlphaFold, un programa de aprendizaje automático , utilizó estas estructuras cristalinas como conjunto de entrenamiento para determinar la forma de las proteínas a partir de sus secuencias de nucleótidos. Y en menos de un año, el programa calculó las estructuras proteínicas de los 214 millones de genes que se han secuenciado y publicado. Las estructuras proteínicas que AlphaFold determinó se han publicado en una base de datos de libre acceso .
Para abordar eficazmente las enfermedades no infecciosas y diseñar nuevos medicamentos, los científicos necesitan un conocimiento más detallado de cómo las proteínas, especialmente las enzimas, se unen a las moléculas pequeñas. Las enzimas son catalizadores proteicos que permiten y regulan las reacciones bioquímicas.
AlphaFold3 , lanzado el 8 de mayo de 2024, puede predecir las formas de las proteínas y las ubicaciones donde las moléculas pequeñas pueden unirse a estas proteínas . En el diseño racional de fármacos , los fármacos se diseñan para unirse a las proteínas involucradas en una vía relacionada con la enfermedad que se está tratando. Los fármacos de moléculas pequeñas se unen al sitio de unión de la proteína y modulan su actividad, influyendo así en la vía de la enfermedad. Al poder predecir los sitios de unión de las proteínas, AlphaFold3 mejorará las capacidades de desarrollo de fármacos de los investigadores.
IA + CRISPR = Composición de nuevas proteínas
Alrededor de 2015, el desarrollo de la tecnología CRISPR revolucionó la edición genética. CRISPR se puede utilizar para encontrar una parte específica de un gen, cambiarla o eliminarla, hacer que la célula exprese más o menos su producto génico o incluso agregar un gen completamente extraño en su lugar.
En 2020, Jennifer Doudna y Emmanuelle Charpentier recibieron el Premio Nobel de Química “ por el desarrollo de un método (CRISPR) para la edición del genoma ”. Con CRISPR, la edición genética, que antes llevaba años y era específica para cada especie, costosa y laboriosa, ahora se puede hacer en días y por una fracción del costo.
La IA y la ingeniería genética están avanzando rápidamente. Lo que antes era complicado y costoso ahora es rutina. De cara al futuro, el sueño es diseñar y producir proteínas a medida mediante una combinación de aprendizaje automático y bacterias modificadas con CRISPR. La IA diseñaría las proteínas y las bacterias modificadas con CRISPR producirían las proteínas. Las enzimas producidas de esta manera podrían potencialmente inhalar dióxido de carbono y metano mientras exhalan materias primas orgánicas o descomponer plásticos para convertirlos en sustitutos del hormigón.
Creo que estas ambiciones no son irrealistas, dado que los organismos genéticamente modificados ya representan el 2 por ciento de la economía estadounidense en los sectores de la agricultura y los productos farmacéuticos.
Dos grupos han creado enzimas funcionales desde cero que fueron diseñadas por diferentes sistemas de IA. El Instituto de Diseño de Proteínas de David Baker en la Universidad de Washington ideó una nueva estrategia de diseño de proteínas basada en el aprendizaje profundo que llamaron ” alucinación de toda la familia “, que utilizaron para crear una enzima única que emite luz . Mientras tanto, la empresa emergente de biotecnología Profluent ha utilizado una IA entrenada a partir de la suma de todo el conocimiento de CRISPR-Cas para diseñar nuevos editores genómicos funcionales .
Si la IA puede aprender a crear nuevos sistemas CRISPR, así como enzimas bioluminiscentes que funcionen y que nunca se hayan visto en la Tierra, existe la esperanza de que la combinación de CRISPR con IA pueda utilizarse para diseñar otras nuevas enzimas a medida. Aunque la combinación CRISPR-IA todavía está en sus inicios, una vez que madure es probable que sea muy beneficiosa e incluso podría ayudar al mundo a enfrentar el cambio climático.
Sin embargo, es importante recordar que cuanto más poderosa es una tecnología, mayores son los riesgos que plantea. Además, los seres humanos no han tenido mucho éxito en la ingeniería de la naturaleza debido a la complejidad e interconexión de los sistemas naturales, lo que a menudo conduce a consecuencias no deseadas .
Este artículo se publica nuevamente en The Conversation bajo una licencia Creative Commons. Lea el artículo original .
Crédito de la imagen: Gerd Altmann / Pixabay
Zimmer, M. (2024, 15 junio). AI Plus Gene Editing Promises to Shift Biotech Into High Gear. Singularity Hub. https://singularityhub.com/2024/06/25/ai-plus-gene-editing-promises-to-shift-biotech-into-high-gear/