A pesar de su simplicidad, los virus son pequeñas fuerzas vitales furtivas.
Tomemos como ejemplo el SARS-Cov-2, el virus detrás del Covid-19. Desafiado con el sistema inmunológico humano, el virus ha reorganizado gradualmente partes de su material genético, lo que facilita su propagación entre la población humana. La nueva cepa ya ha aterrorizado a Sudáfrica y ha cerrado el Reino Unido, y recientemente apareció en los Estados Unidos.
El lado positivo es que nuestras vacunas y terapias de anticuerpos existentes todavía probablemente sean efectivas contra la nueva cepa. Pero ese no es siempre el caso. El “escape viral” es un escenario de pesadilla, en el que el virus muta lo suficiente para que los anticuerpos existentes ya no lo reconozcan. Las consecuencias son nefastas: significa que incluso si ya ha tenido la infección o si ha producido anticuerpos a partir de una vacuna, esas protecciones ahora son inútiles.
Desde una perspectiva evolutiva, las mutaciones virales y nuestro sistema inmunológico están constantemente involucrados en un juego del gato y el ratón. La semana pasada, gracias a un recurso completamente inesperado, ahora podemos tener una ventaja. En un artículo alucinante publicado en Science , un equipo desarrolló una herramienta para predecir el escape viral, y provino del procesamiento del lenguaje natural (PNL), el campo de la inteligencia artificial que imita el habla humana.
Extraño, ¿verdad?
La visión crítica del equipo fue construir una especie de “lenguaje viral”, basado puramente en sus secuencias genéticas. Este lenguaje, si se le dan suficientes ejemplos, se puede analizar usando técnicas de PNL para predecir cómo los cambios en su genoma alteran su interacción con nuestro sistema inmunológico. Es decir, utilizando técnicas de lenguaje artificial, puede ser posible buscar áreas clave en un genoma viral que, cuando mutan, le permiten escapar de los anticuerpos itinerantes.
Es una idea realmente excéntrica. Sin embargo, cuando se probó en algunos de nuestros mayores enemigos virales, como la influenza (la gripe estacional), el VIH y el SARS-CoV-2, el algoritmo pudo discernir mutaciones críticas que “transforman” cada virus lo suficiente como para escapar del alcance de nuestros sistema de vigilancia inmunológica.
“El lenguaje de la evolución viral y el escape … proporciona un marco poderoso para predecir las mutaciones que conducen al escape viral”, dijeron los Dres. Yoo-Ah Kim y Teresa Przytycka del Instituto Nacional de Salud, quienes no participaron en el estudio pero brindaron perspectivas al respecto.
“Esta es una forma fenomenal de reducir todo el universo de posibles virus mutantes”, agregó el Dr. Benhur Lee en Mount Sinai. Y si se valida más, el algoritmo podría reforzar los intentos de una vacuna eficaz contra el VIH o una vacuna universal contra la gripe, en lugar del enfoque de predicción fragmentado que tenemos ahora. También podría proporcionar información sobre cómo el nuevo coronavirus podría mutar aún más y poner nuestro sistema inmunológico en “jaque” y, a su vez, darnos tiempo para luchar contra sus planes de escape y poner fin a la pandemia de una vez por todas.
Una analogía útil
La idea de utilizar la PNL para examinar virus comenzó con una analogía. El invierno pasado, el autor del estudio Brian Hie estaba paseando por los terrenos nevados del MIT cuando se le ocurrió una idea: ¿y si es posible explicar la interacción entre el virus y el sistema inmunológico de la misma manera que analizamos el lenguaje?
Es una comprensión súper nerd que requiere algunos actos de fe. Pero cuanto más pensaba en ello, más sentido tenía. El lenguaje contiene tanto gramática como semántica. El primero es bastante inmutable, antes de que establezca la estructura de una oración. Pero el segundo, la semántica, es solo el significado de la oración. Cambiar una sola palabra podría alterar inmediatamente el significado hasta el punto en que un oyente ya no podría comprender, manteniendo la gramática intacta. En otras palabras, es totalmente posible decir un galimatías gramaticalmente correcto (Mad Libs me viene a la mente) mientras se “escapa” a la comprensión de un oyente.
Aquí está el salto de la analogía. Los virus también se basan en dos características principales para sobrevivir. Ambos involucran su interacción con nuestro sistema inmunológico. El primero es su capacidad para ingresar a una célula para replicarse más de sí mismos. Este rasgo, denominado “virulencia”, debe permanecer semi-consistente para que el virus pueda mantenerse dentro de un huésped.
Toma el SARS-CoV-2. Como la mayoría de los virus, es un ser similar a una burbuja con picos en su superficie. Encapsulada dentro está su secuencia genómica. Las proteínas de pico son necesarias para que el virus “hable” con nuestras células, permitiendo que el virus entre. Pero son los genes virales los que dictan la forma de las proteínas de pico. En otras palabras, si los cambios en los genes virales también alteran las proteínas de pico, estas mutaciones cambiarían la interacción del virus con nuestras células y sistema inmunológico.
Para sobrevivir, cualquier virus debe seguir su propia “gramática”. Estas secuencias fundamentales, capturadas en su genoma, permiten su supervivencia. Si se rompe la gramática con demasiadas mutaciones, o mutaciones en puntos críticos, el virus ya no podrá entrar en una célula y replicarse, y llegará a un callejón sin salida evolutivo. En pocas palabras: un virus debe mantener intacta su “gramática”.
Sin embargo, la gramática es solo la mitad de la comprensión. El otro es la semántica, el significado de las palabras. Aquí, pensó Hie, es donde los virus tienen más libertad de acción. Imagínese el virus como un hablante y nuestro sistema inmunológico como un oyente. Las mutaciones en un genoma viral que intercambian “palabras”, pero dejan la gramática intacta, podrían engañar al “oyente” inmune lo suficiente como para que ya no entienda el lenguaje del virus y detenga un ataque. Sin embargo, debido a que la gramática del virus permanece, es libre de replicarse y causar estragos, escondido de las defensas del sistema inmunológico. En otras palabras, si una mutación permite que un virus mantenga su gramática pero cambia su semántica, también permite el escape viral.
La pregunta es, ¿cómo predecimos esas mutaciones de pesadilla?
Ingrese algoritmos
El segundo salto de pensamiento de Hie fue acceder a un campo completamente diferente: el lenguaje de la IA.
En los últimos años, la IA se ha vuelto extremadamente eficiente para modelar tanto la gramática como la semántica en el lenguaje humano, sin ningún conocimiento previo o comprensión del contenido. Tome GPT-3 de OpenAI , que produce una prosa asombrosa similar a la humana que es gramaticalmente correcta y se mantiene principalmente en el tema. En lugar de estudiar lingüística, estos algoritmos de PNL aprenden a través de un vasto corpus de texto, organizado en palabras, frases cortas, oraciones y párrafos. Incluso sin formación previa, un algoritmo de PNL es capaz de captar patrones en el lenguaje humano. Olvídese de las reglas, es el reconocimiento de patrones hasta el final.
Ahora imagine que el texto de ejemplo es el genoma “normal” del virus y las mutaciones son frases nuevas alternativas; Entonces es posible analizar el lenguaje del virus utilizando técnicas de PNL. Tomemos “gramática”, por ejemplo, o secuencias en un genoma viral que permiten su entrada en una célula. Si se considera un idioma, la PNL podría comenzar a captar secuencias relacionadas con la infecciosidad de un virus, sin necesidad de conocimientos previos de microbiología.
Una idea similar funciona para la semántica viral. Es posible cambiar sistemáticamente una letra genética viral. Usando PNL, podemos analizar hasta qué punto el mutante se desvía en su “significado”, por ejemplo, su comportamiento. Usando el ejemplo del lenguaje, cambiar “gato” por “felino” es un cambio mínimo. Sin embargo, si se cambia “gato” por “excavadora”, se obtiene una diferencia mucho mayor. El grado de estas alteraciones se captura mediante un número, en lugar de la intuición, y permite al algoritmo juzgar qué tan lejos se ha desviado un virus de su forma original.
Usando influenza, VIH y SARS-CoV-2, el equipo se propuso encontrar mutaciones genéticas que permitan el escape viral: las que preservan la “gramática” del virus, pero alteran su “semántica”. Al calificar cada región con su algoritmo, el equipo descubrió varias manchas de proteínas específicas, y su modelo genético, que aumentaron enormemente las posibilidades de escape viral. Recuerde: el algoritmo nunca antes había encontrado ningún dato relacionado remotamente con la biología de un virus. Pero basándose únicamente en el “lenguaje” del virus, reprodujo resultados de laboratorio anteriores de secuencias que llevaron al escape de la influenza.
No es frecuente que ramas de la ciencia no relacionadas se den un empujón entre sí. Y Hie no va a detenerse. Aprovechando aún más la analogía del lenguaje, es posible que algunas personas comprendan la misma oración de manera diferente según su historia, cultura y experiencia. De manera similar, nuestros sistemas inmunológicos no son todos iguales: cada uno tiene su propia plétora de moléculas, anticuerpos y células inmunes, y una “fuerza” general.
“Será interesante ver si el enfoque propuesto se puede adaptar para proporcionar una visión ‘personalizada’ del lenguaje de la evolución del virus”, dijeron Kim y Przytycka.
Fuente:
Fan, S. (2021, 19 enero). A Language AI Is Accurately Predicting Covid-19 «Escape» Mutations. Recuperado 1 de febrero de 2021, de https://singularityhub.com/2021/01/19/a-language-ai-is-accurately-predicting-covid-19-escape-mutations/
Crédito de la imagen: Vektor Kunst de Pixabay