En esta guerra que libramos cada día contra la COVID-19 los científicos han puesto todo su ingenio para encontrar en sus propias disciplinas y en la ajenas, nuevos mecanismos para combatir la pandemia.
Las vacunas son la gran esperanza para este 2021, pero no hay día que no escuchemos que ha aparecido una nueva cepa de la que no sabemos si las vacunas serán capaces de protegernos.
En este sentido, el pasado 15 de enero, unos científicos del MIT publicaron un artículo en la revista Science en el que explicaban cómo con ayuda de algoritmos de procesamiento del lenguaje natural (PNL), han desarrollado un método mediante el cual se pueden predecir las mutaciones del virus con mayor probabilidad, y determinar cómo les afectarán a las vacunas que existen en estos momentos.
La pregunta que surge entonces es: cómo un algoritmo de esta clase puede ayudar a identificar mutaciones del virus. La respuesta se encuentra en cómo trabajan estos algoritmos.
En el lenguaje natural hay muchas formas de expresar la misma idea y a menudo las palabras usadas en un mismo contexto tienen significados parecidos. Sin embargo, pequeñas variaciones de letras pueden cambiar totalmente el sentido de una frase.
Uno de los autores, Bryan Bryson, pone un ejemplo de mutación lingüística para explicar cómo funciona la mutación del virus: “Por ejemplo en C la frase en inglés The boy pats the dog (el chico da palmaditas al perro). Con un único cambio en una letra podemos seguir preservando la gramática y la semántica: The boy pets the dog (el chico acaricia al perro), pero también perder la corrección gramatical: The boy patx the dog (patx no existe)”.
Pero si cambiamos un solo caractarer alteramos sustancialmente el significado diremos algo que no tiene que ver con las frases anteriores: The boy eats the dog (el chico se come al perro)".
“Como ocurre con el lenguaje, los virus pueden evadir la respuesta inmune mediante mutaciones conservando la ‘gramática o sintaxis’ biológica que gobierna su infectividad viral, pero alterando la ‘semántica’ de una secuencia proteica para no ser reconocida por los anticuerpos.”
Analizando la gran cantidad de datos de los que ya disponemos gracias a la secuenciación del genoma del coronavirus se pueden identificar las partes del virus con mayor probabilidad de mutar, y trabajar de forma más rápida y menos costosa en nuevas vacunas que muestren a nuestro sistema inmunológico las partes más estables del virus y que menos probabilidades de mutar tienen, haciendo estas vacunas más efectivas a largo plazo.
Esto se podría aplicar a otras vacunas como la de la gripe que cada año se debe desarrollar una o varias nuevas, vacunar a millones de personas.
Los algoritmos de PNL cada vez están más desarrollados y se usan a diario un ejemplo de ello es que todo el mundo dispone en su smartphone o en d su altavoz inteligente, de un asistente personal que entiende lo que le dices y ejecuta acciones con la información que le hemos dado.
Es más, las soluciones de Vigilancia e Inteligencia Competitiva también utilizan algunos de estos algoritmos de machine learning para identificar términos más repetidos, nombres de personas, empresas, organismos o temáticas de cualquier documento, noticia,… identificando nuevas relaciones de metadatos con los que sacar interpretar la información.
Si deseas conocer más sobre lo que la Vigilancia e Inteligencia Competitiva cuenta con nosotros, asesoramos a empresas y organizaciones.
Referencia: Brian Hie, Ellen D. Zhong, Bonnie Berger y Bryan Bryson."Learning the language of viral evolution and escape". (Perspective: Y.-A. Kim y T.M. Przytycka. "The language of a virus"). Science, 2021