Una herramienta basada en IA es capaz de predecir funciones desconocidas de cualquier proteína
Un equipo liderado por Rosa Fernández (del Instituto de Biología Evolutiva) y Ana Rojas (del Centro Andaluz de Biología del Desarrollo), ha desarrollado una herramienta que funciona como un "traductor inteligente" que es capaz de comprender el "idioma" de los genes para poder determinar la función que hacen las proteínas.
FANTASIA (Functional ANnoTAtion based on embedding space SImilArity), el nombre que recibe el sistema basado en IA, ha logrado mostrar la función de un total de 24 millones de genes. Hecho que marca el comienzo de una nueva etapa en el estudio de las proteínas que son difíciles de estudiar o identificar con las técnicas tradicionales. Asimismo, FANTASIA tiene la habilidad de trabajar con "Big Data", procesando enormes cantidades de datos como analizar secuencias de ADN y ARN de millones de genes y así predecir la función de proteínas desconocidas basándose en patrones aprendidos.
En tan solo unas horas, este ingenioso mecanismo es capaz de iluminar la función de las proteínas que pertenecen al "proteoma oscuro". Además, ha conseguido analizar genomas animales con un una elevada exactitud que se encuentra alrededor del 100%.
El estudio sobre las proteínas que residen en el cuerpo humano ha dado sus frutos, pues entre el 80% y el 90% de funciones de estas proteínas ya son sabidas, sin embargo, este no es el caso de otros mamíferos, pues estos datos no son tan elevados, e incluso en el caso de los invertebrados, el cual es más extremo ya que no se conoce ni la mitad de las funciones de sus proteínas. A pesar de tener acceso a las millones de letras de la secuencia de ADN codificante de las proteínas, la función biológica de muchas se desconoce, lo que provoca que diversa información que podría contribuir a la evolución de las especies, quede fuera de nuestro alcance.
Finalmente, FANTASIA es importante ya que ayuda a revelar la función de proteínas que antes eran un misterio, especialmente en organismos menos estudiados. De manera que actúa como un "ChatGPT" para proteínas; Aprende de ejemplos en los que analiza miles de proteínas ya estudiadas para entender su función, proceso biológico y ubicación de la célula (lo que los científicos llaman términos GO, del inglés Gene Ontology); Crea huellas digitales en los que convierte cada proteína en un "vector numérico" (especie de huella digital que resume sus características); Predice Funciones utilizando las huellas digitales para predecir la función con gran precisión y es fácil de usar siendo un software abierto y sostenible que no requiere superordenadores.
Este artículo se ajusta sobretodo a una parte del temario de 2.º de Bachillerato de Biología, en concreto al tema 4 de Las Proteínas.
Fuente de la noticia: Agencia SINC
Cap comentari:
Publica un comentari a l'entrada