La Inteligencia Artificial permite reconocer cómo se crea la “música de la vida”

Nuestros códigos genéticos controlan no solo qué proteínas producen nuestras células, sino también en qué cantidad. Este descubrimiento pionero, aplicable a toda la vida biológica, fue realizado recientemente por biólogos de sistemas de la Universidad Tecnológica de Chalmers, Suecia, utilizando supercomputadoras e Inteligencia Artificial (IA). Su investigación, que también podría arrojar nueva luz sobre los misterios del cáncer, se publicó recientemente en la revista científica Nature Communications.

Las moléculas de ADN contienen instrucciones para que las células produzcan proteínas. Esto se ha sabido desde mediados del siglo pasado cuando se identificó a la doble hélice como el portador de información de la vida. Pero el factor que determina qué cantidad de una determinada proteína se produce no está claro. Las mediciones han demostrado que una sola célula puede contener desde unas pocas moléculas de una proteína determinada, hasta decenas de miles.

Con esta nueva investigación, la comprensión de los mecanismos detrás de este proceso, conocido como expresión génica, ha dado un gran paso adelante. El grupo de científicos de Chalmers ha demostrado que la mayor parte de la información para la regulación de cantidades también está incrustada en el propio código de ADN. Han demostrado que esta información se puede leer con la ayuda de supercomputadoras e IA.

Comparable a una partitura orquestal

El profesor asistente Aleksej Zelezniak, del Departamento de Biología e Ingeniería Biológica de Chalmers, dirige el grupo de investigación detrás del descubrimiento. “Se podría comparar esto con una partitura orquestal. Las notas describen qué tonos deben tocar los diferentes instrumentos. Pero las notas por sí solas no dicen mucho sobre cómo sonará la música”, explica.

También se requiere información sobre el tempo y la dinámica de la música, por ejemplo. Pero en lugar de instrucciones (como allegro o forte) escritas en una partitura, en el lenguaje de la genética se difunde esta información sobre grandes áreas de la molécula de ADN. “Anteriormente, podíamos leer las notas, pero no cómo debería tocarse la música. Ahora, podemos hacer ambas cosas”, dice Aleksej Zelezniak. “Otra comparación podría ser que ahora hemos encontrado las reglas gramaticales para el lenguaje genético, donde quizás antes solo conocíamos el vocabulario”.

Pero, ¿cuál es la gramática que determina la cantidad de expresión genética? Según Zelezniak, toma la forma de patrones recurrentes y combinaciones de las cuatro “notas” de la genética: los bloques de construcción moleculares designados A, C, G y T. Estos patrones y combinaciones se conocen como motivos. Los factores cruciales son las relaciones entre estos motivos: la frecuencia con la que se repiten y exactamente en qué posiciones del código de ADN aparecen.

Understanding how genetic motifs conduct "the music of life"
Utilizando los enfoques de IA, los investigadores descubren reglas reguladoras que definen qué motivos de ADN deben estar presentes juntos en un gen y en qué ubicaciones para regular la expresión génica en un rango de niveles de bajo a alto. Los estudios anteriores se centran solo en motivos únicos en regiones reguladoras únicas (marcado como “original motif”), mientras que aquí amplían la vista a través de múltiples regiones reguladoras y múltiples motivos (marcados como “additional motifs”). Crédito: Jan Zrimec / Universidad Tecnológica de Chalmers

“Descubrimos que esta información se distribuye entre las partes codificantes y no codificantes del ADN, es decir, también está presente en las áreas que solían denominarse ADN basura”.

_____

_____

Utilizando los enfoques de IA, los investigadores descubren reglas reguladoras que definen qué motivos de ADN deben estar presentes juntos en un gen y en qué ubicaciones para regular la expresión génica en un rango de niveles de bajo a alto. Los estudios anteriores se centran solo en motivos únicos en regiones reguladoras únicas (marcado como “motivo original”), mientras que aquí amplían la vista a través de múltiples regiones reguladoras y múltiples motivos (marcados como “motivos adicionales”). Crédito: Jan Zrimec / Universidad Tecnológica de Chalmers

Un descubrimiento que se aplica a toda la vida biológica

Aunque existen otros factores que también afectan la expresión genética, según el estudio, la información incrustada en el código genético representa alrededor del 80 por ciento del proceso. Los investigadores probaron el método en siete organismos modelo, que incluyen levaduras, bacterias, moscas de la fruta, ratones y humanos, y encontraron que el mecanismo es el mismo. El descubrimiento que han hecho es universal, válido para toda la vida biológica.

Según Zelezniak, el descubrimiento no hubiera sido posible sin acceso a supercomputadoras e inteligencia artificial de última generación. El grupo de investigación realizó enormes simulaciones por computadora tanto en la Universidad Tecnológica de Chalmers como en otras instalaciones en Suecia. “Esta herramienta nos permite mirar miles de posiciones al mismo tiempo, creando una especie de examen automatizado del ADN. Esto es esencial para poder identificar patrones a partir de cantidades tan enormes de datos”.

Jan Zrimec, investigador postdoctoral en el grupo Chalmers y primer autor del estudio, dice: “Con tecnologías anteriores, los investigadores tenían que decirle al sistema qué motivos en el código de ADN se debían buscar. Pero gracias a la inteligencia artificial, el sistema ahora puede aprender por sí mismo, identificando diferentes motivos y combinaciones de motivos relevantes para la expresión génica”. Agrega que el descubrimiento también se debe al hecho de que estaban examinando una parte mucho mayor de ADN de lo que se había hecho anteriormente.

Posibles aplicaciones

Aleksej Zelezniak cree que el descubrimiento generará un gran interés en el mundo de la investigación y que el método podría convertirse en una herramienta importante en varios campos de investigación, incluida la genética y la investigación evolutiva, la biología de sistemas, la medicina y la biotecnología. El nuevo conocimiento también podría permitir comprender mejor cómo las mutaciones afectan la expresión génica en la célula y, por tanto, eventualmente, cómo surgen y funcionan los cánceres.

Las aplicaciones que más rápidamente podrían ser importantes para el público en general se encuentran en la industria farmacéutica. “Es concebible que este método pueda ayudar a mejorar la modificación genética de los microorganismos que ya se utilizan hoy en día como ‘fábricas biológicas’, lo que llevaría a un desarrollo y producción más rápida y barata de nuevos fármacos”, especula.

Con información de Nature, Phys.org y la Universidad de Chalmers | Traducción y edición del Colectivo Alterius


Vídeo Recomendado



Previo

El asunto entre Wall Street, Reddit y GameStop es una lucha de clases

Siguiente

Sexo, rock y revolución

Sin comentarios

Deja un comentario