Un nuevo programa informático puede leer cualquier secuencia del genoma y decodificar su código genético.

Yekaterina «Kate» Shulgina era una estudiante de primer año en la Escuela de Graduados en Artes y Ciencias, y buscaba un proyecto corto de biología computacional para poder verificar los requisitos de su programa de biología de sistemas. Se pregunta cómo podría evolucionar y cambiar el código genético, que alguna vez se pensó que era universal.

Eso fue en 2016 y hoy Shulgina ha salido al otro lado de este proyecto a corto plazo con una forma de descifrar este rompecabezas genético. Ella lo describe en un nuevo artículo de investigación en la revista eLife Con el biólogo de Harvard Sean Eddy.

El informe detalla un nuevo programa informático que puede leer la secuencia del genoma de un organismo y luego determinar su código genético. El programa, llamado Codetta, tiene el potencial de ayudar a los científicos a ampliar su comprensión de cómo evolucionó el código genético e interpretar correctamente el código genético de los organismos recién secuenciados.

«Esto en sí mismo es una cuestión fundamental en biología», dijo Shulgina, quien está realizando su investigación de posgrado en el laboratorio de Eddie.

El código genético es el conjunto de reglas que le dicen a las células cómo interpretar conjuntos de nucleótidos de tres letras en proteínas, a las que a menudo se hace referencia como los componentes básicos de la vida. Casi todas las criaturas vivientes de bacterias coli Para los humanos, usa el mismo código genético. Es por eso que una vez se creyó que el código estaba escrito en piedra. Pero los científicos han descubierto un puñado de valores atípicos: Los organismos que utilizan códigos genéticos alternativos se encuentran donde el conjunto de instrucciones difiere.

READ  Mercurio: Probablemente el planeta más pequeño del sistema solar del tamaño de la Tierra

Aquí es donde Codetta realmente puede brillar. El programa podría ayudar a identificar más organismos utilizando estos códigos genéticos alternativos, ayudando a arrojar nueva luz sobre cómo los códigos genéticos podrían cambiar en primer lugar.

Comprender cómo sucede esto nos ayudará a reconciliar por qué originalmente pensamos que esto era imposible … y cómo funcionan realmente estos procesos básicos. «

Yekaterina «Kate» Shulgina

Codetta ya ha analizado las secuencias del genoma de más de 250.000 bacterias y otros organismos unicelulares llamados arqueas en busca de códigos genéticos alternativos, identificando cinco nunca antes vistos. En los cinco casos, el código de aminoácidos de la arginina se restableció a un aminoácido diferente. Se cree que esta es la primera vez que los científicos han visto este intercambio en bacterias y podrían insinuar las fuerzas evolutivas que intervienen en el cambio del código genético.

Los investigadores dicen que el estudio representa el examen más grande de códigos genéticos alternativos. Codetta analizó esencialmente todos los genomas disponibles de bacterias y arqueas. El nombre del programa es un cruce entre codones, una secuencia de tres nucleótidos que forma fragmentos de código genético, y Rosetta Stone, una placa inscrita en tres idiomas.

El trabajo representa un momento culminante para Shulgina, quien ha pasado los últimos cinco años desarrollando la teoría estadística detrás de Codetta, escribiendo el programa, probándolo y luego analizando el genoma. Funciona leyendo el genoma de un organismo y luego aprovechando una base de datos de proteínas conocidas para producir un código genético potencial. Se diferencia de otros métodos similares por el tamaño con el que puede analizar genomas.

READ  Descubren un agujero negro supermasivo 30 mil millones de veces más masivo que el sol

Shulgina se unió al laboratorio de Eddie, que se especializa en comparar genomas, en 2016 después de buscar asesoramiento sobre el algoritmo que estaba diseñando para interpretar códigos genéticos.

Hasta ahora, nadie ha realizado un estudio tan amplio de códigos genéticos alternativos.

«Fue genial ver nuevos códigos, porque a pesar de todo lo que sabemos, Kate va a hacer todo este trabajo y no habrá nuevos códigos para encontrar», dijo Eddy, quien también es el investigador médico Howard Hughes. También señaló que el sistema podría utilizarse para garantizar la precisión de las numerosas bases de datos de secuencias de proteínas.

«Muchas de las secuencias de proteínas en las bases de datos en estos días son sólo traducciones conceptuales de secuencias de ADN genómico», dijo Eddy. «La gente indaga en estas secuencias de proteínas en busca de todo tipo de cosas útiles, como nuevas enzimas o nuevos modificadores de genes, etc. Desea que las secuencias de proteínas sean precisas, pero si un organismo usa un código no estándar, lo hará». Traducir mal ”.

Los investigadores dicen que el siguiente paso del trabajo es utilizar Codetta para buscar códigos alternativos en virus, eucariotas y genomas organometálicos como mitocondrias y cloroplastos.

«Todavía hay tanta diversidad en la vida que aún no hemos realizado este examen sistemático», dijo Shulgina.

Fuente:

Referencia de la revista:

Shulgina, Y & Eddy, SR, (2021) Una pantalla computacional para códigos genéticos alternativos en más de 250,000 genomas. eLife. doi.org/10.7554/eLife.71402.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *