Una enorme base de datos de componentes básicos ayudará a la IA a descubrir nuevos catalizadores orgánicos | Búsqueda

Los investigadores crearon una base de datos pública de 4000 catalizadores orgánicos derivados experimentalmente. La base de datos también contiene muchos miles de estructuras y fragmentos moleculares enriquecidos en ensamblaje basados ​​en entradas derivadas experimentalmente. Representa «los primeros pasos hacia el mapeo intensivo del espacio de catalizadores orgánicos con gran diversidad química», dice el coautor de la base de datos. Clemens Kormenpov del Instituto Federal Suizo de Tecnología (EPFL). Los investigadores podrán utilizar las estructuras orgánicas de la base de datos del repositorio de catalizadores, conocida como Oscar, para entrenar modelos de aprendizaje automático y predecir las propiedades de retroalimentación de nuevos catalizadores, Simone Gallarati, miembro del equipo de la EPFL. El equipo también espera que la base de datos sirva como trampolín para que los químicos orgánicos diseñen nuevos catalizadores.

Mientras organizaba los Premios de la Academia, el Grupo Corminboeuf desarrolló una estrategia general de ensamblaje, fragmentación y reensamblaje de estructuras para generar miles de nuevos compuestos. Este enfoque basado en fragmentos combina diferentes formas de catalizadores existentes con diferentes ligandos para construir una amplia gama de estructuras que pueden no haber sido estudiadas experimentalmente antes. Roberto Pattonde la Universidad Estatal de Colorado, EE. UU., y miembro de Centro de Síntesis Asistida por Computadordice que «ser capaz de predecir o escanear estructuras que aún no se han hecho realmente sería muy emocionante».

Gráficos de puntos de colores que representan diferentes estímulos

Los últimos años han visto un movimiento hacia la ciencia abierta y el intercambio de datos. Mientras que algunos investigadores temen ser descubiertos, La mayoría ve los beneficios, incluidos los conocimientos basados ​​en datos antiguos y nuevos, validación cruzada y transparencia.. La creación de bases de datos extensas y dedicadas es esencial para Desarrollar herramientas basadas en datos en motivación. y otros campos químicos. Por lo tanto, en un esfuerzo por mejorar el intercambio de datos a través de la química catalítica, los curadores de Oscar han creado las estructuras y propiedades de los catalizadores. Disponible públicamente en Materials Cloud. «Todo el campo se acelerará mediante el acceso a datos de alta calidad y creo que eso es lo que ha hecho este equipo», dice Patton.

READ  El genoma humano se superpone principalmente con los neandertales y otros ancestros humanos.

Ahora que Oscar tiene acceso a los componentes básicos de los catalizadores orgánicos, Kormenpov dice que planean usarlos con modelos generativos moleculares, en particular algoritmos genéticos, para descubrir nuevas moléculas con propiedades objetivo deseables. “A través de estos experimentos evolutivos, podemos encontrar las mejores combinaciones de fragmentos que producen catalizadores orgánicos mejores y más eficientes”, agrega.

El equipo de EPFL sugiere que su base de datos no solo ayudará a establecer métodos de optimización de reacciones basados ​​en datos en síntesis orgánica, sino que la estrategia general utilizada para armonizarlos ayudará a aquellos que construyen bases de datos que antes no estaban disponibles.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.