Partenaires

CNRS
Logo tutelle
Logo tutelle Logo tutelle


Rechercher

Sur ce site

Sur le Web du CNRS


Accueil du site > Open Data > The Open Reaction Database (ORD), une base de connaissances ouverte et structurée pour les réactions chimiques

The Open Reaction Database (ORD), une base de connaissances ouverte et structurée pour les réactions chimiques

par OpenData - 2 décembre 2021

Les données sur les réactions chimiques fournies dans les articles, les brevets, ou même les cahiers de laboratoire électroniques sont jusqu’ici stockées dans des formats variables, souvent non structurés (texte libre) et donc non lisibles par des machines, ce qui présente des limites sévères à leur réutilisation. Un article paru en novembre 2021 présente la nouvelle Open Reaction Database (ORD),

(https://pubs.acs.org/doi/10.1021/ja...)

à la fois un schéma de données en accès ouvert et une infrastructure matérielle pour structurer, déposer et partager des données sur des réactions organiques. Le schéma ORD est compatible avec des données acquises de manière « traditionnelle » à la paillasse et avec des protocoles automatisés à haut débit et/ou en flux. L’ensemble de ORD : données, schéma, code et interfaces web, est accessible à tous sur GitHub. On peut envisager un impact important pour la réutilisation de données, la synthèse planifiée par ordinateur et la chimie prédictive.

Des bases comme SciFinder ou Reaxys donnent accès à diverses informations sur des réactions comme les réactifs, les autres agents utilisés et les produits, mais les protocoles expérimentaux sont au mieux sous forme de texte libre. ORD a pour objectif de fournir une description structurée des réactions chimiques, assez complète pour être réutilisable efficacement. Il s’agit donc de décrire ce qui a été effectivement réalisé au laboratoire, plutôt qu’un protocole idéalisé. Une autre différence essentielle est que ORD est une base ouverte et gratuite.

Organisation de la base

Le schéma est divisé en 9 sections : reaction identifiers, inputs, setup, conditions, notes, observations, workups, outcomes (products and analytics), provenance. Chacune de ces sections contient des données et un nombre variable de sous-sections. Par exemple, chaque ‘ReactionInput’ contient un ou plusieurs éléments (en général des composés chimiques), chacun décrit avec son identifiant, sa quantité et son rôle dans la réaction. Les champs de ces différents éléments sont structurés de manière à restreindre certains types ou valeurs, par exemple des nombres positifs pour les quantités et un nombre limité d’unités possibles pour des propriétés. Beaucoup de sections incluent également des champs de texte libre pour permettre d’inclure des informations autres que celles prévues dans les champs structurés. Des données analytiques (RMN, HRMS, IR,…), brutes ou traitées, peuvent être couplées directement aux produits de réaction décrits.

Dépôt de données

Le ORD Interactive Editor est un outil pour engendrer une soumission à la base de données. L’utilisateur peut remplir en ligne des champs de données structurées ou non. Il est aussi possible d’engendrer un ensemble de réactions dans un tableur.

https://editor.open-reaction-databa...

Les données peuvent être soumises à l’entrepôt ord-data dans GitHub :

https://github.com/open-reaction-da...

ou directement par mail à submissions@open-reaction-database.org

Des tutoriels sont disponibles sur la chaine YouTube de ORD.

Recherche de données

Une interface de recherche existe : https://client.open-reaction-databa...

Des réactions peuvent être recherchées par codes SMILES/ SMARTS pour tout ou partie d’une molécule comme réactif ou comme produit, en utilisant un identifiant de réaction, un DOI de publication, etc. Chaque réaction a une page de synthèse qui montre l’ensemble des informations et un schéma résumé. Des requêtes peuvent enfin être formulées en utilisant une API en python.

Voir en ligne : The Open Reaction Database (ORD)