Bandeau du Laboratoire d'Informatique & Systèmes (LIS)

Modélisation du complexe de réplication du SARS-CoV-2

PullCoVapart est un projet en collaboration entre le LIS (Laboratoire d’Informatique et Systèmes UMR 7020, Equipe MOFED, Claudia Frydman), l’AFMB (Architecture et Fonction des Macromolécules Biologiques UMR 7257), et le LITIS (Laboratoire d'Informatique, de Traitement de l'Information et des Systèmes EA 4108 / FR CNRS 3638). Ce projet bénéficie du soutien de ANR Flash COVID-19 de l’Agence Nationale de la Recherche et REACTing (REsearch and ACTion targeting emerging infectious diseases) Inserm.
  • Contact : Claudia Frydman, équipe MOFED
Le Syndrome Respiratoire Aigu Sévère-Coronavirus-2 (SARS-CoV-2), responsable de la maladie COVID19, est un coronavirus dont le matériel génétique est reproduit lors de l'infection par une protéine centrale, l'ARN polymérase ARN-dépendante (RdRp). Cette protéine centrale dans ce processus de multiplication du virus n'a pas d'équivalent dans la cellule hôte, ce qui en fait une cible antivirale très intéressante. En effet, les stratégies antivirales ciblant les enzymes impliquées dans la réplication des virus ont prouvé leur efficacité, avec par exemple la guérison des patients atteints par l’hépatite C. Le projet PullCoVapart[1], conduit sous la responsabilité scientifique de Claudia Frydman (équipe MOFED - Pôle Calcul (site St Jérome), vise à modéliser et simuler le fonctionnement de cette polymérase virale et à tester, in silico, les inhibiteurs de RdRp qui pourraient potentiellement arrêter sa multiplication.

Problématique

La grande majorité des travaux sur le SARS-CoV-2 se limitent à l'étude de la propagation épidémiologique du virus au sein d'une communauté, que ce soit par la toux, l'éternuement, ou la parole. Cette étude doit permettre de comprendre comment et dans quelles circonstances les personnes ont été infectées par le SARS-CoV-2. Les outils de modélisation et simulation ont largement contribué à l’épidémio-surveillance et éclairé la prise de décisions relatives aux politiques de santé publique. Mais ils ne permettent pas de comprendre les différentes étapes du cycle de multiplication du virus.

En effet, la multiplication virale constitue un phénomène complexe au cours duquel le virus va détourner la machinerie cellulaire à son profit. Du fait de leur simplicité extrême, les virus ne peuvent pas se multiplier par eux-mêmes. Connaître et bien comprendre les différentes étapes du cycle de multiplication virale apparaît essentiel pour le développer des molécules antivirales. Certaines étapes sont spécifiques du virus et constituent une cible idéale.

Or, jusqu'à présent, peu d'outils de simulation informatique ont été proposés pour comprendre entièrement les mécanismes responsables de la multiplication de l'activité virale des coronavirus et, en particulier, du SARS-CoV-2.

À ce jour, les principales méthodes de modélisation en virologie reposent sur une diversité de méthodes mathématiques, essentiellement exprimés par des modèles stochastiques, d'équations différentielles ordinaires (SDE et ODE), des modèles de dynamique des systèmes (SD), ou aussi des modèles d'équations différentielles partielles (PDE). Généralement, les solutions de ces équations ne sont pas des valeurs numériques, mais des fonctions. Elles expriment des relations entre des fonctions inconnues et leurs dérivées successives. Ce qui explique la difficulté de résoudre les modèles d'équations différentielles.

Or, la simulation du cœur catalytique de la réplication du SARS-CoV-2 nécessite la considération de plusieurs paramètres/facteurs simultanément (composition en nucléotidique du génome viral, structures de l’ARN, taux de mutations, ...). Il est impossible d'obtenir une valeur pour chaque paramètre par le biais d'expériences en laboratoire ou de calculs théoriques. Par conséquent, ces modèles mathématiques ne s’appliquent pas à la reproduction et simulation du cycle réplicatif du SARS-CoV-2.

Il devient donc nécessaire de se focaliser sur une modélisation quantitative et qualitative. En effet, les recherches se heurtent au volume souvent important des données, leur hétérogénéité lorsqu'elles sont issues de différentes sources, leur qualité, et leur niveau de détail trop fin pour donner une vision globale de l'activité. De même, la réplication du SARS-CoV-2 peut être considérée comme un système dont les variables d'entrées et d'états sont des fonctions du temps. Ce type de système complexe peut être simulé par des modèles à événements discrets, comme le formalisme DEVS (pour Discrete Event System Specification).

L'étude vise à proposer une approche hybride permettant, de manière qualitative et quantitative, de mieux comprendre les mécanismes moléculaires de la réplication virale. Ces travaux vont permettre d'identifier de nouvelles cibles pharmacologiques pouvant déboucher sur des stratégies antivirales. Claudia Frydman et son équipe s’intéresse spécifiquement à une enzyme essentielle à la réplication du virus, l'ARN polymérase ARN-dépendante (RdRp).

L’approche du projet PullCoVapart repose sur l'utilisation l'Intelligence Artificielle (technologies sémantiques associées à la simulation à événements discrets) pour caractériser les performances de l'ARN polymérase du SARS-CoV-2.

L'un des principaux objectifs de l'étude est d'enrichir les modèles formels existants avec des aspects temporels associés à des règles pour simuler l'activité de l'ARN polymérase du SARS-CoV-2 en fonction des propriétés de l'ARN viral. Les modèles ontologiques ne peuvent pas simuler de larges quantités d’informations et la dimension temporelle est assez limitée. D’où l’idée de les associer à des modèles de simulation à événements discrets ayant la capacité de modéliser, analyser et simuler la dynamique et le comportement des systèmes complexes.

Dans ce type de modélisation, le changement de l'état d'un système, au cours du temps, est une suite d’événements discrets qui arrivent à un instant donné et modifient l'état du système. En outre, la simulation est utile lorsque l'incertitude est élevée en raison de la rareté des données, et pour l'expérimentation dans un environnement à faible risque.

Associant les avantages de chacun des deux modèles qualitatif (modèle ontologique) et quantitatif (modèle de simulation DEVS), nos travaux consistent à générer des modèles de simulation d'événements discrets à partir de la nouvelle ontologie de domaine Covid-19 enrichie, combinée à des règles de raisonnement SWRL (un langage de règles pour le web sémantique) développés conjointement avec les experts biologistes. Ensuite, les modèles de simulation seront exécutés pour reproduire le cycle réplicatif de la polymérase du SARS-CoV-2, permettant aux biologistes de suivre l'activité enzymatique de l’ARN-polymérases ARN-dépendantes et générer des prédictions virtuelles de l'efficacité de cette enzyme en fonction de la séquence d'ARN virale fournie. D’autres modèles de simulation, consistant en des automates cellulaires, s'intéresseront à la modélisation de la propagation du virus au sein des cellules présentes sur la paroi des voies respiratoires, mais aussi sur celles des vaisseaux sanguins ou encore des intestins.