Contexte
Les vagues épidémiques successives de Covid-19 ont touché la quasi-totalité de la population mondiale. Il existe une très grande hétérogénéité dans le nombre d’infections d’infection par le SARS-CoV-2, le moment où ces infections ont eu lieu, le nombre de doses de vaccin, etc. Les individus ont donc des capacités différentes à infecter d’autres personnes ; Leur susceptibilité à l’infection est également très hétérogène. Comprendre comment cette diversité se traduit au niveau individuel pourrait permettre d’améliorer les traitements et de rationaliser les interventions non pharmaceutiques tels que l’isolement des cas contacts.
Au niveau individuel, l’évolution de la charge virale qui suit une infection est un marqueur particulièrement intéressant pour étudier la durée d’infectivité, le taux d’infection, la sévérité des symptômes. Ces mesures sont hautement variables et on comprend encore mal leur association avec l’immunité et les autres facteurs individuels.
La modélisation mathématique des processus de l’infection chez un individu est indispensable pour pouvoir estimer ces différents paramètres. Les modèles décrivant la charge virale varient en complexité, allant de modèles descriptifs de la croissance et décroissance de la charge virale (Hay 2022) à des systèmes d’équations différentielles ordinaires (EDO) prenant en compte la dynamique des cellules ciblées par l’infection, des cellules infectées, des virus, et du système immunitaire (Baccam 2006, Néant 2021). Les modèles non-linéaires à effets mixtes quant à eux fournissent le cadre permettant de traiter à la fois l’estimation des paramètres et de quantifier la variabilité inter-individuelle.
Ces processus sont complexes, et les données disponibles pour caractériser ces mesures souffrent de nombreuses lacunes. Entre autres, les designs d’étude ne permettent pas toujours d’acquérir les données depuis le début de l’infection, les données sont bruitées et la fréquence des mesures ne permet pas toujours de capturer l’ensemble de la dynamique virale. Si certains problèmes liés à l’estimation ont pu être traités dans la littérature (Van Kinh, 2016), la diversité inter-individuelle a été peu traitée.
L’objectif principal du stage sera d’utiliser différentes approches statistiques pour analyser les courbes de la charge virale. Nous confronterons principalement deux modèles de la charge virale à différents niveaux de complexité dans leur description des processus intra-hôtes. On estimera leur capacité à estimer efficacement les paramètres et/ou les summary statistics de la charge virale (la durée totale d’infectivité, le pic de l’infection, l’aire sous la courbe, etc ), dans le but d’identifier pour chaque situation le modèle le plus à même de fournir des résultats quantitatifs exploitables.
Plus particulièrement :
1. Nous commencerons par simuler un ensemble de données individuelles à partir du modèle complet de dynamique virale. Ce modèle consistera en un système d’EDO. On tiendra compte de la variabilité des paramètres individuels qui existent dans les données réelles. Les données simulées seront ensuite traitées pour simuler des observations réalistes.
2. La deuxième étape consistera à analyser les courbes simulées de la charge virale pour identifier et extraire des mesures statistiques. Les summary statistics choisies contiendront les informations pertinentes pour décrire les courbes et permettront de différencier les courbes les unes des autres.
3. On implémentera dans un second temps le modèle descriptif de la charge virale, qui ne tiendra pas compte des processus de l’infection mais seulement de la forme de la courbe de la charge virale.
4. On analysera les données simulées avec les deux modèles implémentés. On utilisera des modèles non-linéaires à effets mixtes pour capturer les variations inter-individuelles. Les paramètres seront inférés par un algorithme stochastic approximation expectation maximisation (SAEM). On évaluera pour chaque modèle l’exactitude et la précision des estimations des paramètres mis en entrée des simulations ainsi que des summary statistics. L’implémentation sera faite dans le langage R.
Profil recherché :
· Bac+5, expertise en biostatistiques ou biomathématiques (Ecole d'ingénieur, M2)
· Intérêt pour la modélisation en biologie
· Maîtrise du logiciel statistique R
· Capacités rédactionnelles et de communication
Environnement de travail :
L’étudiant sera basé au sein de l’équipe BIPID de l’UMR 1137 IAME INSERM situé sur le campus de l’hôpital Bichat (Paris 75018). La gratification de stage se fera selon les grilles de l’INSERM (568.76 € et remboursement de la moitié des frais de transport avec abonnement)
Encadrement : Dr Nathanaël Hozé, Dr Jérémie Guedj.
Contact : nathanael.hoze@inserm.fr et jeremie.guedj@inserm.fr
Néant, Nadège, et al. "Modeling SARS-CoV-2 viral kinetics and association with mortality in hospitalized patients from the French COVID cohort." Proceedings of the National Academy of Sciences 118.8 (2021): e2017962118.
Baccam, Prasith, et al. "Kinetics of influenza A virus infection in humans." Journal of virology 80.15 (2006): 7590-7599.
Hay, James A., et al. "Quantifying the impact of immune history and variant on SARS-CoV-2 viral kinetics and infection rebound: A retrospective cohort study." Elife 11 (2022): e81849.
Van Kinh, Nguyen, et al. "Analysis of practical identifiability of a viral infection model." PLoS One 11.12 (2016).
Commentaires