Sélection de modèles statistiques pour effectuer de l'inférence causale à l'aide de données épidémiologiques

 

Denis Talbot

Université Laval

 

Domaine : santé des populations

Programme Chercheurs-boursiers - Junior 1

Concours 2018-2019

En statistique, les techniques d'inférence causale sont construites pour prédire l'effet qu'aurait une intervention potentielle, comme un traitement, une campagne de santé publique ou une politique, soit à l'aide d'expériences randomisées ou de données observationnelles. Les inférences causales sont le plus facilement effectuées à l'aide d'études randomisées, mais des approches pour inférer des relations de cause à effet à l'aide de données d'observation sont également établies. Pour des raisons financières, éthiques ou logistiques, il est cependant parfois impossible de conduire des études randomisées. Cette situation survient fréquemment en épidémiologie et dans d'autres sciences médicales où plusieurs études utilisent des données d'observation. Les décideurs doivent ainsi parfois se baser sur les informations provenant d'études observationnelles. L'estimation d'effet causal à l'aide de données observationnelles requière de vastes connaissances du domaine d'application.

En effet, il est d'abord nécessaire d'identifier les variables confondantes pouvant déformer l'association entre l'exposition et l'issue d'intérêt en plus de sélection une approche de modélisation adéquate pour contrôler pour les variables confondantes identifiées. À moins que ces tâches ne soient accomplies adéquatement, les informations produites peuvent être erronées, parfois de façon importante, et peuvent ainsi induire en erreur les décideurs. Ces tâches sont difficiles à accomplir, particulièrement dans les domaines où les connaissances sont encore limitées. Il semblerait ainsi naturel de supplémenter les connaissances du domaine d'application disponibles avec les informations provenant directement des données récoltées. Cependant les approches classiques d'analyse de données sont mal adaptées à tirer de l'information des données pour ensuite effectuer des inférences causales. Ce programme de recherche cherche donc à développer de nouveaux outils d'analyse de données qui aideront les chercheurs du domaine de la santé à effectuer des inférences causales appropriées à l'aide de données d'observation.