Développement de plateformes et d'outils bio-informatiques pour faciliter l'analyse de données épigénomiques et génétiques

 

Pierre-Étienne Jacques

Université de Sherbrooke

 

Domaine : génétique humaine

Programme Chercheurs-boursiers - Junior 2

Concours 2018-2019

Au cours des dernières années, le coût de séquençage de l'ADN a drastiquement diminué, permettant à un très grand nombre de scientifiques d'utiliser cette technologie pour aider à répondre à d'importantes questions biologiques. Par contre, la très grande quantité de données générées par cette technologie requiert l'utilisation d'infrastructures informatiques de pointe. Les chercheurs canadiens peuvent accéder gratuitement aux infrastructures de Calcul Canada. Cependant, la plupart des chercheurs en sciences de la vie n'ont pas l'expertise technique pour utiliser ces importantes infrastructures. Nous avons ainsi conçu le projet nommé GenAP exactement pour répondre à ce besoin. Nous proposons d'améliorer les capacités de GenAP afin d'augmenter son utilisation par les chercheurs.

Nous allons également participer au développement d'une autre plateforme d'analyse importante, cette fois ciblant la communauté des chercheurs-cliniciens. Il est désormais possible de séquencer annuellement des dizaines de milliers de génomes humains simplement au Canada, provenant principalement de patients diagnostiqués avec différents types de problématiques de santé. Identifier les mutations responsables d'une maladie à composante génétique nécessite souvent des milliers de patients. Le nombre de patients partageant la même maladie est cependant trop faible dans un seul hôpital pour permettre d'identifier les mutations causales. La plateforme nommée CanDIG permettra de maximiser l'utilité des séquences génomiques cliniques en construisant une couche logicielle robuste et sécurisée permettant de brancher les données et infrastructures informatiques de différents hôpitaux, sans pour autant sortir les données propres à chaque hôpital. La plateforme CanDIG permettra ainsi de faire des analyses pancanadiennes sur des données restant sous contrôle local.

Nous allons également développer et utiliser de nouveaux outils bio-informatiques pour répondre à certaines questions biologiques spécifiques, telles que pour étudier la régulation de l'expression des gènes, exploiter des milliers d'ensembles de données épigénomiques publiques et de grande qualité, ainsi qu'analyser les génomes de tumeurs pour mieux les classifier.