Nouvelles approches statistiques pour la modélisation des données génomiques de grandes dimensions à l'ère des technologies omiques

 

Karim Oualkacha

Université du Québec à Montréal [UQAM]

 

Domaine : génétique humaine

Programme Chercheurs-boursiers - Junior 2

Concours 2019-2020

Les développements récents des nouvelles techniques de séquençage dans le domaine de la génétique ont fait appel à de nouvelles approches "omiques" performantes à haut débit telles que la génomique, la protéomique, l'épigénomique ou la métabolomique. Ces approches ont pour but de fournir une vision riche et non-biaisée de la cellule et offrir ainsi un aperçu unique de sa complexité biologique. Cependant, l'afflux continu de la grande quantité de données génomiques générés par ces techniques risque de dépasser notre capacité à analyser, interpréter les résultats et à mieux comprendre la biologie associée. En fait, de telles données sont souvent de grande dimension, sujettes à plusieurs erreurs expérimentales, hétérogènes et peuvent contenir à la fois des phénotypes inter-corrélés et/ou qui varies dans le temps et des sujets apparentés. Ainsi, le défi pour les statisticiens est d'extraire un aperçu biologique pertinent de ce vaste volume de données et d'exploiter ces connaissances pour guider le développement de nouveaux diagnostics et  thérapies pour les maladies humaines.

Guidé par ce principe, l'objectif général de ce programme de recherche chercheur-boursier Junior 2 est d'établir un ensemble d'outils multivariés qui traiteront de manière appropriée les problèmes d'analyse de données auxquels nous sommes confrontés à l'ère omiques. Plus précisément, il propose des méthodes statistiques modernes qui contrôlent de manière appropriée les erreurs expérimentales, fournissent une modélisation flexible de la dépendance à plusieurs niveaux, capturent l'hétérogénéité et traitent efficacement des données volumineuses et complexes. Ainsi, ces méthodes seront très utiles pour analyser plusieurs plates-formes de données omiques, telles que celles issues du séquençage de nouvelles générations du génome entier. Par conséquent, les méthodes proposées dans ce programme de recherche peuvent aider à maximiser l'utilité des données omiques au sein de la communauté des chercheurs en génomique.