VariantIP : un outil bio-informatique web intégrant des données génomiques fonctionnelles afin de faciliter l'interprétation de variants génétiques

 

Pierre-Étienne Jascques

Université de Sherbrooke

 

Domaine : génétique humaine

Programme chercheurs-boursiers - Junior 1

Concours 2014-2015

Environ 0,1 % (3 millions) des 3 milliards de bases d'ADN composant le génome humain diffèrent entre deux individus. Les études génétiques traditionnelles sont parvenues à identifier les mutations causant des maladies génétiques simples héritées des parents. La fibrose kystique et l'hémophilie sont des exemples de telles maladies causées par des variations génétiques dans la portion codante d'un seul gène. Malheureusement, un grand nombre de maladies génétiques, telles le diabète et le cancer, sont causées par la combinaison de variations génétiques affectant plusieurs gènes.

Considérant que la fraction du génome correspondant aux portions codantes des gènes est de moins de 3 %, la grande majorité des variations génétiques sont situées dans les portions dites non-codantes du génome. Contrairement aux variations modifiant la portion codante d'un gène, l'interprétation des variations dans les régions non-codantes représente encore un défi considérable. Les portions non-codantes du génome contiennent de petites séquences reconnues par des régulateurs contribuant à ajuster l'expression des gènes. L'emplacement précis de toutes ces séquences régulatrices n'est pas encore déterminé.  L'accumulation de mutations affectant légèrement certaines séquences régulatrices de plusieurs gènes pourrait expliquer que les maladies génétiques complexes tendent à être sur-représentées dans certaines familles affectées, mais qu'elles ne montrent pas un patron d'hérédité clairement défini. La séquence complète du génome de patients devient de plus en plus accessible considérant les améliorations récentes dans les technologies de séquençage. Le besoin de nouvelles méthodes innovantes pour interpréter les variations dans les régions non-codantes est ainsi manifeste.

Le but du présent programme de recherche est de contribuer à la prochaine révolution de la médecine personnalisée, plus spécialement dans l'éventuelle prévention et dans le traitement des maladies humaines avec composante génétique, en concevant une méthode bio-informatique innovatrice utilisant des milliers de données publiques facilitant l'interprétation de toutes les variations génétiques impliquées dans la dérégulation de gènes impliqués dans des maladies comme le cancer du rein et l'Alzheimer.