Annotation structurale et fonctionnelle du génome de Botrytis cinerea

 

J. Amselem (1), E. Quevillon (1,4), C. Pommier (1), F. Legeai (1), D. Samson (1), S Reboux (1), F. Artiguenave (1), E. Fournier (2), C. Levis (2), J.-M. Pradier (2), M. Viaud (2), A. Simon (2), S. Fillinger (3), M.-H. Lebrun (4)

 

INRA Centre de Versailles-Grignon, (1) Unité de Recherche Genomique-Info, 91000Evry

(2) Phytopathologie et methodologie de la Detection, 78000 Versailles

(3) Unité de Phytopharmacie & Médiateurs Chimiques, 78000 Versailles

CNRS - Bayercropscience-Lyon (4) UMR 2847, Physiologie des plantes et des champignons, 69009 Lyon

 

 

Botrytis cinerea, champignon de la classe des Ascomycètes est un des principaux agents pathogènes de la vigne (pourriture grise) et affecte un large spectre d’hôtes (plus de 200 espèces) en causant de sérieuses pertes de cultures à travers le monde. Dans le cadre du développement d’outils génomiques, une première banque de cDNA de mycélium a été séquencée par le Genoscope (http://www.genoscope.cns.fr/) générant des EST correspondant à environ 3000 contigs annotées par l’URGI (http://urgi.infobiogen.fr/). Un séquençage génomique 12X de la souche T4 a été initié au Genoscope en 2005 dont l’assemblage est en cours (~40Mb, ~16 chromosomes, 15.000 gènes). Ce séquençage en « whole genome shotgun » a été réalisé à partir de banques génomiques de 3 et 10Kb (environ 600 000 lectures) et 20 000 bacs permettant l’assemblage des contigs en « supercontigs », consistant en une suite ordonnée et orientée des différents contigs de séquences.

Nous mettons en place à l’URGI une plateforme bioinformatique fongique permettant de générer l’annotation automatique du génome de Botrytis, dans un premier temps puis d’autres génomes fongiques. Cette plateforme regroupe des outils d’analyse performants, une base de données et des interfaces graphiques de visualisation et d’édition. Leur intégration et configuration au sein de la plateforme bioinformatique de l’URGI est en cours. Le processus d’annotation structurale est basé sur la prédiction de gènes ab initio mais aussi sur des algorithmes de comparaison de séquences (ADN génomique/cDNA, ADN génomique/protéine). En effet la fiabilité des identifications de gènes dépend en grande partie des transcrits disponibles (EST) car la prédiction de gènes ab initio génère de nombreuses erreurs telles que des fusions de gènes et des erreurs d’épissage et n’arrive pas à détecter certains exons ou gènes. Afin de pallier à ce problème, 50 000 ESTs supplémentaires sont en cours de séquençage au Genoscope et seront intégrées dans le processus d’annotation. 5000 cDNA pleines longueurs ont été séquencés en 3’ et 5’ et seront utilisés pour l’entraînement des programmes de prédiction de gènes. En collaboration avec l’équipe de Thomas Schiex à l’INRA de Toulouse nous utiliserons Eugene comme intégrateur d’informations d’annotation et outil d’aide à la décision. L'annotation fonctionnelle de ces génomes sera réalisée sur l'ensemble des protéines identifiées par l'annotation structurale : recherche des orthologues de fonction connue et des domaines protéiques conservés, assignement des fonctions biochimiques, des localisations cellulaires et des processus biologiques. L'ensemble des annotations automatiques sera fourni à des experts pour validation et correction à travers une interface graphique évoluée, et accessible à l'ensemble de la communauté scientifique sur le site de l'URGI. Parallèlement, en collaboration avec le Genoscope, le MIG-INRA et le Broad Institute, différents outils d’analyse comparative seront adaptés aux génomes fongiques et utilisés pour comparer ce génome à ceux d’autres espèces fongiques proches taxonomiquement.