IMPBIO

ACI IMPBio - Projet soutenu en 2003 et 2006


 

MOSAIC

Analyse comparative de génomes microbiens : étude de la distribution statistique de mots dans un modèle hétérogène. Application à la prédiction de courts motifs répétés de fonction biologique connue ou potentielle

http://www-mig.jouy.inra.fr//aci-mosaic/

Coordinateur

Meriem El Karoui

Unité de Recherche Laitière et Génétique Appliquée

Equipes partenaires :

Responsable équipe 1



Sophie Schbath



Mathématique Informatique et Génome

Responsable équipe 2

Stéphane Robin

INRA Département Organisation et Modélisation de l'Information et des Processus

Responsable équipe 3

Frédéric Boccard

CNRS Centre de Génétique Moléculaire

 

 

poster

Objectifs initiaux

La très récente possibilité d'accéder à la séquence d'une centaine de génomes de bactéries permet de poser des questions inédites, concernant l'évolution de leur structure à partir de comparaisons de génomes complets. Les premières comparaisons de génomes de souches d'une même espèce ont permis de mettre en évidence une structure en mosaïque qui est composé d'un « squelette » commun à toute les souches et de «boucles » spécifiques de chaque souche. La plupart des analyses effectuées jusqu'à présent s'intéressent principalement au contenu en gènes des génomes étudiés. Il est cependant bien clair que l'information génétique ne se réduit pas aux seuls gènes. De nombreux types de motifs d'ADN de fonction connue ont été identifiés dans les génomes bactériens. Au delà de ceux qui ont déjà été identifiés il est très probable que d'autres motifs existent, qui ne sont pas connus pour le moment. L'analyse de ces motifs représente l'un des défis majeurs de l'étude des génomes aujourd'hui. L'objet de notre étude est de développer une méthode alliant la comparaison de génomes et l'analyse statistique pour analyser la distribution et prédire des motifs de fonction connue ou potentielle. Il s'agira pour cela de développer de nouvelles méthodes statistiques de recherche de motifs de fréquence exceptionnelle qui puissent prendre en compte la structure hétérogène des séquences. Ces méthodes seront appliquées à deux exemples de motifs biologiques et les prédictions testées expérimentalement.







Erreur SQL !
SELECT * from tbl_user WHERE pseudo = 'Meriem El Karoui';
Access denied for user 'www-data'@'localhost' (using password: NO)