concepts biologiques et prédiction fonctionnelle

33
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 EA 3781 - Evolution Biologique Laboratoire de Phylogénomique UP - Case 19, Pl. V. Hugo 13331 Marseille - France 14 Décembre 2006 Carry-le-Rouet Anthony LEVASSEUR UMR 1163 INRA de Biotechnologie des Champignons Filamenteux ESIL-163 av. de Luminy 13288 Marseille - France

Upload: avian

Post on 13-Jan-2016

35 views

Category:

Documents


2 download

DESCRIPTION

Concepts biologiques et prédiction fonctionnelle. 14 Décembre 2006 Carry-le-Rouet Anthony LEVASSEUR. EA 3781 - Evolution Biologique Laboratoire de Phylogénomique UP - Case 19, Pl. V. Hugo 13331 Marseille - France. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

EA 3781 - Evolution BiologiqueLaboratoire de Phylogénomique

UP - Case 19, Pl. V. Hugo 13331 Marseille - France

14 Décembre 2006Carry-le-Rouet

Anthony LEVASSEUR

UMR 1163 INRA de Biotechnologie des Champignons Filamenteux

ESIL-163 av. de Luminy 13288 Marseille - France

Page 2: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Plan de la présentation

Introduction générale

Exemple d’un outil de détection du shift évolutif

Etude d’un cas : la famille lipase/féruloyl estérase A

I

II

III

Exploitation des données pour la prédiction fonctionnelle

II.1

II.2

Conclusion

Page 3: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Comment exploiter l’information phylogénétique pour l’annotation fonctionnelle ?

Comment les concepts de l’évolution pourraient-ils apporter de nouvelles informations ?

Objectif : tenter de répondre aux questions suivantes

Introduction générale

I.

Page 4: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Un exemple de reconstruction phylogénétique

Page 5: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Recherche données fonctionnelles (expérimentales)

Page 6: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Annotation par encadrement

Page 7: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Intégration du shift évolutif pour l’annotation

Page 8: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Etude d’un cas : la famille fongique lipase/féruloyl estérase AII.

Reconstruction phylogénétique:Reconstruction phylogénétique:

Protéine d’entrée: FAEA

Swissprot: locus FAEA_ASPNG, accession O42807

Utilisation de la plateforme FIGENIX (http://www.up.univ-mrs.fr/evol/figenix/index.html)

Pipeline : CASSIOPE_PHYLO+M

Production d’un arbre consensus fusionné

Page 9: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Unknown protein: gris, lipase: vert, FAEA: jaune

Page 10: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Lipase

FAEA

Arbre obtenu après intégration des données fonctionnelles (experimental data)

Page 11: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Exemple d’un outil de détection du shift évolutifII.1

PAML inclut plusieurs programmes, dans notre exemple nous avons exploité codeml pour :

Estimer le taux de substitutions synonymes et non synonymes et détecter la sélection positive Comparer différents modèles pour la validation d’hypothèses (Likelihood ratio tests)

Page 12: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Modèles & analyses

Théorie générale:

Le ratio du taux de substitutions non-synonymes sur synonymes (ω) fournit une mesure de la sélection naturelle à l’échelle protéique dans laquelle:

D(N)/D(S) <1 signifie que la séquence évolue sous sélection conservatrice D(N)/D(S) =1 … sous la neutralitéD(N)/D(S) >1 … sous sélection positive

La description détaillée des modèles est disponible sur les sites suivants :

Page 13: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Différents modèles:

1. Modèles branches

Les modèles dits par branches permettent au ratio ω de varier parmi les branches dans une phylogénie et sont utiles pour détecter la sélection positive se produisant sur des lignées particulières

Le shift évolutif peut se produire pendant une période brève & sur certains acides aminés Le shift évolutif peut se produire pendant une période brève & sur certains acides aminés uniquement… D’où le développement de différents modèles prenant en compte ces uniquement… D’où le développement de différents modèles prenant en compte ces observations.observations.

2. Modèles par sites

Ces modèles dits par sites permettent au ratio ω de varier parmi les sites de la séquence protéiquePlusieurs modèles ont été développés. Il apparaît que les modèles M1a (Nearly Neutral) et M2a (Positive selection) sont particulièrement utiles pour la détection de la sélection positive et sont fortement recommandés pour les tests de données réelles.

Page 14: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

3. Modèles Sites + Branches

Yang et Nielsen (2002) ont développé un modèle (model A) qui autorise ω à varier parmi les sites et parmi les lignées. Ce modèle tente de détecter la sélection positive sur plusieurs classes de sites et se focalise sur une branche donnée.

Sélection positive

La validation de la sélection positive s’effectue par un test LRT (Likelihood Ratio Test).

En supposant que le modèle le plus simple (null model) ait p0 paramètres, le modèle alternatif p1 paramètres et les valeurs log likelihood sous ces deux modèles soient l0 et l1, respectivement

La différence 2Δl = 2(l1-l0) a une distribution χ2 avec df= p1-p0 si le null model est vrai.

2 Δl peut être comparé à une distribution χ2 pour tester si le modèle null est rejeté contre le modèle alternatif.

1. Yang Z, Nielsen R. 2002. Mol Biol Evol. 19:908-917.

1

Page 15: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Codeml

ML analysis of protein-coding DNA sequences using codon substitution models (e.g., Goldman and Yang 1994)

Données d’entrées nécessaires:

1/ Alignement (ClustalW)

2/ Arbre parenthèse

Fichier de contrôle ctl. :

Tableau de bord permettant de cibler le modèle appliqué, divers paramètres d’analyse…

Page 16: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Exploitation des données pour la prédiction fonctionnelleII.2

Page 17: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Likelihood Ratio Tests

Détection de la sélection positive confirméeDétection de la sélection positive confirmée

Page 18: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Cartographie évolutive

Utilisation des sites évoluant sous sélection positive pour la prédiction fonctionnelle

17M, 19T, 22Q, 29C, 51W, 63T, 70G, 71D, 74L, 75Q, 76L, 103G, 126A, 163S209G, 226V, 248T, 257A

La prédiction fonctionnelle s’est basée sur le « profil évolutif » et à permis de compléter l’annotation de cette famille

Page 19: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Lipase

FAEA

Page 20: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

33 sites évoluent sous sélection positive(seuil de probabilité >95%)

Résultats

Détection de la sélection positive confirméeDétection de la sélection positive confirmée

Page 21: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Alignement et conservation des sites:

Une majorité des sites positivement sélectionnés est conservée dans le groupe féruloyl estérase A mais pas dans le groupe des lipases

La présence de sites évoluant sous sélection positive a été démontrée.

Est-ce que les sites positivement sélectionnés sont impliqués dans le changement fonctionnel

Confirme le rôle essentiel des ces sites pour la fonction enzymatique

Page 22: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Lien entre changements évolutif et fonctionnel

Sites sous sélection positive et implication fonctionnelle

FaeA Aspergillus niger (1USW)

1. Asp71 et Tyr80 dans la région du « clapet » (69-80)

2. Tyr100 et le site catalytique

La mutagénèse dirigée permet de connecter les sites positivement

sélectionnés au changement fonctionnel

Page 23: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

III. Conclusion

Les sites sous sélection positive représentent des « sondes évolutives » exploitables pour la prédiction fonctionnelle

Une relation entre shift évolutif et shift fonctionnel a été établie

Pour plus d’infos… sur ces travaux : Levasseur et al. BMC Evolutionary Biology 2006, 6:92 (8 November 2006)

sur la détection de la sélection positive : http://workshop.molecularevolution.org/people/faculty/files/codon.html

Page 24: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

EA 3781 - Evolution BiologiqueLaboratoire de Phylogénomique

UP - Case 19, Pl. V. Hugo 13331 Marseille - France

UMR 1163 INRA de Biotechnologie des

Champignons Filamenteux ESIL-163 av. de Luminy 13288 Marseille - France

http://www.up.univ-mrs.fr/evol/ http://umrbcf.esil.univ-mrs.fr/

Page 25: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Page 26: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Page 27: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Un point sur les définitions

1.Shift fonctionnel : Changement de la « fonction » d’un produit de gène pouvant s’opérer à diverses échelles biologiques (protéine… compartiment cellulaire… organes…organismes…population etc…)

• Quelques causes du shift fonctionnel : Micro-mutations: substitutions, délétions, insertions…Gene shufflingDuplications (Évolution divergente des duplicats)

Page 28: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

• Devenir & Conséquence du shift fonctionnel :

Contre-sélection

Evolution sous la neutralité

Sélection : nouveauté conférant un avantage sélectif par rapport au milieu environnemental, reproduction… ?

Acquisition de nouvelles caractéristiques biochimiques, colonisation de nouvelles niches écologiques… Adaptation à l’environnement

Page 29: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

• Shift évolutif: Accélération (épisodique) du taux de substitutions d’une séquence

Origine : Sélection positiveRelâche de contraintes fonctionnelles

Page 30: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

• Exemple d’un modèle statistique de prédiction fonctionnelle basé sur l’exploitation des informations

phylogénétiques

Page 31: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

La famille lipase/feruloyl esterase A

LIPASES

FERULOYLESTERASES A

LignocellulolyseMetabolisme

Cette famille possède deux types d’activité enzymatique malgrè un pourcentage de similarité de séquences élevé.

Comment expliquer une telle divergence fonctionnelle au sein de cette famille ?&

Quelles sont les forces conduisant à de tels événements ?

Page 32: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006

Koseki et al., Biochim Biophys Acta, 1722: 200-8

Page 33: Concepts biologiques et prédiction fonctionnelle

Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006