arn non codant - freefdanieau.free.fr/cours/master/semestre1/rinf/cours_arn.pdf · anrep (mehldau...

41
ARN non codant et bioinformatique

Upload: others

Post on 21-Mar-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

ARN non codant

et

bioinformatique

Page 2: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT
Page 3: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Gènes ?

Deux types de gènes:

gènes codant pour des protèines

gènes à ARN

Page 4: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

ARN

ARNs codant

ARNm

ARNs non codants

ARNs traduction

ARNt ARNr

Petits ARNs

siARN miARN

(stARN)snoARN snARN

Ribozymes

Les familles d’ARNs

Page 5: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Molécule simple brin

CCAGGAAUCCUGG…

Appariement entre bases par des

liaisons hydrogènes Watson-Crick: (C,G) et (A,U)

de type Wobble: (G,U)

Qu’est qu’un ARN ?

Page 6: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Qu’est qu’un ARN ?

Possibilité de former des duplex avec

d’autres ligands: ADN

ARN

Protéines

Les ARN adoptent une structure

essentielle à leur fonction

Repliement intra-moléculaire

Page 7: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Exemple : snoARNs

Page 8: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Exemple: ARN 16S

Page 9: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Exemple : RNAIII

Page 10: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Exemple : miARN (1)

Page 11: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT
Page 12: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Structure primaire

Structure secondaire

Structure tertiaire

Structure des ARNs

Page 13: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Structure secondaire

•Mise en évidence de la plupart des liaisons

•Repliement dans un plan

Page 14: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Structure tertiaire

•Détermine activité biochimique

•Repliement dans l’espace

Page 15: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Signature d’une famille

Elément de structure II : motif

Page 16: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Motifs de structure III

Page 17: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

ARN et bioinformatique

Inférence de signature d’ARN

◦ Le motif est inconnu

Plusieurs séquences

Motif commun?

Recherche de gènes d’ARN

Le motif est connu

Une ou plusieurs séquences

Toutes les positions où une

occurrence du motif apparait

Page 18: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Inférence (prédire) les ARNs

À partir d’une séquence Recherche de similarité dans les banques?

Biais de composition

Structure d’énergie optimale

À partir de plusieurs séquences Analyse comparative

Structure primaire

Structure secondaire

Page 19: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Inférence (structure I)

Page 20: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Mot

Alignement

Multiple

Consensus

Expression

Régulière

Inférence (structure I)

Page 21: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Inférence (structure I)

Profil de poids

Chaine de Markov

Cachées

(HMM)

Page 22: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Inférence (structure II)

Principe de la Covariation

Page 23: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

L‘exemple de l’ARNt

Page 24: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

QRNA examine les motifs conservés entre

plusieurs espèces :

Il distingue protéine et ARNnc

MSARi évalue la significativité d’un nombre

de mutations compensatoires observées

RNAz évalue la significativité de l’énergie

libre de structure individuelles entre elles et

avec une structure consensus

Exemples (Inférence)

Page 25: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

ARN et bioinformatique

Inférence de signature d’ARN

◦ Le motif est inconnu

Plusieurs séquences

Motif commun?

Recherche de gènes d’ARN

Le motif est connu

Une ou plusieurs séquences

Toutes les positions où une

occurrence du motif apparait

Page 26: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Logiciels (outils) spécifiques La signature du motif est définie dans le logiciel

Ne s’appliquent qu’à un seul type de famille

Nécessite des programmeurs pour modifier les caractéristiques du motif recherché

Logiciels généralistes La signature du motif est donné par l’utilisateur

Le logiciel propose un langage

Selon la flexibilité du langage, l’utilisateur peut décrire les caractéristiques qu’il souhaite

Recherche de motif

Page 27: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Séquence

ou génome

Séquence

ou génome

Entrée Sortie

candidat

candidat

candidat

candidat

candidat

candidat

candidat

candidat

Motif

Motif

OutilS

pécif

iqu

eG

én

éra

lis

te

Page 28: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Logiciels spécifiques

Les ingrédients?

Une signature de la famille

Un score pondérant la présence de chaque

élément du motif

Algorithme de recherche efficace

Identification d’éléments dont la présence est

discriminante

Page 29: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Logiciels spécifiques

Les avantages/inconvénients?

Avantage

Efficacité

Confiance élevée dans les scores

Inconvénients

Programmeur indépendant

Difficile de modifier l’algorithmes

Page 30: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Logiciels spécifiques

Group I introns I: CITRON (Lisacek et al., 1994)

tRNA :

(Staden, 1980), (Marvel, 1986),

tRNAscan (Fichant et Burks, 1991), (Pavesi et al., 1994),

FASTtRNA (El-Mabrouk et Lisacek, 1996),

tRNAscan-SE (Lowe et Eddy, 1007)

snoRNA : SNOscan (Lowe et Eddy, 1997)

IRE motifs : (Dandekar et al., 1991)

La signature est définie dans le logiciel

Page 31: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Travaille en trois étapes:

1) Recherche avec tRNAscan (Fichant & Burks, 1991) et

EutfindtRNA (Pavesi et al, A994)

2) Evaluation des candidats avec COVELS (Eddy & Durbin, 1994)

3) Localisation des éléments de structure dans les candidats

Excellent compromis entre efficacité, sensibilité et

spécificité

Classiquement utilisé pour les ARNT dans les

programmes d’annotation de génome

l’ARNt avec tRNAscan-SE

Page 32: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Logiciels généralistes

Les ingrédients?

Une signature de la famille

Un langage permettant de traduire l’ensemble

des éléments et leurs caractéristiques

Algorithme de recherche efficace

Identification d’éléments dont la présence est

discriminante (éventuellement)

Page 33: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Logiciels généralistes

Les avantages/inconvénients?

Avantage

Programmeur indépendant

Généralement facile de décrire un motif structuré

Inconvénients

Ne permet pas toujours de décrire l’ensemble des

caractéristiques du motif

Moins efficace

Difficile de construire des scores pertinents

Page 34: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Logiciels généralistes

Séquence seulement

ANREP (Mehldau et Myers, 1993)

FindPattern (Devereux et al, 1984)

Séquence et structure

RNAMOT (Gautheret et al, 1990, Laferriereet al, 1994)

PALINGOL (Billoud et al., 1996)

PATSCAN (DSOUZA er al., 1997),

PATSEARCH (Pesole et alm., 2000)

La signature est à définir par l’utilisateur

Page 35: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

l’ARNt avec RnaMot

Page 36: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Evaluation des outils (1)

OUTIL DE

PREDICTION

Exemples =

Séquences qui

correspondent au motif

Contre exemples =

Séquences qui ne

correspondent pas au motif

candidats

Page 37: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Evaluation des outils (2)

Positifs Négatifs

Exemples Vrais Faux

Positifs Négatifs

Contre Faux Vrais

Exemples Positifs Négatifs

Page 38: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Sensibilité : un programme est d’autant plus sensible qu’il va proposer des vrais positifs

SE = VP / (VP +FN)

Spécificité : un programme est d’autant plus spécifique qu’il ne va pas trouver des faux positifs

SP = VP /(VP + FP)

Evaluation des outils (3)

Page 39: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

Exemple :

Prédiction des ARNts dans une séquence

5 candidats sont prédits

3 correspondent à de vrais gènes : VP = 3

1 vrai gène n’a pas été trouvé : FN = 1

2 ne sont pas de vrais gènes : FP = 2

SE = 3/(3+1) = 3/4 75 %

SP = 3/(3+2) = 3/5 60 %

Evaluation des outils (4)

Page 40: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT
Page 41: ARN non codant - Freefdanieau.free.fr/cours/master/Semestre1/RInf/cours_arn.pdf · ANREP (Mehldau et Myers, 1993) FindPattern (Devereux et al, 1984) Séquence et structure RNAMOT

RFAM stats

503 familles Une famille : groupe d’ARN homologues et

alignables (structure II ou I)

miARN: > 20 familles

Humain 100 familles

3000 ARN différents annotés

E. Coli 40 familles