présentation de la thèse de julien allali soutenue le 23 décembre 2004 à marne la vallée
DESCRIPTION
Lisa ALLALI M1 Bio-Informatique formelle MPRI 2004/2005. Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée Modélisation et comparaison de la structure secondaire de l’ARN - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/1.jpg)
Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée
Modélisation et comparaison de la structure secondaire de l’ARN
Sous la direction de Maxime Crochemore et Marie France Sagot
Lisa ALLALI M1
Bio-Informatique formelle MPRI 2004/2005
![Page 2: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/2.jpg)
Présentation de la structure des ARN
![Page 3: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/3.jpg)
Les ARN sont des séquences mono-brin de nucléotides. Dans la cellule où ils exercent de nombreux rôles, ils ne restent pas sous forme linéaire. Un ARN se replie sur lui-même et crée des liaisons entre certains de ses nucléotides.
Les bases qui ne sont pas liées sont dites “non appariées”.
Les 3 formes de l’ARN sontla structure primaire : séquence linéaire de nucléotidesla structure secondaire : disposition des nucléotides sur le planla structure tertiaire : disposition des nucléotides dans l’espace
La conformation spaciale de l’ARN est déterminée et directement liée à la fonction de l’ARN dans la cellule. La structure tertiaire apparait donc naturellement comme la plus adaptée pour étudier la fonction d’un ARN. Cependant il est admis que 2 ARN ayant une structure secondaire proche auront une fonction moléculaire relativement proche.
Presentation
![Page 4: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/4.jpg)
La structure secondaire
Les éléments de la structure secondaire
Une hélice est une suite contiguë de liaisons entre 2 nucléotides
![Page 5: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/5.jpg)
La structure secondaire
Les éléments de la structure secondaire
Une hélice est une suite contiguë de liaisons entre 2 nucléotides
Une boucle terminale est une suite de bases non appariées formant une boucle à l’extremité d’une hélice
![Page 6: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/6.jpg)
La structure secondaire
Les éléments de la structure secondaire
Une hélice est une suite contiguë de liaisons entre 2 nucléotides
Une boucle terminale est une suite de bases non appariées formant une boucle à l’extremité d’une hélice
Une boucle multiple est le point de rencontre d’au moins 3 hélices
![Page 7: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/7.jpg)
La structure secondaire
Les éléments de la structure secondaire
Une hélice est une suite contiguë de liaisons entre 2 nucléotides
Une boucle terminale est une suite de bases non appariées formant une boucle à l’extremité d’une hélice
Une boucle multiple est le point de rencontre d’au moins 3 hélices
Une boucle interne relie 2 hélices
![Page 8: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/8.jpg)
La structure secondaire
Les éléments de la structure secondaire
Une hélice est une suite contiguë de liaisons entre 2 nucléotides
Une boucle terminale est une suite de bases non appariées formant une boucle à l’extremité d’une hélice
Une boucle multiple est le point de rencontre d’au moins 3 hélices
Une boucle interne relie 2 hélices
Un renflement est une “demie” boucle interne
![Page 9: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/9.jpg)
La structure secondaire
Les éléments de la structure secondaire
Une hélice est une suite contiguë de liaisons entre 2 nucléotides
Une boucle terminale est une suite de bases non appariées formant une boucle à l’extremité d’une hélice
Une boucle multiple est le point de rencontre d’au moins 3 hélices
Une boucle interne relie 2 hélices
Un renflement est une “demie” boucle interne
Une tige dénote une suite d’hélice(s)/boucle(s) interne(s)/(renflement(s)
![Page 10: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/10.jpg)
La structure tertiare – repliement de l’ARN
![Page 11: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/11.jpg)
Ce qui nous intéresse ici est la comparaison des structures secondaires de l’ARN pour chercher à prédire la fonction d’un ARN inconnu grâce à sa ressemblance avec un ARN connu.
Mais que signifie “être proche” pour deux ARN ?
Comment automatiser cette reconnaissance de ressemblance ?
C’est ce que nous allons essayer de comprendre pour trouver une réponse satisfaisante à la question de la comparaison entre 2 ARN.
Questions
![Page 12: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/12.jpg)
Modélisations existantes
Vers une formalisation satisfaisante
![Page 13: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/13.jpg)
Séquences annotées par des arcs
Séquences de type imbriqué représentant un ARN de transfert
Structure primaireStructure
Secondaire
![Page 14: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/14.jpg)
Séquences annotées par des arcs
Séquences de type imbriqué représentant un ARN de transfert
Structure primaireStructure
Secondaire
Séquence annotée modélisant la structure secondaire
![Page 15: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/15.jpg)
Les informations conservées par les séquences anotées sont aussi bien la suite de nucléotides qui composent l’ARN que sa structure (helices boucles etc...).
Toutes ces informations sont-elles nécessaires ?
Il apparait que c’est la structure, plus que la sequence de nucléotides qui détermine la fonction d’un ARN (même si ces deux aspects ne peuvent être totalement séparés).
Ainsi on peut imaginer de nouvelles représentations des ARN qui s’intéresseraient de façon plus accentuée à la structure pour elle-même.
Séquences annotées par des arcs
![Page 16: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/16.jpg)
La structure secondaire se prête assez naturellement à une formalisation par des arbres. Voici les étapes d’un exemple de construction d’un arbre codant la structure secondaire d’un ARN. La question qui se pose étant quel est le raffinement de l’information qui nous interesse ?
Arbres enracinés et ordonnés
![Page 17: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/17.jpg)
La structure secondaire se prête assez naturellement à une formalisation par des arbres. Voici les étapes d’un exemple de construction d’un arbre codant la structure secondaire d’un ARN. La question qui se pose étant quel est le raffinement de l’information qui nous interesse ?
Arbres enracinés et ordonnés
![Page 18: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/18.jpg)
La structure secondaire se prête assez naturellement à une formalisation par des arbres. Voici les étapes d’un exemple de construction d’un arbre codant la structure secondaire d’un ARN. La question qui se pose étant quel est le raffinement de l’information qui nous interesse ?
Arbres enracinés et ordonnés
![Page 19: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/19.jpg)
La structure secondaire se prête assez naturellement à une formalisation par des arbres. Voici les étapes d’un exemple de construction d’un arbre codant la structure secondaire d’un ARN. La question qui se pose étant quel est le raffinement de l’information qui nous interesse ?
Arbres enracinés et ordonnés
![Page 20: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/20.jpg)
La structure secondaire se prête assez naturellement à une formalisation par des arbres. Voici les étapes d’un exemple de construction d’un arbre codant la structure secondaire d’un ARN. La question qui se pose étant quel est le raffinement de l’information qui nous interesse ?
Arbres enracinés et ordonnés
![Page 21: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/21.jpg)
Deux codages possibles avec des granularités différentes :
Arbres enracinés et ordonnés
Un arc de l’arbre code pour une hélice ou une tige.
Les boucles multiples sont les noeuds internes rouges
Les boucles terminales sont les feuilles bleues
Les noeuds internes rouges sont les paires de bases appariées.
Les feuilles bleues sont les bases non appariées.
![Page 22: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/22.jpg)
Voici un éventail de granularisations possibles pour la représentation en arbre des structures secondaire de l’ARN.
Arbres enracinés et ordonnés
![Page 23: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/23.jpg)
Arbres enracinés et ordonnés
Voici un éventail de granularisation possibles pour la représentation en arbre des structures secondaire de l’ARN.
![Page 24: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/24.jpg)
Arbres enracinés et ordonnés
Voici un éventail de granularisation possibles pour la représentation en arbre des structures secondaire de l’ARN.
![Page 25: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/25.jpg)
Arbres enracinés et ordonnés
Voici un éventail de granularisation possibles pour la représentation en arbre des structures secondaire de l’ARN.
![Page 26: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/26.jpg)
Arbres enracinés et ordonnés
Voici un éventail de granularisation possibles pour la représentation en arbre des structures secondaire de l’ARN.
![Page 27: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/27.jpg)
Arbres enracinés et ordonnés
Voici un éventail de granularisation possibles pour la représentation en arbre des structures secondaire de l’ARN.
![Page 28: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/28.jpg)
Arbres enracinés et ordonnés
Voici un éventail de granularisation possibles pour la représentation en arbre des structures secondaire de l’ARN.
![Page 29: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/29.jpg)
Arbres enracinés et ordonnés
Voici un éventail de granularisation possibles pour la représentation en arbre des structures secondaire de l’ARN.
![Page 30: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/30.jpg)
Comparaison de structures
![Page 31: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/31.jpg)
La distance d’édition entre deux séquences d’ARN se calcule par la somme des coûts des opérations successives d’insertion, délétion et substitution nécessaires au passage d’une structure à l’autre.
Ces opérations sont réversibles.
La distance d’édition entre deux séquences est donc strictement équivalente au calcul d’alignement de deux séquences.
Comparaison – distance d’édition
![Page 32: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/32.jpg)
La distance d’édition entre deux séquences d’ARN se calcule par la somme des coûts des opérations successives d’insertion, délétion et substitution nécessaires au passage d’une structure à l’autre.
Ces opérations sont réversibles.
La distance d’édition entre deux séquences est donc strictement équivalente au calcul d’alignement de deux séquences.
On peut transposer ces opérations pour obtenir un calcul d’édition entre deux arbres quelconques (et en particulier au cas des arbres représentant des ARN
Comparaison – distance d’édition
Substitution noeud noir/jaune
Insertion/délétion
du noeud jaune
![Page 33: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/33.jpg)
L’édition d’abres enracinés, ordonnés et étiquetés est pertinente pour la comparaison des ARN car elle permet de prendre en compte de manière réaliste des phénomènes biologiques connus comme la perte de certaines bases (délétion), ou encore les mutations (chagement de base par une autre) mis en formalisé par les substitutions.
Néanmoins, si on en reste à cette distance d’édition, d’autres réalités biologiques ne sont pas prises en compte, et des rapprochements “non souhaités” peuvent avoir lieu.
Comparaison – distance d’édition
![Page 34: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/34.jpg)
Un exemple d’ “erreur” de rapprochement. On appellera ce phénomène la dispersion.
Comparaison d’ARN – distance d’édition
![Page 35: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/35.jpg)
Les lacunes de cette distance d’éditions :
Exemple 1 :
Comparaison d’ARN – distance d’édition
![Page 36: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/36.jpg)
Exemple 2 :
Comparaison d’ARN – distance d’édition
![Page 37: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/37.jpg)
2 nouvelles opérations d’édition
![Page 38: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/38.jpg)
2 nouvelles opérations d’édition
La fusion de noeuds
![Page 39: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/39.jpg)
2 nouvelles opérations d’édition
La fusion de noeuds
La fusion d’arcs
Ces deux opérations conservent bien l’ordre des fils (essentiel pour exprimer des opérations possibles dans l’évolution d’un ARN)
![Page 40: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/40.jpg)
Vers la bonne solution...
Ces deux nouvelles opérations d’édition (et leur inverse) permettent d’associer un nombre quelconque d’éléments d’un arbre à un ou plusieurs éléments de l’arbre auquel il est comparé.
Néanmoins, pour continuer d’exprimer des “réalité biologiques”, il est évident que des restrictions doivent être apportées à ces opérations : on ne peut pas fusionner n’importe quelles parties ensembles (ce qui reviendrait à associer des éléments de façon arbitraire, hors on veut toujours exprimer des phénomènes existants.
Il serait donc intéressant d’ajouter une information supplémentaire aux arcs et aux noeuds de notre arbre. Il faudrait savoir pour chacun à quel élément structural COMMUN il appartient, et ne permettre les fusions que d’éléments appartenant à cette même structure.
Comment définir cette appartenance à un élément structural commun?
Comment conserver cette information ?
![Page 41: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/41.jpg)
Conservation de la structure globaleMiGaL
Multiple Graph Layer
![Page 42: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/42.jpg)
MiGaL – cas général
Avant de nous intéresser aux RNA-MiGaL, décrivons la structure MiGaL dans le cas général.
Il s’agit d’un ensemble de graphes G et d’un ensemble de raffinements R.Chaque graphe Gi (Si , Ai ) de G est composé d'un ensemble Si de sommets et un ensemble Ai d'arcs. Le raffinement Ri est une application de Si dans P(Si+1 ) c'est à dire qu'un sommet de Si a pour image un sous-ensemble de Si+1 . L'application réciproque est une application surjective appelée abstraction qui à tout sommet de Si+1 associe un sommet de Si .
On peut ainsi définir une structure MiGaL par M(G,A), l'ensemble des graphes de M ainsi que des abstractions entre ces graphes.
![Page 43: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/43.jpg)
MiGaL – cas général
Avant de nous intéresser aux RNA-MiGaL, décrivons la structure MiGaL dans le cas général.
Il s’agit d’un ensemble de graphes G et d’un ensemble de rafinements R.Chaque graphe Gi (Si , Ai ) de G est composé d'un ensemble Si de sommets et un ensemble Ai d'arcs. Le raffinement Ri est une application de Si dans P(Si+1 ) c'est à dire qu'un sommet de Si a pour image un sous-ensemble de Si+1 . L'application réciproque est une application surjective appelée abstraction qui à tout sommet de Si+1 associe un sommet de Si .
On peut ainsi définir une structure MiGaL par M(G,A), l'ensemble des graphes de M ainsi que des abstractions entre ces graphes.
G0 G1 G2
![Page 44: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/44.jpg)
RNA-MiGaL
Grâce à MiGaL, nous avons non seulement la possibilité de modéliser la structure secondaire d’un ARN selon des granularités croissantes, mais surtout nous avons la possibilité de transmettre sur plusieurs niveaux ces informations grâces aux applications de raffinement !
On définit un RNA-MiGaL comme une structure de type MiGaL composée de 4 arbres :
T0 : réseau de boucles multiples
![Page 45: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/45.jpg)
RNA-MiGaL
Grâce à MiGaL, nous avons non seulement la possibilité de modéliser la structure secondaire d’un ARN selon des granularités croissantes, mais surtout nous avons la possibilité de transmettre sur plusieurs niveaux ces informations grâces aux applications de raffinement !
On définit un RNA-MiGaL comme une structure de type MiGaL composée de 4 arbres :
T0 : réseau de boucles multiples
T1 : réseau de tiges, boucles multiples et boucles terminales
![Page 46: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/46.jpg)
RNA-MiGaL
Grâce à MiGaL, nous avons non seulement la possibilité de modéliser la structure secondaire d’un ARN selon des granularités croissantes, mais surtout nous avons la possibilité de transmettre sur plusieurs niveaux ces informations grâces aux applications de raffinement !
On définit un RNA-MiGaL comme une structure de type MiGaL composée de 4 arbres :
T0 : réseau de boucles multiples
T1 : réseau de tiges, boucles multiples et boucles terminales
T2 : les arcs codent les hélices. Un noeud peut coder pour une
boucle multiple, une boucle interne, un renflement, une boucle
terminale.
![Page 47: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/47.jpg)
RNA-MiGaL
Grâce à MiGaL, nous avons non seulement la possibilité de modéliser la structure secondaire d’un ARN selon des granularités croissantes, mais surtout nous avons la possibilité de transmettre sur plusieurs niveaux ces informations grâces aux applications de raffinement !
On définit un RNA-MiGaL comme une structure de type MiGaL composée de 4 arbres :
T0 : réseau de boucles multiples
T1 : réseau de tiges, boucles multiples et boucles terminales
T2 : les arcs codent les hélices. Un noeud peut coder pour une
boucle multiple, une boucle interne, un renflement, une boucle
terminale.
T3 : un noeud interne représente une baire de base,
les feuilles les bases libres.
![Page 48: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/48.jpg)
RNA-MiGaL
Les applications de raffinement :
R0 : Les noeuds correspondant aux boucles multiples sont mis en relation avec les noeuds codant pour ces mêmes boucles multiples dans T0 . Un noeud correspondant à une boucle terminale est mis en relation avec le même noeud que son père (qui code forcément pour une boucle multiple).
R1 : Lorsque le noeud de T2 représente une boucle terminale ou une boucle multiple, il est mis en relation avec le noeud correspondant au même élément dans T1 . Si le noeud correspond à une boucle interne ou un renflement, celui-ci est mis en relation avec le noeud dont l'arc qui pointe dessus code pour la tige à laquelle appartient la boucle interne ou le renflement.
R2 : A chaque noeud interne de T3 on associe le noeud de T2 tel que l’arc pointant sur ce noeud code pour l'hélice dont fait partie cette paire de base. A chaque feuille de T3 codant pour une base libre, R2 associe le noeud de T2 codant pour l’élément structural dont fait partie cette base.
![Page 49: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/49.jpg)
RNA-MiGaL - illustration
![Page 50: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/50.jpg)
Contamination des couleurs
![Page 51: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/51.jpg)
Contamination des couleurs
![Page 52: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/52.jpg)
Contamination des couleurs
![Page 53: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/53.jpg)
RNA-MiGaL – Comparaison
![Page 54: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/54.jpg)
RNA-MiGaL – Coloration Layer 0
T0 : réseau de boucles multiples
![Page 55: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/55.jpg)
RNA-MiGaL – Coloration Layer 1
T1 : réseau de tiges, boucles multiples et
boucles terminales
![Page 56: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/56.jpg)
RNA-MiGaL – Coloration Layer 2
T2 : hélices, boucles multiples, boucles internes, renflements et boucles terminales
![Page 57: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/57.jpg)
RNA-MiGaL – Coloration Layer 3
![Page 58: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/58.jpg)
Les problèmes corrigés
![Page 59: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/59.jpg)
RNA-MiGaL – Les problèmes corrigés
La dispersion
![Page 60: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/60.jpg)
RNA-MiGaL – Les problèmes corrigés
Ici il y aurait une fusion
![Page 61: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/61.jpg)
RNA-MiGaL – Un cas particulier non géré
Commençons par remarquer que deux ARN peuvent avoir une fonction proche, mais une struture générale globalement assez différente. Néanmoins ils ont en commun une petite zone très fortement conservée.
Il est immédiat que notre procédure sera aveugle à cette ressemblance puisqu’il s’agit de chercher une structure commune globale. Il y a donc de fortes chances pour que ces éléments essentiels mais locaux soient fusionnés ou même délétés si l’ARN global n’a pas la même conformation général...
Néanmoins, nous ne considérerons pas ceci comme un inconvénient.
Il y a déjà d’autres outils efficaces pour repérer les motifs fortement conservés, ce n’est pas dans cette catégorie de que se situe MiGaL.
![Page 62: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/62.jpg)
MiGaL : les améliorations à venir
![Page 63: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/63.jpg)
RNA-MiGaL – Comparaison des sous-arbres
D’après les résultats obtenus, lors de la comparaison (et donc coloration) de deux ARN, 5% du temps de calcul suffit à comparer les niveaux 0, 1 et 2 du RNA-MiGaL . Les 95% restants sont pour la comparaison du niveau 3.
Or, deux “morceaux” de la structure secondaire ne sont mis en relation que s’ils appartiennent à un même élément structural, autrement dit s’ils sont de la même couleur.
On peut donc imaginer d’optimiser fortement le calcul en comparant non plus les deux arbres de niveau 3 globalement mais de faire les comparaisons de chaque sous-arbre de même couleur (de bien plus petite taille). On pense pouvoir gagner un facteur 100 en temps de calcul.
Cependant, un problème peut apparaitre.
![Page 64: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/64.jpg)
RNA-MiGaL – Comparaison des sous-arbres
![Page 65: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/65.jpg)
RNA-MiGaL – Comparaison des sous-arbres
![Page 66: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/66.jpg)
RNA-MiGaL – Comparaison des sous-arbres
![Page 67: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/67.jpg)
RNA-MiGaL – Comparaison des sous-arbres
![Page 68: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/68.jpg)
RNA-MiGaL – Comparaison des sous-arbres
![Page 69: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/69.jpg)
RNA-MiGaL – Comparaison des sous-arbres
![Page 70: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/70.jpg)
RNA-MiGaL – Comparaison des sous-arbres
![Page 71: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/71.jpg)
RNA-MiGaL – Comparaison des sous-arbres
Résolution du problème
Ce problème trouve une bonne solution avec un système d’ancrage simple.
Il résoud le probleme de la contrainte de respect de l’ordre des fils.
En effet, lorsqu’on compare 2 sous-arbres de même couleur, on garde une information sur le positionnement des fils de couleurs différentes. Comme la permutation d’arc n’est pas autorisée, soit il faut respecter l’ordre, soit il faut déleter le sous arbre qui correspond à l’ancre qui pose problème.
![Page 72: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/72.jpg)
Conclusion
Les premiers résultats obtenus avec les structures RNA MiGaL sont très satisfaisants. En effet, la modélisation par niveau, outre son intérêt pour la comparaison, semble très utile pour appréhender les régions ayant des structures communes. Le niveau 0 nous permet de visualiser rapidement les différentes parties d'une structure, les niveaux suivants fournissant plus de détails.
MiGaL présente un atout capital : il ne se fige pas dans une seule façon d'appréhender une structure secondaire.
L'implémentation de l'algorithme de comparaison utilisant le partage de couleurs devrait sans doute faire de RNA MiGaL la méthode de comparaison de structures secondaires la plus rapide existante.
![Page 73: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/73.jpg)
Pour plus d’informations
![Page 74: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/74.jpg)
L.I.A.F.A Laboratoire d'Informatique Algorithmique, Fondements et Applications
Date: 2005-03-15/2005-03-15 [16H00] Auteur: Julien Allali (IGM) Titre: Comparaison de structures secondaires d'ARN
Pour plus d’informations
Groupe de travail Bioinformatique et Algorithmique
[email protected] http://www-igm.univ-mlv.fr/~allali/
![Page 75: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/75.jpg)
![Page 76: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/76.jpg)
Ne fait pas partie de la presentation. Pour des questions eventuellement
![Page 77: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/77.jpg)
Les pseudos noeuds sont les liaisons entre des nucléotides non appariés, ils donnent une indication sur la structure tertiaire (en 3 dimensions) de l’ARN
Pour une idée de la structure tertiaire
![Page 78: Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée](https://reader036.vdocuments.net/reader036/viewer/2022062308/56812bc8550346895d90159b/html5/thumbnails/78.jpg)
Le cas général ne convient pas. Une base ne peut appartenir à plusieurs liaisons. De même deux arcs croisés sont quelque chose qui n’existe pas dans la structure secondaire
Remarquons néanmoins que le type croisé laisse la possibilité de représenter les pseudo-noeuds.
Séquences annotées par des arcs