introduction à la bioinformatique. biologie in situenvironnement naturel biologie in vivo organisme...

73
Introduction à la bioinformatique

Upload: bernarde-turpin

Post on 03-Apr-2015

123 views

Category:

Documents


10 download

TRANSCRIPT

Page 1: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Introduction à la bioinformatique

Page 2: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Biologie in situ Environnement naturel

Biologie in vivo Organisme entier

Biologie ex vivo Niveau cellulaire

Biologie in vitro Niveau moléculaire

Biologie in silico Bioinformatique

La Bioinformatique: définition

Page 3: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

La bioinformatique : définition

Bioinformatique = biologie théorique

Ensemble des concepts et techniques nécessaires pour interpréter:

- l’information génétique (manipulation de séquences)

- l’information structurale (repliement 3D)

C est le décryptage de la bio- information

Page 4: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

- Effectuer la synthèse des données disponibles

- Énoncer des hypothèses généralisatrices

- Formuler des prédictions

Le but de la bioinformatique

Bioinformatique = traitement numérique des informations + approche théorique

Page 5: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

- Acquisition des données: instrumentation , robotique

- Archivage des données: bases de données

- Consultation des données: interfaces utilisateurs

Domaines de l’informatique traditionnelle utilisés par la génomiqueMais pas impliqués dans la découverte de nouveau concepts en biologie

Ce que n’est pas la bioinformatique

Page 6: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Ce qu’est la bioinformatique

Analyse de l’information biologique

L’information est:

• La séquence (ADN, ARN et Protéine)

• La structure (primaire, secondaire etc.)• La fonction (fonction moléculaire ex: enzyme; composant cellulaire ex:

protéine membranaire; processus biologique ex: transport d’oxygène)

•Les interactions (protéines, voies métaboliques, réseaux de gènes)

Page 7: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Les axes privilégiés de la bioinformatique

• La formalisation de l'information génétique• L'analyse des séquences (biomolécules) et de leur

structure (notamment , structure 3D)• L'interprétation biologique de l'information génétique• L'intégration des données (établissement de cartes et de

réseaux d'interactions géniques, d'interactions protéiques ...)

• La prédiction fonctionnelle

Page 8: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Les méthodes de la bioinformatique• Méthode comparative : comparaison des séquences ou

structures inconnues avec les bases de données (séquences et structures) de gènes et de protéines connues pour établir des rapprochements (similarités , homologies ou identités).

• Méthode statistique : Des logiciels appliquent des analyses statistiques aux données (sur la syntaxe des séquences) pour tenter de dégager et de repérer des règles et des contraintes présentant un caractère systématique, régulier ou général.

• Approche par modélisation Approche probabiliste. Elle consiste à étudier les objets (ex. : séquences, structures, motifs, etc., ...) à travers la construction d'un modèle qui tente d'en extraire les propriétés communes. La relation entre les objets d'étude (et/ou leur reconnaissance) est alors exprimée en référence à ce modèle optimal commun.

Page 9: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

La mission du bioinformaticien

•Leur formation première peut être la biologie, les mathématiques ou l'informatique et ils ont suivi une formation complémentaire dans "l'autre domaine". Leur fonction est:

• mettre en œuvre les méthodes et en automatiser le traitement

• nourrir la recherche en biologie des résultats de ces analyses

• réduire les problèmes posés par les biologistes en termes accessibles aux mathématiciens et informaticiens

• participer à l'élaboration de nouvelles méthodes

Page 10: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Biologie: science molle

Biologie = science empirique pas théoriquedans le monde du vivant : • rien n'est totalement prévisible • rien n'est totalement reproductible

Ce qui s'est produit à l'instant t ne se produira pas nécessairement à l'instant t+1.

• rien n'est constantLe temps fait évoluer l'objet vivant dans sa forme et dans ses fonctions de manière irréversible.

• l'identité totale de deux objets biologiques n'existe pasDeux individus à l'intérieur d'une même espèce ne sont jamais identiques, pas même à l'intérieur d'un couple de jumeaux.

Page 11: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Biologie : étude du dynamique

• Même si elle intègre la notion d'objet (une cellule, un individu, une population), elle repose fondamentalement sur l'étude des liens, des interactions et des régulations dynamiques qui organisent les objets entre eux dans le temps et dans l'espace, à l'intérieur d'un système d'un niveau de complexité supérieur

Page 12: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Révolutions dans la biologie• Les lois de Mendel (1866): Mendel est un des pionniers de la

bioinformatique : un des premiers à construire une théorie biologique nouvelle à partir d'une analyse statistique.

• La mise en évidence des chromosomes comme support

cellulaire de l' hérédité et de l' information génétique par Morgan (1913).

• Les découvertes de la structure en double hélice de l' ADN par James Watson et Francis Crick (1953), puis du mécanisme de la régulation génétique impliqué dans le dogme central de la biologie moléculaire, énoncé initialement par Crick et révélé par Jacques Monod, François Jacob et André Wolf (1965).

Page 13: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

La séquence : élément fondateur du puzzle du vivant

• La séquence , linéaire, chaîne de caractères basée sur un alphabet de quatre caractères (les nucléotides) dont la combinaison donne sa spécificité (espèce, gène..).

• La séquence est stable dans l'espace et présente des propriétés d' hybridation et de dénaturation à haute température qui en font un objet biologique expérimental de qualité : elle peut être extraite, manipulée et synthétisée in vitro.

• La séquence est relativement stable dans le temps. Les changements qui l'affectent (mutations , délétions , substitutions) peuvent être utilisés comme une mesure quantitative de l'évolution.

• Elément fondateur de la biodiversité et de la complexité du vivant : l' ADN est le

support biologique commun à presque tous les êtres vivants

• Le code génétique , avec lequel les protéines seront codées à partir de la séquence nucléique, est (à quelques codons près ...), universel.

Page 14: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Les biotechnologies

Domaine d’application privilégié de la bioinformatique• Pour la médecine & santé publique:

– Diagnostique– Pharmacogénomique (pharmacogenetique&toxicogenétique)– Thérapie génique– Vaccins– Empreintes génétiques

• Pour l’agroalimentaire– Résistance aux pesticides, aux pathogènes, aux insectes– Tolérance au stress environnementaux– Rendements et qualité

• Pour l’environnement– Lutte contre les pollutions chimiques ou biologiques (traitements de l'eau, des sols,

des déchets)– Nouvelles sources d'énergie– Préservation de la biodiversité

Page 15: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Notions essentielles de biologie

Page 16: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie
Page 17: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie
Page 18: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Schéma d’une cellule eucaryote

Page 19: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie
Page 20: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Origines évolutives

Page 21: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Les quatre familles de molécules

Page 22: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Composition d’une cellule bactérienne

Page 23: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Assemblages de molécules

Exemple du ribosome

Page 24: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Quel est le support de l’hérédité?

Page 25: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Structure de l’ADN

Page 26: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Liaisons hydrogènes de l ‘ADN

Page 27: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Liaison hydrogènes de l’ADN

Page 28: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Modèle moléculaire d’ADN

Page 29: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Gènes?! Génome ?!?!?!

Page 30: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Génome humain

Page 31: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Constitution du génome

Page 32: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Organisation du génome

Page 33: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Qu’est ce qu’un gène?

• Gène protéique: code pour une protéine

• Gène régulateur: participe aux mécanismes de maintien du génome

• Géne non traduits: produit un ARN fonctionnel

Page 34: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Structure d’un gène protéique eucaryote

Zone Régulatrice = Promoteur

Zone transcrite

Site d’initiation de la transcription

Page 35: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

TATA

AMPLIFICATEUR

PROMOTEURBASAL

100-200 pdb 100-200 pdb 40 pdb

0-20 kb

Structure d’un promoteur

PROMOTEUR DISTAL

Région régulatrice Région Codante

Page 36: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Structure de la partie codante

AMPLIFICATEUR

100-200 pdb

Région régulatriceRégion codante

Exon Exon Exon

Intron Intron

Page 37: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie
Page 38: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Dogme central de la biologie moléculaire

ADN ARN ARNm protéine

Transcription Maturation Traduction

Matrice ADN ARN ARN

Effecteur ARN pol Très variées Ribosome

Produit ARN ARNm Protéine

Page 39: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

L’expression d’un gène

Eucaryotes

Procaryotes

Page 40: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Expression d’un gène eucaryote

                                                                                                                              

    

exon1 exon2 exon3intron2intron1

                                                                                                                              

    

exon1 exon2 exon3intron2intron15’UTR 3’UTR

3’UTRexon1 exon2 exon3

5’UTR

Page 41: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Init

iati

on d

e la

tran

scri

ptio

n

Page 42: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Elongation de la transcription

Page 43: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie
Page 44: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Maturation du transcrit primaire

Page 45: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Polyadénylation

Page 46: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Structure de l’ARN intermédiaire

Page 47: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Epissage du messager

Page 48: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Traduction

Page 49: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Code génétique

Page 50: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Code génétique bis

Page 51: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

L’ARN de transfert

Page 52: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Initiation de la traduction

Page 53: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Incorporation d’un acide aminé

Page 54: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Translocation du ribosome

Page 55: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Elongation de la traduction

Page 56: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Terminaison de la traduction

Page 57: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Polyribosome

Page 58: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Structure de l’ARNm

Page 59: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Stabilité du messager

Page 60: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Code dégénéré

Page 61: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Contrôle de l’expression d’un gène

ADNARN primaire

ARNm ARNm ProtéineProtéineinactive

Noyau Cytoplasme

Contrôle de la transcription

Contrôle de lamaturation

Contrôle de latraduction

Contrôle de l’activité

Pore nucléaire

Enveloppe nucléaire

Page 62: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Comment fonctionne le génome

Quelle est l’organisation du génome?

Comment est lue l’information contenue dans

le génome?

Mise en place du programme génétique

Page 63: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Organisation des gènes dans les organismes

Page 64: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Paradoxe !!!!

Page 65: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Complexité du génome Humain

• Taille 3 200 Mb pour 30 000 gènes

• Nature répétitive– Séquences répétées localement

• ADN satellite

– Séquences répétées dispersées• SINES (Short Interspersed Repeated Sequences)

– Ex: ALU, 300 pb tous les 6000 nucleotides• LINES (Long Interspersed Repeated Sequenes)

– Ex: L1, 5 kb, 100 000 copies dans génome

• Rôle de l’ADN non génique ???– Régulation globale de l’expression des gènes– Nucléosquelette

Page 66: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Epissages alternatifs

Page 67: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie
Page 68: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie
Page 69: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Initiation de la transcription

Répresseur

Activateurs

FT

FT

FT

Promoteur basal

Facteurs d’initiation

RNA Pol II Région codante

Coactivateurs

Page 70: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Régulation du niveau d’expression des gènes

Page 71: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Interaction protéine -ADN

Page 72: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Interaction protéine - ADN

Page 73: Introduction à la bioinformatique. Biologie in situEnvironnement naturel Biologie in vivo Organisme entier Biologie ex vivo Niveau cellulaire Biologie

Localisation des éléments régulateurs