introduction à la bioinformatique. biologie in situenvironnement naturel biologie in vivo organisme...

Post on 03-Apr-2015

123 Views

Category:

Documents

10 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Introduction à la bioinformatique

Biologie in situ Environnement naturel

Biologie in vivo Organisme entier

Biologie ex vivo Niveau cellulaire

Biologie in vitro Niveau moléculaire

Biologie in silico Bioinformatique

La Bioinformatique: définition

La bioinformatique : définition

Bioinformatique = biologie théorique

Ensemble des concepts et techniques nécessaires pour interpréter:

- l’information génétique (manipulation de séquences)

- l’information structurale (repliement 3D)

C est le décryptage de la bio- information

- Effectuer la synthèse des données disponibles

- Énoncer des hypothèses généralisatrices

- Formuler des prédictions

Le but de la bioinformatique

Bioinformatique = traitement numérique des informations + approche théorique

- Acquisition des données: instrumentation , robotique

- Archivage des données: bases de données

- Consultation des données: interfaces utilisateurs

Domaines de l’informatique traditionnelle utilisés par la génomiqueMais pas impliqués dans la découverte de nouveau concepts en biologie

Ce que n’est pas la bioinformatique

Ce qu’est la bioinformatique

Analyse de l’information biologique

L’information est:

• La séquence (ADN, ARN et Protéine)

• La structure (primaire, secondaire etc.)• La fonction (fonction moléculaire ex: enzyme; composant cellulaire ex:

protéine membranaire; processus biologique ex: transport d’oxygène)

•Les interactions (protéines, voies métaboliques, réseaux de gènes)

Les axes privilégiés de la bioinformatique

• La formalisation de l'information génétique• L'analyse des séquences (biomolécules) et de leur

structure (notamment , structure 3D)• L'interprétation biologique de l'information génétique• L'intégration des données (établissement de cartes et de

réseaux d'interactions géniques, d'interactions protéiques ...)

• La prédiction fonctionnelle

Les méthodes de la bioinformatique• Méthode comparative : comparaison des séquences ou

structures inconnues avec les bases de données (séquences et structures) de gènes et de protéines connues pour établir des rapprochements (similarités , homologies ou identités).

• Méthode statistique : Des logiciels appliquent des analyses statistiques aux données (sur la syntaxe des séquences) pour tenter de dégager et de repérer des règles et des contraintes présentant un caractère systématique, régulier ou général.

• Approche par modélisation Approche probabiliste. Elle consiste à étudier les objets (ex. : séquences, structures, motifs, etc., ...) à travers la construction d'un modèle qui tente d'en extraire les propriétés communes. La relation entre les objets d'étude (et/ou leur reconnaissance) est alors exprimée en référence à ce modèle optimal commun.

La mission du bioinformaticien

•Leur formation première peut être la biologie, les mathématiques ou l'informatique et ils ont suivi une formation complémentaire dans "l'autre domaine". Leur fonction est:

• mettre en œuvre les méthodes et en automatiser le traitement

• nourrir la recherche en biologie des résultats de ces analyses

• réduire les problèmes posés par les biologistes en termes accessibles aux mathématiciens et informaticiens

• participer à l'élaboration de nouvelles méthodes

Biologie: science molle

Biologie = science empirique pas théoriquedans le monde du vivant : • rien n'est totalement prévisible • rien n'est totalement reproductible

Ce qui s'est produit à l'instant t ne se produira pas nécessairement à l'instant t+1.

• rien n'est constantLe temps fait évoluer l'objet vivant dans sa forme et dans ses fonctions de manière irréversible.

• l'identité totale de deux objets biologiques n'existe pasDeux individus à l'intérieur d'une même espèce ne sont jamais identiques, pas même à l'intérieur d'un couple de jumeaux.

Biologie : étude du dynamique

• Même si elle intègre la notion d'objet (une cellule, un individu, une population), elle repose fondamentalement sur l'étude des liens, des interactions et des régulations dynamiques qui organisent les objets entre eux dans le temps et dans l'espace, à l'intérieur d'un système d'un niveau de complexité supérieur

Révolutions dans la biologie• Les lois de Mendel (1866): Mendel est un des pionniers de la

bioinformatique : un des premiers à construire une théorie biologique nouvelle à partir d'une analyse statistique.

• La mise en évidence des chromosomes comme support

cellulaire de l' hérédité et de l' information génétique par Morgan (1913).

• Les découvertes de la structure en double hélice de l' ADN par James Watson et Francis Crick (1953), puis du mécanisme de la régulation génétique impliqué dans le dogme central de la biologie moléculaire, énoncé initialement par Crick et révélé par Jacques Monod, François Jacob et André Wolf (1965).

La séquence : élément fondateur du puzzle du vivant

• La séquence , linéaire, chaîne de caractères basée sur un alphabet de quatre caractères (les nucléotides) dont la combinaison donne sa spécificité (espèce, gène..).

• La séquence est stable dans l'espace et présente des propriétés d' hybridation et de dénaturation à haute température qui en font un objet biologique expérimental de qualité : elle peut être extraite, manipulée et synthétisée in vitro.

• La séquence est relativement stable dans le temps. Les changements qui l'affectent (mutations , délétions , substitutions) peuvent être utilisés comme une mesure quantitative de l'évolution.

• Elément fondateur de la biodiversité et de la complexité du vivant : l' ADN est le

support biologique commun à presque tous les êtres vivants

• Le code génétique , avec lequel les protéines seront codées à partir de la séquence nucléique, est (à quelques codons près ...), universel.

Les biotechnologies

Domaine d’application privilégié de la bioinformatique• Pour la médecine & santé publique:

– Diagnostique– Pharmacogénomique (pharmacogenetique&toxicogenétique)– Thérapie génique– Vaccins– Empreintes génétiques

• Pour l’agroalimentaire– Résistance aux pesticides, aux pathogènes, aux insectes– Tolérance au stress environnementaux– Rendements et qualité

• Pour l’environnement– Lutte contre les pollutions chimiques ou biologiques (traitements de l'eau, des sols,

des déchets)– Nouvelles sources d'énergie– Préservation de la biodiversité

Notions essentielles de biologie

Schéma d’une cellule eucaryote

Origines évolutives

Les quatre familles de molécules

Composition d’une cellule bactérienne

Assemblages de molécules

Exemple du ribosome

Quel est le support de l’hérédité?

Structure de l’ADN

Liaisons hydrogènes de l ‘ADN

Liaison hydrogènes de l’ADN

Modèle moléculaire d’ADN

Gènes?! Génome ?!?!?!

Génome humain

Constitution du génome

Organisation du génome

Qu’est ce qu’un gène?

• Gène protéique: code pour une protéine

• Gène régulateur: participe aux mécanismes de maintien du génome

• Géne non traduits: produit un ARN fonctionnel

Structure d’un gène protéique eucaryote

Zone Régulatrice = Promoteur

Zone transcrite

Site d’initiation de la transcription

TATA

AMPLIFICATEUR

PROMOTEURBASAL

100-200 pdb 100-200 pdb 40 pdb

0-20 kb

Structure d’un promoteur

PROMOTEUR DISTAL

Région régulatrice Région Codante

Structure de la partie codante

AMPLIFICATEUR

100-200 pdb

Région régulatriceRégion codante

Exon Exon Exon

Intron Intron

Dogme central de la biologie moléculaire

ADN ARN ARNm protéine

Transcription Maturation Traduction

Matrice ADN ARN ARN

Effecteur ARN pol Très variées Ribosome

Produit ARN ARNm Protéine

L’expression d’un gène

Eucaryotes

Procaryotes

Expression d’un gène eucaryote

                                                                                                                              

    

exon1 exon2 exon3intron2intron1

                                                                                                                              

    

exon1 exon2 exon3intron2intron15’UTR 3’UTR

3’UTRexon1 exon2 exon3

5’UTR

Init

iati

on d

e la

tran

scri

ptio

n

Elongation de la transcription

Maturation du transcrit primaire

Polyadénylation

Structure de l’ARN intermédiaire

Epissage du messager

Traduction

Code génétique

Code génétique bis

L’ARN de transfert

Initiation de la traduction

Incorporation d’un acide aminé

Translocation du ribosome

Elongation de la traduction

Terminaison de la traduction

Polyribosome

Structure de l’ARNm

Stabilité du messager

Code dégénéré

Contrôle de l’expression d’un gène

ADNARN primaire

ARNm ARNm ProtéineProtéineinactive

Noyau Cytoplasme

Contrôle de la transcription

Contrôle de lamaturation

Contrôle de latraduction

Contrôle de l’activité

Pore nucléaire

Enveloppe nucléaire

Comment fonctionne le génome

Quelle est l’organisation du génome?

Comment est lue l’information contenue dans

le génome?

Mise en place du programme génétique

Organisation des gènes dans les organismes

Paradoxe !!!!

Complexité du génome Humain

• Taille 3 200 Mb pour 30 000 gènes

• Nature répétitive– Séquences répétées localement

• ADN satellite

– Séquences répétées dispersées• SINES (Short Interspersed Repeated Sequences)

– Ex: ALU, 300 pb tous les 6000 nucleotides• LINES (Long Interspersed Repeated Sequenes)

– Ex: L1, 5 kb, 100 000 copies dans génome

• Rôle de l’ADN non génique ???– Régulation globale de l’expression des gènes– Nucléosquelette

Epissages alternatifs

Initiation de la transcription

Répresseur

Activateurs

FT

FT

FT

Promoteur basal

Facteurs d’initiation

RNA Pol II Région codante

Coactivateurs

Régulation du niveau d’expression des gènes

Interaction protéine -ADN

Interaction protéine - ADN

Localisation des éléments régulateurs

top related