dess bioinformatique montpellier ii sciences et techniques du languedoc echantillonnage en cultures...
TRANSCRIPT
DESS BioInformatiqueMontpellier II Sciences et Techniques du Languedoc
Echantillonnage en cultures de Melon
Aurore Veyrat année 2003-2004
UMR 1112
Réponse des Organismes aux Stress Environnementaux Equipe de Biologie des Populations en Interaction
Equipe Informatique de Centre
Mise en service d’une interface Web Mise en service d’une interface Web pour la saisie, le stockage et l’interrogation pour la saisie, le stockage et l’interrogation
de données expérimentalesde données expérimentales
Tuteurs de stage : Laurent Lapchin, Roger BollInformaticien encadrant : Xavier Bernardet
CONTEXTE DU PROJETDurabilité de la résistance du melon au puceron Aphis
gossypii
Chez le melon, le gène Vat permet de résister à la colonisation par le puceron Des cas d’installation du puceron sur melon Vat ont été signalés
=> Mesurer l’ampleur de ce phénomène et récupérer les souches résistantes à Vat Echantillonnage 2004:
- 2 types de culture: serre et plein champ - 3 à 4 sites d’observation distants- Sur chaque site 2 parcelles étudiées :
- melon Vat, résistant- melon –Vat, sensible
Objectif du stage BioInformatique
1. Conception et mise en service d’une interface WEB de saisie des données melon
2. Mise en place d’une base sous MySQL pour le stockage des données
3. Débuggage de l’utilitaire de saisie rosier développé en 2003
Cahier des charges de l’interface de saisie
1. Contrôle d’accès à l’interface (serveur) et à la base de données
2. Fiabilité, rapidité et confort de la saisie - Contrôle d’intégrité référentielle des données- Contrôle de vraisemblance
- Absence de données orphelines ou de doublons
3. Développement de modules - d’interrogation et de correction - de mise en forme des données
Audit de la saisie des données 2004
Suivi de colonies Suivi parcellaire
Suivi spatio-temporel d’une colonie à l’échelle d’un foyer
Surface 1/16ème de m²,centrée sur la colonie
Suivi spatio-temporel de l’infestation (?) d’une parcelle
Transect de 8 placettes (1 m²)centré dans la parcelle
La mesure du couvert végétal (1 m²) et le sous-échantillonnage du nombre d’organes (1/16ème
m²) servent à calculer les densités au m²
Le protocole expérimental
Les positions des organes observés dans les foyers et les placettes sont repérées par des coordonnées (x,y)
Les données expérimentalesLes données expérimentales sont des observations en classes visuelles d’abondance sur des organes végétaux (feuilles, apex), ainsi que des comptages d’organes par unité de surface.
Deux types de suivi : de colonie et/ou parcellaire
L’enregistrement des données élémentaires (organe) permet les regroupements aux différentes échelles : organe, foyer, placette, parcelle, zone culturale…
On a donc :
N nombre de pucerons/organe
pucerons/type d’organe pucerons/placette (m²)
pucerons/parcelle (m²)
pucerons/foyer
Répété pour chaque date * expérimentation
(313 relevés)
L’utilitaire de saisie
L’administrateur de données délivre un password à l’utilisateur et lui autorise la saisie sur des références d’expérimentation melon uniquement.
Construction du formulaire
L’utilitaire de saisieL’utilisateur construit la grille d’échantillonnage correspondant à l’expérimentation.
Construction du formulaire
La connexion à la base de données nécessite un
password
L’utilitaire de saisie Saisie à partir du formulaire
Le formulaire de saisie correspond à la feuille de terrain et représente tous les organes observés, dans chaque placette. Sélection par bouton radio, les classes visuelles d’abondances sont initialisées à 0.
L’utilitaire de saisie Saisie à partir du formulaire
Administrateur de données
Fichiers de données
Pièce jointe
Oracle
L’utilitaire de saisie Envoi des données
Les données définitivement saisies sont insérées dans les tables MySQL (java, JavaScript), les fichiers .txt correspondant sont envoyés à l’administrateur de données
temporel.txt
organe.txt
spatial.txt
Utilisateur
MySQL
Inra Sophia
L’utilitaire de saisie Affichage des résultats
Histogrammes de fréquence des classes visuelles d’abondance par type d’organes
On peut obtenir l’affichage de 3 dates successives
L’utilitaire de saisie Corrections
Un module « corrections » permet l’interrogation et la ressaisie des données erronées (date entière)
AUDIT DE L’INTERFACE DE SAISIE
3 critères :
Compréhension / Ergonomie
Construction de la feuille de saisie
Validité des données saisies
Compréhension / Ergonomie
AUDIT DE L’INTERFACE DE SAISIE
Cinq techniciens et stagiaires ont saisis 132 relevés parcellaires
Soit 1056 placettes et 22110 observations en classe
+ Peu de questions sur le fonctionnement de l’interface (les utilisateurs ont tous participé aux observations)
- 2 déclarations de saisie de mot de passe par relevé (appels contrôlés en entrée et en sortie à la base de données)
= Confort oculaire mais monotonie inévitable (cause d’erreur)
Construction de la feuille de saisie
13% de feuilles de saisie inexploitables.
Explications :
- Inversion des coordonnées lignes-colonnes : 3 cas ;- Erreur dans les pourcentages de couvert végétal, 1 au lieu de 100% : 2 cas ;- Saisie avec date erronée : 2 cas ;- Confusion dans les coordonnées des placettes : 2 cas ;- Nombre d’organes observés incorrect : 1 cas ;
AUDIT DE L’INTERFACE DE SAISIE
Erreurs imparables de lecture de la feuille de terrain : saisie trop rapide et/ou monotonie de l’opération.
Initialisation automatique des coordonnées des placettes d’une même expérimentation Affichage graphique de la grille avant validation Contrôle des valeurs aberrantes du nombre d’organes observés
Validité des données saisies
AUDIT DE L’INTERFACE DE SAISIE
Échantillon de 19 relevés non nuls, 152 placettes, 3213 observations en classes
Le remplissage direct des feuilles de saisie nécessitait 396 sélections radio bouton (les valeurs initialisées à 0)
0,6% d’erreur globale mais 5% d’erreur de sélection 14/22 erreurs = oublis de saisie (sur 2 relevés chargés)8/22 confusions entre classe d’abondance ou ligne de saisie
Attention particulière aux relevés complexes Utilisation de boutons radio plus espacés Saisie par lecture optique, en cours avec URIH (rosier)
Tableur Application
7 minutes par relevé
Création du formulaire à chaque relevé
Taux global d’erreur 0,6%
Impossible avec l’application Contrôle des doublons à la saisie
Envoi automatique des données à l’administrateur
Affichage des résultats par l’application
Fonction disponible dans l’application
15 minutes par relevé
Masques de saisie modifiables
Taux global d’erreur 5% (D. citrus)
Superpositions de données ou création de dates ou de placettes dues aux copier / coller multiples pour adapter le masque
Gestion des fichiers locale avant insertion dans la base de données
Programmation de macros pour les graphes
Interrogation / correction des données nécessite une interface (Access)
DiscussionAUDIT
laborieux et source d’erreurs
L’application est actuellement exploitable pour le projet melon, résultats satisfaisant
En accord avec la démarche qualité pour l’acquisition des données expérimentales
Améliorable : écriture d’un module de représentation spatiale
Démonstration d’adaptation générique de l’informatique à une problématique scientifique
CONCLUSIONS
La diversité des travaux réalisés durant ce stage ainsi que la rencontre entre chercheurs et informaticiens s’est révélée très bénéfique pour la mise en place du projet.
Les chercheurs sont très attachés à la feuille de terrain (mémoire physique du relevé).
Préparation de la migration base Oracle vers ProgreSQL
Intégration des procédures de modélisations quantitatives aux interfaces de saisie
Conception d’un système de création d’interfaces : données de terrain ou de laboratoire
Accessible à partir du site Web de l’équipe BPI http://bpi.antibes.inra.fr
PERSPECTIVES
REMERCIEMENTS
Merci à Laurent LAPCHIN, Eric LOMBAERT, Xavier BERNARDET, Stephen AMBROGIO
Merci à toute l’équipe BPI et particulièrement Michèle SALLES et Roger BOLL
Enfin merci à vous pour votre attention
Des données complexes…
Exemple : calcul du nombre de pucerons d’une placette (1 m²)
On a observé 5 feuilles âgées : l’étalonnage nous indique = 28 pucerons/FAOn a observé 5 feuilles jeunes : l’étalonnage nous indique = 7 pucerons/FJOn a observé tous les apex (15): l’étalonnage nous indique = 2 pucerons/AP
D’autre part, le couvert végétal de cette placette est de 70% et les nombres de feuilles âgées et jeunes dans le sous-ensemble de 1/16ème de m² sont respectivement 5 et 10.
Le calcul du nombre de pucerons par placette est le suivant:(28*5*16 *0.70)+(7*10*16*0.7)+(15*2)= 2382 pucerons dans la placette