réunion bgpr/safescale 06 / 07 / 2006 - paris / jussieu
DESCRIPTION
Laboratoire Informatique de Grenoble. Réunion BGPR/SafeScale 06 / 07 / 2006 - Paris / Jussieu. Kaapi dans Safescale. Vincent Danjean, Thierry Gautier, Samir Jafar, Jean-Louis Roch Projet MOAIS [ INRIA / CNRS / INPG / UJF ] moais.imag.fr kaapi.gforge.inria.fr. - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Réunion BGPR/SafeScale 06 / 07 / 2006 - Paris / Jussieu](https://reader035.vdocuments.net/reader035/viewer/2022081515/56815193550346895dbfca17/html5/thumbnails/1.jpg)
LaboratoireInformatiquede Grenoble
Réunion BGPR/SafeScale 06 / 07 / 2006 - Paris / Jussieu
Kaapi dans Safescale
1. Une application Safescale sur Grid’5000
2. Kaapi : graphe dataflow, vol de travail, et adaptation
3. Tolérance aux pannes franches
Vincent Danjean, Thierry Gautier, Samir Jafar, Jean-Louis Roch Projet MOAIS [ INRIA / CNRS / INPG / UJF ]
moais.imag.fr kaapi.gforge.inria.fr
![Page 2: Réunion BGPR/SafeScale 06 / 07 / 2006 - Paris / Jussieu](https://reader035.vdocuments.net/reader035/viewer/2022081515/56815193550346895dbfca17/html5/thumbnails/2.jpg)
Une application SafeScale sur Grid’5000 [V Danjean]
• Construction de boîtes cryptographiques [R Gillard]– Espace de recherche : Perm(F256) => 256!– Code “paloDF.c” : recherche statistique (calcul de minima)
• Parallélisation sur Athapascan/Kaapi et portage Grid’5000– paloDF.C: fichier principal en C++ : 370 lignes à l'origine, 680 maintenant
• Enrobage tâches de calcul dans des tâches “Athapascan/Kaapi”• Découpe récursive directe de l’espace exploré (parallélisme dynamique/vol de travail)• Flag de compilation pour compiler avec ou sans les modifications Kaapi
– mt19937ar.[hc]: tirages aléatoires 280 lignes à l'origine, 300 maintenant• Transformation thread-safe (suppression variables globales)
– Re-vérification des boîtes intéressantes trouvées• Comment vérifier les autres ? (OK si attaque massive mais sinon …)
• Expériences menées sur Grid’5000:– Tests de fonctionnement sur les 3 clusters de Rennes en simultané– Cluster 100 bi-pro Nice : en 2h30, 686 boites intéressantes trrouvées
• Expériences prévues : mesures sur plus de procs, hétérogènes : – Utilisation tolérance aux pannes de Kaapi [Ingénieur SafeScale oct. 2006]– Récupération résultats partiels locaux : schéma récursif adaptatif
•
![Page 3: Réunion BGPR/SafeScale 06 / 07 / 2006 - Paris / Jussieu](https://reader035.vdocuments.net/reader035/viewer/2022081515/56815193550346895dbfca17/html5/thumbnails/3.jpg)
![Page 4: Réunion BGPR/SafeScale 06 / 07 / 2006 - Paris / Jussieu](https://reader035.vdocuments.net/reader035/viewer/2022081515/56815193550346895dbfca17/html5/thumbnails/4.jpg)
Modèle de coût : avec une grande probabilité, sur p proc. Identiques - Temps d’exécution =
- nombre de requètes de vols =
![Page 5: Réunion BGPR/SafeScale 06 / 07 / 2006 - Paris / Jussieu](https://reader035.vdocuments.net/reader035/viewer/2022081515/56815193550346895dbfca17/html5/thumbnails/5.jpg)
![Page 6: Réunion BGPR/SafeScale 06 / 07 / 2006 - Paris / Jussieu](https://reader035.vdocuments.net/reader035/viewer/2022081515/56815193550346895dbfca17/html5/thumbnails/6.jpg)
![Page 7: Réunion BGPR/SafeScale 06 / 07 / 2006 - Paris / Jussieu](https://reader035.vdocuments.net/reader035/viewer/2022081515/56815193550346895dbfca17/html5/thumbnails/7.jpg)
![Page 8: Réunion BGPR/SafeScale 06 / 07 / 2006 - Paris / Jussieu](https://reader035.vdocuments.net/reader035/viewer/2022081515/56815193550346895dbfca17/html5/thumbnails/8.jpg)
![Page 9: Réunion BGPR/SafeScale 06 / 07 / 2006 - Paris / Jussieu](https://reader035.vdocuments.net/reader035/viewer/2022081515/56815193550346895dbfca17/html5/thumbnails/9.jpg)
![Page 10: Réunion BGPR/SafeScale 06 / 07 / 2006 - Paris / Jussieu](https://reader035.vdocuments.net/reader035/viewer/2022081515/56815193550346895dbfca17/html5/thumbnails/10.jpg)
![Page 11: Réunion BGPR/SafeScale 06 / 07 / 2006 - Paris / Jussieu](https://reader035.vdocuments.net/reader035/viewer/2022081515/56815193550346895dbfca17/html5/thumbnails/11.jpg)
SEL : protocole par journalisation du graphe de flot de données
![Page 12: Réunion BGPR/SafeScale 06 / 07 / 2006 - Paris / Jussieu](https://reader035.vdocuments.net/reader035/viewer/2022081515/56815193550346895dbfca17/html5/thumbnails/12.jpg)
![Page 13: Réunion BGPR/SafeScale 06 / 07 / 2006 - Paris / Jussieu](https://reader035.vdocuments.net/reader035/viewer/2022081515/56815193550346895dbfca17/html5/thumbnails/13.jpg)
![Page 14: Réunion BGPR/SafeScale 06 / 07 / 2006 - Paris / Jussieu](https://reader035.vdocuments.net/reader035/viewer/2022081515/56815193550346895dbfca17/html5/thumbnails/14.jpg)
![Page 15: Réunion BGPR/SafeScale 06 / 07 / 2006 - Paris / Jussieu](https://reader035.vdocuments.net/reader035/viewer/2022081515/56815193550346895dbfca17/html5/thumbnails/15.jpg)
![Page 16: Réunion BGPR/SafeScale 06 / 07 / 2006 - Paris / Jussieu](https://reader035.vdocuments.net/reader035/viewer/2022081515/56815193550346895dbfca17/html5/thumbnails/16.jpg)
Conclusion tolérance défaillances• Kaapi tolère ajout et
défaillance de machines – Protocole TIC :
• période à ajuster
– Détecteur défaillances • signal erreurs +heartbeat
• améliorable
Athapascan / Kaapi
Pile [TIC]
oui
Pas besoin
Locale ou globale
oui
FullDag[SEL]Dataflow graph
![Page 17: Réunion BGPR/SafeScale 06 / 07 / 2006 - Paris / Jussieu](https://reader035.vdocuments.net/reader035/viewer/2022081515/56815193550346895dbfca17/html5/thumbnails/17.jpg)
Questions ?
• http://kaapi.gforge.inria.fr