grid - globalny system przetwarzania danych

60
GRID - globalny system przetwarzania danych Dlaczego GRID? Jak jest zbudowany, zorganizowany i jak działa Międzynarodowe i krajowe inicjatywy gridowe Zastosowania Trudne do pogodzenia sprzeczności interesów GRID dla energetyki? Wojciech Wiślicki, IPJ, 25/9/2010

Upload: vuongkhuong

Post on 14-Feb-2017

228 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: GRID - globalny system przetwarzania danych

GRID - globalny system przetwarzania danych

Dlaczego GRID?

Jak jest zbudowany, zorganizowany i jak działa

Międzynarodowe i krajowe inicjatywy gridowe

Zastosowania

Trudne do pogodzenia sprzeczności interesów

GRID dla energetyki?

Wojciech Wiślicki, IPJ, 25/9/2010

Page 2: GRID - globalny system przetwarzania danych

Dlaczego GRID?

Produkcja i zapis

informacji

Możliwości CPU

Więcej informacji będziemy

reprodukowali i silniej ją

zredukujemy przed zapisem

Page 3: GRID - globalny system przetwarzania danych

Dlaczego GRID?

Prawa Moore'a

dla nośników danych

i bandwidth 100/(10 lat)‏

Ale najszybciej tanieje

bandwidth

Wniosek: wzrasta ruch

w sieci

Page 4: GRID - globalny system przetwarzania danych

Dlaczego GRID?

Złożoność problemów

Złożoność urządzeń

i grup ludzkich

Page 5: GRID - globalny system przetwarzania danych

Czym jest grid?

Grid jest rodzajem rozproszonego computingu, tzn. do zadania używamy zasobów zlokalizowanych w różnych miejscach i połączonych siecią

Grid organizuje przetwarzanie danych, zarówno zasoby, jak użytkowników, lecz nie zarządza nimi centralnie. Zasoby należą do różnych właścicieli

Używane są tzw. open standards

Zapewnia Quality of service

Page 6: GRID - globalny system przetwarzania danych

Pierwszy historycznie przykład GRIDu: SETI @ home

Każdy komputer podłączony do Internetu może zainstalować oprogramowanie do analizy danych z radioteleskopu San Mateo CA

Niebo podzielone jest na małe obszary i każdy komputer dostaje kawałek do przeanalizowania w czasie, gdy jest nieobciążony (zasada screen-savera)‏

Page 7: GRID - globalny system przetwarzania danych

Pierwszy historycznie przykład GRIDu: SETI @ home, c.d.

Poszukuje się w widmie częstości struktur niepodobnych do znanych wzorców

Page 8: GRID - globalny system przetwarzania danych

Pierwszy historycznie przykład GRIDu: SETI @ home, c.d.

Obecnie SETI @ home ma 5.5 mln uczestników

SETI @ home nie jest jednak prawdziwie rozwiniętym gridem (brak prawdziwych serwisów i QoS)‏

Page 9: GRID - globalny system przetwarzania danych

Pierwszy historycznie przykład GRIDu: SETI @ home, c.d.

Dotychczas (ok. 10 lat) nie znaleziono ET

Page 10: GRID - globalny system przetwarzania danych

Architektura gridu (opartego na systemie gLite)‏

Model przetwarzania danych

Łączność: sieć GEANT i sieciowa koordynacja operacyjna ruchu

Organizacja w dużej skali: struktury globalne, federacje, społeczności użytkowników

Struktura węzła gridowego

Dostęp do zasobów i usługi gridowe

Aplikacje

Page 11: GRID - globalny system przetwarzania danych

Wielowarstwowy (multi-tier) model przetwarzania danych: LHC w CERN

Page 12: GRID - globalny system przetwarzania danych
Page 13: GRID - globalny system przetwarzania danych
Page 14: GRID - globalny system przetwarzania danych
Page 15: GRID - globalny system przetwarzania danych
Page 16: GRID - globalny system przetwarzania danych

Najniższy poziom przetwarzania w gridzie WLCG: Tier-3

Poziom ten nie jest udostępniany w gridzie

Służy lokalnym grupom do celów deweloperskich

Może być też mocną lokalną farmą do analizy na wysokim poziomie, np. do zrównoleglonej analizy PROOF'em

Tier-3 może mieć minimalną funkcjonalność gridową (np. tylko user interface i gridowy transfer danych)‏

Page 17: GRID - globalny system przetwarzania danych

Łączność: sieć GEANT wraz z EGEE Network Operations Centre

Page 18: GRID - globalny system przetwarzania danych

Organizacja GRIDU z lotu ptaka

Pl: NREN=PIONIER, RGI=PlGrid

Page 19: GRID - globalny system przetwarzania danych

Podstawowe elementy struktuaralne: węzły gridowe

Page 20: GRID - globalny system przetwarzania danych

Podstawowe usługi gridowe (system gLite)‏

Katalogi zbiorów i metadanych

Workflow management

Monitoring

Accounting

Zarządzanie rozproszonymi zbiorami danych

Zarządzanie wirtualnymi organizacjami użytkowników

Wsparcie dla użytkowników

Page 21: GRID - globalny system przetwarzania danych

Dostęp do gridu

Trzeba skutecznie

rozpoznać użytkownika

i dać mu bezpieczny

dostęp do zasobów

obliczeniowych

Page 22: GRID - globalny system przetwarzania danych

Dostęp do gridu, c.d.

Grid Security Infrastructure, oparta na certyfikatach dla użytkowników, wystawianych przez narodowe Certificate Authorities

Certyfikaty użytkowników w formacie X.509, umożliwiające autentykację (sprawdzenie tożsamości) użytkownika

Autoryzacja na zasoby udzielana w ramach wirtualnych organizacji przez serwisy Virtual Organization Membership Service (VOMS)‏

Page 23: GRID - globalny system przetwarzania danych
Page 24: GRID - globalny system przetwarzania danych
Page 25: GRID - globalny system przetwarzania danych
Page 26: GRID - globalny system przetwarzania danych

Trochę statystyki: Enabling Grids for E-science

54 kraje, 267 węzłów sieciowych

114 000 CPU dostępnych 24/7

20 PB pamięci dyskowej + tape MS

200 wirtualnych organizacji

16 000 użytkowników

150 000 zadań/dzień

15 obszarów tematycznych aplikacji

Page 27: GRID - globalny system przetwarzania danych

Infrastruktura obliczeniowa

Serwisy produkcyjne (PS), używane w bieżącej pracy operacyjnej, np. Worldwide LHC Computing Grid

Serwisy pre-produkcyjne (PPS), używane do testowania nowych narzędzi i usług gridowych przed ich wdrożeniem do produkcji

Infrastruktura szkoleniowa (portal szkoleniowy GILDA), umożliwiająca przeprowadzanie kursów gridowych bez wpuszczania użytkowników na infrastrukturę produkcyjną

Page 28: GRID - globalny system przetwarzania danych

Wsparcie dla użytkowników

Page 29: GRID - globalny system przetwarzania danych

Monitoring gridu: GIIS w Academia Sinica

Klaster warszawski w domenie polgrid.pl

Page 30: GRID - globalny system przetwarzania danych

Monitoring gridu: GIIS w Academia Sinica, c.d.

Klaster warszawski w domenie polgrid.pl

Page 31: GRID - globalny system przetwarzania danych

Aplikacje

Dwa największe gridy typu general purpose, to EGEE (EC) i OSG (USA)‏

Ich największymi użytkownikami są eksperymenty nowej generacji w fizyce wysokich energii, głównie przy Large Hadron Collider w CERNie

Istnieją też duże aplikacje biomedyczne, geologiczne, meteorologiczne, chemiczne, z fizyki plazmy .., uprawiane zarówno na EGEE, OSG, jak i na gridach dziedzinowych

Page 32: GRID - globalny system przetwarzania danych

Narodowa inicjatywa gridowa Pl-Grid

Od 2009 organizacja gridów WLCG i EGEE oparta jest o narodowe projekty gridowe

Pl-Grid, konsorcjum finansowane przez MNiSW w ramach Programu Operacyjnego Innowacyjna Gospodarka

Finansowany w ramach umowy

POIG.02.03.00-00-007/08-00 2009-11

Page 33: GRID - globalny system przetwarzania danych

Pl-Grid, partnerzy

ACK Cyfronet

ICM UW

PCSS PAN

CI TASK

WCSS

Page 34: GRID - globalny system przetwarzania danych

Pl-Grid, partnerzy

Oparty na tym samym szkielecie sieciowym co EGEE

Page 35: GRID - globalny system przetwarzania danych

Pl-Grid, struktura

Page 36: GRID - globalny system przetwarzania danych

Pl-Grid, struktura warstwy sprzętowej i narzędziowej

Równoległe działanie dwóch infrastruktur w warstwie narzędziowej i operacyjnej - gLite i Unicore

Wykorzystanie dorobku narzędziowego i serwisowego projektów gridowych z FP 5,6,7

Struktura serwisów wzorowana na EGEE

Sprzęt obliczeniowy i sieciowy częściowo odziedziczony po EGEE/WLCG, uzupełniony o duże zakupy w ramach pl-grid

Page 37: GRID - globalny system przetwarzania danych

Pl-Grid, zadania i koordynatorzy

Z1- Zarządzanie Projektem – ACK CYFRONET AGH (Kraków)

Z2 - Infrastruktura sprzętowa – CI TASK (Gdańsk)‏

Z3 - Centrum Operacyjne – ACK CYFRONET AGH (Kraków)‏

Z4 - Rozwój oprogramowania e-infrastruktury i narzędzi użytkownika – PCSS (Poznań)‏

Z5 - Szkolenia i wsparcie użytkowników – ICM UW (Warszawa)‏

Z6 - Bezpieczeństwo infrastruktury – WCSS (Wrocław).

Page 38: GRID - globalny system przetwarzania danych

Pl-Grid, struktura organizacyjna

Page 39: GRID - globalny system przetwarzania danych

Pl-Grid, zadania merytoryczne

Wsparcie dla EGEE i DEISA

Wspieranie nowych inicjatyw i systemów gridowych

Przydział zasobów do celów naukowo-badawczych i R&D

Stworzenie i wsparcie infrastruktury produkcyjnej

Zarządzanie zasobami

Wsparcie sieciowe

Wsparcie aplikacji

Własne R&D

Page 40: GRID - globalny system przetwarzania danych

Pl-Grid, dostępność usług

Service Availability Monitoring (SAM)‏

Page 41: GRID - globalny system przetwarzania danych

Pl-Grid, dostępność infrastruktur informatycznych

Monitoring GSTAT oparty na narzędziu EGEE

Program instalacji zasobów do 2011 obejmuje 215 Tflops i 2500 TB, zlokalizowanych w 5 ośrodkach

Page 42: GRID - globalny system przetwarzania danych

Pl-Grid, wsparcie dla użytkowników

Obsługa zapytań w ramach helpdesk, opartego na systemach rd-tracker (wcześniej 1or0)‏

https://helpdesk.plgrid.pl

Specjalistyczna pomoc w przypadku problemów operacyjnych i badawczo-rozwojowych

Dostęp poprzez certyfikaty użytkowników

Page 43: GRID - globalny system przetwarzania danych

Pl-Grid, narzędzia dla użytkowników

Bazaar

G-Eclipse

Grid Commander

Grid Space

Migrating Desktop

QosCosGrid

Vine

Page 44: GRID - globalny system przetwarzania danych

Pl-Grid, narzędzia zarządzania

FiVO – konfiguracja VO

Acarm

Gemini2

StorMon

X2R

Page 45: GRID - globalny system przetwarzania danych

Pl-Grid, szkolenia

Szkolenia dla użytkowników zaawansowanych ze świata nauki i przemysłu w formie kursów hands-on

Szkolenia wprowadzające dla nowych użytkowników

Różne formy szkoleń:

Regularne kursy tradycyjne, o różnych poziomach szczegółowości i zaawansowania

Zdalne kursy przy użyciu platformy Blackboard

Page 46: GRID - globalny system przetwarzania danych

Pl-Grid, oprogramowanie specjalistyczne

Freeware z różnych dziedzin, wypracowywany stopniowo przez społeczności naukowe

Oprogramowanie licencyjne potrzebne użytkownikom

Reprezentowane dziedziny: fizyka wysokich energii, fizyka molekularna, fizyka płynów, geofizyka, chemia kwantowa, biologia obliczeniowa, ogólne metody numeryczne i symulacyjne

Page 47: GRID - globalny system przetwarzania danych

Trudne do pogodzenia sprzeczności interesów

Kto jest właścicielem i kto zarządza zasobami obliczeniowymi?Różne podmioty porozumiewają się, nikt nie zrzeka się praw do swoich części Jeden właściciel i administrator

Kto finansuje infrastrukturę i serwisy?Provider(zy): wolny dostęp dla użytkownikówUżytkownicy: dostęp płatny

Page 48: GRID - globalny system przetwarzania danych

Trudne do pogodzenia sprzeczności interesów, c.d.

Bezpieczeństwo serwisów i rzetelność infrastrukturyPodstawowe bezpieczeństwo w ramach Grid Security Infrastructure, bez odpowiedzialności finansowo-prawnej provider'ówWysokie wymagania niezawodności (>99.99%) i predefiniowane bezpieczeństwo danych, z określoną odpowiedzialnością finansowo-prawną

Page 49: GRID - globalny system przetwarzania danych

Dwa modele przetwarzania:GRID vs. CLOUD

GRIDWspółdzielone zasoby należące do wielu właścicieli, znajdujące się w różnych miejscach, połączone, brak zarządzania centralnego. Przykłady: EGEE (EU+), OSG (USA)‏

CLOUDZasoby rozproszone, lecz zarządzane i posiadane przez jednego właściciela. Użytkownik płaci za usługi (dostęp, cykle, pamięć..)‏Przykłady: Amazon Elastic Compute Cloud, Google App Engine

Page 50: GRID - globalny system przetwarzania danych

GRID vs CLOUD

Provider: nauka

Technologia open source

Użytkownik wpływa na infrastrukturę i dostosowuje do specyficznych zadań

Złożony – do używania wymagana wstępna wiedza

Provider: komercja

Technologia proprietary

Użytkownik dzierżawi dostęp do zdefiniowanej infrastruktury

Prosty w użyciu od „poziomu zero”

Page 51: GRID - globalny system przetwarzania danych

GRID vs CLOUD, c.d.

Niepewna jakość usług

Możliwość tworzenia własnych, specyficznych serwisów

Bezpieczeństwo danych: repliki w różnych miejscach

Łatwe współdzielenie danych

Komercyjnie gwarantowana jakość

Brak wysoko-specjalizowanych serwisów aplikacyjnych

Bezpieczeństwo danych: specjalna usługa

Współdzielenie po wykupie dostępu

Page 52: GRID - globalny system przetwarzania danych

Pro domo sua: przetwarzanie rozproszone dla energetyki

Zadania computingu wspierającego energetykę w Polsce:

Konfiguracja i eksploatacja siłowni jądrowych

Dystrybucja energii

Monitoring zagrożeń radiacyjnych i chemicznych oraz wspomaganie decyzyjne

Bezpieczeństwo energetyczne

Page 53: GRID - globalny system przetwarzania danych

Przetwarzanie rozproszone dla energetyki, c.d.

Koncepcja computingu na potrzeby długofalowego programu rozwoju energetyki w Polsce:

Centrum Informatyczne w Świerku jako główny węzeł wsparcia informatycznego

Planowana częściowa integracja z Pl-grid

Architektura CIŚ uwzględniająca specyfikę zadań (kiedy GRID, a kiedy CLOUD?)‏

Specjalne wymagania bezpieczeństwa a rekonfigurowalność klastra

Page 54: GRID - globalny system przetwarzania danych

Monitoring zagrożeń radiologicznych

Page 55: GRID - globalny system przetwarzania danych

Monitoring zagrożeń chemicznych

Page 56: GRID - globalny system przetwarzania danych

Monitoring zagrożeń radiologicznych i chem., c.d.

Charakter serwisu wymaga całkowitego bezpieczeństwa danych i gwarantowanej jakości (wysoki poziom Service Level Agreement)‏

Potrzebne zasoby „na życzenie” (on demand) z możliwością szybkiej alokacji

Bezpieczniejszym rozwiązaniem jest CLOUD, aniżeli GRID

Page 57: GRID - globalny system przetwarzania danych

LEAD: huragany tropikalne w USA

Product Generation

Display,

Dissemination

Models and Algorithms Driving Sensors

The CS challenge: Build cyberinfrastructure services that provide adaptability, scalability, availability, useability, and real-time response.

Page 58: GRID - globalny system przetwarzania danych

Zadania off-line, wymagające bezpieczeństwa baz danych, lecz

nie obliczeń

Transport materii i promieniowania, obliczenia reaktorowe oraz optymalizacja eksploatacji siłowni jądrowych

Optymalizacja dystrybucji energii w sieciach, projektowanie sieci przesyłu energii i surowców (zadania typu routingu na grafach i optymalizacji dyskretnej; bardzo wymagające obliczeniowo)‏

Zadania doskonałe dla GRIDu

Page 59: GRID - globalny system przetwarzania danych

Sieć szkieletowa w CIŚ

Page 60: GRID - globalny system przetwarzania danych

Uwagi końcowe

Architekturę gridu dominują usługi serwisowe

(Service-oriented architecture)‏

Infrastruktura staje się niewidoczna dla użytkownika

Przetwarzanie rozproszone jest dominowane przez dwa trendy: grid i cloud

Wsparcie informatyczne dla energetyki prawdopodobnie wymaga mariażu obu