grid - globalny system przetwarzania danych
TRANSCRIPT
GRID - globalny system przetwarzania danych
Dlaczego GRID?
Jak jest zbudowany, zorganizowany i jak działa
Międzynarodowe i krajowe inicjatywy gridowe
Zastosowania
Trudne do pogodzenia sprzeczności interesów
GRID dla energetyki?
Wojciech Wiślicki, IPJ, 25/9/2010
Dlaczego GRID?
Produkcja i zapis
informacji
Możliwości CPU
Więcej informacji będziemy
reprodukowali i silniej ją
zredukujemy przed zapisem
Dlaczego GRID?
Prawa Moore'a
dla nośników danych
i bandwidth 100/(10 lat)
Ale najszybciej tanieje
bandwidth
Wniosek: wzrasta ruch
w sieci
Dlaczego GRID?
Złożoność problemów
Złożoność urządzeń
i grup ludzkich
Czym jest grid?
Grid jest rodzajem rozproszonego computingu, tzn. do zadania używamy zasobów zlokalizowanych w różnych miejscach i połączonych siecią
Grid organizuje przetwarzanie danych, zarówno zasoby, jak użytkowników, lecz nie zarządza nimi centralnie. Zasoby należą do różnych właścicieli
Używane są tzw. open standards
Zapewnia Quality of service
Pierwszy historycznie przykład GRIDu: SETI @ home
Każdy komputer podłączony do Internetu może zainstalować oprogramowanie do analizy danych z radioteleskopu San Mateo CA
Niebo podzielone jest na małe obszary i każdy komputer dostaje kawałek do przeanalizowania w czasie, gdy jest nieobciążony (zasada screen-savera)
Pierwszy historycznie przykład GRIDu: SETI @ home, c.d.
Poszukuje się w widmie częstości struktur niepodobnych do znanych wzorców
Pierwszy historycznie przykład GRIDu: SETI @ home, c.d.
Obecnie SETI @ home ma 5.5 mln uczestników
SETI @ home nie jest jednak prawdziwie rozwiniętym gridem (brak prawdziwych serwisów i QoS)
Pierwszy historycznie przykład GRIDu: SETI @ home, c.d.
Dotychczas (ok. 10 lat) nie znaleziono ET
Architektura gridu (opartego na systemie gLite)
Model przetwarzania danych
Łączność: sieć GEANT i sieciowa koordynacja operacyjna ruchu
Organizacja w dużej skali: struktury globalne, federacje, społeczności użytkowników
Struktura węzła gridowego
Dostęp do zasobów i usługi gridowe
Aplikacje
Wielowarstwowy (multi-tier) model przetwarzania danych: LHC w CERN
Najniższy poziom przetwarzania w gridzie WLCG: Tier-3
Poziom ten nie jest udostępniany w gridzie
Służy lokalnym grupom do celów deweloperskich
Może być też mocną lokalną farmą do analizy na wysokim poziomie, np. do zrównoleglonej analizy PROOF'em
Tier-3 może mieć minimalną funkcjonalność gridową (np. tylko user interface i gridowy transfer danych)
Łączność: sieć GEANT wraz z EGEE Network Operations Centre
Organizacja GRIDU z lotu ptaka
Pl: NREN=PIONIER, RGI=PlGrid
Podstawowe elementy struktuaralne: węzły gridowe
Podstawowe usługi gridowe (system gLite)
Katalogi zbiorów i metadanych
Workflow management
Monitoring
Accounting
Zarządzanie rozproszonymi zbiorami danych
Zarządzanie wirtualnymi organizacjami użytkowników
Wsparcie dla użytkowników
Dostęp do gridu
Trzeba skutecznie
rozpoznać użytkownika
i dać mu bezpieczny
dostęp do zasobów
obliczeniowych
Dostęp do gridu, c.d.
Grid Security Infrastructure, oparta na certyfikatach dla użytkowników, wystawianych przez narodowe Certificate Authorities
Certyfikaty użytkowników w formacie X.509, umożliwiające autentykację (sprawdzenie tożsamości) użytkownika
Autoryzacja na zasoby udzielana w ramach wirtualnych organizacji przez serwisy Virtual Organization Membership Service (VOMS)
Trochę statystyki: Enabling Grids for E-science
54 kraje, 267 węzłów sieciowych
114 000 CPU dostępnych 24/7
20 PB pamięci dyskowej + tape MS
200 wirtualnych organizacji
16 000 użytkowników
150 000 zadań/dzień
15 obszarów tematycznych aplikacji
Infrastruktura obliczeniowa
Serwisy produkcyjne (PS), używane w bieżącej pracy operacyjnej, np. Worldwide LHC Computing Grid
Serwisy pre-produkcyjne (PPS), używane do testowania nowych narzędzi i usług gridowych przed ich wdrożeniem do produkcji
Infrastruktura szkoleniowa (portal szkoleniowy GILDA), umożliwiająca przeprowadzanie kursów gridowych bez wpuszczania użytkowników na infrastrukturę produkcyjną
Wsparcie dla użytkowników
Monitoring gridu: GIIS w Academia Sinica
Klaster warszawski w domenie polgrid.pl
Monitoring gridu: GIIS w Academia Sinica, c.d.
Klaster warszawski w domenie polgrid.pl
Aplikacje
Dwa największe gridy typu general purpose, to EGEE (EC) i OSG (USA)
Ich największymi użytkownikami są eksperymenty nowej generacji w fizyce wysokich energii, głównie przy Large Hadron Collider w CERNie
Istnieją też duże aplikacje biomedyczne, geologiczne, meteorologiczne, chemiczne, z fizyki plazmy .., uprawiane zarówno na EGEE, OSG, jak i na gridach dziedzinowych
Narodowa inicjatywa gridowa Pl-Grid
Od 2009 organizacja gridów WLCG i EGEE oparta jest o narodowe projekty gridowe
Pl-Grid, konsorcjum finansowane przez MNiSW w ramach Programu Operacyjnego Innowacyjna Gospodarka
Finansowany w ramach umowy
POIG.02.03.00-00-007/08-00 2009-11
Pl-Grid, partnerzy
ACK Cyfronet
ICM UW
PCSS PAN
CI TASK
WCSS
Pl-Grid, partnerzy
Oparty na tym samym szkielecie sieciowym co EGEE
Pl-Grid, struktura
Pl-Grid, struktura warstwy sprzętowej i narzędziowej
Równoległe działanie dwóch infrastruktur w warstwie narzędziowej i operacyjnej - gLite i Unicore
Wykorzystanie dorobku narzędziowego i serwisowego projektów gridowych z FP 5,6,7
Struktura serwisów wzorowana na EGEE
Sprzęt obliczeniowy i sieciowy częściowo odziedziczony po EGEE/WLCG, uzupełniony o duże zakupy w ramach pl-grid
Pl-Grid, zadania i koordynatorzy
Z1- Zarządzanie Projektem – ACK CYFRONET AGH (Kraków)
Z2 - Infrastruktura sprzętowa – CI TASK (Gdańsk)
Z3 - Centrum Operacyjne – ACK CYFRONET AGH (Kraków)
Z4 - Rozwój oprogramowania e-infrastruktury i narzędzi użytkownika – PCSS (Poznań)
Z5 - Szkolenia i wsparcie użytkowników – ICM UW (Warszawa)
Z6 - Bezpieczeństwo infrastruktury – WCSS (Wrocław).
Pl-Grid, struktura organizacyjna
Pl-Grid, zadania merytoryczne
Wsparcie dla EGEE i DEISA
Wspieranie nowych inicjatyw i systemów gridowych
Przydział zasobów do celów naukowo-badawczych i R&D
Stworzenie i wsparcie infrastruktury produkcyjnej
Zarządzanie zasobami
Wsparcie sieciowe
Wsparcie aplikacji
Własne R&D
Pl-Grid, dostępność usług
Service Availability Monitoring (SAM)
Pl-Grid, dostępność infrastruktur informatycznych
Monitoring GSTAT oparty na narzędziu EGEE
Program instalacji zasobów do 2011 obejmuje 215 Tflops i 2500 TB, zlokalizowanych w 5 ośrodkach
Pl-Grid, wsparcie dla użytkowników
Obsługa zapytań w ramach helpdesk, opartego na systemach rd-tracker (wcześniej 1or0)
https://helpdesk.plgrid.pl
Specjalistyczna pomoc w przypadku problemów operacyjnych i badawczo-rozwojowych
Dostęp poprzez certyfikaty użytkowników
Pl-Grid, narzędzia dla użytkowników
Bazaar
G-Eclipse
Grid Commander
Grid Space
Migrating Desktop
QosCosGrid
Vine
Pl-Grid, narzędzia zarządzania
FiVO – konfiguracja VO
Acarm
Gemini2
StorMon
X2R
Pl-Grid, szkolenia
Szkolenia dla użytkowników zaawansowanych ze świata nauki i przemysłu w formie kursów hands-on
Szkolenia wprowadzające dla nowych użytkowników
Różne formy szkoleń:
Regularne kursy tradycyjne, o różnych poziomach szczegółowości i zaawansowania
Zdalne kursy przy użyciu platformy Blackboard
Pl-Grid, oprogramowanie specjalistyczne
Freeware z różnych dziedzin, wypracowywany stopniowo przez społeczności naukowe
Oprogramowanie licencyjne potrzebne użytkownikom
Reprezentowane dziedziny: fizyka wysokich energii, fizyka molekularna, fizyka płynów, geofizyka, chemia kwantowa, biologia obliczeniowa, ogólne metody numeryczne i symulacyjne
Trudne do pogodzenia sprzeczności interesów
Kto jest właścicielem i kto zarządza zasobami obliczeniowymi?Różne podmioty porozumiewają się, nikt nie zrzeka się praw do swoich części Jeden właściciel i administrator
Kto finansuje infrastrukturę i serwisy?Provider(zy): wolny dostęp dla użytkownikówUżytkownicy: dostęp płatny
Trudne do pogodzenia sprzeczności interesów, c.d.
Bezpieczeństwo serwisów i rzetelność infrastrukturyPodstawowe bezpieczeństwo w ramach Grid Security Infrastructure, bez odpowiedzialności finansowo-prawnej provider'ówWysokie wymagania niezawodności (>99.99%) i predefiniowane bezpieczeństwo danych, z określoną odpowiedzialnością finansowo-prawną
Dwa modele przetwarzania:GRID vs. CLOUD
GRIDWspółdzielone zasoby należące do wielu właścicieli, znajdujące się w różnych miejscach, połączone, brak zarządzania centralnego. Przykłady: EGEE (EU+), OSG (USA)
CLOUDZasoby rozproszone, lecz zarządzane i posiadane przez jednego właściciela. Użytkownik płaci za usługi (dostęp, cykle, pamięć..)Przykłady: Amazon Elastic Compute Cloud, Google App Engine
GRID vs CLOUD
Provider: nauka
Technologia open source
Użytkownik wpływa na infrastrukturę i dostosowuje do specyficznych zadań
Złożony – do używania wymagana wstępna wiedza
Provider: komercja
Technologia proprietary
Użytkownik dzierżawi dostęp do zdefiniowanej infrastruktury
Prosty w użyciu od „poziomu zero”
GRID vs CLOUD, c.d.
Niepewna jakość usług
Możliwość tworzenia własnych, specyficznych serwisów
Bezpieczeństwo danych: repliki w różnych miejscach
Łatwe współdzielenie danych
Komercyjnie gwarantowana jakość
Brak wysoko-specjalizowanych serwisów aplikacyjnych
Bezpieczeństwo danych: specjalna usługa
Współdzielenie po wykupie dostępu
Pro domo sua: przetwarzanie rozproszone dla energetyki
Zadania computingu wspierającego energetykę w Polsce:
Konfiguracja i eksploatacja siłowni jądrowych
Dystrybucja energii
Monitoring zagrożeń radiacyjnych i chemicznych oraz wspomaganie decyzyjne
Bezpieczeństwo energetyczne
Przetwarzanie rozproszone dla energetyki, c.d.
Koncepcja computingu na potrzeby długofalowego programu rozwoju energetyki w Polsce:
Centrum Informatyczne w Świerku jako główny węzeł wsparcia informatycznego
Planowana częściowa integracja z Pl-grid
Architektura CIŚ uwzględniająca specyfikę zadań (kiedy GRID, a kiedy CLOUD?)
Specjalne wymagania bezpieczeństwa a rekonfigurowalność klastra
Monitoring zagrożeń radiologicznych
Monitoring zagrożeń chemicznych
Monitoring zagrożeń radiologicznych i chem., c.d.
Charakter serwisu wymaga całkowitego bezpieczeństwa danych i gwarantowanej jakości (wysoki poziom Service Level Agreement)
Potrzebne zasoby „na życzenie” (on demand) z możliwością szybkiej alokacji
Bezpieczniejszym rozwiązaniem jest CLOUD, aniżeli GRID
LEAD: huragany tropikalne w USA
Product Generation
Display,
Dissemination
Models and Algorithms Driving Sensors
The CS challenge: Build cyberinfrastructure services that provide adaptability, scalability, availability, useability, and real-time response.
Zadania off-line, wymagające bezpieczeństwa baz danych, lecz
nie obliczeń
Transport materii i promieniowania, obliczenia reaktorowe oraz optymalizacja eksploatacji siłowni jądrowych
Optymalizacja dystrybucji energii w sieciach, projektowanie sieci przesyłu energii i surowców (zadania typu routingu na grafach i optymalizacji dyskretnej; bardzo wymagające obliczeniowo)
Zadania doskonałe dla GRIDu
Sieć szkieletowa w CIŚ
Uwagi końcowe
Architekturę gridu dominują usługi serwisowe
(Service-oriented architecture)
Infrastruktura staje się niewidoczna dla użytkownika
Przetwarzanie rozproszone jest dominowane przez dwa trendy: grid i cloud
Wsparcie informatyczne dla energetyki prawdopodobnie wymaga mariażu obu