jak znaleźć igłę w stogu siana

Download Jak znaleźć igłę w stogu siana

If you can't read please download the document

Post on 10-Feb-2016

39 views

Category:

Documents

3 download

Embed Size (px)

DESCRIPTION

Jak znaleźć igłę w stogu siana. Rola obliczeń komputerowych w eksperymentach fizyki wysokich energii Krzysztof Korcyl na bazie wykładu Piotr a Golonk i CERN EN/ICE-SCD. Użytkowanie i kopiowanie dozwolone na warunkach Licencji CC-BY (Creative Commons Attribution). Plan. - PowerPoint PPT Presentation

TRANSCRIPT

Jak znale ig w stogu siana

Jak znale ig w stogu sianaRola oblicze komputerowych w eksperymentach fizyki wysokich energii

Krzysztof Korcyl na bazie wykadu Piotra GolonkiCERN EN/ICE-SCD

Uytkowanie i kopiowanie dozwolonena warunkach Licencji CC-BY(Creative Commons Attribution)

12Plan Co jest ig a co stogiem siana... midzy teori a dowiadczeniem Seria zoonych problemw Zbieranie danych Opracowywanie danych Analiza danych Technologie Klastry, GRID

23Co jest stogiem siana? - LHC

Genewaprotonyprotony

4 + 4 TeV = 8 1012 eV34Co jest stogiem siana? ... i detektory

LHCEksperymentInteresujce oddziaywaniaproton-proton

45Co jest ig ?Wikszo zderze to zwyke, dobrze znane oddziaywania.

Te interesujce ktre nios informacje o nieznanych zjawiskach s bardzo rzadkie.Typowo 1 przypadek na 100 mln!

Jak zauway taki przypadek w aparaturze i zapisa go na tam gdy mamy tak duy strumie danych tak mao czasu na analiz on-line?56Czego szukamy w eksperymentach?

amanie CP w ukadzie mezonw piknych (B)Zjawiska rzadkie ~ 10-4 10-8Pozostae eksperymenty na LHC maj swoje zestawy igie Czstka Higgsa (ATLAS, CMS) Supersymetria (ATLAS, CMS) Plazma kwarkowo-gluonowa (ALICE) ...Przykad: eksperyment LHCb

67Przykad: rekonstrukcja ladw czstekSymulacja komputerowa danych z 1 przypadku w detektorze wewntrznym eksperymentu ATLASZagadka:znajd 4proste lady

78Przykad: rekonstrukcja ladw czstekRozpad czstki Higgsa na 4 miony: H 4

89

Analiza danych: co zobaczy Fizyk:Czstki Higgsa (?) o masie ~125 GeVMasa inwariantna4 leptonw [GeV]To od innych rozpadwdajcych 4 miony

910Teoria, dowiadczenie i ... komputery

Teoria

Dowiadczenie(?)=

Metodykomputerowe

1011

Symulacja i prawdziwy eksperymentRekonstrukcjaAnaliza fizycznaW efekcie modelowania otrzymujemy dane symulowane w formacie takim jakie bd napywa z elektroniki odczytu aparatury eksperymentalnej.

SymulacjaGenerator przypadkw (teoria)Modelowanie odpowiedzi aparatury (Geant4)Eksperyment

1112Symulacja zjawisk w detektorachSlajd ze strony www eksperymentu CMS

1213Co jest stogiem siana Przecicia pkw wizek: co 25 nanosekund (czstotliwo LHC: 40 MHz) Nie wszystkie pczki s pene zderzenia: 31 MHz 10 * 106 zderze w cigu 1 sekundy widocznych w eksperymencie LHC-b!10 mln100 tys1l. dyskw (300 GB)3 EB ( 3*1018 )30 PB300 GBIlo danych10141012107l. przypadkwRokDzieSekunda

Dane przepywajce przez eksperyment Dla eksperymentw ATLAS i CMS jest znacznie gorzej ATLAS 2PB/sek 3 mln CD/s1314

Dygresja... ile to bajtw?1 Megabajt (1MB)zdjcie z aparatu cyfrowego: 6 MB

1 Gigabajt (1GB) = 1000MBfilm na noniku DVD: 6 GB, BluRay: 25GB1 Terabajt (1TB) = 1000GBNajwiksze twarde dyski: 4 TBwiatowa roczna produkcja ksiek: 8TBBiblioteka kongresu USA: 10 TB1 Petabajt (1PB) = 1000TBRoczne skadowanie danych w LHC: 25 PBInformacja w WWW: 8PB1 Eksabajt (1EB) = 1000 PBRoczna produkcja informacji zapisanej cyfrowo: 5 EBWszystkie dotd wypowiedziane sowa: 5EBWszystkie twarde dyski w stanie Minesota, USA (5 mln mieszkacw): 1EBPrzepyw cyfrowej informacji w 2002: 18 EB ( z czego 98% to telefony)Ilo danych widzianych przez eksperyment na LHC: 3 EB1 Zetabajt (1ZB) = 1000 EBRoczna konsumpcja informacji w USA: 3.6 ZB (55% to gry komputerowe, 35% telewizja)rdo: HMI Report 2009, http://hmi.ucsd.edu/howmuchinfo.php ;

1415Co jest stogiem siana Przecicia pkw wizek: co 25 nanosekund (czstotliwo LHC: 40 MHz) Nie wszystkie pczki s pene zderzenia: 31 MHz 10 * 106 zderze w cigu 1 sekundy widocznych w eksperymencie LHC-b!10 mln100 tys1l. dyskw (300 GB)3 EB ( 3*1018 )30 PB300 GBIlo danych10141012107l. przypadkwRokDzieSekundaZapis wszystkich przypadkw jest niemoliwyNa kady przypadek naley jednak zerkn i zadecydowa czy jest interesujcy.Do przegldania przypadkw suy system wyzwalania czyli filtracji przypadkw ( tzw. tryger).

Dane przepywajce przez eksperyment Dla eksperymentw ATLAS i CMS jest znacznie gorzej ATLAS 2PB/sek 3 mln CD/s1516Zbieranie danych - system wyzwalania Zadaniem systemu wyzwalania jest przede wszystkim jak najszybsze odrzucanie zbdnych przypadkw (a nie wybieranie tych interesujcych). W kolejnych stopniach filtrowania mamy do dyspozycji coraz wicej czasu na dokadniejsz analiz przypadkw zaakceptowanych i dokadniejsze odrzucanie.

TAKTAKNIENIE?1 ms10 ms

1617

Zbieranie danych30 MHz2 kHz35 GB/s

21010 przyp./rok

1 MHzHLT (algorytmy)Wyszy stopie wyzwalania1 MHz 1s/przypadek.W ciagu 1 s nie mona nawet zdekodowac danychCo zrobic ???1000 procesorw 1 ms/przypadekMoliwa staje si rekonstrukcja sladow w detektorze wierzcholka w rzucie r

L0 (hardware)Wstpny poziom wyzwalania

1718Farma procesorw on-line

Force10 E1200:1260 portw GbEPrzepustowo 50 GB/s

1 MHz na wejciu 30 GB/s1000 CPU2 kHz na wyjciuZapis 250 MB/s

1 m

1819Iga czy stg siana?

LHCEksperymentyInteresujce oddziaywania p-p

15 Petabajtw / rok przefiltrowanych danych z czterech eksperymentow na LHCFiltrowanieRedukcja > 105

3 Eksabajty/rok15 Petabajtw/rok

1920Analiza danych Analiza danych zapisanych na tamy Przypadki przefiltrowane Niespotykane dotd wyzwania ~25 PB danych na rok 200 tys procesorw 10 tys dyskw Skoncentrowanie infrastruktury w jednym miejscu jest niesychanie trudne (i niecelowe bo blokuje rozwj innych orodkw). Instalacja, zasilanie, chodzenie, obsuga systemw operacyjnych i oprogramowania Konieczny model rozproszonych oblicze czyli zespl wsppracujcych ze sob farm komputerowych.Czy mona jednak stworzy co bardziej uniwersalnego co byoby przydatne take dla innych dziedzin?

2021GRID globalny komputer

WWW przewrt w dostpie do informacji (wynalezione w CERN).Jednolity dostp do informacji bez wzgldu na miejsce na Ziemi.GRID jednolity dostp do zasobw obliczeniowych.GRID widziany przez kadego uytkownika jako jeden wielki komputer.Dobra platforma wsppracy dla duych projektw.Wsplne narzdzia i dane, dostp do mocy obliczeniowej.Analogia z sieci elektryczna (take w przypadku opat za pobran moc obliczeniowa)Pierwsz udan inicjatyw na du skal byy obliczenia w ramach projektu SETI (Search for Extra-Terrestrial Intelligence)Kady posiadacz PC mg udostpni moc obliczeniowa np. w nocy i uruchomi program analizujcy sygnay przychodzce z kosmosu. Dziki projektowi zaoszczdzono wiele milionw $

2122Oglnowiatowa sie GRID: WLCG WLCG: Worldwide LHC Computing Grid najwikszy projektem GRID170 orodkw obliczeniowych w 36 krajachOk. 330 ty procesorw (rdzeni), z czego ~30 tys w CERN, 22 tys w Polsce(!)) 220 PB miejsca na dane (30 PB w CERN, 1.2PB w Polsce(!))Koordynatorem projektu jest CERNFizyka czstek jest gwnym uytkownikiem (najwiksze potrzeby)

2223Univ. ALab. CUniv. BLab. AUniv. CLab. BUniv. DTier 2NiemcyTier 1USAUKFrancjaWochyKoreaCERNTier 1Japonia

Struktura hierarchiczna (Multi Tier)Tier 0Tier 3HolandiaHiszpaniaNordic23In order to handle these volumes we are creating a hierarchical distribution network. With both data and processing power spread amongst all of the sites.

Tier 0 is at CERN and represents where the data is produced.

At Tier 1 several national sites receive direct feeds from Tier 0. Notable CERN will also host a Tier 1 site to handle the computing and data needs of its local Physicist population.

Universities and other collaborating laboratories will be at Tier 2.

With finally the end-users desktop at Tier 3.24

Struktura hierarchiczna (Multi Tier)2425Technologie: farmy PC

Pocztkowo CERN zdecydowa zakupi komputery w formie zwykych PC dostpnych w sklepach. W midzyczasie technologie RACK i BLADE osigny konkurencyjne ceny. Obecnie w duych orodkach wygrywaj technologie specjalistyczne RACK i BLADEHala w CERN przygotowana do montau PC w szafach RACKPC typu RACK i BLADEPierwsze klastry w CERNw standardowej technologii.Serwery typu rackw centrum komputerowym CERN

2526Technologie - c.d.O(10000) procesorw (rdzeni)Kilka procesorw w komputerze, kilka rdzeni w procesorze, wirtualizacja...

Ultra-szybkie poczenia sieciowe1, 10Gb EthernetFiber Channel

Skadowanie danych: tamynp. robot: Sun StorageTek SL8500Do 300 tys tam, 500 GB kadaDo 2048 napdw o prdkoci 100MB/s

System operacyjny:CERN Scientific Linux

2627PodsumowanieEksperymenty na LHC dostarczaj ogromnej iloci danych.Przypadki ktrych szukamy zdarzaj si bardzo rzadko, ~1 na 100 mln.Jedynie dziki komputerom udaje si zebra, przetworzy i analizowa dane.CERN stymuluje rozwj nowych technologii informatycznych (WWW, GRID)27

Recommended

View more >