sima dezső

62
Sima Dezső Többmagos/sokmagos processzorok 2008. November

Upload: yoshi-walls

Post on 30-Dec-2015

59 views

Category:

Documents


0 download

DESCRIPTION

Többmagos/sokmagos pro cess z or ok. Sima Dezső. 2008. November. Áttekintés. 1. Többmagos processzorok megjelenésének szükségszerűsége. 2. Homog én többmagos processzorok. 2.1 Hagyományos többmagos processzorok. 2.2 Sokmagos processzorok. 3. Heterog én többmagos processzorok. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Sima Dezső

Sima Dezső

Többmagos/sokmagosprocesszorok

2008. November

Page 2: Sima Dezső

Áttekintés

1. Többmagos processzorok megjelenésének szükségszerűsége•

2. Homogén többmagos processzorok •

3. Heterogén többmagos processzorok•

2.1 Hagyományos többmagos processzorok•

3.1 Mester/szolga elvű többmagos processzorok•

3.2 Csatolt többmagos processzorok•

4. Kitekintés•

2.2 Sokmagos processzorok•

Page 3: Sima Dezső

1. Többmagos processzorok megjelenésének szükségszerűsége

Page 4: Sima Dezső

1.1 ábra: Az integrált áramkörök gyártási technológiájának fejlődése

1. Többmagos processzorok megjelenésének szükségszerűsége (1)

Shrinking: ~ 0.7/2 Years

Page 5: Sima Dezső

1. Többmagos processzorok megjelenésének szükségszerűsége (2)

IC gyártási technológia

Moore szabály

• azonos tranzisztorszám ½ Si területen

(Lineáris zsugorítás ~ 0.7x/2 év)

• azonos területen 2x annyi tranzisztor

Két évente

Kétévente kb. duplázódik az egy lapkán megvalósítható

ltranzisztorok száma

Page 6: Sima Dezső

1.2 ábra: A lapkán integrált tranzisztorok számának növekedése – a Moore szabály

1. Többmagos processzorok megjelenésének szükségszerűsége (3)

Page 7: Sima Dezső

Possible use of surplus transistors

Wider processor width Core enhancements Cache enhancements

superscalar

• branch prediction• speculative loads• ...

L2/L3enhancements

(size, associativity ...)

1. Gen. 2. Gen.

1 2 4

pipeline

A tranzisztorszámok duplázódása ~ két évente

Mire használhatók fel a többlet-tranzisztorok?

Moore szabály

1. Többmagos processzorok megjelenésének szükségszerűsége (4)

Page 8: Sima Dezső

A többlet tranzisztorok felhasználása többmagos processzorként

A többmagos processzorok megjelenésének szükségszerűsége

Növekvő tranzisztorszámok Egyre csökkenő teljesítményhozam

1. Többmagos processzorok megjelenésének szükségszerűsége (5)

Page 9: Sima Dezső

1.3 ábra: Intel többmagos processzorainak robbanásszerű elterjedése

1. Többmagos processzorok megjelenésének szükségszerűsége (6)

Page 10: Sima Dezső

1. Többmagos processzorok megjelenésének szükségszerűsége (7)

1.4 ábra: Többmagos processzorok főbb osztályai

Desktops

Heterogenous multicores

Homogenous multicores

Multicore processors

Manycore processors

Servers

with >8 cores

ConventionalMC processors

Master/slavearchitectures

Add-onarchitectures

MPC

CPU GPU

2 ≤ n ≤ 8 cores

General purpose computing

Prototypes/ experimental systems

MM/3D/HPCproduction stage

HPCnear future

Page 11: Sima Dezső

2. Homogén többmagos processzorok

Page 12: Sima Dezső

2. Homogén többmagos procdesszorok (1)

2.1 ábra: Többmagos processzorok főbb osztályai

Desktops

Heterogenous multicores

Homogenous multicores

Multicore processors

Manycore processors

Servers

with >8 cores

ConventionalMC processors

Master/slavearchitectures

Add-onarchitectures

MPC

CPU GPU

2 ≤ n ≤ 8 cores

General purpose computing

Prototypes/ experimental systems

MM/3D/HPCproduction stage

HPCnear future

Page 13: Sima Dezső

Többmagos MP szerver processzorok

2.1 Többmagos MP szerver processzorok (1)

AMD MP szerver processzorai•

Intel MP szerver processzorai•

Page 14: Sima Dezső

2007: AMD: K10 (Barcelona)-alapú QC MP szerver (Opteron 8300 család)

Többmagos négyprocesszoros MP szerverek megjelenésének mérföldkövei

2006: Intel: Netburst-alapú DC MP szerver (8500 platform)

2007: Intel: Core 2-alapú QC MP szerver (7300 platform)

2005: AMD: K8-alapú DC MP szerver (Opteron 800 család)

2006: AMD: K8-alapú DC MP szerver (Opteron 8000 család)

2.1 - Többmagos MP szerver processzorok (2)

Page 15: Sima Dezső

Intel többmagos MP szerver processzorai

2.1 Többmagos MP szerver processzorok (3)

Page 16: Sima Dezső

Xeon 7000

11/2005

Cores Xeon 7200 Xeon 7300Xeon 7100

9/20079/20078/2006

MP Chipsets

3/2006 4/2006 9/2007

8500 8501 7300

(Paxville MP DC) (Tulsa DC) (Tigerton DC) (Tigerton QC)

7300

9/2007

(Clarksboro)(Twin Castle) (?)

2.2 ábra: Intel négyfoglalatos DC/QC MP platformjai (magok, lapkák)

2xFSB667 MT/s

4 x XMB(2 x DDR2)

32GB

2xFSB800 MT/s

4 x XMB(2 x DDR2)

32GB

4xFSB1066 MT/s

4 x FBDIMM(DDR2)512GB

(Caneland)

8500

(Truland)

DC QC

Intel’s DC/QC MP-servers3/2006

2.1 – Intel többmagos MP szerver processzorai (1)

Page 17: Sima Dezső

2.3 ábra: Intel MP szerver lapka készleteinek fejlődése

Preceding NB

Potomac Potomac Potomac Potomac

Clarksboro

Tigerton Tigerton Tigerton Tigerton

(Twin Castle)

Paxville MPTulsa

XMB

XMB

XMB

XMB

Paxville MPTulsa

Paxville MPTulsa

Paxville MPTulsa

8500

DC/QC DC/QC DC/QC DC/QC

SC SC SC SC DC DC DC DC

2005: 2006:

2007:

DDR/DDR2

FBDIMM/DDR2

DDR/DDR2

2.1 – Intel többmagos MP szerver processzorai (2)

Page 18: Sima Dezső

2.4 ábra: Intel négyfoglalatos 7300-as (Caneland) platformja (9/2007)

FB-DIMM

up to 512 GB

7200 (Tigerton DC, Core2), DC

Xeon

7300 (Tigerton QC, Core2), QC

2.1 – Intel többmagos MP szerver processzorai (3)

Page 19: Sima Dezső

FB-DIMM DDR2

192 GB 7200 DC 7300 QC(Tigerton)

Xeon

2.5 ábra: Négyfoglalatos 7300 (Caneland) alaplap (Supermicro X7QC3)

SBE2 SB

7300 NB

2.1 – Intel többmagos MP szerver processzorai (4)

Page 20: Sima Dezső

AMD többmagos MP szerver processzorai

Page 21: Sima Dezső

UP: Opteron 100/1000 DP: Opteron 200/2000, MP: 800/8000

CPU0

1MB L2 Cache

CPU1

System Request Interface

Crossbar Switch

MemoryController HT

1MB L2 Cache

CPU0

1MB L2 Cache

CPU1

System Request Interface

Crossbar Switch

MemoryController 0 1 2

1MB L2 Cache

HyperTransport™

2 x 72 bit 2 x 72 bit 800/8000: 3 coherent links200/2000: 1 coherent link

2.6 ábra: Az Opteron család alapvető felépítése

2.1 – AMD többmagos MP szerver processzorai (1)

Page 22: Sima Dezső

2.7 ábra: AMD 4P/8P Direct Connect szerver architektúrája

2.1 – AMD többmagos MP szerver processzorai (2)

Page 23: Sima Dezső

2.8 ábra: Többmagos processzorok főbb osztályai

Desktops

Heterogenous multicores

Homogenous multicores

Multicore processors

Manycore processors

Servers

with >8 cores

ConventionalMC processors

Master/slavearchitectures

Add-onarchitectures

MPC

CPU GPU

2 ≤ n ≤ 8 cores

General purpose computing

Prototypes/ experimental systems

MM/3D/HPCproduction stage

HPCnear future

2.2 Sokmagos processzorok (1)

Page 24: Sima Dezső

2.2 Sokmagos processzorok

2.2 Sokmagos processzorok•

(Intel Tiled processszora)•

Intel Larrabee processzora•

Page 25: Sima Dezső

Intel Larrabee processzora

2.2 Sokmagos processzorok - Larrabee (1)

Page 26: Sima Dezső

Larrabee

Intel’s Tera-Scale kezdeményezésének részeként.

Projekt kezdete ~ 2005Az első nem nyilvános prezentáció: 03/2006 (visszavonva) Az első nyilvános prezentáció: 08/2008 (SIGGRAPH)Várható megjelenés ~ 2009

• Teljesítmény (cél): 2 TFlops

• Előzmények:

• Célok:

Nem egyetlen termék, hanem több család alapjául szolgáló bázis architektúra.

Nagyteljesítményű grafikai processzor, HPC

2.2 Sokmagos processzorok - Larrabee (2)

Page 27: Sima Dezső

2.9 ábra: A GPU-orientált Larrabe blokk diagramja (2008 aug. SIGGRAPH)

2.2 Sokmagos processzorok - Larrabee (3)

Basic architecture

16-byte széles SIMD feldolgozó egységek

Page 28: Sima Dezső

2.10 ábra: GPU-orientált Larrabee alaplapja (2006, túlhaladott)

2.2 Sokmagos processzorok - Larrabee (4)

Page 29: Sima Dezső

2.11 ábra: Négyfoglalatos MP szerver célú Larrabee rendszer architektúrája

2.2 Sokmagos processzorok - Larrabee (5)

CSI: Common Systems Interface (csomagalapú soros IF)

Page 30: Sima Dezső

Intel Tiled processzora

2.2 Sokmagos processzorok – Tiled processzor (1)

Page 31: Sima Dezső

• Intel Tera-Scale kezdeményezésének első megvalósítása

Bejelentése IDF 9/2006Várható megjelenése 2009/2010

• Cél: Tera-Scale kísérleti chip

(több, mint 100 projekt között)

• Előzmények:

Processzor

2.2 Sokmagos processzorok – Tiled processzor (2)

Page 32: Sima Dezső

2.12 ábra: A Tiled processzor alapvető felépítése

2.2 Sokmagos processzorok – Tiled processzor (3)

Page 33: Sima Dezső

3. Heterogén többmagos processzorok

Page 34: Sima Dezső

3.1 Heterogén mester/szolga elvű többmagos processzorok (1)

3.1 ábra Többmagos processzorok főbb osztályai

Desktops

Heterogenous multicores

Homogenous multicores

Multicore processors

Manycore processors

Servers

with >8 cores

ConventionalMC processors

Master/slavearchitectures

Add-onarchitectures

MPC

CPU GPU

2 ≤ n ≤ 8 cores

General purpose computing

Prototypes/ experimental systems

MM/3D/HPCproduction stage

HPCnear future

Page 35: Sima Dezső

3. Heterogén többmagos processzorok

3.1 Heterogén többmagos mester/szolga elvű TP-ok•

A Cell processzor

Page 36: Sima Dezső

3.1 Heterogén mester/szolga elvű TP-ok - A Cell (1)

Cell BE

• Előzmények:

2000 nyara: Az architektúra alapjainak meghatározása02/2006: Cell Blade QS2008/ 2007 Cell Blade QS2105/ 2008 Cell Blade QS22

• Sony, IBM és Toshiba közös terméke

• Cél: Játékok/multimédia, HPC alkalmazások

Playstation 3 (PS3) QS2x Blade Szerver család

(2 Cell BE/blade)

Page 37: Sima Dezső

EIB: Element Interface Bus

3.2 ábra: A Cell BE blokk diagramja

SPE: Synergistic Procesing ElementSPU: Synergistic Processor UnitSXU: Synergistic Execution UnitLS: Local Store of 256 KBSMF: Synergistic Mem. Flow Unit

PPE: Power Processing ElementPPU: Power Processing UnitPXU: POWER Execution Unit

MIC: Memory Interface Contr.BIC: Bus Interface Contr.

XDR: Rambus DRAM

3.1 Heterogén mester/szolga elvű TP-ok - A Cell (2)

Page 38: Sima Dezső

3.3 ábra: A Cell BE lapka (221mm2, 234 mtrs)

3.1 Heterogén mester/szolga elvű TP-ok - A Cell (3)

Page 39: Sima Dezső

3.10 ábra: A Cell BE lapka - EIB

3.1 Heterogén mester/szolga elvű TP-ok - A Cell (4)

Page 40: Sima Dezső

3.11 ábra: Az EIB működési elve

3.1 Heterogén mester/szolga elvű TP-ok - A Cell (5)

Page 41: Sima Dezső

3.12 ábra: Konkurens átvitelek az EIB-en

3.1 Heterogén mester/szolga elvű TP-ok - A Cell (6)

Page 42: Sima Dezső

• Teljesítmény @ 3.2 GHz:

QS21 Csúcs SP FP: 409,6 GFlops (3.2 GHz x 2x8 SPE x 2x4 SP FP/cycle)

• Cell BE - NIK

2007: Faculty Award (Cell 3Đ app./Teaching)

2008: IBM – NIK Kutatási Együttműködési Szerződés: Teljesítményvizsgálatok• IBM Böblingen Lab• IBM Austin Lab

3.1 Heterogén mester/szolga elvű TP-ok - A Cell (7)

Page 43: Sima Dezső

The Roadrunner

6/2008 : International Supercomputing Conference, Dresden

A világ 500 leggyorsabb számítógépe

1. Roadrunner1. Roadrunner 1 Petaflops (1015) fenntartott teljesítmény (linpack)

3.1 Heterogén mester/szolga elvű TP-ok - A Cell (8)

Page 44: Sima Dezső

3.13 ábra:A világ leggyorsabb számítógépe: IBM Roadrunner (Los Alamos 2008)

3.1 Heterogén mester/szolga elvű TP-ok - A Cell (9)

Page 45: Sima Dezső

3.14 ábra: A Roadrunner főbb jellemzői

3.1 Heterogén mester/szolga elvű TP-ok - A Cell (10)

Page 46: Sima Dezső

3.15 ábra: Többmagos processzorok főbb jellemzői

Desktops

Heterogenous multicores

Homogenous multicores

Multicore processors

Manycore processors

Servers

with >8 cores

ConventionalMC processors

Master/slavearchitectures

Add-onarchitectures

MPC

CPU GPU

2 ≤ n ≤ 8 cores

General purpose computing

Prototypes/ experimental systems

MM/3D/HPCproduction stage

HPCnear future

3.2 Heterogén csatolt többmagos processzorok (1)

Page 47: Sima Dezső

3. Heterogén többmagos processzorok

3.2 Heterogén csatolt többmagos processzorok•

Page 48: Sima Dezső

Ötlet

A jelenlegi GPUk (Graphics Prtocessing Units) hatalmas számítási teljesítményűek, pl.

• NVIDIA GeForce GTX 260/280 (2008)

• AMD/ATI FireStream 9250 (6/2008)

3.2 Heterogén csatolt többmagos processzorok (2)

Page 49: Sima Dezső

3.2 Heterogén csatolt többmagos processzorok (3)

3.16 ábra: CPU-k és GPU-k egyszeresen pontos LP csúcsteljesítménye

Page 50: Sima Dezső

3.2 Heterogén csatolt többmagos processzorok (4)

3.17 ábra: CPUk és GPUk memória sávszélessége [GB/s]

Page 51: Sima Dezső

Not cached

3.18 ábra: A lapkafelület hasznosítása CPU-kban ill. GPU-kban

3.2 Heterogén csatolt többmagos processzorok (5)

Page 52: Sima Dezső

3.19 ábra: A GeForce GTX 280 és a Penryn lapkaméretének összehasonlítása

1400 mtrs

3.2 Heterogén csatolt többmagos processzorok (6)

Page 53: Sima Dezső

3.2 Heterogén csatolt többmagos processzorok (7)

3.20 ábra: A Geforce GTX 280 rendszerarchitektúrája

240 SP

Page 54: Sima Dezső

3.2 Heterogén csatolt többmagos processzorok (8)

3.21 ábra: Az SP-k felépítése

SP

Page 55: Sima Dezső

3.2 Heterogén csatolt többmagos processzorok (9)

3.22 ábra: Az AMD/ATI 2950felépítése

LP csúcsteljesítmény

EP LP telj. > 1 TFlops

Egyetlen PCIe kártya

Page 56: Sima Dezső

3.2 Heterogén csatolt többmagos processzorok (10)

3.23 ábra: Csatolt GPU architektúrák várható fejlődése

Integration to the chip

Page 57: Sima Dezső

4. Kitekintés

Page 58: Sima Dezső

4. Kitekintés (1)

Processor Technology Aim

Bloomfield (45 nm) desktopBeckton (45 nm) MP serverWestmare (32 nm) desktop DP server

Cores Memory channels

4 triple channel DDR3 8 quad channel FB_DIMM (2)

4/6 triple channel DDR3 4/6 quad channel DDR3

Intel Nehalem (i7) processzorcsaládja (várhatóan 2008 novemberében bejelentik)

• Integrált memóriavezérlő

• Megnövelt memória sávszélesség

• 4/6/8-magos

• Magonként kétszálas

• A hagyományos párhuzamos (64-bites) rendszerbusz leváltása nagysávszélességű soros buszra

Főbb jellemzők

Page 59: Sima Dezső

4. Kitekintés (2)

4.1 ábra: Intel asztali gépeinek várható fejlódése (roadmap)

Core2 i7 (Nehalem)Pentium4

Q4/08

Page 60: Sima Dezső

4. Kitekintés (3)

4.2 ábra: Intel processzor fejlesztési tervének részlete

Q2/09 Q3/09Q4/08 Q1/09

Page 61: Sima Dezső

4. Kitekintés (4)

Kitekintés

Heterogenous multicores

Master/slavearchitectures

Add-onarchitectures

1(Ma):M(S) 2(Ma):M(S) M(Ma):M(S) 1(CPU):1(D) M(CPU):1(D) M(CPU):M(D)

Ma: MasterS: SlaveM: Many

D: Dedicated (like GPU)H: HomogenousM: Many

M(Ma) = M(CPU)

M(S) M(D)

?M(S) M(D)

4.3 ábra: Hetererogén többmagos processzorok várható fejlődése

Page 62: Sima Dezső

Köszönöm a figyelmet!