christer svenssonchrister svensson linköpings …...processor core2 core5 stefan rusu intel system...

32
LINCE Slutet Moores lag Slutet Moores lag -vad kommer sedan? Christer Svensson Christer Svensson Linköpings Universitet S.E.E. 2010

Upload: others

Post on 26-Jul-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Slutet på Moores lagSlutet på Moores lag-vad kommer sedan?

Christer SvenssonChrister SvenssonLinköpings Universitet

SDR 2006S.E.E. 2010

Page 2: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Outline

M lMoores lagVad kommer sedan?Digital trendsDigital trendsAnalog trendsUltralåg effektSammanfattning

SDR 20062

S.E.E. 2010

Page 3: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Moores lag

SDR 20063

S.E.E. 2010

Page 4: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Moores lag

Hög risk att förutsäga slutetförutsäga slutetpå Moores lag

2010, 32nm*

8nm floor (?)

SDR 20064

S.E.E. 2010

Page 5: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Moores lagHög risk att förutsäga slutet på Moores lagJag tar dock risken

Frank (IBM) 2001: ~8nm (2030?)

Detta är 20 atomer på rad. Många fenomen hindrar mindre geometrierMånga fenomen hindrar mindre geometrier.Styreoxiden blir för tunn, tunnelingströmmar, motverkas av ”high dielectric”.Drainfältet penetrerar till source, motverkas av dubbel gate eller FINFET-strukturerAvståndet drain source för kort tunnelingströmmar

SDR 20065

S.E.E. 2010

Avståndet drain-source för kort – tunnelingströmmar.

Page 6: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Moores lag

Bohr (Intel) 2009: Klassisk skalning upphörde ~2005Därefter strained Si, high , mm.S d FINFETSedan FINFET, mm. Ger begränsad fortsättning.

Stor mängd nya problem:LäckströmmarHög effekttäthetStor parameterspridning försvårar konstruktionLångsamt ökande effekter av kosmisk strålning

SDR 20066

S.E.E. 2010

g g

Page 7: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Moores lagDelagi, TIISSCC2010

Mikroprocessorerklockfrekvens stagnerar

SDR 20067

S.E.E. 2010

Page 8: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Vad händer sedan?

Moores lag har gett oss ständigt ökande kapacitet till ständigt lägre effekt och pristill ständigt lägre effekt och pris.

En stagnation av Moores lag ger stora möjligheter g g g j gtill innovationer i kretsar, system och metoder.

Vi k fö ä t f t i fö ä d d t ktVi kan förvänta oss framsteg i oförändrad taktmed nya metoder och kompetenser.

Elektroniken tjänar allt fler marknader

SDR 20068

S.E.E. 2010

Page 9: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Vad händer sedan?

Låt mig diskutera trender idag, inom

Digitalt

Analogt

Ult lå ff ktUltralåg effekt

SDR 20069

S.E.E. 2010

Page 10: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Digitala trender

Högre beräkningskapacitet hos processorerHögre beräkningskapacitet hos processorerMulticore, 2, 4, 8, 16 …Applikationsspecifika arkitekturerAcceleratorer (MMX mm.)Massiv parallellism fortsatt mycket svårutnyttjat

Lägre effektförbrukningExploatera effekt istället för prestandaExploatera effekt istället för prestanda Applikationsspecifika arkitekturerEffektiva program

SDR 200610

S.E.E. 2010

Page 11: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Digitala trenderQPI0 QPI1

Core4Core3

QPI2 QPI3 A 45nm 8-Core Enterprise Xeon®

Processor

Core5Core2

Processor

Stefan RusuIntel

System InterfaceIntelISSCC 2009

Notera mängdenCore6Core1

Notera mängdenminne!

MinnesaccessCore7

MI MI

Core0Minnesaccessflaskhals

SDR 200611

S.E.E. 2010

Page 12: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Digitala trender

Multicore för ökad kapacitet vid fix klockfrekvens

Kräver nya operativsystem /programmeringsmetoder

Olika program på olika kärnor

Ett program på flera kärnor kräver ny kodEtt program på flera kärnor kräver ny kod

Minnesaccess är flaskhals - försämras

SDR 200612

S.E.E. 2010

Page 13: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Digitala trender

Applikationsspecifika arkitekturer

Grafikprocessorn stor framgång – gjord för grafikVektor och matrisorienteradVektor och matrisorienteradNya användningar för tunga matematiska uppgifter

Digitala signalprocessorer (DSP)

(Återkommer med fler exempel)( p )

SDR 200613

S.E.E. 2010

Page 14: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Digitala trenderDelagi, TIISSCC2010

Coresonic

SDR 200614

S.E.E. 2010

Page 15: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Digitala trender

Acceleratorer

Specialiserade processorer inom en mikroprocessor

Exempel MMX, liten SIMD-maskin inom en Pentium(Ett 64b ord behandlas som 4 16b ord på vilka man utför samma operation parallellt)utför samma operation parallellt)

Multiplikatorer, flyttalsprocessorer

Grafikprocessorer

SDR 200615

S.E.E. 2010

Page 16: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Digitala trender

Massiv parallellism

Gammal idé – fortfarande inte särskilt framgångsrik

Problem: MinnesaccessKollisioner då olika processorer accessar samma minneKollisioner då olika processorer accessar samma minneProblem att veta om minnesinformationen är aktuell

Exempel: Cell (IBM/Sony) PowerPC + stort antal små kärnorExempel: Cell (IBM/Sony), PowerPC + stort antal små kärnor

SDR 200616

S.E.E. 2010

Page 17: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Digitala trender

Lägre effektförbrukning

Under lång tid prioriterades prestanda

Metoder för låg effekt utvecklades på 90-talet(Berkeley och Linköping)(Berkeley och Linköping)Lägre matningsspänningParallella beräkningarLå t i å I/O

iidd

c CaVfP2

2

Lågt sving på I/OMinimera trafik mellan chipMindre minnen, begränsa minnesaccesserna

SDR 200617

S.E.E. 2010

Page 18: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Digitala trender

Kraven kommer nu! Avancerade mobiler, mobila datorer …Delagi, TIISSCC2010

Batterilivslängdnytt försäljningsnytt försäljnings-argument?

Men långsamt

SDR 200618

S.E.E. 2010

Page 19: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Digitala trender

Lägre effektförbrukning- exploatera effekt istället för prestanda

Vdd2

NfCVP cadd

a 2

Minskar vid skalning Kan öka vid skalning

Traditionellt: Öka prestanda (fc och N), samma effektNy trend: Behåll prestanda, minska effekt via Vdd och Ca

SDR 200619

S.E.E. 2010

Page 20: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Digitala trender

Applikationsspecifika arkitekturer

General purpose - arkitekturen kommer inte längre

Applikationsspecifikt kan ge stora vinsterExempel: Coresonics arkitektur för radio basbandExempel: Coresonics arkitektur för radio basband(Coresonic AB, Linköping)Datatyp: komplexvärda vektorerLiten kontrollenhet, effektiva instruktionerMånga parallella processer på parallella ALUer och minnen

SDR 200620

S.E.E. 2010

Page 21: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Digitala trender

host

so

r

Hos

ter

face

eler

ator

s

UIntegerComplex GU Complex GU

Memory bank #0 Memory bank #4 Integer memory

To F

EC/

proc

essH

inte

Acc

e

AG

gMemory

pMemory A

G pMemory A

G...

Frequency error Vector load/store unit Vector load/store unitolle

r

olle

r

RF Stack

On-chip network

16+16RadioBasebandProcessory

cancellation

Filter and decimation

Vector load/store unit

CA

LUD

PC

ALU

DP

CA

LUD

PC

ALU

DP

Vector load/store unit

CM

AC

DP

CM

AC

DP

CM

AC

DP

CM

AC

DP

o A

DC

/DA

C

Vect

or c

ontr

o

Vect

or c

ontr

o RF Stack

ALS

U

MA

C

PM

Processor

A NilssonCoresonicC C C C C C C C

To V V A

Digital Front-End CALU SIMD Unit CMAC SIMD Unit RISC Core 24ISSCC2008

SDR 200621

S.E.E. 2010

Page 22: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Digitala trender

Resurssnål programmering

Programmera för låg effektförbrukningHårdvarunära programmering – kräver hårdvarukunskapSpara på minnesaccessermm.

SDR 200622

S.E.E. 2010

Page 23: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Analoga trenderTrådlös teknik mot högre datatakter och nya band

LTE mot 1Gb/sMikrovågslänkar mot 10Gb/s (60…120GHz)Flexibel radio (mjukvaruradio, SDR)

Trådbunden teknik mot högre datatakterOptolänkar 100Gb/s över en våglängdp g gMultipla 10Gb/s länkar på kretskort

Lägre effektförbrukningLägre effektförbrukning

SDR 200623

S.E.E. 2010

Page 24: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Analoga trenderMoore – analogt?

Klar trend att använda digital CMOS även för analogt:

Bra: Hög integrationsgrad – lågt prisSmå geometrier – höga gränsfrekvenser (fT ~200GHz)

Dåligt:Låga matningsspänningar (~1V)g g p g ( )Mer parasiter, stor spridning

SDR 200624

S.E.E. 2010

Page 25: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Analoga trenderTrådlös teknik mot högre datatakter och nya band

Mobil radio utvecklas vidare – LTEupp till 1Gb/s (multipla antenner)massor av band (698 2690 MHz)massor av band (698-2690 MHz)stora krav på teknologiutvecklingen

Mikrovågslänkar för backhauldatatakter upp till 10Gb/snya band 60-120GHzy(Pågående Vinnova-projekt, Chalmers, Ericsson, LiU, Bitsim mfl.)

SDR 200625

S.E.E. 2010

Page 26: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Analoga trenderTrådlös teknik – exempel på ny teknologi

Mjukvaruradiosamma hårdvara för alla band och modulationerexempel på utmaning: multiband PA med hög verkningsgrad för komplex modulation

SDR 200626

S.E.E. 2010

Page 27: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Analoga trenderWide band Class D outphasing PA

Jonas FritzinLiU 2010LiU 2010

Demo visar uppfylld EDGE 32-QAM spektrum utan fördistortion

Pmax=10.3dBm, PAE=33% vid 2GHz. Bandbredd 2GHz (1…3GHz)

SDR 200627

S.E.E. 2010

Page 28: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Analoga trenderTrådbunden teknik mot högre datatakter

10-20Gb/s per trådpar, kretskort och bakplanfinns upp till 10Gb/s även på FPGA

100Gb/s Ethernet per våglängd i optiska nätkräver mer avancerad modulationexempel på utmaning: 28 eller 56GS/s ADC

Exempel: 2 4GS/s 5b 320mW ADC Med interleaving kanExempel: 2.4GS/s, 5b, 320mW ADC. Med interleaving kanman erhålla önskad datatakt (Timmy Sundström, LiU 2010)

SDR 200628

S.E.E. 2010

Page 29: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Analoga trenderLägre effektförbrukning

Ganska liten forskning på analog effektförbrukning(tills nu?)

Exempel sampler: DkTfP s16

SamplingfrekvensDynamiskt område

Vanligaste ”fel”: för stora säkerhetsmarginaler

SDR 200629

S.E.E. 2010

Page 30: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Analoga trender

Analog

Jämförelse mellan analogt och digitalt.1 l fil

g

Digital 350nm

1-pols filter

Digital 90nm

SDR 200630

S.E.E. 2010

Page 31: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Ultralåg effekt

Ultralåg effektförbrukning möjliggörUltralåg effektförbrukning möjliggör system med 10-20 års batterilivslängdsystem som klarar sin egen energiförsörjningsystem som klarar sin egen energiförsörjning(energy harvesting)

ApplikationerApplikationerIdentifieringsetiketter (RFID)Distribuerade sensorsystemDistribuerade sensorsystemInplanterade biosensorer

SDR 200631

S.E.E. 2010

Page 32: Christer SvenssonChrister Svensson Linköpings …...Processor Core2 Core5 Stefan Rusu Intel System Interface ISSCC 2009 Notera mängden Core1 Core6 minne! Minnesaccess Core7 MI MI

LINCE

Sammanfattning

Moores lag närmar sig successivt ett slutMoores lag närmar sig successivt ett slut

Massor kvar att exploatera hos kiselteknikenMassor kvar att exploatera hos kiseltekniken

SDR 200632

S.E.E. 2010