evaluarea performantelor

Upload: doryangray5

Post on 13-Jul-2015

426 views

Category:

Documents


2 download

TRANSCRIPT

1. Noiuni de baz privind evaluarea performanelorBenchmarking este un proces utilizat n management i n particular management strategic, n care organizaia evalueaz mai multe aspecte ale propriilor procese n relaie cu "best practice" (succesul), de obicei n interiorul sectorului propriu de activitate. Acest proces permite organizaiilor s dezvolte planuri despre cum s adopte aceste poveti de succes (best preactice), cu scopul de a obine creteri n performanei. Benchmarking-ul poate fi un eveniment de singular, dardeseori este tratat ca un proces continuu n care organizaia caut n mod permanent s-i mbunteasc practicile. Traducere: Bench-mark = (inf) mulime bench-mark (mulime cu un numr minim de lucrri, utilizat pentru evaluarea performanelor);

1.1. Benchmark-ul organizaiilor1.1.1. Avantajele benchmarking-ului Benchmarking-ul este o unealt de management puternic deoarece nvinge "paradigmul orbului", paradigm care poate fi rezumat la modul de gndire, adic astfel: "Calea pe care o urmm este cea mai bun, deoarece este calea pe care o urmm ntotdeauna". Benchmarkingul deschide organizaiile ctre noi metode, idei i mijloace pentru ai mbunti eficacitatea. El ajut la nvingerea rezistenei naturale mpotriva schimbrilor prin demonstrarea altor metode utilizabile n rezolvarea problemelor i demonstreaz c aceste metode funcioneaz fiind folosite i de alii. Avantajele benchmarking-ului asupra companiilor: O mai bun nelegere asupra ateptrilor clienilor deoarece benchmark-ul este bazat pe realitatea pieei estimate ntr-un mod obiectiv; O planificare economic mai bun a scopurilor i obiectivelor de atins n companie deoarece ele sunt: centrate pe ce are loc n afara spaiului controlat i stpnit; O mai bun cretere a productivitii: rezoluia problemelor reale prin nelegerea proceselor i a ceea ce produc ele; O practic curent mai bun; O mai competitivitate datorit: nelegerii solide a competiiei cu o puternic implicare a noilor idei de vrf n practic i n testarea noilor tehnologii. Benchmark-ul are consecine care sunt dincolo de procesul nsui: el reformeaz toate nivelurile companiei, modific procesul de producie, reformeaz organizarea ierarhic a companiei, producia nsi, i mentalitatea angajailor. 1.1.2. Procedura de realizare a benchmark-ului Identificarea zonelor cu probleme - deoarece benchmakingul poate fi aplicat oricrui proces sau funcii economice, pot fi necesare o serie de tehnici de cercetare. Acestea includ: conversaii informaionale cu clienii, angajaii sau5

Evaluarea performanelor sistemelor de calcul

furnizorii; tehnici de cercetarea exploratorii, cum ar fi: grupul int, cercetri de marketing, cantitative, supraveghere, chestionare, analiz inginereasc, harta procesului, controlul calitii, analiza indicatorilor financiari: Identificarea organizaiilor care sunt lideri n aceste probleme Examinarea, supravegherea companiilor pentru msurtori i practic companiile ating anumite procese de afaceri folosind examinri detaliate ale msurtorilor i practicilor utilizate pentru a identifica procese alternative i companii de vrf. Supravegherea este realizat, de obicei, asociai i/sau consultani neutri, pentru a proteja datele confideniale; Vizitarea companiilor de succes pentru a identifica cele mai bune metode (practici) companiile sunt de obicei de acord cu schimbul mutual de informaii n interes comun pentru un grup de benchamark i a mpri rezultatele n interiorul grupului, Implementarea i mbuntirea noilor practici acumulate preluarea celor mai bune practici (metode) i dezvoltarea planurilor de implementare care includ identificarea oportunitilor specifice, finanarea proiectului i vnzarea ideilor ctre organizaie n scopul obinerii valorilor demonstrative ale procesului.

1.1.3. Costul benchmarking-ului Benchmarking-ul este un proces cu un cost moderat-scump. Principalele trei tipuri de costuri sunt: Costuri cu deplasri cheltuieli cu transportul, cazarea, diurna, cadouri simbolice, i pierderea timpului cu munca; Costuri cu timpul membrii echipei de benchmark vor investi timp n cercetarea problemelor, gsirea celor mai bune companii pentru studiu, vizitare i implementare. Acest timp este luat din timpul dedicat activitilor curente de producie; Costul bazei de date de benchmarking - organizaiile ca au instituionalizat benchmarkingul n procedura zilnic creeaz i ntrein o baz de date cu best practice i cu companiile asociate fiecrui succes.

1.2. Benchmarking-ului n computeren domeniul computerelor, benchmarking-ul nseamn rularea unui program de calculaor, sau a unui set de programe sau alte operaii, cu scopul de a stabili performanele relative a unui obiect, normal prin rularea a unui numr de testa standard sau de ncercare asupra lui. Termenlul benchmark mai este de asemenea folosit de specialiti pentru a defini nsi programele de testare. Benchmarking-ul este de obicei asociat cu evaluarea performanelor componentelor hardware caracteristice ale calculatoarelor, de exemplu, testarea performanelor procesoarelor la operarea n virgul mobil. Testarea poate fi aplicat, de asemenea, i software-uli, n special n testarea compilatoarelor sau a bazelor de date de management a sistemului. Benchmark-urile ofer o metod de comparare a performanelor diferitor tipuri de subsisteme n combinaie cu diferite sisteme. Benchmark-ul este util n nelegerea modului n care managerul bazei de dare rspunde n diferite condiii. Pot fi create scenarii care testeaz blocarea definitiv a manipulrii, utiliti de performan, diferite6

Cap 1: Noiuni de baz privind evaluarea performanelor

metode de ncrcat date, caracteristica ratei de tranzacie cnd sunt conectai mai muli utilizatori i chiar efectele utilizrii unei versiuni noi a produsului. 1.2.1. Scopul benchmarking-ului Odat cu avansarea arhitecturii calculatoarelor, este din ce n ce mai dificil compararea performanelor diferitelor sisteme de calcul doar prin analizarea specificaiilor lor. Astfel, au fost dezvoltate teste care pot fi realizate pe diferite sisteme, permind compararea rezultatelor obinute pe sisteme diferite. De exemplu, n tip ce un procesor Intel Pentium 4 opereaz n general la frecvene mai mari dect AMD Athlon XP, asta nu nseamn n mod automat mai mult putere de calcul,. Cu alte cuvinte, un procesor AMD "mai lent" din punct de vedere al frecvenei de ceas, poate realiza la fel de bine un test de benchmark ca un procesor Intel ce funcioneaz la o frecven mai mare. Benchmark-urile sunt destinate a imita un anumit tip de suprasarcin pe un calculator sau sistem. Benchmarking-ul "sintetic" realizeaz testarea prin programe special create care impun o suprasarcin componentei evaluate. Benchmark-ul "aplicaie" ruleaz un program din lumea real pe sistem. n timp ce benchmark-ul aplicaie ne d o msur mult mai bun a performanelor reale ale sistemelor, benchmark-ul sintetic i are utilitatea n testarea individual a unor componente, cum ar fi hard discuri sau dispozitive de reea. Benchmark-urile sunt importante n special n proiectarea micorprocesoarelor, oferind arhitecturii procesorului abilitatea de a msura i realiza optimizarea deciziilor din proiectarea micro arhitectural. De exemplu, dac un benchmark ne ofer algoritmul cheie pentru o aplicaie, el va conine aspecte ale performanelor sensibile ale acelei aplicaii. Rulnd aceasta ntr-o bucl mult mai strmt pe un simulator ciclic precis, putem obine indicii privind mbuntirea performanelor. Productorii de calculatoare au o lung istorie n ncercarea de a-i seta (proiecta) sistemele pentru a obine performane mai nalte, nerealiste, n testele de benchmark care nu se regsesc i n utilizarea real. De exemplu, prin 1980 unele compilatoare puteau detecta o operaie specific matematic folosit n cunoscutul benchmark n virgul mobil i nlocuiau operaia cu o operaie matematic echivalent care este mult mai rapid. Dar, o asemenea transformare era rareori utilizat n afara benchmark-ului , pn la mijlocul anilor 1990, cnd arhitecturile RISC1 i VLIW2 au evideniat importana tehnologiei compilrii n atingerea performanelor. Benchmarkurile sunt acum frecvent utilizate de dezvoltatorii de compilatoare pentru a mbunti nu numai propriul scor, dar i performanele reale ale aplicaiilor. Productorii raporteaz de obicei doar benchmark-urile (sau aspecte ale acestora) care pun produsul lor ntr-o lumin bun. Este de asemenea cunioscut metoda de a denatura semnificaia benchmark-urilor, doar pentru a pune ntr-o lumin mai bun propriile produse. Luate mpreun, aceste practici sunt numite "benc-marketing". 1.2.2. Provocri Benchmarking-ul nu este uor i deseori implic mai multe runde iterative nainte de a obine concluzii predictibile i utile. Interpretarea datelor benchmark-ului

1 2

RISC = reduced instruction set computer VLIW = Very Long Instruction Word 7

Evaluarea performanelor sistemelor de calcul

este, de asemenea, extraordinar de dificil. Iat cteva din provocrile normale ale benchmarking-ului: productorii au tendina de a potrivi specificaiile produselor dup standardele industriale; benchmark-urile n general nu dau nici o garanie pentru calitatea serviciilor. Exemple de ne-msurare a calitii serviciilor includ: securitatea, disponibilitatea, fiabilitatea, integritatea execuiei, durata de serviciu, scalabilitatea (n special abilitatea de a aduga sau modifica capaciti n mod nedistructiv); n general, benchmark-urile nu msoar TCO3. Specificaiile TCP4 Benchmark se adreseaz parial asupra costului de proprietate prin specificarea faptului c trebuie utilizat o metric pre/performan. Benchmarkul rareori msoar performanele din lumea real a sarcinilor mixate rularea unor aplicaii multiple concureniale ntr-un context multidepartamental / multi-aplicaie. De exemplu, serverul mainframe IBM exceleaz n sarcini mixate, dar standardele industriale de evaluare nu tind s msoare puterea I/O i design-ul mare i rapid al memoriilor de care are nevoie serverul. Multe alte arhitecturi de server dicteaz o funcie fix, un scop unic: server de baze de date, server de aplicaii, server de fiiere, server web; Productorii de benchmark-uri tind s ignore necesitile pentru capacitile de dezvoltare, testare i recuperarea n caz de dezastru. Productorilor le place s se raporteze doar la necesitile restrnse ale capacitilor de producie. Benchmark-urile au probleme n adaptarea la lumea serverelor distribuite, n special datorit sensibilitii topologiei reelelor; Utilizatorii pot avea percepii foarte diferite a performaneei pe care benchmarkul o poate sugera. n particular, utilizatorii apreciaz predictabilitatea servere care ntotdeauna ndeplinesc sau depesc SLA5. Bgenchmark-ul tinde s accentueze un scor (din perspectiva IT). Multe arhitecturi de servere se degradeaz dramatic la un nivel ridicat de utilizare (apropiat de 100%) - ("fall off a cliff" = cdere n pant, brusc), dar benchmark-ul nu ia ntotdeauna n calcul acest factor. Productorii au tendina s publice rezultatele benchmark-ului pentru o utilizare constant de 80% a serverelor, o situaie total nereal, i s nu ne informeze despre ce se ntmpl la suprancrcarea sistemului, cnd vrful de sarcin trece epste acest prag. 1.2.3. Tipuri de benchmark 1. Real program o Software de procesare text; o Unelte software CDA o Aplicaii utilizator (MIS) 2. Kernel o Conine codul cheie; o n mod normal abstract de la programul actual ; o Kernel normal: bucle Livermore;3 4

TCO = Total cost of ownership TCP Benchmark = Transaction Processing Performance Council 5 SLA = Service Level Agreement 8

Cap 1: Noiuni de baz privind evaluarea performanelor

3.

4.

5. 6.

linpack benchmark (cnine subrutine algebrice lineare scrise n limbajul FORTRAN); 6 o rezultatele sunt prezentate n MFLOPS Toy Benchmark/ micro-benchmark o Utilizatorii le pot programa i utiliza pentru a testa componentele de baz ale calculatorului; o Detecteaz automat parametrii componentelor hardware ale calculatoarelor, cum ar fi: numr de nregistrare, dimensiune cache, ntrzierea memoriei; Synthetic Benchmark o Procedura pentru programarea unui synthetic Bench mark Se culeg date statistice despre toate tipurile de operaii de la programele de aplicaii; Se obine proporia fiecrei operaii Se scrie un program bazat pe proporiile obinute anterior. o Tipuri de Synthetic Benchmark: Whetstone Dhrystone o Rezultatele sunt reprezentate n KWIPS (kilo whetstone instructions per second). Acest test nu este adecvat pentru a msura pileline-ul (conductele) computerelor. I/O benchmarks Benchmark-uri paralele: sunt utilizate pe maini cu procesoare multiple sau sisteme ce onstau din mai multe maini.o

1.3. Arhitectura calculatoarelorn viziune clasic, arhitectura calculatorului este vzut c o serie de straturi abstracte: Hardware este un termen utilizat n general Fig. 1.1: O viziune tipic asupra pentru deschierea componentelor fizice ale arhitecturii calculatorului ca o sistemului, serie de straturi. Firmware este un software scris (ars) de productori n componentele hardware (cipuri); Assembler program utilitar folosit pentru traducerea limbajului de asamblare (care este un limbaj low-level pentru programarea calculatoarelor); Kernel reprezint componenta central a oricrui sistem de operare al computerului, el administreaz resursele sistemului i comunicarea dintre componentele hardware i software; sistem de operare reprezint un set de programe care administreaz resursele hardware i software ale unui computer; aplicaii.

6

MFLOPS = FLoating point Operations Per Second, operaii n virgul mobil pe secund 9

Evaluarea performanelor sistemelor de calcul

n ingineria calculatoarelor, arhitectura calculatoarelor este un design conceptual i structurarea funcionrii fundamentale a unui sistem de calcul. Ea reprezint copia fidel i descrierea funcional a cerinelor (n special viteze i interconexiuni) i designul implementrii pentru diferite pri ale calculatorului, concentrndu-se pe larg asupra modului n care unitatea central de calcul (procesorul) realizeaz funciile sale interne i acceseaz adresele din memorie. Arhitectura calculatoarelor cuprinde cel puin trei ari categorii: arhitectura setului de instruciuni, sau ISA, - este o imagine abstract a sistemului de calcul care este vzut de limbajul main (limbajul de asamblare), i include setul de instruciuni, modul de adresare al memoriei, regitrii procesor i adresarea i formatul datelor; micro-arhitectura, cunoscut ca i organizarea calculatorului, - este de nivel sczut, mai concret, descrierea sistemului care implic cum prile constituente ale sistemului sunt interconectate i cum inter-opereaz ele pentru a implementa ISA. De exemplu, dimensiunea memoriei cache, este o caracteristic organizaional care, n general, nu are nimic n comun cu ISA. designul sistemului, care include toate celelalte componente hardware din calculator, cum ar fi: o sistemul de interconectare: magistrale i comutatoare; o controllerul de memorie i ierarhie; o mecanismul de acces direct la memorie al CPU; o faciliti ca multiprocesarea. Odat ce ISA i microarhitectura au fost specificate, dispozitivul trebuie s fie proiectat n hardware. Acest proces de design, proiectare, este deseori denumit implementare. Implementarea nu este considerat ca fcnd parte din arhitectura calculatorului, ci, mai degrab, din ingineria proiectrii. Implementarea poate fi mprit n trei pri, i anume: implementarea logic n care blocurile definite n microarhitectur sunt implementate ca ecuaii logice; implementarea circuitului n care blocuri de vitez critic, sau ecuaii logice sau pori logice sunt implementate la nivel de tranzistor; implementarea fizic n care circuitele sunt desenate, componente de circuit diferite sunt plasate n planul chipului sau pe plac i sunt trasate conexiunile dintre piese. Pentru procesoare, ntregul proces de implementare se numete CPU design. 1.3.1. Scopurile proiectrii Cele mai comune ine n arhitectura calculatoarelor este realizarea echilibrului dintre cost i performan (ex: vitez), alturi de alte consideraii, cum ar fi: dimensiunea, greutatea, fiabilitatea, setul de faciliti, expandabilitatea i consumul de energie. Costul n general costul este meninut constant, determinat de cerineele de sistem sau comerciale; Performana n general, performana calculatorului este descris n termeni de vitez de ceas (MHz sau GHz). Aceasta se refer la cicluri pe secund ale ceasului procesorului. Dar,10

Cap 1: Noiuni de baz privind evaluarea performanelor

de multe ori aceast msur este greit neleas, deoarece o main cu o frecven de ceas mai mare nu este obligatoriu s ating performane mai nalte. Drept rezultat, productorii sau ndeprtat de msurarea performanelor prin msurarea frecvenei procesorului. Performanele calculatorului mai pot fi, de asemenea, msurate prin dimensiunea memoriei cache. Drept analogie s luam traficul auto, dac viteza mainii este dat n MHz sau n GHz, lipsa aglomeraiei de pe autostrad este dat de mrimea cache. Nu conteaz ct de mare este viteza unei maini, dac autostrada este aglomerat (cache mic) performanele vor fi reduse. Cu ct viteza este mai mare, cu att mai mare este necesarul de cache. Procesoarele moderne pot executa mai multe instruciuni pe un ciclu de ceas, ceea ce crete dramatic viteza de execuie a unui program. Un alt factor care influeneaz viteza este mixarea unor uniti funcionale, viteza magistralei, disponibilitatea memoriei i tipul i ordinea instruciunilor din programul care ruleaz. Sunt dou tipuri principale de vitez: latena i puterea de trecere (throughput). Latena este timpul dintre nceputul procesului i terminarea lui. Puterea de trecere reprezint cantitatea de munc realizat pe unitate de timp. Latena de ntrerupere7 este garantarea timpului maxim de rspuns a sistemului la un eveniment electronic (ex: cnd HDD termin de mutat datele dintr-un loc n altul). Performana este afectat de o foarte mare plaj de alegeri fcute n proiectare de exemplu, adugarea de cache face latena mai proast (lent) dar crete puterea de trecere. Calculatoarele care controleaz maini (calculatoarele de proces) necesit, de obicei, o laten de ntrerupere sczut. Aceste calculatoare opereaz n timp real i produc eec dac o operaie nu este terminat ntrun anumit interval de timp. Performana unui calculator poate fi msurat folosind alte metrici, dependente de domeniul de aplicaie. Consumul de energie a devenit important n sistemele server i cele portabile. Benchmarking-ul ncearc s ia n considerare toi aceti factori n procesul de msurarea a timpului de execuie a unei serii de programe de test. Cu toate c benchmark-ul ne d puterea, el nu ne poate ajuta n alegerea unui calculator. De cele mai multe ori, msurarea unei maini nseamn mai multe msurtori. De exemplu, un sistem poate realiza rapid aplicaii tiinifice, iar un altul poate rula jocuri video la mod mult mai uor. Schema general a optimizrii este de a cuta costurile diferitor pri componente al calculatorului. ntr-un sistem de calcul echilibrat, rata de transfer a datelor va fi constant pentru toate prile sistemului, i costul va fi alocat proporional pentru a asigura acest lucru. Forma exact a unui sistem de calcul va depinde de constrngerile i scopurile pentru care va fi optimizat. Consumul de energie Consumul de putere este un alt criteriu de design. Eficiena energetic poate fi deseori tratat pentru performan sau eficien economic. Odat cu creterea densitii de energie n circuitele numerice moderne datorat creterii numrului de tranzistori din chip, eficiena energetic a crescu ca importan. Designul procesoarelor moderne, cum este i IntelCore 2 pune un accent mai mare pe creterea eficienei energetice. Astfel, n lumea calculatoarelor capsulate, eficiena energetic a fost i rmne principala int n proiectare, alturi de performan.latena de ntrerupere - timpul scrus de la generarea unei ntreruperi de ctre un dispozitiv i deservirea acelui disozitiv. 117

2. Evaluarea performanelor plcilor de baz2.1. Plcile de baz: funcionare, istorie2.1.1. Definiii de baz: chipset-ul Chip-ul reprezint denumirea pentru un circuit integrat, construit pe baz de siliciu, care are un rol bine definit n funcionarea unui echipament electronic. Procesorul, memoria, placa de baz, placa grafic, placa de sunet, toate nglobeaz unul sau mai multe astfel de chip-uri, fiecare avnd rolul su, ce poate fi ori de execuie a anumitor operaii, ori de memorare a unor date, de obicei temporar. Spre exemplu, funcia procesorului este uor de neles: execuia propriu-zis a operaiilor necesare desfurrii activitilor unui computer. Placa grafic deine un chip principal ce efectueaz operaii similare dar optimizate pentru domeniul grafic, att 2D ct i 3D. Memoria nu face altceva dect s stocheze temporar informaii necesare celorlalte echipamente. Am ajuns la placa de baz, al crei rol este mai greu de neles. Muli vor considera c singurul ei rol este acela de a lega componentele ntre ele, aadar ce nevoie mai avem de chip-urile prezente pe ea? n primul rnd, placa de baz nu este pur i simplu un element de legtur ci componenta principal a unui sistem, care coordoneaz toate activitile. Ea joac rol de arbitru i direcioneaz fluxurile de date ntre procesor i memorie, memorie i hard disk, procesor i tastatur i altele asemenea. Nimic nu poate funciona pur i simplu, este nevoie de o component suprem care s tie s foloseasc resursele celorlalte componente dintr-un PC. Un astfel de echipament poart numele de controller. Putem spune c placa de baz este un controller general, diferitele segmente ale ei oferind funcia de controller local. De exemplu, controller-ul de memorie este circuitul care d via memoriei, fr el minunatele memorii DDR PC3200 vor fi alimentate cu energie i nimic mai mult, neexistnd nimeni care s exploateze posibilitile oferite de ele.

(plac de baz pentru procesoare 486)

(plac de baz modern: Epox 4PCA3+)

Controller-ul principal al plcii de baz este denumit chipset, fiind format de obicei din dou chip-uri independente (de aici denumirea de chipset = set de chip-uri). Ele poart numele de northbridge i southbridge (aceasta n ciuda ncercrii unor companii de a le schimba aceste nume deja ncetenite). Sau altfel spus, puntea de nord i cea de sud (evident c nu exist nici o legtur cu punctele cardinale, nordul i sudul fiind alese pentru a sublinia poziiile opuse pe care le au aceste chip-uri, aproape simetrice fa de centrul plcii). Fiecare dintre ele are un rol bine determinat, rol care depinde de la chipset la chipset dar exist multe elemente comune ntre diferitele modele. Numrul tipurilor de chipset-uri aprute de-a lungul istoriei este foarte mare, ns numrul celor folosite ntr-o anumit perioad a evoluiei PC-urilor este relativ mic.12

Cap 2: Evaluarea performanelor plcilor de baz

Voi folosi n continuare denumirile de chipset, northbridge i southbridge chiar dac ele nu sunt 100% corecte, n primul caz pentru c unele chipset-uri sunt de fapt simple chipuri (nordul se contopete cu sudul), fiind prezent un singur integrat principal pe placa de baz ce joac dublu rol, iar n ultimele cazuri pentru c schimbarea forat a denumirilor de ctre productori (un exemplu fiind Intel) este ntemeiat i relevant. Aceast prim parte a capitolului intenioneaz, pe de o parte, s fac lumin printre utilizatorii de calculatoare care nu cunosc principiile funcionrii plcilor de baz moderne i nici nu sunt la curent cu ultimele evoluii de chipset-uri i, pe de alt parte, s ofere pasionailor o scurt istorie a acestui domeniu. Cum o istorie a modelelor de plci de baz este inutil i practic imposibil de realizat, numrul lor fiind de ordinul miilor, vom parcurge chipset-urile prezente n epoca modern a calculatoarelor, insistnd pe perioada ultimilor 5-6 ani i exemplificnd acolo unde este cazul cu modele de plci care au rmas cu adevrat n istorie. Pentru nceput, vom vorbi despre modelul clasic de chipset, format din northbridge i southbridge, componente ce ndeplinesc anumite sarcini standard: northbridge-ul este rspunztor de comunicarea cu procesorul, cu memoria, cu portul AGP i/sau PCI Express (dac cel puin unul dintre ele exist) iar southbridge-ul cu tot ce nseamn periferic: uniti de stocare (porturile IDE i cel de floppy), slot-urile PCI i ISA i interfeele externe, cum ar fi cea USB, FireWire, reeaua sau sunetul. Comunicarea dintre cele dou componente principale este realizat la o vitez maxim predefinit, care este de regul egal cu cea a bus-ului PCI (133 MB/s), eventual multiplicat de un numr de ori. (Vom vedea mai trziu ce este un bus.) Spre exemplu, comunicarea dintre nordul i sudul chipset-ului VIA KT133A este realizat la viteza bus-ului PCI, la KT266A ea este (cu ajutorul tehnologiei V-Link) de 266 MB/s iar n cazul lui KT400 la 533 MB/s (V-Link 8x). Aceasta nseamn c fluxul de date nu poate depi aceast limit, deci degeaba avei un hard disk Serial ATA cu un transfer de 150 MB/s (iari, maxim) dac exist limitarea de 133 MB/s. n realitate, aceste limite nu influeneaz aproape deloc performana unui sistem, necesarul fiind mai mare dect limita ntr-un numr infim de situaii; dac hard disk-ul dorete s transfere 150 MB/s ntr-o situaie dintr-o mie i nu-i pot fi satisfcui dect 133 MB/s, rezult faptul c viteza sa a fost diminuat cu un procent total nesemnificativ. Productorii de chipset-uri se lupt n aceast pseudo-competiie a bus-urilor, recent depindu-se 1 GB/s. ntradevr, arat bine pe hrtie. Dup cum ai putut observa, fiecare component a sistemului trebuie controlat de cineva. Plcile PCI sunt, la rndul lor, un fel de controllere, ele fiind rspunztoare de activiti conexe, cum ar fi emiterea de sunet n boxe (plcile de sunet), preluarea semnalului din linia telefonic (modemul) sau prelucrarea semnalului TV (TV tuner-ul). Mai mult, unele plci chiar se numesc controllere i ndeplinesc funcia de suport pentru unele componente externe pe care placa de baz nu le cunoate. Spre exemplu, dac placa de baz nu deine integrat suportul pentru interfaa FireWire, o simpl plac PCI poate ndeplini sarcina. Sau, mai exist situaia n care controller-ul nu este nici integrat n chipset-ul plcii de baz, nici prezent sub forma unei plci suplimentare; el este pur i simplu integrat pe plac, sub forma unui chip, fiind considerat un dispozitiv obinuit, ataat adesea la bus-ul PCI. Northbridge-ul este componenta principal a chipset-ului, de el depinznd practic performana sa. Un controller de memorie bun poate oferi mai mult vitez, i13

Evaluarea performanelor sistemelor de calcul

aceasta ne putem da seama parial doar privind specificaiile. S lum nite exemple: VIA KT266A i KT333. Primul poate lucra cu memorie DDR la frecvena de 133 MHz, al doilea poate crete viteza acesteia la 166 MHz, de unde rezult performane mai bune. Exist i alt situaie, aceea n care specificaiile sunt aceleai dar performanele difer: KT266A este mai rapid dect KT266, dei ambele suport acelai tip de memorie, din cauza optimizrilor interne. Uneori, aceste optimizri depesc n eficien fora brut a creterii frecvenei, cum este i n cazul de fa: saltul de performan de la KT266 la KT266A este mai mare dect n cazul comparaiei KT266A - KT333. Exist mai multe tipuri de controllere de memorie, n funcie de tipul acesteia. Unele pot lucra i cu memorie SDR i cu cea DDR, altele sunt dedicate special celor de tip Rambus, altele ofer tehnici de dublare a vitezei efective (nc o dat fa de DDR); este vorba de tehnologia dual-channel. Iar alte chipset-uri nici nu conin acest controller, el fiind integrat n procesor, precum este cazul procesoarelor din familia AMD64. A doua sarcin principal a northbridge-ului este comunicarea cu procesorul. Aici apar diferenele fundamentale dintre chipset-uri i de aceea exist incompatibiliti ntre anumite chipset-uri i anumite procesoare. Limbajul folosit pentru comunicare trebuie s fie comun i, din cauza faptului c exist mai multe generaii i mai multe companii care produc procesoare, exist i mai multe standarde n ceea ce privete chipset-urile. Astfel, gsim cteva platforme distincte: Athlon XP (Socket A), Pentium 4 (Socket 478, LGA 775), Athlon 64 (Socket 754 i 939) i exemplele pot continua. Pentru fiecare din ele exist o serie de chipset-uri care cunosc limbajul procesoarelor n cauz i astfel pot dota plci de baz corespunztoare acestora. Acest limbaj, care permite comunicarea pe aceeai lungime de und ntre orice dou componente dintrun sistem, se numete bus. Deja se nate o ntrebare fireasc: care este viteza de comunicare dintre northbridge i procesor? Aceast vitez este dat de PSB (Processor Side Bus), variaz n funcie de procesor dar i de setrile plcii de baz i se msoar n MHz. Procesoarele pn la Pentium III aveau acest PSB setat la frecvene ntre 66 i 133 MHz (nu vorbim aici de creterea artificial, adic overclocking). Pentru procesoarele din familia AMD K7 (Athlon, Athlon XP, Duron), el variaz ntre 100 i 200 MHz, n funcie de procesor, frecven care este multiplicat cu 2. n termeni electronici, spunem c informaia este transmis att pe frontul cresctor ct i pe cel descresctor al semnalului, de unde rezult o dublare a vitezei (i nu o dublare a frecvenei), tehnic folosit i la memoria DDR. Departamentele de marketing au profitat imediat de situaie i au afirmat c FSB-ul procesoarelor Athlon este de 200-400 MHz, afirmaie teoretic greit, practic neafectnd cu nimic adevrul palpabil. Pentium 4 folosete un mecanism asemntor prin care multiplic de patru ori PSB-ul, rezultnd 400, 533, 800 i 1066 MHz virtuali n loc de 100, 133, 200 i 266. Bus-urile AGP i PCI Express reprezint a treia sarcin a northbridge-ului. Orice sistem modern deine o plac grafic cu capabiliti 3D, component care comunic cu northbridge-ul prin bus-ul AGP sau PCI Express X16. Frecvena celui AGP este de 66 MHz, egal cu dublul frecvenei PCI, ns ea este multiplicat opional de un numr de ori, corespunztor x-ului indicator: AGP 2x, AGP 4x, AGP 8x, ultimul oferind valoarea impresionant de 2.1 GB/s. Sunt valabile aceleai considerente de la comunicarea dintre14

Cap 2: Evaluarea performanelor plcilor de baz

cele dou componente ale chipset-ului, aadar necesarul efectiv este n majoritatea cazurilor mult mai mic dect cel oferit de AGP 8x. Drept dovad, micorarea forat a transferului la nivelul lui AGP 2x nu scade performanele cu mai mult de 10-30%. n cazul lui PCI Express, lucrurile stau altfel: att bus-ul X16, necesar plcii grafice (eventual X8 n unele cazuri), ct i cele destinate plcilor obinuite (X1, X4) sunt gestionate de northbridge. Frecvena sa este de 100 MHz, iar rata de transfer n modul 1x este similar lui AGP 1x i dubl fa de PCI. 2.1.2. Memoria, tipuri de memorie Memoria RAM (Random Access Memory) este denumirea generic pentru orice tip de memorie care deine urmtoarele caracteristici: poate fi accesat aleator (nu secvenial, precum benzile magnetice), este volatil (la ntreruperea alimentrii cu energie electric, datele stocate se pierd) i , se prezint sub form de chip-uri (aadar excludem dispozitivele magnetice sau optice, precum hard disk-urile sau CD-urile). Utilitatea memoriei RAM este foarte mare, ea beneficiind n plus fa de alte medii de stocare a informaiilor de o vitez extrem de mare, fiind de mii de ori mai rapid dect un hard disk, de exemplu. Exist dou tipuri principale de RAM: memorie static (SRAM = Static RAM) i dinamic (DRAM = Dynamic RAM), diferenele constnd n stabilitatea informaiilor. Astfel, memoria static pstreaz datele pentru o perioad de timp nelimitat, pn n momentul n care ea este rescris, asemntor unui mediu magnetic. n schimb, memoria dinamic necesit rescrierea permanent, la cteva fraciuni de secund, altfel informaiile fiind pierdute. Avantajele memoriei SRAM: utilitatea crescut datorit modului de funcionare i viteza foarte mare; dezavantaj: preul mult peste DRAM. n realitate, memoria de tip SRAM este folosit cel mai adesea ca memorie cache pe cnd DRAM-ul este uzual n PC-urile moderne, fiind prezent n primul rnd ca memorie principal a oricrui sistem. De acest din urm tip ne vom ocupa n continuare, enumernd tipurile uzuale de DRAM prezente de-a lungul istoriei, toate concepute n scopul creterii performanelor DRAM-ului standard: FPM DRAM (Fast Page Mode DRAM), EDO DRAM (Extended Data Out DRAM), BEDO RAM (Burst EDO DRAM), RDRAM (Rambus DRAM), n prezent impunndu-se SDRAM (Synchronous DRAM), cu variantele DDR SDRAM (Double Data Rate SDRAM) i DDR2 SDRAM. De asemenea, pentru plcile grafice au fost concepute mai multe tipuri de memorie, printre care VRAM (Video RAM), WRAM (Windows RAM), SGRAM (Synchronous Graphics RAM) i GDDR3, ele fiind variante de DRAM (primele dou), SDRAM i respectiv DDR2 SDRAM, optimizate pentru a fi folosite ca memorie video. Ar mai fi de menionat alte dou elemente care influeneaz viteza, stabilitatea i preul memoriilor: funciile ECC i Registered, integrate n unele module de memorie. Cele ECC (Error Correction Code) dein o funcie special care permite corectarea erorilor ce apar pe parcursul utilizrii iar cele Registered (numite i Buffered), dein un buffer (zon de memorie suplimentar) care depoziteaz informaia nainte ca ea s fie transmis controller-ului, permind verificarea riguroas a acesteia. Memoriile Registered sunt mai lente dect cele normale sau ECC i extrem de scumpe, folosirea lor fiind justificat doar n cazuri speciale, cnd corectitudinea15

Evaluarea performanelor sistemelor de calcul

informaiilor prelucrate i stabilitatea sistemului este vital, de exemplu n cazul serverelor. n general, att timp ct memoria nu este supus unor situaii anormale de funcionare (frecven, tensiune sau temperatur n afara specificaiilor) ea ofer o stabilitate extrem de apropiat de perfeciune, arhisuficient pentru un calculator obinuit. Ne-am referit pn acum la chip-urile de memorie, cnd vine vorba de modulele n sine (plcuele care se introduc n slot-urile plcii de baz), avem cteva modele constructive. Dup perioada de nceput, cnd chip-urile de memorie se nfigeau pur i simplu n placa de baz, primul model uzual a fost SIMM-ul pe 30 de pini, urmat de cel pe 72 de pini. Denumirea de SIMM provine de la Single Inline Memory Module, modulul prezentnd o lime de band de 8 bii pentru prima versiune i de 32 pentru cea de-a doua; dimensiunea fizic a SIMM-ului pe 30 de pini este de dou ori mai mic dect n cazul celeilalte variante. Diferenele de vitez dintre ele corespund perfect perioadei de glorie: dac prima versiune era uzual pe timpul sistemelor 286 i 386, SIMM-ul pe 72 de pini a stat la baza generaiei 486, Pentium i Pentium Pro. Chip-urile folosite au fost de tip DRAM, FPM i, mai trziu, EDO DRAM. Urmaul lui SIMM s-a chemat DIMM, adic Dual Inline Memory Module. Dup cum i spune i numele, el ofer o lime de band de 64 de bii, dubl fa de SIMMurile pe 72 de pini, avnd la baz un fel de dual-channel intern, dac ni se permite comparaia. Numrul de pini a fost de 168 sau de 184 de pini, n funcie de tip: SDRAM sau DDR SDRAM. A existat i un numr limitat de modele de DIMM bazate pe EDO DRAM dar ele nu au avut succes pentru c trecerea de la SIMM la DIMM a coincis cu cea de la EDO la SDRAM. RIMM (Rambus Inline Memory Module) este modelul constructiv al memoriilor RDRAM. Numrul de pini este de 184 (ca i la DDR SDRAM) dar asemnrile se opresc aici, configuraia pinilor i modul de lucru fiind total diferit. Mai amintim de modulele SO-DIMM, destinate calculatoarelor portabile, care dein un numr diferit de pini: 184 pentru SDRAM i 200 pentru DDR SDRAM. Practic vorbind, montarea modulelor SIMM era o operaie greoaie i necesita experien i ndemnare. Odat cu modulele DIMM (i RIMM, care au acelai sistem de prindere) chinul a fost dat uitrii, oricine putnd monta o memorie, fiind necesar doar puin atenie. Montarea invers a unui DIMM (care necesit, totui, destul for) duce ntotdeauna la arderea memoriei. Diferenele de vitez dintre memorii se bazeaz n mare parte pe diferenele de frecvene. S lum cazul memoriei principale, inclus n sisteme ca memorie de lucru. n prim faz, pn la apariia procesoarelor 80486, frecvena sa era egal cu cea a procesorului i a PSB-ului (de ordinul zecilor de MHz), ns n momentul n care procesoarele au atins frecvene de peste 50 MHz, s-a pus problema faptului c nu exist posibilitatea fabricrii (la preuri acceptabile) de memorii la astfel de frecvene. Aa c s-a recurs la un truc: s-a hotrt ca memoria i PSB-ul s lucreze la o frecven mai mic dect cea a procesorului, setndu-se astfel un raport fix ntre PSB i procesor. Astfel, un 486 DX4 la 100 MHz avea un PSB de 33 MHz (memoria rulnd i ea la aceast frecven) iar un Pentium MMX la 233 MHz avea un PSB de 66 MHz. Spunem c procesorul ruleaz asincron fa de PSB, n primul caz cu un multiplicator de 3x iar n al doilea de 3.5x. Nu numai imposibilitatea creterii frecvenei memoriei a dus la16

Cap 2: Evaluarea performanelor plcilor de baz

aceast situaie ci i limitrile celorlalte bus-uri, la acea vreme ISA, VLB i PCI, care nu suportau frecvene mult mai mari dect cele standard. Observaie: Nu trebuie confundat frecvena PSB cu cea a memoriei, sunt lucruri total diferite, PSB-ul fiind viteza de comunicare dintre procesor i northbridge. ntmpltor, controller-ul de memorie se afla n northbridge i, tot ntmpltor, memoria rula sincron cu FSB-ul. Vom vedea c mai trziu c situaia s-a schimbat. 66 MHz a fost un prag greu de trecut pentru memorie, poate i datorit faptului c aceast frecven corespunde dublului frecvenei bus-ului PCI i egalului frecvenei bus-ului AGP (care a aprut mai trziu), iar pentru a crete frecvena RAM independent de aceste dou bus-uri era necesar implementarea acestei funcii n chipset. Dar poate cel mai important factor a fost instabilitatea preului la memorie, care a oscilat permanent foarte puternic, existnd cazuri n care el a crescut de cteva ori pe parcursul unei singure luni; scderea a fost, desigur, mult mai lent. Trecerea la SDRAM i creterea FSB-ului uzual de la 66 la 100 MHz (odat cu Pentium II Deschutes i K6-2) a facilitat depirea acestei bariere, ajungndu-se rapid la 100 i apoi la 133 MHz (chiar i cu pstrarea FSB-ului la 100 MHz). Urmtorul prag, de 166 MHz, nu a mai fost atins de SDRAM dar nici exclus total, ci mai degrab neglijat datorit apariiei memoriei DDR SDRAM, care dubla limea de band a unui SDRAM. Chiar dac frecvena real era de 100, 133 sau 166 MHz, memoria se comporta aproape identic cu una la frecven dubl i de aceea au fost ncetenite frecvenele improprii de 200, 266 i 333 MHz (memoriile fiind marcate ca DDR200, DDR266 i DDR333 sau PC1600, PC2100 i PC2700, corespunztor limii de band: 1.6, 2.1 i respectiv 2.7 GB/s). Ulterior s-a ajuns la 400 MHz (DDR400, PC3200) i chiar mai sus, amatorii de overclocking dezlnuindu-i pasiunea odat cu module DDR533 (PC4200) sau chiar DDR625 (PC5000), care cost totui o avere. Urmtorul pas a fost DDR2 SDRAM, un standard asemntor cu DDR, dar care permite, la latene mai ridicate, frecvene mai mari. S-a nceput cu DDR2-400 (PC2-3200), urmnd apoi DDR2-533 (PC2-4300), ultima realizare fiind DDR2-800 (PC2-6400). Dei numele ar sugera dublarea vitezei, un modul DDR2 nu este mai rapid dect unul DDR la aceeai frecven, ci dimpotriv: latenele mai ridicate scad uor performana. Avantajul const n posibilitatea creterii frecvenei mult dincolo de DDR400, standardul la care s-a poticnit DDR SDRAM (DDR533 i urmtoarele sunt pseudo-standarde, nefiind ratificate). Pentru plcile grafice, avem GDDR3 SDRAM, fiind anticipat o nou versiune, numit (cum altfel?) GDDR4. Este vorba de o optimizare a standardului DDR2 pentru plcile grafice, la fel cum era SGRAM pentru SDRAM. Ca o mic parantez, am folosit termenul de PSB (Processor Side Bus) care s-a metamorfozat n cazul lui Pentium II n FSB (Front Side Bus). Aceste denumiri au generat i genereaz n continuare confuzii; termenul de FSB a fost introdus special pentru procesoarele al cror cache level 2 era extern procesorului, FSB-ul fiind bus-ul care lega chipset-ul plcii de baz de acest cache. Bus-ul BSB (Back Side Bus) era cel care fcea legtura mai departe, ntre cache-ul L2 i nucleu. Procesoarele cu cache-ul L2 inclus n pastila central au bus-urile FSB i BSB unificate sub denumirea de PSB. Aadar, denumirea de FSB are sens doar cu privire la procesoarele Pentium II, o parte din modelele Pentium III (doar cele cu nucleu Katmai) i unele variante de Athlon, toate avnd la baz platforma Slot 1 (pentru Intel) i17

Evaluarea performanelor sistemelor de calcul

respectiv Slot A (pentru AMD). Aadar, orice procesor inserabil ntr-un socket, nu are FSB, ci PSB. Dei nu intr n categoria de mai sus, trebuie s menionm n final i un alt tip de memorie: ROM (Read Only Memory). Dup cum i spune i numele, aceast memorie nu poate fi dect citit, nu i scris prin metode obinuite. Distingem i aici mai multe varieti, diferite de ROM-ul standard: PROM (Programmable ROM) - care poate fi scris o singur dat, similar unui CD-R, EPROM (Erasable Programmable ROM) - care poate fi i rescris, similar unui CD-RW i EEPROM (Electrically Erasable Programmable ROM) memorie care poate fi rescris inclusiv prin metode software. Acest din urm tip este folosit ndeosebi n cazul BIOS-urilor diverselor componente (plci de baz, plci grafice), BIOS care este rescris n caz de necesitate (se spune c i se face update). BIOS-ul (Basic Input Output System) reprezint interfaa dintre hardware i software, elementul care face posibil comunicarea dintre un program i o component hard. l putem numi controller la nivel software, fiind n esen un program care traduce comenzile software-ului ntr-un limbaj propriu al componentei respective i invers. Ar putea fi asemnat i cu un driver, dar BIOS-ul lucreaz la un nivel mai low-level, mai apropiat de hardware i deine doar cteva funcii elementare, pe care se va baza driverul. Legat de EPROM i EEPROM, este puin forat denumirea de ROM pentru c, la prima vedere, funcionalitatea unei astfel de memorii este asemntoare memoriei RAM: informaia poate fi alterat. ns modul de construcie i ofer o vitez redus i o face utilizabil doar ocazional i n cantiti mici. 2.1.3. Interfeele interne: ISA, VLB, PCI, AGP etc Revenind la nceputuri, voi detalia istoricul interfeelor destinate dispozitivelor mai mult sau mai puin periferice, precum ISA, PCI, AGP, USB, IDE, Serial ATA i altele. Bus-ul ISA (Industry Standard Architecture) a fost inventat de IBM odat primul IBM PC, aprut la nceputul anilor '80 , calculator ce folosea magistrala de 8 bii specific procesorului 8088. ISA era destinat plcilor de extensie (plci grafice, controllere de hard disk) ce se ataau PC-ului. Odat cu 80286 i cu nevoile tot mai mari de vitez, s-a impus versiunea pe 16 bii a lui ISA, ce consta (fizic vorbind) ntr-o extensie la vechiul ISA, cu care era compatibil, n sensul c o plac de baz compatibil 16-bit ISA suporta plci de extensie 8-bit. Standardul s-a pstrat pn aproape de zilele noastre, chiar i azi mai putnd fi ntlnite plci ISA i plci de baz care s le suporte. Odat cu procesorul 80386DX, s-a pus problema unui nou bus, care s foloseasc din plin posibilitile acestuia, i anume adresarea pe 32 de bii. Astfel s-au nscut o serie de standarde, incompatibile ntre ele, i anume MCA (Micro Channel Architecture), EISA (Extended ISA) i VLB (VESA Local Bus, VESA = Video Electronics Standards Association). MCA a euat din cauza politicii IBM foarte restrictive, care s-a manifestat prin incompatibilitatea bus-ului cu vechiul ISA i prin decizia de a face acest standard proprietar; cu alte cuvinte, IBM era singurul care putea proiecta i fabrica plci de extensie destinate lui MCA. EISA a fost rspunsul lui Compaq la MCA, care a evitat cele dou greeli ale lui IBM dar nu a reuit s se impun18

Cap 2: Evaluarea performanelor plcilor de baz

datorit preului mare practicat i a performanelor nu tocmai strlucite. A urmat bus-ul VLB ce a fost conceput pentru plcile grafice dar a fost folosit i pentru diverse controllere, fiind mult mai rapid fa de predecesori i avnd compatibilitatea cu ISA asigurat (fizic, plcile VLB aveau un conector suplimentar fa de ISA). Dei a devenit popular n epoca lui 486, odat cu introducerea de ctre Intel a bus-ului PCI (Peripheral Component Interconnect) VLB a deczut ca importan datorit problemelor de compatibilitate cu nou-aprutul Pentium i a altor detalii minore care adunate au determinat impunerea lui PCI pe pia. Acesta, ca i celelalte trei tentative de bus-uri pe 32 de bii (deloc sau doar parial reuite), oferea avantajul utilizrii ntregului potenial al procesoarelor 386 i 486 dar nu i al lui Pentium, care deinea un bus extern de 64 de bii. ns cum necesitile vremii nu au cerut altceva dect un simplu bus PCI pe 32 de bii, acesta a devenit un standard utilizat i n prezent, nu nainte de a deschide calea lui PCI-64, utilizat doar n servere. Pentru calculatoarele obinuite, urmaul lui PCI s-a numit AGP i a fost (i este) destinat doar plcilor grafice. AGP (Accelerated Graphics Port) a sosit mai trziu, n epoca jocurilor 3D, impunerea sa datorndu-se exclusiv nevoii tot mai mari de cretere a numrului de cadre pe secunde afiate n jocuri. n loc s se creasc limea de band, ca n cazul lui PCI-64, a fost crescut frecvena, de la 33 la 66 MHz, efectul fiind similar. Avantajele lui AGP n faa lui PCI sunt numeroase i legate n special de plcile grafice. Spre exemplu, a fost introdus posibilitatea ca chip-ul video s poat accesa memoria sistemului ca memorie video, realizndu-se aa-zisa texturare AGP. Desigur, tehnica este inferioar folosirii de ctre placa grafic a propriei memorii, dar aceasta poate fi ntr-o cantitate mai mic dect este necesar. Extinderea bus-ului AGP a dus la crearea standardelor AGP 2x, AGP 4x i AGP 8x, tehnici speciale permind atingerea unei frecvene virtuale de opt ori mai mari dect AGP-ul standard (numit i AGP 1x), dar care nu au adus mult-ateptatul spor de vitez din simplul motiv c ele nu erau necesare. De remarcat faptul c, odat cu dublarea limii bus-ului la 2x i respectiv 4x, au fost create noi standarde, numite AGP 2.0 i AGP 3.0. Ele modificau diverse aspecte interne (i relativ puin importante) ale bus-ului i scdeau tensiunea de alimentare de la 3.3 la 1.5V i respectiv de la 1.5V la 0.8V - o surs de incompatibilitate ntre unele plci grafice i de baz. Ultima realizare n domeniu se numete PCI Express. Standardul este total incompatibil cu oricare altul, att fizic ct i logic, fiind necesare controllere noi pentru a-l gestiona - practic plci de baz noi, bazate pe alte chipset-uri dect cele cunoscute. Dei n prezent utilitatea sa este legat exclusiv de plcile grafice, ce lucreaz n modul PCI Express X16 (de 16 ori mai rapid dect AGP-ul standard), majoritatea plcilor de baz compatibile PCI Express ofer cteva slot-uri X1 sau X4, n care pot fi introduse unele plci de extensie practic absente de pe pia. Chipset-urile PCI Express nu sunt, n general, compatibile cu AGP, motivul fiind ncercarea productorilor de a impune noul standard n defavoarea celui vechi. ns cu plcile PCI simplu nu exist probleme, ele putnd coexista cu PCI Express (de fapt, de ele este rspunztor southbridge-ul, care este comun tuturor northbridge-urilor, att cu controller AGP ct i cu PCI Express). Un alt avantaj al noului bus const n posibilitatea ca plcile grafice NVIDIA (i n curnd i ATI) s lucreze n mod SLI (Scalable Link Interface), o facilitate multiGPU. Astfel, este posibil existena a dou plci grafice n sistem care s lucreze n mod cooperativ, crescnd substanial performana n jocuri. Tehnologia se afl abia la nceput i nu este foarte popular, nefiind altceva dect o opiune pentru entuziati.19

Evaluarea performanelor sistemelor de calcul

2.1.4. Interfeele externe: serial, paralel, USB etc Pe lng interfeele care permit conectarea componentelor interne, n spe plcile de extensie, porturile externe permit ataarea de dispozitive exterioare PC-ului care ndeplinesc diverse funcii, de la mouse pn la DVD writer. Porturile serial i paralel sunt prezente n practic toate sistemele, de la apariia PC-ului ncoace, fiind utilizate n principal pentru cuplarea unor dispozitive periferice externe (mouse serial, imprimant, modem, scanner etc). Diferenele dintre ele privesc modul de funcionare: portul serial transmite date pe un singur fir (bit cu bit), fa de cel paralel care transfer datele pe opt linii paralele (byte cu byte). Iniial, portul paralel era capabil de transmisie unidirecional (ntr-un singur sens), aceasta datorit limitrii standardului SPP (Standard Parallel Port); odat cu EPP (Enhanced Parallel Port), problema a disprut iar viteza maxim atins a crescut de la 150 KB/s la 2 MB/s. Nevoia tot mai mare de vitez a adus un nou impediment privind creterea ratei de transfer: utilizarea prea mare a procesorului sistemului. Pentru a se evita inconvenientul a fost introdus standardul ECP (Extended Capabilities Port) care lucra n aa-numitul mod DMA (Direct Memory Access), utilizarea procesorului fiind minim. Pe lng aceasta, EPP a oferit compresie/decompresie n timp real, ceea ce a constituit un ajutor remarcabil pentru dispozitivele ce necesitau rate mari de transfer. Perifericele conectate la portul paralel sunt diverse, cuprinznd n primul rnd imprimantele, scanner-ele, unitile de band dar i altele mai exotice, precum webcamurile. ns odat cu necesitile tot mai mari de la sfritul anilor '90, portul paralel a nceput ncet-ncet s fie dat uitrii, locul su fiind preluat de alte standarde incompatibile cu acesta. Portul serial, datorit vitezei sczute, nu poate fi utilizat dect de componente care nu necesit viteze mari, precum mouse-ul sau modem-ul. Un avantaj al su, de cele mai multe ori ignorat, este posibilitatea de transmitere a datelor la distane mult mai mari dect portul paralel. Putem aduga i numrul de fire de transmisie mai mic (3 n cazul portului serial fa de 19 sau 25 pentru paralel), deci costurile cablurilor sunt mai reduse. Concluzionnd, nu putem pune o relaie comparativ ntre portul serial i paralel pentru c ele au fost concepute pentru utilizri diferite. Ambele se afl n declin, ns nici un alt standard nu a reuit s se impun puternic din cauza costurilor ridicate, cu excepia celui PS/2 - utilizat azi pentru tastatur i mouse. Acesta a fost introdus de IBM n 1987, odat cu seria de PC-uri numit PS/2 (Personal System/2), un eec total pentru Big Blue. ns Intel s-a folosit de standard, el devenind uzual abia odat cu introducerea n 1997 a form factor-ului ATX, despre care vom vorbi mai trziu. Reinem c att mouse-ul ct i tastatura (conectat pn atunci prin standardul AT - compatibil pin la pin cu PS/2, dar de form mai mare) se leag n prezent la computer prin acest port. Un nou standard, pe numele su USB (Universal Serial Bus), a aprut din dorina de a se oferi o interfa universal, capabil s conecteze la PC orice fel de dispozitiv, de la mouse, imprimant, pn la interfa extern de sunet (similar unei plci de sunet dar situat n exteriorul PC-ului), TV tuner, hard disk i unitate optic.20

Cap 2: Evaluarea performanelor plcilor de baz

Interfaa este plug&play i hot-swappable, ceea ce nseamn c orice dispozitiv va fi recunoscut automat de sistemul de operare i respectiv va putea fi conectat sau deconectat din zbor, fr a fi necesar o repornire. USB s-a impus foarte greu, pe parcursul ctorva ani el progresnd lent din cauza performanelor reduse ale dispozitivelor conectate la acest port, fapt datorat limitrii transferului la 12 Mbps. Spre exemplu, unui CD-ROM 40x i era imposibil s se conecteze la portul USB pentru c ar fi avut nevoie de un transfer de 6 MB/s (48 megabii pe secund), de patru ori mai mult dect limitele bus-ului. De aceea, USB a fost destinat doar dispozitivelor lente (totui mult mai rapide dect portul serial, care era limitat la cteva sute de Kbps). Soluia la problem a fost oferit de USB 2.0, a doua versiune a standardului, ce prevedea viteze de pn la 480 Mbps (60 MB/s, deci i un ipotetic CD-ROM 400x ar face fa). n prezent, majoritatea plcilor de baz suport interfaa USB 2.0 i dispozitivele ce se conecteaz la aceasta sunt din ce n ce mai multe. Totui, cei mai muli utilizatori prefer soluiile comune (dac ele exist), care cost mai puin i ofer aproape aceleai faciliti. Un port cu funcii mai avansate i cu o vechime mai mare este FireWire, numit i IEEE 1394, standard introdus de ctre Apple la mijlocul anilor '80 i oferit apoi ctre IEEE (Institute of Electrical and Electronics Engineers) pentru standardizare, de unde i numele alternativ. n 1995, acest institut lansa specificaiile sale oficiale, oferind trei rate de transfer posibile: 100, 200 i 400 Mbps. Aceasta n perioada n care USB, n prima sa versiune (12 Mbps) era doar n proiect... Totui, scopul lui FireWire este diferit: el dorete s conecteze la computer dispozitive ce au nevoie (i aveau nevoie nc de la acea dat) de viteze foarte mari, precum camerele video digitale, Sony adoptnd rapid standardul. ncet-ncet, FireWire a ctigat popularitate, devenind astzi ceva doar cu puin mai exotic dect USB (nefiind prezent pe orice plac de baz, dar cele high-end sigur l dein). n prezent, utilizarea sa este destul de larg, fiind folosit de dispozitive real-time de editare audio/video, dar i de produse destinate publicului larg, precum scannere, webcam-uri, uniti optice de stocare sau hard disk-uri portabile. Alt interfa ntlnit pe majoritatea plcilor de baz, dar mai rar folosit, este IrDA (Infrared Data Association), care permite schimbul de date wireless (fr fir) cu alte echipamente ce au incorporat o astfel de tehnologie (imprimante, laptop-uri, PDAuri, telefoane mobile, camere digitale etc) sau chiar cu un alt PC. Tot la capitolul interfee wireless mai merit menionat standardul Bluetooth, relativ folosit, dar nc exotic pentru utilizatorii obinuii. Prin intermediul acestuia, PC-urile, PDA-urile, telefoanele mobile, imprimantele i alte dispozitive, pot fi conectate folosind undele radio, pe distane scurte sau medii. Cum subiectul este destul de complex pentru a fi detaliat aici, trecem la capitolul urmtor. 2.1.5. Interfeele pentru dispozitive de stocare Interfeele de conectare a unitilor de disc nu au fost ntotdeauna att de rapide precum sunt astzi. Primul standard, introdus n IBM PC-ul original s-a numit ST-506, fiind dezvoltat n anul 1980 de ctre Seagate. Mai multe sub-standarde au respectat specificaiile ST-506, printre ele numrndu-se MFM (Modified Frequency Modulation, versiunea original), RLL (Run Length Limited, ce cretea densitatea datelor cu 50% i era compatibil cu MFM), ESDI (Enhanced Small Device Interface, ce oferea o rat de21

Evaluarea performanelor sistemelor de calcul

transfer foarte ridicat pentru acea perioad) i, n final, IDE (Integrated Drive Electronics), numit i ATA (Advanced Technology Attachment). Spre deosebire de standardele iniiale, ESDI i mai ales IDE au integrat pe hard disk o mare parte din funcionalitatea controller-ului acestuia (i e uor s ne dm seama de acest lucru privind partea electronic a oricrui hard disk modern); astfel, viteza de transfer a crescut substanial. IDE aducea o serie de inovaii, fiind practic o versiune foarte sofisticat a lui RLL, oferind, spre exemplu, posibilitatea conectrii a dou hard disk-uri pe acelai cablu n combinaia Master/Slave. Transferul era realizat prin intermediul modului PIO (Programmable Input/Output) - n acest proces fiind angrenat i procesorul - sau DMA (Direct Memory Access), prin care controllerul IDE comunica direct cu memoria, procesorul fiind degrevat de aceast sarcin. Rata maxim de transfer era de 8.3 MB/s. O extensie a lui IDE, EIDE (Enhanced IDE), numit i FastATA sau ATA-2, oferea la mijlocul anilor '90 rate de transfer de pn la 16.6 MB/s, posibilitatea detectrii automate n BIOS a parametrilor hard disk-ului, precum i capaciti mai mari dect limita impus IDE-ul standard - 504 MB. De fapt, denumirile nu sunt perfect sinonime, EIDE i FastATA (numite astfel de Western Digital i respectiv Seagate) fiind versiuni ale standardului ATA-2 ce cuprind i specificaiile ATAPI (Advanced Technology Attachment Packet Interface). Este vorba de posibilitatea conectrii i a altor tipuri de uniti de stocare dect hard disk-urile, precum unitile optice (doar de tip CD-ROM la acea vreme), de band sau de dischete cu capaciti mari. ATA-3, introdus n 1997, nu a adus mbuntiri legate de vitez, ci privind securitatea, un Power Management extins (micorndu-se astfel consumul de putere) i, nu n ultimul rnd, legat de tehnologia SMART (Self Monitoring Analysis and Report Technology), ce permitea monitorizarea permanent a strii de sntate a hard disk-ului. Mai departe, ATA-4 (1998) a introdus modul Ultra DMA/33 (Ultra ATA, UDMA33 sau Ultra DMA 2), renunndu-se la mbuntirea modului PIO, UDMA33 oferind un maxim de 33 MB/s. ATA-5 (UDMA66 sau Ultra DMA 4), ATA-6 (UDMA100 sau Ultra DMA 5) i ATA-7 (UDMA133 sau Ultra DMA 6, srit de unii productori) nu au fcut dect s creasc rata maxim de transfer la 66, 100 i respectiv 133 MB/s, de obicei mai mult dect puteau oferi hard disk-urile acelei perioade. Aadar, marketing similar lui AGP 8x vs. 4x. Totodat, ncepnd cu Ultra DMA/66, numrul de fire ale cablului de date a crescut de la 40 la 80 pentru a se reduce interferenele electromagnetice ce ar putea aprea la viteze att de mari (fiecare al doilea fir era unul de mas, pentru ecranare). n plus, standardul Ultra DMA/100 a oferit i AAM (Automatic Acoustic Management), o facilitate care permite reducerea zgomotului emis de hard disk prin reducerea nesemnificativ a performanelor; totui, nu toate unitile suport AAM. Serial ATA (sau S-ATA) a fost urmtorul pas. Schimbrile palpabile au fost reprezentate de noile tipuri de cabluri, att pentru alimentare ct i pentru date (ultimul mult mai comod de folosit, fiind mai subire, cu doar 7 fire), precum i de eliminarea conceptelor de Master i Slave, fiecare hard disk avnd canalul su dedicat. Un alt avantaj remarcabil este hot-swapping-ul, fiind posibil introducerea/eliminarea hard22

Cap 2: Evaluarea performanelor plcilor de baz

disk-ului fr a opri PC-ul; practic, orice hard disk normal poate fi acum folosit precum unul portabil. Standardul ATA a fost redenumit retroactiv n Parallel ATA (sau P-ATA), pentru a se putea diferenia uor de S-ATA. Denumirile provin chiar de la modul n care sunt transmise datele: P-ATA folosete mai multe ci pentru transmiterea n paralel a informaiilor (de aici i numrul mare de fire necesar), pe cnd S-ATA efectueaz o transmisie serial. Versiunile curente sunt Serial ATA original (150 MB/s) i Serial ATA II (300 MB/s), dar se ateapt adoptarea n viitor a lui Serial ATA III pentru 600 MB/s. Separat de ATA/IDE i variantele sale, SCSI (Small Computer System Interface - pronunat scazi, n dou silabe i cu accent pe a) a devenit, ncepnd cu mijlocul anilor '80 , un standard foarte utilizat n workstation-uri, servere i, ocazional, n PCurile high-end. Avantajele sunt numeroase (vitez mai mare, ocupare minim a procesorului n timpul transferului, daisy-chaining etc) i nu afecteaz n mare msur utilizatorul obinuit. SCSI este folosit i n alte scopuri, precum conectarea imprimantelor sau a scanner-elor. Orice controller P-ATA/S-ATA/SCSI poate fi integrat pe placa de baz (este cazul P-ATA, cel puin pentru plcile fabricate n ultimii 10 ani, a celor S-ATA pentru mai toate modelele de plci din ultimul an, precum i cazul SCSI pentru plcile de baz de servere), dar se poate gsi i separat, sub forma unei plci de extensie ce se ataeaz prin intermediul unui slot (PCI, eventual VLB sau ISA). n finalul acestui capitol, trebuie s spunem cteva cuvinte i despre unitatea de dischete, al crei controller a trecut prin multe faze, ncepnd cu MFM (controller care putea gestiona att floppy-ul ct i hard disk-ul), el fiind azi integrat pe placa de baz. Cablul de date este asemntor celui IDE, ns cu numai 34 de fire. De notat c unitile floppy se mai pot conecta prin SCSI sau USB

2.2. Testarea plcilor de baz Socket 9392.2.1. Introducere Platforma Socket 939 nu poate fi dect atrgtoare, performana actual dar mai ales cea viitoare, posibil printr-un upgrade la un procesor mai rapid fiind imboldul care golete magazinele de puinele plci cu 939 de pini. Platforma Socket 939 este una high-end, ce se adreseaz n primul rnd utilizatorilor cu pretenii mari i n acelai timp cu buzunarele ceva mai pline dect ceilali. AMD a lansat primele procesoare AMD64 odat cu platforma Socket 940, nlocuit rapid de cea 754. Procesoarele sunt practic identice, dar cele cu 754 de pini sunt limitate la un controller de memorie single-channel. Cu alte cuvinte, o platform mainstream. Socket 939 este urmaul lui S940, AMD determinnd astfel utilizatorii de Socket 940 s schimbe placa de baz pentru a obine un pin n minus dar compatibilitate cu nou-aprutele modele de Athlon 64 i Athlon 64 FX. Totui, de ce aceast schimbare? Socket 940 necesit memorii de tip registered din cauza motenirii arhitecturii lui Opteron; modelele cu un pin mai puin au scpat de aceast limitare, modulele non-registered (unbuffered) fiind mult mai ieftine. Dual-channel-ul oferit de pinii suplimentari (n comparaie cu 754) readuce n prim-plan o tehnologie att de bine23

Evaluarea performanelor sistemelor de calcul

gndit nct nu merita s moar: limea de band a memoriei este dublat folosind un mic artificiu, destul de puin costisitor. n continuare se vor prezenta o serie de teste realizate cu placi de baz Socket 939. Produsele testate sunt nzestrate cu slot-uri PCI Express, plcile cu suport AGP urmnd s fac subiectul unor teste viitoare, n caz c se vor gsi pe pia n cantiti suficiente. Oricum, bus-ul AGP este nc suportat de o serie de plci, ns numrul lor este n scdere, n cteva luni - maxim un an - urmnd s aib loc impunerea plcilor grafice PCI Express. Astfel este lsat n urm un bus ce a dominat ultimii 78 ani i care a fost izgonit oarecum pe nedrept, complotul marilor productori neavnd, aparent, o justificare clar. E adevrat, acum putem avea din nou dou plci grafice n sistem, unite prin SLI, performanele obinute fiind foarte mari (la un pre foarte mare), plus alte mici detalii care fac diferena dar nu justific renunarea la un bus ce nu constituia limitarea n calea obinerii de performane maxime. Chipset-ul nForce4 de la NVIDIA se pare c domin plcile PCI Express, cele mai multe produse de pe pia i toate cele testate dotate cu acesta. nForce3 este deja depit datorit suportului pentru AGP i a lipsei unor faciliti incluse n urmaul su. La fel i K8T880 (Pro), doar K8T890 fiind comparabil cu nForce4, dar el nu a fost adoptat la scar larg. n toate variantele sale (simplu, Ultra, SLI i eventual neoficialul 4X) nForce4 ofer o serie de faciliti deosebite, NVIDIA fiind o companie care n ultima vreme a nceput s dea tonul pe piaa plcilor de baz pentru procesoare AMD. Amintim de Serial ATA II (numai n versiunile Ultra i SLI), ce dubleaz limea maxim de band fa de prima versiune de Serial ATA (avantaj total neobservabil n practic) i suport pentru modul SLI (doar n versiunea nForce4 SLI) cu alte cuvinte e posibil conectarea a dou plci grafice PCI Express pentru performane nu chiar duble dar foarte mari. nForce3 deine i el o serie de funcii inovatoare, cum ar fi un Firewall integrat, ns ncepe ncet-ncet s-i resimt btrneea. 2.2.2. Modul de testare nainte de orice, trebuie s stabilim cine sunt utilizatorii n pielea crora am ncercat s intrm, evalund la snge produsele. n primul rnd, este vorba de entuziati, cei ncntai mai degrab de o dotare n plus sau, n egal msur, de opiune ascuns n BIOS care le permite un overclocking superior, dect de un pre mai mic. Calificative precum excelent sau extrem cost i vor costa ntotdeauna foarte mult, aadar dac cititorul este interesat mai degrab de un ECS ieftin, dotat numai cu cteva elemente eseniale i al crui pre nu trece de 50-60 de dolari, ar trebui s parcurg testul nostru cel mult din curiozitate. n lucrare, au fost punctate cu o pondere mai mare caracteristicile pe care un pasionat i le-ar dori la placa sa de baz, precum un port FireWire sau o frecven mare atins prin overclocking. Testul a fost mprit n patru categorii, i anume: performan,24

Cap 2: Evaluarea performanelor plcilor de baz

faciliti, construcie & ergonomie; documentaie & service. Ponderea performanei a fost relativ mic, de 40%, diferit fa de cele mai multe review-uri ntlnite n diverse reviste sau pe web. Aceasta deoarece am considerat c performana unei plci de baz este extrem de puin important n luarea unei decizii privind achiziionarea uneia pentru c diferenele sunt de ordinul a 1-2%, maxim 3%. De aceea, alii sunt factorii care ar trebui s influeneze un potenial cumprtor. Performana a fost evaluat prin rularea mai multor programe speciale de benchmark, a unora ce au alt scop dar care dein i un modul de testare a vitezei sau pur i simplu prin cronometrarea timpului scurs ntre dou momente ntre care a fost efectuat o anumit operaie. Testele analitice au avut o pondere mic. Astfel, testul de lime de band a memoriei din SiSoft Sandra i cel de laten a memoriei din ScienceMark au contat cu cte 5%. SPECviewperf i 3DMark 2001, dei sintetice, reflect destul de bine activitatea profesionitilor n grafic i a gamerilor, de aceea au contat cu 8 i respectiv 12.5%. Restul testelor au fost practice: arhivarea unor fiiere cu WinRAR (8%), comprimarea unui film cu codec-ul XviD (8%), randarea unei imagini cu PovRay (8%), copierea unor fiiere de pe o partiie pe alta a unui hard disk Serial ATA (8%), testele implicite din 3DMark 2001, FarCry i Unreal Tournament 2004 (12.5% fiecare) i un test special creat n Quake3 care folosete procesorul mult mai mult dect testul implicit (12.5%). De remarcat faptul c testele 3D au contat n total cu 50% din punctaj (excludem de aici SPECviewperf care, dei ruleaz n mod 3D, se adreseaz altei categorii de utilizatori). Facilitile au contat tot cu 40 de procente. Am inclus aici numrul de slot-uri i porturi, complexitatea interfeei de sunet, facilitile din BIOS (n special cele legate de overclocking), precum i software-ul livrat. Menionm pentru cei (ne)interesai de overclocking c opiunile destinate acestei practici, precum i rezultatele testelor realizate n condiii extreme au contat cu 35% din cele 40 de procente ale facilitilor, deci cu 14% la nota final. Mult, puin, rmne s judecai dumneavoastr. Ergonomia i construcia, reunite ntr-o singur rubric, au contribuit cu 15% la rezultatul final. Au fost acordate note att comoditii operrii pe placa de baz, n interiorul carcasei (de exemplu poziia jumper-ilor i a conectorilor), precum i diverselor indicii privind fiabilitatea produsului, lund n seam temperaturile atinse de diversele componente de pe plac i alte aspecte subiective. Este imposibil de evaluat fiabilitatea oricrui produs hardware, fiind necesare luni sau chiar ani pentru ca primul defect s-i fac apariia, precum i un numr mare de produse care s fie supuse testelor. De aceea, punctajul oferit aici a fost destul de mic i n totalitate subiectiv, un rol important jucnd experiena n acest domeniu. n fine, documentaia i service-ul au completat ultimele 5 procente, fiind punctat manualul, garania, precum i posibilitatea de contact online cu productorul.

25

Evaluarea performanelor sistemelor de calcul

2.2.3. Testarea efectiv Sistemul de test a constat ntr-un procesor Athlon 64 3200+ (nume de cod Winchester - 0.09 microni, 2000 MHz, 512 KB L2 cache, 1.4V, frecvena maxim la care rula stabil: 2550 - 2600 MHz la 1.6 1.65V), un kit de memorii Corsair TwinX1024-3200XLPT ce totalizau 1 GB, o plac grafic Gigabyte GV-NX66T128D cu chip GeForce 6600 GT (128 MB, 500 MHz core, 1000 MHz memoria), un hard disk Western Digital Caviar SE (WD800JB) de 80 GB cu 8 MB cache pe Parallel ATA, iar pentru evaluarea performanei controller-ului Serial ATA am montat un Seagate Barracuda 7200.7 SATA cu aceleai specificaii. Driverele au fost cele mai noi oficiale la data nceperii testrii, i anume nForce4 Standalone Kit 6.39 i ForceWare 66.93. Sistemul de operare, desigur, Windows XP SP2. Fiecare plac a fost setat, dup un update al BIOS-ului (dac exista unul mai nou dect cel cu care placa venea), la maximul de performan pe care l puteam obine n condiii de stabilitate perfect. Stabilitatea a fost msurat cu al cincilea test din Memtest86+1, urmat de cteva procente din testul 7. Nu am rulat Prime952 pentru c procesorul nu avea prea mult motive s manifeste instabilitate, iar testele rulate pentru a evalua performana sunt suficient de stresante pentru acesta pentru a se bloca sau a da erori n caz de probleme. Setrile principale de memorie, i anume CAS Latency, tRCD, tRP, tRAS i Command per Clock au fost setate la minimul posibil, de obicei CL2 2-2-5 1T, ns au fost i cazuri n care am rulat n CL1.5 2-2-0 1T. tRC, tRFC, tRRD, tWR, tWTR, tRTW, tREF sunt alte cteva setri, primele dou ieind n eviden prin faptul c au valori mari, de minim 7 i respectiv 9. Rareori am rulat stabil n aceste condiii, valorile normale fiind 9 i respectiv 12. De asemenea, Bank Interleave a fost i el activat. Overclocking-ul a fost testat n dou moduri, n ambele situaii scopul fiind obinerea unui bus HTT maxim (n pai de 5 MHz). Am setat multiplicatorul (dac placa a permis acest lucru) n aa fel nct frecvena final a procesorului s fie cel puin egal cu cea implicit, de 2 GHz, iar celelalte setri au fost puse la minim sau aproape de minim, n aa fel nct ele s nu afecteze stabilitatea (LDT 2x sau 3x, CL3 4-4-8 2T etc). Apoi am setat memoria att sincron cu HTT-ul ct i la un raport de 1:2 fa de acesta. Tensiunea procesorului a fost ajustat la 1.65V (sau cea mai apropiat valoare mai mic de 1.65V pe care o permitea BIOS-ul) - maximul la care putem sta linitii c nu urmeaz o mic explozie n interiorul acestuia. De asemenea, tensiunea memoriei a fost urcat pn la maxim 2.9V iar dac placa permitea setarea voltajului chipset-ului, am realizat i aceast modificare, crescnd valoarea la maxim. Nu am folosit programe de tip A64 Tweaker sau ClockGen pentru a efectua alte setri dect cele ale BIOS-ului sau a ncerca creterea HTT-ului direct din Windows. 2.2.4. Abit AN8 Fatal1ty (nForce4 Ultra) AN8 Fatal1ty poart numele lui Johnathan Wendel, alias Fatal1ty, un gamer care la doar 23 de ani a ctigat numeroase turnee de 3D Shootere (Quake3, Unreal Tournament, Doom3). Placa are ca scop declarat obinerea celor mai mari performane, ns tim cu toii c diferenele dintre plci dotate cu acelai chipset, sau chiar cu chipset-uri diferite, sunt minime (desigur, dac neglijm factorul overclocking). Productorul susine c seria Fatal1ty (deschis cu modelul AA8XE pentru Pentium 4)1 2

http://www.memtest.org/ http://www.mersenne.org/freesoft.htm 26

Cap 2: Evaluarea performanelor plcilor de baz

este creat special pentru jocuri, att datorit performanelor extreme ce pot fi obinute ct i faptului c placa a fost lipsit de anumite componente pe care gamerii nu le folosesc - fcnd referire, probabil, la absena porturilor serial i paralel. Aadar, avem de-a face cu o campanie de marketing aparent reuit, mai ales dac inem seama de aspectul exterior al produsului, extrem de atrgtor. S vedem ce surprize ne mai rezerv. Cele dou cutii incluse n pachet, cu care Abit ne-a obinuit de ceva vreme, conin diverse accesorii utile plcii. Nu s-a pus att de mult accent pe cantitate, precum vedem la plcile Gigabyte high-end. Astfel, nu avem dect un bracket USB 2.0/FireWire, totaliznd (mpreun cu porturile din back-panel) ase i respectiv trei porturi. ns pe plac avem un singur conector extern de FireWire, ceea ce nu justific cele dou porturi prezente pe bracket.

Cablurile Serial ATA sunt n numr de patru, iar pentru alimentarea hard diskurilor este disponibil un convertor molex SATA, ce conine doi conectori. Cablurile Parallel ATA sunt n numr de unu, ns el iese n eviden prin faptul c este de tip rounded, acoperit cu un plastic transparent, astfel nct cele 80 de fire se afl la vedere. i cablul floppy este rounded, ns de culoare neagr. Un efect deosebit s-ar fi obinut dac i aceste din urm cabluri erau de culoare rou-viiniu, precum cele SATA, PCB-ul plcii, slot-urile PCI i DIMM i cele cteva LED-uri. Dac pn aici nu am gsit nimic ieit din comun, situaia se schimb dramatic odat ce punem ochii pe OTES RAMFlow, un set de dou ventilatoare de 40 mm nglobate ntr-o carcas de plastic i destinate rcirii memoriilor. Ele se aeaz deasupra slot-urilor DIMM, prinzndu-se cu ajutorul a dou cleme, meninnd astfel memoriile la o temperatur la care s suporte un overclocking superior condiiilor normale. Iat c ncet-ncet acele performane extreme promise ncep s-i arate colii...

Rcirea extrem este lucrul de care Abit s-a ngrijit cel mai mult. Tranzistorii de tip MOSFET sunt acoperii de radiatoare, iar dac temperatura acestora depete o anumit limit, spre ele ncep s bat dou ventilatoare Dual OTES tot de 40 mm dar mai adnci dect cele normale, poziionate n locul porturilor PS/2, serial i paralel pe plcile obinuite. De asemenea, rcirea chip-ului principal (nu a chipset-ului, pentru c nForce4 este construit dintr-un singur chip) este, dup spusele lui Abit, eficient, radiatorul fiind realizat din cupru. Practic, este vorba de cooler-ul clasic Abit, ntlnit de exemplu la modelul NF7, doar culoarea roie trdeaz materialul din care a fost confecionat. Nu putem trece mai departe fr a enumera succint celelalte elemente de27

Evaluarea performanelor sistemelor de calcul

pe plac: un slot PCI Express X16, dou X1, trei PCI, dou porturi IDE aezate culcat (un bravo! la ergonomie), patru Serial ATA 300 coordonate de southbridge-ul integrat n chip-ul central, iar de reeaua Gigabit se ocup un integrat Vitesse. n caz c neglijm alimentrile de ventilatoare deja ocupate (dou cu rcirea surselor de putere, una cu chip-ul nForce4, una opional pentru rcirea memoriilor), gsim doar dou fan headere libere, ceea ce nu prea st bine unui produs Abit, care ne-a obinuit cu patru sau chiar cu cinci astfel de conectori. Dac mufa de floppy nu s-ar fi aflat ntr-o poziie extrem de proast, i anume n spatele ultimului slot PCI, nota la ergonomie ar fi fost mare. Oricum, la acest capitol AN8 st bine, peste medie. Performanele nu au dezamgit, fiind normale pentru o plac bazat pe acelai chipset (sper c mi este permis folosirea n continuare a acestui termen, el specific foarte clar la ce se face referirea dei este impropriu numit astfel). Trecnd la analiza BIOS-ului, primul lucru care iese n eviden este imposibilitatea setrii multiplicatorului. Imposibil i inadmisibil pentru o plac Abit, cu att mai mult cu ct e vorba de una de vrf. n testul de overclocking, placa se oprea fr drept de apel la un HTT de 255 MHz din cauza procesorului care nu reuea s ruleze stabil la frecvene mai mari (reamintesc c este vorba de un Athlon 64 3200+ ce ruleaz stabil la puin sub 2600 MHz, frecvena standard fiind de 2 GHz). Problema poate fi rezolvat cu versiunea beta de BIOS (12 beta 1, varianta iniial fiind 11), ce rezolv problema multiplicatorului. Frecvenele maxime atinse prin overclocking au fost de 310 MHz sincron i 375 MHz cu raport de 2:1 ntre HTT i memorie, valori foarte bune. n acordarea notei sa inut seama doar de funcionarea cu acest BIOS beta deoarece lansarea variantei finale de ctre Abit este iminent. BIOS-ul este foarte bun, dei nu de excepie. Setrile uzuale sunt la locul lor, n meniul SoftMenu, devenit acum Guru. Tensiunea procesorului poate fi ajustat pn la 1.75V, cea a memoriei pn la 2.8V, valori aproape deranjant de comune. Nu aveam pretenia la 4V la memorie, rulm cu Abit, nu cu DFI, dar un 3.2V pentru a hrni memorii precum Winbond BH5 nu ar fi stricat deloc. Voltajul chipset-ului poate urca pn la 1.8V, valoarea cea mai mare ntlnit (pe majoritatea plcilor el se limiteaz la 1.65V). Temperatura cooler-ului de pe chipset nu a fost deloc mic, semn c radiatorul de cupru lucreaz la maximul de care este capabil. Setarea greit a parametrilor sensibili poate duce, desigur, la imposibilitatea pornirii. Placa detecteaz automat aceste situaii, nefiind necesar nici mcar apsarea clasicei taste Insert pentru ca sistemul s POST-eze. n cel mai ru caz, avem la dispoziie LED-urile binecunoscute, ce indic printr-un cod de eroare starea n care sistemul s-a agat. Turaiile celor maxim ase ventilatoare pot fi reglate n fel i chip, existnd posibilitatea setrii unei valori minime de temperatur la care s intre n funciune ventilatorul la o turaie mic (reglabil n voli), ct i o valoare destinat turaiei maxime. Monitorizarea este bun, att pentru temperatur ct mai ales pentru voltaje, fiind prezente i cmpuri rar ntlnite, precum voltajul de standby al chipset-ului. O problem destul de grav am ntlnit-o chiar de la pornirea plcii: dup cteva secunde, ea s-a nchis irevocabil din cauza ventilatorului pentru procesor alimentat din alt conector. Pe lng faptul c suntem obligai s folosim, la prima montare a plcii (sau dup reset-area BIOS-ului) un anume conector, sunt ventilatoare care se alimenteaz din mufa molex i care practic nu pot fi folosite pe aceast plac pn nu i este setat n BIOS opiunea de a nu stinge sistemul dac observ c CPU Fan raporteaz zero turaii. Soft-ul livrat include, pe lng un program de scriere a BIOS-ului din Windows, Abit EQ i OC Guru, utilitare capabile cam de aceleai lucruri ca i meniurile de28

Cap 2: Evaluarea performanelor plcilor de baz

monitorizare i respectiv overclocking din BIOS. n plus, n cazul lui Abit EQ exist trei preset-uri: Quiet, Normal i Turbo, ce corespund valorilor de 204, 210 i 216 MHz pentru HTT, ajustndu-se n acelai timp i voltajul memoriei i procesorului. ntlnim acelai 204, valoare considerat implicit de anumite plci Abit, precum AV8. De aceea, putem face presupunerea c viitoarele BIOS-urile de AN8 ar putea recurge la aceeai metod, nu foarte ortodox, de a crete performana plcii. Ce lipsete? Dispozitivul extern 3rd Eye, prezent pe multe plci mai slab cotate. Dar dac spm puin, descoperim c exist i modelul cu al treilea ochi, puin mai scump. Concluzie Nu este foarte plcut s afli c placa de baz pe care tocmai ai cheltuit o sum impresionant are un BIOS n stadiu beta, dei marcat ca oficial. Acesta este unul dintre puinele impedimente care pot hotr un entuziast s nu cumpere Abit AN8 Fatal1ty. + potenial mare de overclocking + rcire excelent + LED-uri de diagnosticare + prezentare atrgtoare - BIOS beta - doar 2.8V pentru memorie - pre mare 2.2.5. Abit AN8 (nForce4) Probabil ai remarcat pe parcursul acestei prezentri c uneori m-am referit la plac numind-o AN8 pur i simplu, fr sufixul Fatal1ty. De ce? Pentru c exist i versiunea AN8 simplu, ce nu difer de sora mai mare dect prin culoarea PCB-ului i a slot-urilor, prin inscripionarea diferit a sistemului de rcire a surselor de putere, prin absena modulului de rcire a memoriilor i prin dotarea puin mai obinuit la capitolul cabluri (de exemplu, nu avem cabluri IDE rounded ci normale). i nu n ultimul rnd, prin dotarea cu chipset-ul nForce4 simplu, ce nu dispune de Serial ATA 300, ci de versiunea ce permite un transfer de doar 150 MB/s. Diferena este absolut insesizabil, testele nu au scos-o n eviden. Teste care au demonstrat performane identice i frecvene de overclocking atinse la fel de identice. Preul ei este cu circa 25% mai mic, aadar este foarte discutabil dac achiziionarea versiunii Fatal1ty reprezint o opiune bun.

Concluzie + potenial mare de overclocking + rcire bun29

Evaluarea performanelor sistemelor de calcul

+ LED-uri de diagnosticare + prezentare atrgtoare - BIOS beta - doar 2.8V pentru memorie 2.2.6. DFI LANParty UT nF4 Ultra-D (nForce4 Ultra) BE6-II, KX7-333, IT7, NF7 - toate sunt modele de plci de baz de la Abit ce ntr-un moment sau altul au fcut istorie, fiind considerate adevrate campioane ale overclocking-ului. Probabil v vei ntreba ce au ele n comun cu DFI-ul despre care vrem sa discutm aici?; ei bine, ele, ca i ultimele modele produse de DFI, poart semntura aceluiai inginer, pe nume Oscar Wu. Aceasta, mpreun cu lista de specificaii tehnice i mai ales cu opiunile foarte ndrznee disponibile n meniul BIOS-ului (pe care le vom detalia mai trziu), ar trebui s spun multe despre cui se adreseaz placa de fa.

La o prim vedere aruncat asupra ambalajului, singura opinie este legat de culorile folosite i de imaginea stilizat ce las impresia unui ambalaj de jucrii. Deschiznd cutia, observm un coninut nu foarte bogat, nsa interesant dac lum n calcul c modelul prezentat aici este cea mai srac variant din oferta DFI a acestei game. Cablurile (dou ATA-133 rounded, dou S-ATA, unul FDD rounded) sunt toate de culoare galben i sensibile la ultraviolete i, mpreun cu combinaia de culori (PCB cafeniu i slot-uri galbene la fel de UV-sensitive) folosit de placa de baz, pot avea un aspect destul de plcut ntr-o carcas cu fereastr. Alturi de aceste cabluri, sunt furnizate un adaptor pentru alimentarea a dou hard disk-uri S-ATA, un cletior pentru manevrarea mai uoar a jumper-ilor, cinci jumperi suplimentari cu mo, trei seturi de jumperi SLI de rezerv i un back-panel ce asigur compatibilitatea configuraiei mufelor la orice carcas. De asemenea, n cutie se mai gsesc un manual nu foarte bogat, ns cu informaii suficiente pentru ca instalarea s decurg fr probleme, CD-ul cu drivere i utilitare, un pliant ce prezint tehnologia CMOS Reloaded, o dischet cu driverele de RAID Silicon Image (inutil, deoarece controller-ul Sil3114 se afl numai pe modelele high-end), precum si exoticul modul audio Karajan, care dei nu e dect un simplu codec ALC850 pe opt canale ce se monteaz pe un PCB separat, se presupune c ofer o mbuntire calitativ a semnalului fa de implementarea obinuit onboard.

30

Cap 2: Evaluarea performanelor plcilor de baz

Trecnd la analizarea aspectului plcii, observm poziionarea mai deosebit a slot-urilor de memorie i a procesorului, probabil n efortul de a reduce lungimea traseelor bus-ului HyperTransport; un vot n plus pentru inginerii DFI, pentru c au depus efortul de a modifica att de radical PCB-ul de referin NVIDIA. Analiznd sistemele de rcire, observam c att tranzistorii ce deservesc sursa de alimentare a procesorului, ct i cei pentru RAM i chipset, sunt dotai cu radiatoare de dimensiuni impresionante, din aluminiu, ce promit o funcionare stabil a respectivelor module n condiii extreme. Punnd i cooler-ul de pe chipset sub lup, cooler ce are dimensiuni peste medie i beneficiaz de un ventilator Mag-Lev (teoretic de cteva ori mai fiabil dect cele ball bearing si n acelai timp mai silenios), i adugnd la aceasta faptul c sunt prezente nu mai puin de 4 (patru!) mufe de alimentare pentru placa de baz (ATX 2.0, +12V, molex HDD + mufa FDD), nu putem trage dect o concluzie: placa e proiectat s gzduiasc componente ce consum foarte multa putere. Overclocking anybody? Majoritatea conectorilor au o amplasare bun, singurul care aduce o penalizare mai serioas este unul din cei de alimentare, i anume cel cu mufa de FDD, plasat foarte aproape de centru; existena lui acolo este justificata dac ne gndim la eficien maxim, pentru c livreaz curentul foarte aproape de consumator, eliminnd astfel pierderile suplimentare prin traseele de pe PCB-ul plcii de baza. Un alt lucru care merit cu siguran atenia e prezena a dou slot-uri PCI Express X16, iar alturi de ele existena unor seturi de jumperi ce se pot seta pe Normal sau SLI, ntocmai ca la modelele ce suport modul SLI. Mai mult, AnandTech3 a sesizat acum ceva timp c chipset-urile nForce4 Ultra i nForce SLI sunt unul i acelai, diferena constnd doar n prezenta unei puni conectate pe chipset (similare celei ntlnite la procesoarele Athlon), ce permite identificarea chipset-ului ca avnd sau nu posibiliti de SLI. DFI-ul a suportat cu succes modificarea (ce poate fi realizat cu un creion, cu substan electroconductoare sau chiar cu pistolul de lipit - nerecomandat celor care nu au priceperea necesar), funcionnd perfect cu dou plci grafice Leadtek 6800 n mod SLI, sistemul overclock-at depind bariera celor 19.000 de puncte in 3DMark03. Back-panel-ul e special, gzduind nu mai puin de ase mufe USB, dou RJ-45 (LAN Gigabit), una FireWire, ase jack-uri audio, dou conectoare de tip RCA (intrarea, respectiv ieirea SP/DIF), precum i obinuiii conectori PS/2 pentru tastatur i mouse. Se observ eliminarea conectorului pentru portul paralel, n timp ce cel serial precum i unul suplimentar FireWire i patru USB pot fi conectate intern pe placa de baz, dei conectorii de extensie lipsesc. Ultimul lucru legat de layout ce merit menionat este prezena switch-urilor de Power i Reset precum i a unui speaker direct3

http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2322 31

Evaluarea performanelor sistemelor de calcul

pe placa de baza, pe care am avut ocazia s le apreciem n timpul testelor, placa avnd funcionalitate deplin fr a necesita folosirea unei carcase. Mai departe, descoperim un BIOS extrem de bogat care, pe lng numrul foarte mare de setri legate de memorie, permite reglarea tensiunii Vcore (pentru procesor) pn la 2.1V, VDD (chipset) pn la 1.8V, LDT (HyperTransport) pn la 1.5V i, cel mai impresionant, Vdimm (cea a memoriei) pn la 4V. Dei aceast din urm setare e util doar n cazul n care sunt folosite memorii cu anumite chip-uri Winbond ce rspund dar mai ales rezist la asemenea valori, notm nc un punct n plus pentru DFI din partea entuziatilor. Toate setrile legate de overclocking sunt strnse ntr-o singur categorie a BIOS-ului, numit Genie BIOS - i cnd zic toate nu m refer doar la memorie i voltaje, ci i la posibilitatea de a dezactiva anumite device-uri on-board ce ar putea limita overclocking-ul extrem (porturi S-ATA, on-board LAN etc) - de unde putem afla tensiunile critice i, foarte interesant, avem posibilitatea de a rula Memtest86+ imediat dup POST (test ce este integrat n chip-ul de BIOS). Ambalajul de jucrii conine, se pare, i ceva jucrii de oameni mari. Un lucru de asemenea special este CMOS Reloaded, ce const n posibilitatea de a stoca patru configuraii ale BIOS-ului, ce se pot ncrca mai trziu prin simpla apsare a unei taste; alturi de modul Safe Boot selectabil printr-un jumper (pentru a nu fi necesar s resetm BIOS-ul), este o unealt foarte util n cazul overclocking-ului sau al testrii componentelor. Trecnd mai departe la msurarea performanelor, am observat un comportament excelent, placa stabilind referina pentru celelalte incluse n test, mai ales datorit faptului c a suportat setri ale memoriei mai agresive dect n cazul celorlalte modele. Astfel, setrile CAS i TRAS au mers coborte pn la unele valori mai neobinuite, i anume 1.5 i respectiv 0, n timp ce la celelalte modele testate nu am reuit sa le coborm n condiii de stabilitate mai jos de 2, respectiv 5. De asemenea, tRC, tRFC si tRRD au cobort pn la 7-9-0, comparativ cu 9-12-2 la celelalte. Cea mai mare diferen de performan a avut loc n compresia WinRAR, unde placa a punctat cu 1.5% mai bine dect urmtoarea clasat. Overclocking-ul este ns capitolul unde DFI arat cu adevrat tot ce poate. Fornd memoriile Corsair la latene crescute, am reuit s le mpingem pn la o frecven stabil de 315 MHz, destul de impresionant avnd n vedere c ele sunt certificate la o frecven de lucru de 200 MHz (cu latene mult mai strnse ns). Cel mai impresionant lucru a fost HTT-ul atins, i anume 445 MHz, folosind un divizor 2:1 pentru memorie; astfel, placa a dovedit c poate rula stabil la o frecven aproape de dou ori i jumtate mai mare fa de specificaii. Software-ul inclus pe CD-ul cu drivere const ntr-un program de monitorizare (ITE SmartGuardian) ce permite i controlul turaiei ventilatoarelor n funcie de temperaturi, soft-ul NVIDIA nTune precum i un alt utilitar numit ITE SmartSpeed. Acesta conine, pe lng funcionalitatea lui ITE SmartGuardian, i posibilitatea setrii tensiunilor Vcore, Vdimm si VDD, precum i un overclocking limitat. Aceast din urm funcie este total nereuit, posibilitile de supratactare fiind practic nefuncionale, aceasta pe lng greelile evidente de limb englez din program. Per total, micul productor DFI reuete s se prezinte cu o ofert excepional, singurele categorii care ar putea fi mbuntite fiind legate de documentaie i de funcionalitatea software-ului; avnd ns n vedere c target-ul produsului se afl mai degrab n zona power-user, aceste lipsuri sunt ca i inexistente.

32

Cap 2: Evaluarea performanelor plcilor de baz

Concluzie Performana i posibilitile deosebite de overclocking fac din DFI LANParty UT nF4 Ultra-D ctigtorul testului nostru, chiar i n competiie cu modelele high-end de la productori consacrai. Titlul de XF Award l-a primit cu greu din cauza absenei de pe piaa romneasc la data efecturii testelor. + overclocking extrem atins n practic + BIOS special conceput pentru overclocking + numeroase setri de memorie + poate fi transformat uor pentru lucrul n mod SLI - documentaia i software-ul las de dorit 2.2.7. Gigabyte GA-K8NXP-SLI (nForce4 SLI) Plac creat special pentru a oferi maximul de performan dintr-un sistem de gaming, este dotat cu dou slot-uri PCI Express X16, GA-K8NXP-SLI impresioneaz n primul rnd prin dotare i, de ce nu, prin aspectul estetic de excepie. Mai nti sare n ochi cutia dubl fa de cea a unei plci normale, n interiorul pachetului aflndu-se dou cutii mai mici, pline cu jucrii. n prima gsim (enumerate ntr-o ordine aleatoare) o foaie ce face reclam la cooler-ul 3D Rocket, creat tot de Gigabyte (un model foarte reuit), un manual bine scris, unul destinat chip-ului Sil3114 (hint: Serial ATA, RAID 5), un ghid de instalare rapid sub form de pliant, scris n cteva limbi, un abibild Gigabyte... i cam att cu maculatura. Lucrurile mai serioase se concretizeaz prin nu mai puin de opt cabluri Serial ATA i patru cabluri convertoare molex alimentare SATA (cu cte doi conectori pe fiecare cablu) i numai un cablu Parallel ATA. Cu alte cuvinte, fiecare hard disk Serial ATA ce poate fi utilizat mpreun cu aceast plac de baz nu va avea nevoie de nici un cablu suplimentar fa de cele livrate.

n cealalt cutie avem deja obinuitul DPS (Dual Power System) cu care ne rsfa Gigabyte de circa doi ani ncoace, precum i o plac al crui nume spune totul: 802.11 Wireless LAN Card. S nu uitm nici de cele trei bracket-uri USB (ase porturi n total, fr a le meniona pe cele patru de pe plac), unul servind i conectrii a dou dispozitive FireWire. Analiznd acum placa, observm cele dou slot-uri PCI Express, fiecare putnd suporta o plac grafic performant. Modul SLI este reflectat de un mic card, asemntor modulelor SO-DIMM, ce permite selectarea modului de operare: SLI sau Normal. Cu al