FLOPS
| de prestaties van de computer | ||
|---|---|---|
| Naam | flops | |
| megaflop | 106 | |
| gigaflop | 109 | |
| teraflop | 1012 | |
| petaflop | 1015 | |
| exaflop | 1018 | |
| zettaflop | 1021 | |
| yottaflop | 1024 | |
| xeraflop | 1027 | |
FLOPS is een afkorting die staat voor floating point operations per second (zwevendekommabewerkingen per seconde). Dit is een eenheid die wordt gebruikt om de rekenkracht van CPU's aan te duiden. Deze aanduiding is een aanvulling op de MIPS-eenheid, een andere snelheidsmeting van CPU's die voornamelijk de snelheid van instructieverwerking aangeeft.
FLOPS worden vaak gebruikt met de SI-voorvoegsels mega-, giga-, tera- en recent ook peta-.
Over het algemeen zijn GPU's krachtiger dan CPU's. Dit komt gedeeltelijk door een andere architectuur die GPU's op grafische kaarten gebruiken en doordat de CPU meer rekening moet houden met de snelheid van de randapparatuur.
Inhoud |
[bewerken] Vergelijking
Over het algemeen halen huidige CPU's tussen de 20 en 100 GFlops, huidige GPU's halen op enkele-precisie-berekeningen meer dan 800 GFlops, maar vallen terug naar een kwart van deze snelheid bij dubbele-precisie-berekeningen. Enkele voorbeelden van grafische kaarten met bijhorende prestaties zijn:
- De Radeon HD4870 X2 van ATI met 2.400 GFlops (2,4 TFlops).
- De GTX 295 van nVidia met 1.788 GFlops.
- De Larrabee van Intel met 1.000 GFlops.
Bovenstaande beschrijvingen zijn echter theoretische gevallen die alleen onder de meest ideale omstandigheden worden gehaald, berekend met SGEMM-benchmark of LINPACK.
Bij mainframes en supercomputers ligt het aantal FLOPS aanzienlijk hoger; de Cray XT5 Jaguar haalt 1,759 PetaFLOPS, de Japanse 'K Computer' zelfs 10,51 petaflops (november 2011). Als je een cluster zou bouwen met per server een Intel Core i7 en 2 ATI Radeon HD4870 X2-kaarten, zou je minimaal 361 servers nodig hebben om de snelheid van de Jaguar te behalen (theoretisch, in een perfecte omgeving). Dat is een stuk minder dan de duizenden die nodig zijn als je alleen CPU's gebruikt, maar dan hebben we het alleen over enkele precisie.
Voorbeeld van GFlops-scores van enige bekende CPU's:
| LINPACK-score 1kx1k (DP) | Cores | Threads | Piek GigaFLOPS | Werkelijke GigaFLOPS | Efficiëntie (in %) |
|---|---|---|---|---|---|
| Cell (processor), 1 SPU, 3,2 GHz | - | - | 1,83 | 1,45 | 79,23 |
| Cell (processor), 8 SPU's, 3,2 GHz | - | - | 14,63 | 9,46 | 64,66 |
| Pentium 4, 3,2 GHz | 1 | 1 | 6,4 | 3,1 | 48,44 |
| Pentium 4 + SSE3, 3,6 GHz | 1 | 1 | 14,4 | 7,2 | 50,00 |
| Itanium, 1,6 GHz | 1 | 1 | 6,4 | 5,95 | 92,97 |
| Core i7, 3,2 GHz | 4 | 8 | 70 | - | - |