Hvordan beregner man FLOP?

Grafikkort d.  28. april. 2009, skrevet af rene0399
Vist: 752 gange.

rene0399
 
Superbruger
Tilføjet:
28-04-2009 11:01:22
Svar/Indlæg:
217/32
Hej OC'ere

ganske enkelt som overskriften lyder, hvordan beregner man FLOP?
her tænker jeg mest omkring gfx.


-René
Reverb
 
Superbruger
Tilføjet:
28-04-2009 11:03:53
Svar/Indlæg:
450/67
Man kigger på salgstallene 😉



http://en.wikipedia.org/wiki/F...


Mathis77
 
Elitebruger
Tilføjet:
28-04-2009 11:06:58
Svar/Indlæg:
6293/359
#1 🤣


rene0399
 
Superbruger
Tilføjet:
28-04-2009 11:13:02
Svar/Indlæg:
217/32
Jeg har skam været inde på wiki og kigge den artikel flere gange..

Men jeg søger noget fast og håndterbart.
Hvordan finder de store chipproducenter ud af hvad deres kort kan?

Eftersom FLOP er et teoretisk max, kan der jo ikke bruges et program til det. Så der må være en eller anden form for ligning eller regnestykke af en art, som man bruger til det..

Så der må være en der er smart, og kan forklare mig det.. i stedet for man er dumsmart...


Gripen90
 
Senior Skribent
Tilføjet:
28-04-2009 11:15:26
Svar/Indlæg:
15893/632
Du kan kigge på LINPACK benchmark'en. Om den anvendes i GFX sammenhæng ved jeg ikke, men jeg ville da mene, at fillrate mv. må være mere interessant i GFX sammenhæng.


1EaR
 
Elitebruger
Tilføjet:
28-04-2009 11:25:25
Svar/Indlæg:
5734/122
Hvorfor er det lige man har glemt det, men når der kommer rygter om nye grafikkorts specs er der jo også nogle som beregner en mulig teoretisk FLOPS barriere som det vil bryde. Men det er noget med instruktioner pr. clock pr. Shader (kerne). og så har det nogle forskellige faktorere man skal gange med...

EDIT:

Hvis vi tager en ca. beregning, så kan vi tage mit HD3870 som reference.

Det spænder med 777Mhz på core, har 320 SP'er (kerner). Derved kan vi lave et regne stykke:

Vi starter med at omregne 777Mhz til Ghz, altså 0.777Ghz

Dette ganger vi med antallet af kerner, altså 320

Dette giver 256 Gflops, og den teoretiske er så vidt jeg husker 512GFLOPS 😉 altså det dobbelte 😀 Kan det ske jeg har ramt rigtigt 😲


rene0399
 
Superbruger
Tilføjet:
28-04-2009 11:32:05
Svar/Indlæg:
217/32
Se det ligner noget jeg har set før 😀

Jeg troede bare ikke det var så enkelt..

super! 🙂

Hvor finder man så ud af hvor mange kerne der er i sit grafikkort?

EDIT - På producentens hjemmeside 🙂


1EaR
 
Elitebruger
Tilføjet:
28-04-2009 11:36:26
Svar/Indlæg:
5734/122
#6 antallet af shaders... du skal huske at Nvidia ikke har samme gange faktor, det kan jo ske de ganger med 3 eller 4 der hvor man med ATI ganger med 2 😉 ... Altså 8800GTX har vist nok ca. 470-480GFLOPS, og 128 "kerner".

Kortets shaders kørte ved 1.35Ghz, så vi prøver lige at regne den ud...


128 * 1.35 * 2.75 (vil jeg tro) = 475.2

Håber andre kan bekræfte den teori 😀


NoNig
 
Elitebruger
Tilføjet:
28-04-2009 12:22:14
Svar/Indlæg:
23124/739
-> #0

Som de andre er inde på, er det lidt forskelligt alt efter arkitektur. Jeg fatter det heller ikke 100 %, men har nogenlunde styr på regnestykket.

Du tager clockfrekvensen, ganger med antal kerner/tråde og så er der en eller anden "precision" faktor, som netop er forskellig fra teknologi til teknologi.

ATi kører med "2x", nVidia kører med "3x".

Eksempelvis, så ved vi at HD4870 har ca. 1,2 TFLOPS at gøre med. Eller hvad der svarer til 1.200 GFLOPS. Lad os atter en gang gange med 1.200 og får derfor 1.200.000 MFLOPS.

Kortet kører med, så vidt jeg husker, 750 MHz på shaderne som der er 800 stk. af der kører med "double precision".

Det giver: 750 * 800 * 2 = 1.200.000 millioner kommatalsberegninger i sekundet.

nVidia GTX280 kører med:

1296 MHz * 240 shaders * 3 = 933.120 millioner kommatalsberegninger i sekundet.

Til trods for, at GTX280 "kun" har 80 % af HD4870'erets rå regnekraft, kan vi vel hurtigt blive enige om, at sådan ser virkeligheden (desværre) ikke ud.

Sammenlign så med Intels kraftigste Core 2 Quad, der ligger og roder rundt på små 50 GFLOPS. Altså 50.000 millioner kommatalsberegninger i sekundet.



Notika
 
Superbruger
Tilføjet:
28-04-2009 12:31:15
Svar/Indlæg:
649/37
#0
Jeg faldt lige over nogle sider:

http://cuda-z.sourceforge.net/ - Programmet kan lave en masse beregninger over forskellige NVIDIA grafikkort.

http://www.gpureview.com/show_... - God side der giver en masse informationer om diverse grafikkort.


Mapples
 
Elitebruger
Tilføjet:
28-04-2009 12:36:50
Svar/Indlæg:
6168/270
#1 man kigger på Naser khader. 🤣


sjoestedt
 
Overclocker
Tilføjet:
28-04-2009 13:48:19
Svar/Indlæg:
504/116
(#8) så hvordan får jeg lige min gpu ned i en cpu socket 😛



rene0399
 
Superbruger
Tilføjet:
28-04-2009 14:19:52
Svar/Indlæg:
217/32
#8 Den præcisionsfaktor, hvor kommer den fra?

Er det noget med effektivitet per clockfrekvens?


#13
1EaR
 
Elitebruger
Tilføjet:
28-04-2009 14:58:59
Svar/Indlæg:
5734/122
#12 antal beregninger / tråde en "kerne" kan afvikle i en clock 😉


scheea2000
 
Superbruger
Tilføjet:
28-04-2009 15:43:20
Svar/Indlæg:
818/58
"Kortet kører med, så vidt jeg husker, 750 MHz på shaderne som der er 800 stk. af der kører med "double precision".
Det giver: 750 * 800 * 2 = 1.200.000 millioner kommatalsberegninger i sekundet. "


<flueknep> 😛
Så hut jeg hvisker så er FLOPS for grafikkort altid single precision, da double precision tallet er meget lavere. Din x2 har du fra det faktum at en ALU kan udføre 2 floating point operationer per instruktion (mul, add), dvs.

core clock x shader units x antal FLOPS per instruktion

Aner ikke om det er 100% korrekt. 😳
</flueknep>


#15
FnaX
 
Elitebruger
Tilføjet:
28-04-2009 17:46:07
Svar/Indlæg:
4156/111
Det er sjovt som jeg hver gang bliver facineret af den regnekraft der ligger i dagens grafikkort når vi snakker om FLOPS 🤣 Hver gang ser jeg nye uanede muligheder med så meget regnekraft 😛