Technické údaje grafických kariet
Na nasledujúcej stránke máme porovnané technické parametre jednotlivých grafických kariet a ich príslušné teoretické peak hodnoty:
            Radeon HD 3850 512 GDDR3 | 
            
            Radeon HD 3870 512 GDDR4 | 
            
            HD 3870 512 GDDR4 @ CrossFire | 
        |
|  Jadro: | 
            RV670 | RV670 | 2x RV670 | 
|  Výrobný proces: | 
            55nm | 55nm | 55nm | 
|  Veľkosť jadra: | 
            ~192 mm2 | ~192 mm2 | 2x ~192 mm2 | 
|  Počet tranzistorov: | 
            ~666 miliónov | ~666 miliónov | ~666 miliónov | 
|  Frekvencia jadra: | 
            670 MHz | 
            775 MHz | 2x 775 MHz | 
|  Frekvencia pamäte: | 
            830 MHz | 1125 MHz | 
            2x 1125 MHz | 
|  Kapacita, typ pamäte: | 
            512MiB, GDDR3 | 512MiB, GDDR4 | 
            2x 512MiB, GDDR4 | 
|  Frekvencia shadercore: | 
             670 MHz | 
             775 MHz | 
            2x 775 MHz | 
|  Počet TFUs: | 
            16 | 16 | 2x 16  | 
        
|  Počet TAUs: | 
            32 | 32 | 2x 32 | 
|  Počet ALUs: | 
            64x Vec5 (320 SPs) | 
            64x Vec5 (320 SPs) | 
            2x 64x Vec5 (640 SPs) | 
        
|  Počet ROPs | 
            16 | 16 | 2x 16 | 
        
| Podpora D3D: | 10.1 | 10.1 | 10.1 | 
|  Pixel fillrate: | 
            10 720 Mpixels/s | 12 400 Mpixels/s | 2x 12 400 Mpixels/s | 
|  Bilinear texelfillrate: | 
            10 720 Mtexels/s | 12 400 Mtexels/s | 2x 12 400 Mpixels/s | 
| Bilinear FP-16 texel fillrate:  | 
            10 720 Mtexels/s | 12 400 Mtexels/s | 2x 12 400 Mtexels/s | 
|  Z-sample rate: | 
            21 440 Msamples/s | 24 800 Msamples/s | 2x 24 800 Msamples/s | 
| AA-sample rate: | 42 880 Msamples/s | 49 600 Msamples/s | 2x 49 600 Msamples/s | 
| Aritmetický výkon: | 428,8 GFlop/s | 496 GFlop/s | 2x 496 GFlop/s | 
| Geometry rate: | 670 Mtriangles/s | 775 Mtriangles/s | 2x 775 Mtriangles/s | 
|  Šírka zbernice: | 
            256 bit | 256 bit |  2x 256 bit | 
        
| Priepustnosť pamäte: | 53,1 GB/s | 72 GB/s | 2x 72 GB/s | 

            GeForce 9600 GT OC | 
            
            GeForce 9600 GT
             | 
            
            GeForce 8800 GT | 
            
            GeForce 8800 GTX | 
        |
|  Jadro: | 
            G94 | G94 | G92 | G80 | 
|  Výrobný proces: | 
            65nm | 65nm | 65nm | 90nm | 
|  Veľkosť jadra: | 
            ~240mm2 | ~240mm2  | 
            ~325 mm2 | ~484 mm2 | 
|  Počet tranzistorov: | 
            ~505 miliónov | ~505 miliónov | ~754 miliónov | ~681 miliónov | 
|  Frekvencia jadra: | 
             700 MHz | 
             650 MHz | 
             600 MHz | 
            575 MHz | 
        
|  Frekvencia pamäte: | 
             950 MHz | 
             900 MHz | 
            900 MHz | 
            900 MHz | 
|  Kapacita, typ pamäte: | 
             512MiB, GDDR3 | 
            512MiB, GDDR3  | 
            512MiB, GDDR3 | 
            768MiB, GDDR3 | 
|  Frekvencia shadercore: | 
             1680 MHz | 
            1625 MHz |  1512 MHz | 
            1350 MHz | 
|  Počet TFUs: | 
            32 | 32 | 56 | 64 | 
|  Počet TAUs: | 
            32 | 32 | 56 | 32 | 
|  Počet ALUs: | 
            4x Vec16 (64 SPs) | 
            4x Vec16 (64 SPs) | 7x Vec16 (112 SPs) | 
            8x Vec16 (128 SPs) | 
        
|  Počet ROPs | 
            16 | 16 | 16 | 24 | 
| Podpora D3D: | 10 | 10 | 10 | 10 | 
|  Pixel fillrate: | 
             11 200 Mpixels/s | 
             10 400 Mpixels/s | 
            9600 Mpixels/s | 13 800 Mpixels/s | 
|  Bilinear texelfillrate: | 
             22 400 Mtexels/s | 
             20 800 Mtexels/s | 
            33 600 Mtexels/s | 
            18 400 Mtexels/s | 
        
| Bilinear FP-16 texel fillrate:  | 
             11 200 Mtexels/s | 
            10 400 Mtexels/s | 16 800 Mtexels/s | 18 400 Mtexels/s | 
|  Z-sample rate: | 
            44 800 Msamples/s | 41 600 Msamples/s  | 
            38 400 Msamples/s | 55 200 Msamples/s | 
| AA-sample rate: |  89 600 Msamples/s | 
            83 200 Msamples/s | 76 800 Msamples/s | 110 400 Msamples/s | 
| Aritmetický výkon: |  322,56 GFlop/s | 
             312 GFlop/s | 
            508 GFlop/s | 518,4 GFlop/s | 
| Geometry rate: |  700 Mtriangles/s | 
            650 Mtriangles/s | 600 Mtriangles/s | 575 Mtriangles/s  | 
        
|  Šírka zbernice: | 
             256 bit | 
            256 bit | 256 bit | 384 bit | 
| Priepustnosť pamäte: |  60,8 GB/s | 
            57,6 GB/s | 57,6 GB/s | 86,4 GB/s | 
Poznámky:
Každá TMU = textúrovacia jednotka sa skladá z TFUs = filtrovacích a TAUs = adresovacích subjednotiek. Rozhodli sme sa zaradiť do tabuľky aj Bilinear FP-16 texelfillrate okrem "čistej" bilinear texelfillrate, lebo má vyššiu výpovednú hodnotu. V hrách asi už len málokto nevyužíva trilineárny či anizotropný filter - dvojnásobne to platí pri high-end kartách a architektúre silnej na texelfillrate ako je G8x/G9x. Pure fillrate má G92/94 vyššiu ako G80, kvôli väčšiemu počtu adresovacích jednotiek (TAUs) v sampler array. GeForce 8800GTX má na rozdiel od toho viac filtrovacích jednotiek (TFUs), ktoré dokáže využiť napr. až pri trilieárnom, anizotropnom alebo bilinearnom FP-16 filtrovaní. Jej texelfillrate so zapnutím bilinear 2x anizotropného filtra neklesne. G92/G94, áno. Možno z toho dôvodu hovoriť o trilineárnych TMUs v prípade G8x a o bilineárnych TMUs v prípade G9x.
Aritmetický výkon sme u GeForce grafických kartách počítali s 3 FLOPs (MAD + MUL) za takt ako udáva nVidia, aj napriek tomu, že MUL sub-ALU, ktorá dodáva tretiu FLOPs je často využívaná na korektúru perspektív, interpoláciu a SFUs. Od grafického ovládača ForceWare 158.19 je ju možné využiť z časti - 15% na general shading, ako MAD jednotky. Dôvod prečo sme takto počítali je v konkurencii. Reálny aritmetický výkon RV670 čipe je taktiež nižší, lebo Vec5 ALUs dokážu za takt spracovať len vtedy 5 komponentov, pokiaľ nie sú na sebe závislé a 5. sub-ALU = tá väčšia, sa stará takisto o SFUs. G8x/G9x má oproti R(V)6x0 výhodu v lepšom vyťažení shadercore, lebo jej ALUs sa tvária ako "skalárne" vďaka riadiacej logike (v skutočnosti sú to Vec ALUs) a superskalárna architektúra R(V)6xx využívajúca VLIW je závislá na compileri, assembleri.
Pre viac detailov ohľade jednotlivých architektúr odporúčam prečítať technické články zaoberajúce sa čipom G80, R600:
    
jutes
M1ch4l
Gudas
M1ch4l
M1ch4l
andrejsvk
JeffoneoN
fobos
Pavol Bobik
fobos
Gudas
Pavol Bobik
sapiq
crux2005