RSX Reality Synthesizer - RSX Reality Synthesizer

RSX 'Reality Synthesizer' PlayStation 3 -emolevyllä

RSX 'Todellisuus syntetisaattori' on oma grafiikka (GPU) codeveloped mukaan Nvidia ja Sonyn varten PlayStation 3 pelikonsoli. Se on Nvidia 7800GTX -näytönohjaimeen perustuva grafiikkasuoritin, ja Nvidian mukaan se on G70 / G71 (aiemmin nimellä NV47) hybridiarkkitehtuuri, jossa on joitain muutoksia. RSX on erilliset Vertex ja Pixel Shader putkistoja . GPU käyttää 256 Mt: n GDDR3- muistia, joka kellotaajuus on 650 MHz ja tehollinen lähetysnopeus 1,3 GHz, ja jopa 224 Mt 3,2 GHz: n XDR-päämuistia suorittimen kautta (enintään 480 Mt). Vaikka se suorittaa suurimman osan grafiikkaprosessoinnista, konsolin CPU: ta , Cell Broadband Engineä , käytetään myös täydellisesti joihinkin grafiikkaan liittyviin konsolin laskennallisiin kuormituksiin.

Tekniset tiedot

Sirun pituus alareunassa: 4,28 cm

Ellei toisin mainita, seuraavat tekniset tiedot perustuvat Sonyn E3 2005 -konferenssissa julkaisemaan lehdistötiedotteeseen, dioihin samasta konferenssista ja dioihin Sonyn esityksestä vuoden 2006 pelikehittäjien konferenssissa .

  • 550 MHz: n pikselivarjostinkello / 500 MHz: n vertex-varjostinkello 90 nm: n prosessissa (kutistui 65 nm: iin vuonna 2008 ja 40 nm: iin vuonna 2010), 300+ miljoonaa transistoria
  • Perustuu NV47: ään (Nvidia GeForce 7800 -arkkitehtuuri)
  • Pikku Endian
  • 24 tekstuurisuodatusyksikköä (TF) ja 8 kärjen pintarakenteen osoitinyksikköä (TA)
    • 24 suodatettua näytettä kelloa kohti
    • Suurin Texel-täyttösuhde: 13,2 gigatexeliä sekunnissa (24 tekstuuria * 550 MHz)
    • 32 suodattamatonta tekstuurinäytettä kelloa kohti (8 TA * 4 tekstuurinäytettä)
    • 8 renderöintiyksikköä (ROP) / pikselin renderöintiä
      • Pikselien huippunopeus (teoreettinen): 4,4 gigapikseliä sekunnissa
      • Suurin Z-puskurointinäytteenottotaajuus : 8,8 giga-näytettä sekunnissa (2 Z-näytettä * 8 ROP: ta * 550 MHz)
    • Suurin pistetuotetoiminto: 51 miljardia sekunnissa (yhdistettynä Cell-suorittimeen)
    • 128-bittinen pikselitarkkuus tarjoaa korkean dynaamisen alueen renderoinnin
  • 256 Mt GDDR3-muistia taajuudella 650 MHz
    • 128-bittinen muistiväylän leveys
    • 20,8 Gt / s luku- ja kirjoituskaistanleveys
  • Cell FlexIO -väyläliitäntä
    • Rambus XDR -muistiliitännän väyläleveys: 56 bittiä 64 bitistä (sarja)
    • 20 Gt / s luettavissa solu- ja XDR-muistiin
    • 15 Gt / s kirjoitus solu- ja XDR-muistiin
  • 576 kt: n tekstuurivälimuisti (96 kt / pikseliputkilinjoja)
  • Tuki PSGL: lle (OpenGL ES 1.1 + Nvidia Cg )
  • Tuki S3-tekstuurin pakkaukselle

Muut ominaisuudet: Tuki bilineaariselle, trilineaariselle , anisotrooppiselle, quincunx- tekstuurisuodatukselle, quincunx-antialiaseille, jopa 4x MSAA , SSAA , Alpha to Coverage ja Alphakill.

Mallinumero

90 nm:

  • CXD2971AGB
  • CXD2971DGB
  • CXD2971GB
  • CXD2971-1GB
  • CXD297BGB

65nm:

  • CXD2982
  • CXD2982GB
  • CXD2991GB
  • CXD2991BGB
  • CXD2991GGB
  • CXD2991CGB
  • CXD2991EGB

40nm:

  • CXD5300AGB
  • CXD5300A1GB
  • CXD5301DGB
  • CXD5302DGB
  • CXD5302A1GB

Paikallinen GDDR3-fyysisen muistin rakenne

  • Muisti yhteensä 256 Mt
  • 2 osiota (128 Mt)
  • 64-bittinen väylä / osio
  • 8 pankkia per osio (16 Mt)
  • 4096 sivua pankkia kohden (4 kt) -> 12-bittinen riviosoite
  • Muistilohko sivulla -> 9-bittinen sarakeosoite
  • Pienin käyttöoikeuden tarkkuus = 8 tavua -> sama kuin väyläleveys RSX <> GDDR: n välillä

RSX-muistikartta

Vaikka RSX: llä on 256 Mt GDDR3-RAM-muistia, kaikkia niitä ei voida käyttää. Viimeinen 4 Mt on varattu RSX: n sisäisen tilan ja annettujen komentojen seuraamiseen. 4 Mt GPU-dataa sisältää RAMIN-, RAMHT-, RAMFC-, DMA-objektit, graafiset objektit ja graafisen kontekstin. Seuraava on erittely osoitteesta 256 Mt: n sisällä RSX: stä.

Osoitealue Koko Kommentti
0000000-FBFFFFF 252 Mt. Kehyspuskuri
FC00000-FFFFFFF 4 Mt. GPU-tiedot
FF80000-FFFFFFF 512 kt RAMIN: Ilmentymämuisti
FF90000-FF93FFF 16 kt RAMHT: Hash-taulukko
FFA0000-FFA0FFF 4 kt RAMFC: FIFO-konteksti
FFC0000-FFCFFFF 64 kt DMA-objektit
FFD0000-FFDFFFF 64 kt Graafiset objektit
FFE0000-FFFFFFF 128 kt KAAVIO: Graafinen konteksti

Paikallisen GDDR3-muistin lisäksi pääXDR-muistia voi käyttää myös RSX, joka on rajoitettu joko:

  • 0 Mt - 256 Mt (0x00000000 - 0x0FFFFFFF)
-tai-
  • 0 Mt - 512 Mt (0x00000000 - 0x1FFFFFFF)

Nopeus, kaistanleveys ja viive

Järjestelmän kaistanleveys (teoreettinen enimmäismäärä):

  • Solu 256 Mt: n XDR-muistiin: 25,6 Gt / s
  • Solusta RSX: ään (IOIFO): 20 Gt / s (käytännöllinen: 15,8 Gt / s @ packetsize 128B)
  • Solu RSX: ltä (IOIFI): 15 Gt / s (käytännöllinen: 11,9 Gt / s @ packetsize 128B)
  • RSX 256 Mt: n GDDR3: lle / alkaen: 20,8 Gt / s (@ 650 MHz)

Eri sirujen välisen tiedonsiirtopolun edellä mainitun asettelun sekä eri komponenttien välisten viive- ja kaistanleveyserojen takia on olemassa erilaisia ​​pääsynopeuksia riippuen pääsyn suunnasta suhteessa lähteeseen ja kohteeseen. Seuraava on kaavio, joka näyttää luku- ja kirjoitusnopeuden GDDR3- ja XDR-muistiin solun ja RSX: n näkökulmasta. Huomaa, että nämä ovat mitattuja nopeuksia (eikä laskettuja nopeuksia) ja niiden pitäisi olla huonompia, jos kyseessä on RSX- ja GDDR3-yhteys, koska nämä luvut mitattiin, kun RSX: n kellotaajuus oli 550 MHz ja GDDR3-muistin kellotaajuus oli 700 MHz. Toimitetun PS3: n RSX on ajastettu 500 MHz: iin (etu- ja takapää, vaikka pikselivarjostimet toimivat erikseen sisällä 550 MHz). Lisäksi GDDR3-muisti kellotettiin myös matalammalla nopeudella 650 MHz.

Nopeuspöytä

Suoritin 256 Mt: n XDR 256 Mt GDDR3
Solun lukeminen 16,8 Gt / s 16 Mt / s (15,6 Mt / s @ 650 MHz)
Solun kirjoitus 24,9 Gt / s 4 Gt / s
RSX-luku 15,5 Gt / s 22,4 Gt / s (20,8 Gt / s @ 650 MHz)
RSX-kirjoitus 10,6 Gt / s 22,4 Gt / s (20,8 Gt / s @ 650 MHz)

256 Mt: n GDDR3-muistin erittäin hitaan solunlukunopeuden vuoksi on tehokkaampaa, että solu toimii XDR: ssä ja että sen jälkeen RSX-vetotiedot XDR: ltä ja kirjoittaminen GDDR3: een lähetettäväksi HDMI- näyttöön. Siksi RSX: ään sisällytettiin ylimääräiset tekstuurin hakuohjeet, jotta tiedot voidaan ladata XDR-muistista (toisin kuin paikallinen GDDR3-muisti).

RSX-kirjastot

RSX on omistettu 3D-grafiikalle, ja kehittäjät voivat käyttää erilaisia ​​API-kirjastoja pääsemään sen ominaisuuksiin. Helpoin tapa on käyttää korkean tason PSGL: ää, joka on periaatteessa OpenGL | ES, johon on lisätty ohjelmoitava putki, mutta tämä on epäsuosittu johtuen suhteellisen heikon konsoliprosessorin suorituskyvystä. Alemmalla tasolla kehittäjät voivat käyttää LibGCM: ää , joka on API, joka rakentaa RSX- komentopuskureita alemmalle tasolle. (PSGL toteutetaan tosiasiallisesti LibGCM: n päällä). Tämä tapahtuu asettamalla komennot (FIFO-kontekstin kautta) ja DMA-objektit ja antamalla ne RSX: lle DMA-puheluiden kautta.

Erot G70-arkkitehtuuriin

RSX: n 'Reality Synthesizer' perustuu G70-arkkitehtuuriin, mutta sisältää muutamia muutoksia ytimeen. Suurin ero näiden kahden sirun välillä on tapa, jolla muistin kaistanleveys toimii. G70 tukee hahmonnusta vain paikalliseen muistiin , kun taas RSX pystyy hahmontamaan sekä järjestelmä- että paikalliseen muistiin. Koska renderöinnillä järjestelmämuistista on paljon suurempi viive verrattuna renderöintiin paikallisesta muistista, sirun arkkitehtuuria oli muutettava suoritusrangaistuksen välttämiseksi. Tämä saavutettiin suurentamalla sirun kokoa suurempien puskureiden ja välimuistien sijoittamiseksi grafiikkaputken pitämiseksi täyteen. Tuloksena oli, että RSX: llä on vain 60% G70: n paikallisen muistin kaistanleveydestä, joten kehittäjien on käytettävä järjestelmämuistia suorituskykytavoitteiden saavuttamiseksi.

Ero RSX nVidia 7800GTX
GDDR3-muistiväylä 128-bittinen 256 bittiä
ROP: t 8 16
Muunnoksen ja valaistuksen välimuisti 63 maksimipistettä 45 maksimipistettä
Rakenteen kokonaisvälimuisti per neliö pikseliputkia (L1 ja L2) 96 kt 48 kt
CPU-liitäntä FlexIO PCI-Express 16x
Teknologia 28 nm / 40 nm / 65 nm / 90 nm 110 nm

Muita RSX-ominaisuuksia / -eroja ovat:

  • Lisää varjo-ohjeita
  • Ylimääräinen tekstuurihakulogiikka (auttaa RSX: tä siirtämään tietoja XDR: stä)
  • Nopea vektori normalisoituu

lehdistötiedotteet

Sonyn henkilökunta lainattiin PlayStation Magazine -lehdessä sanomalla, että "RSX jakaa paljon sisäisiä toimintoja NVIDIA 7800: n kanssa, joka perustuu G70-arkkitehtuuriin." Koska G70 pystyy suorittamaan 136 varjostinoperaatiota kellosykliä kohti, RSX: n odotettiin olevan sama määrä rinnakkaisia ​​pikseli- ja kärkipistevirheitä kuin G70, joka sisältää 24 pikseliä ja 8 kärkiputkijohtoa.

Nvidian toimitusjohtaja Jen-Hsun Huang totesi Sonyn esitystä edeltävässä lehdistötilaisuudessa E3 2005: ssä, että RSX on kaksi kertaa tehokkaampi kuin GeForce 6800 Ultra.

Katso myös

Viitteet