Grafiikan prosessointiyksikkö - Graphics processing unit

GPU: n komponentit

Grafiikkaprosessori ( GPU ) on erikoistunut elektroninen piiri on suunniteltu nopeasti manipuloida ja alter muisti nopeuttaa luomista kuvien on kehyspuskuriin tarkoitettu lähtö näyttölaitteeseen . GPU: ita käytetään sulautetuissa järjestelmissä , matkapuhelimissa , henkilökohtaisissa tietokoneissa , työasemissa ja pelikonsoleissa .

Nykyaikaiset grafiikkasuorittimet manipuloivat erittäin tehokkaasti tietokonegrafiikkaa ja kuvankäsittelyä . Niiden erittäin rinnakkainen rakenne tekee niistä tehokkaampia kuin yleiskäyttöiset keskusyksiköt (CPU) algoritmeille, jotka käsittelevät suuria tietolohkoja rinnakkain. Henkilökohtaisessa tietokoneessa GPU voi olla näytönohjaimessa tai upotettuna emolevyyn . Tietyissä suorittimissa ne on upotettu CPU -muottiin .

1970 -luvulla termi "GPU" tarkoitti alun perin grafiikkaprosessoriyksikköä ja kuvasi ohjelmoitavaa prosessointiyksikköä, joka toimii itsenäisesti CPU: sta ja vastaa grafiikan käsittelystä ja tulostamisesta. Myöhemmin, vuonna 1994, Sony käytti termiä (nykyään grafiikkaprosessointiyksikköä ) viitaten PlayStation -konsolin Toshiba -suunnittelemalle Sony GPU: lle vuonna 1994. Nvidia suositteli tätä termiä vuonna 1999, joka markkinoi GeForce 256: ta "maailman ensimmäisenä" GPU ". Se esiteltiin "yksisiruisena prosessorina, jossa on integroitu muunnos, valaistus, kolmion asetus/leikkaus ja renderointimoottorit". Kilpailija ATI Technologies loi termin " visuaalinen prosessointiyksikkö " tai VPU julkaisemalla Radeon 9700: n vuonna 2002.

Historia

1970 -luku

Arcade -emolevyt ovat käyttäneet erikoisgrafiikkapiirejä 1970 -luvulta lähtien. Varhaisessa videopelilaitteistossa kehyspuskurien RAM -muisti oli kallista, joten videopiirit yhdistivät tietoja yhteen, kun näyttöä skannattiin näytöltä.

Erikoistunut tynnyrisiirtäjään piiri käytettiin auttamaan CPU Animoi ruutupuskurointia grafiikkaa erilaisiin 1970 arcadepelit päässä Midway ja Taito , kuten Gun Fight (1975), Sea Wolf (1976) ja Space Invaders (1978). Namco Galaxian arcade järjestelmää vuonna 1979 käytettiin erikoistunut näytönohjaimen tukevat RGB , monivärinen sprite ja tilemap taustoja. Galaxin laitteistoa käyttivät laajalti arcade -videopelien kulta -aikana pelifirmat , kuten Namco , Centuri , Gremlin , Irem , Konami , Midway , Nichibutsu , Sega ja Taito .

Atari ANTIC -prosessori Atari 130XE -emolevyllä

Kotimarkkinoilla Atari 2600 käytti vuonna 1977 televisioliitäntäsovittimella varustettua videovaihdinta . Atari 8-bittisten tietokoneiden (1979) oli ANTIC , video-prosessori, joka tulkitsee ohjeita kuvaavat "näyttö listan" AT tavalla Pyyhkäisyjuovien kartta tiettyihin bittikartoitettu tai luonteen tilat ja jos muisti on tallennettu (niin ei tarvinnut olla viereinen kehyspuskuri). 6502 konekoodin aliohjelmaa voidaan laukaista skannauslinjoilla asettamalla bitti näyttöluettelon käskylle. ANTIC tuki myös sujuvaa pystysuoraa ja vaakasuuntaista vieritystä suorittimesta riippumatta.

1980 -luku

NEC μPD7220 A

NEC μPD7220 oli ensimmäinen toteutus PC grafiikka näyttö prosessori yhtenä Large Scale Integration (LSI) integroidun piirin siru, joka mahdollistaa suunnittelun edullisia, korkean suorituskyvyn näytönohjaimelle kortteja, kuten niillä, Numero yhdeksän visuaalisena . Siitä tuli tunnetuin GPU 1980-luvun puoliväliin saakka. Se oli ensimmäinen täysin integroitu VLSI (erittäin laajamittainen integrointi) -metallioksidi-puolijohde ( NMOS ) -näyttöprosessori tietokoneille, tuettu jopa 1024x1024 resoluutiolle ja loi perustan kehittyville PC-grafiikkamarkkinoille. Sitä käytettiin useissa näytönohjaimissa, ja se lisensoitiin klooneille, kuten Intel 82720, joka on ensimmäinen Intelin grafiikkaprosessointiyksikkö . Williams Electronicsin arcade-pelit Robotron 2084 , Joust , Sinistar ja Bubbles , jotka kaikki julkaistiin vuonna 1982, sisältävät mukautettuja blitter- siruja 16-väristen bittikarttojen käyttämiseen.

Vuonna 1984 Hitachi julkaisi ARTC HD63484: n, ensimmäisen suuren CMOS -grafiikkaprosessorin PC: lle. ARTC kykeni näyttämään jopa 4K resoluutio kun mustavalkoista tilassa, ja sitä käytettiin useissa PC näytönohjainten ja terminaalit 1980-luvun lopulla. Vuonna 1985 Commodore Amigassa oli mukautettu grafiikkapiiri, jossa blitter -yksikkö nopeutti bittikarttojen käsittelyä, viivanvetoa ja alueen täyttötoimintoja. Mukana on myös rinnakkaisprosessori, jolla on oma yksinkertainen käskykokonaisuutensa ja joka pystyy manipuloimaan grafiikkalaitteiston rekistereitä synkronoituna videokeilan kanssa (esim. Skannauslinjakohtaisia ​​palettikytkimiä, sprite-multipleksointia ja laitteisto-ikkunointia varten) tai ajamaan blitteriä. Vuonna 1986 Texas Instruments julkaisi ensimmäisen täysin ohjelmoitavan grafiikkaprosessorin TMS34010 . Se pystyi suorittamaan yleiskoodin, mutta sillä oli grafiikkasuuntainen käskykanta. Vuosina 1990–1992 tästä sirusta tuli Texas Instruments Graphics Architecture ("TIGA") Windowsin kiihdytinkorttien perusta .

IBM 8514 Micro Channel adapteri, muistilla lisäosa.

Vuonna 1987 IBM 8514 -grafiikkajärjestelmä julkaistiin yhtenä ensimmäisistä näytönohjaimista IBM PC -yhteensopiville laitteille, jotka ottivat käyttöön kiinteän toiminnon 2D-primitiivit elektronisessa laitteistossa . Sharp n X68000 , julkaistiin vuonna 1987, käytetään mukautetun grafiikkapiiri kanssa 65536 väripaletin ja laitetuen sprite, vieritys, ja useita playfields lopulta toimii kehityksen kone Capcomin n CP System arcade aluksella. Fujitsu kilpaili myöhemmin vuonna 1989 julkaistun FM Towns -tietokoneen kanssa, joka tuki koko 16 777 216 -värivalikoimaa. Vuonna 1988 ensimmäiset omistetut monikulmaiset 3D -grafiikkalevyt otettiin käyttöön arcadeissa Namco System 21: n ja Taito Air Systemin kanssa.

Emolevyn VGA -osa IBM PS/55: ssä

IBM : n oma VGA ( Video Graphics Array ) -näyttöstandardi otettiin käyttöön vuonna 1987, ja sen suurin resoluutio on 640 × 480 pikseliä. Marraskuussa 1988 NEC Home Electronics ilmoitti perustavansa Video Electronics Standards Associationin (VESA), joka kehittää ja edistää Super VGA (SVGA) -tietokonenäytön standardia IBM: n omistaman VGA -näyttöstandardin seuraajana. Super VGA -yhteensopiva grafiikanäytön resoluutio jopa 800 × 600 pikseliä , mikä on 36% enemmän.

1990 -luku

Voodoo3 2000 AGP -kortti

Vuonna 1991 S3 Graphics esitteli S3 86C911: n , jonka sen suunnittelijat nimesivät Porsche 911 : n mukaan osoittamaan lupaamansa suorituskyvyn. 86C911 synnytti joukon jäljittelijöitä: vuoteen 1995 mennessä kaikki suuret PC -grafiikkapiirien valmistajat olivat lisänneet 2D -kiihdytystuen siruihinsa. Tähän mennessä kiinteätoimiset Windows-kiihdyttimet olivat ylittäneet kalliit yleiskäyttöiset näytönohjaimet Windowsin suorituskyvyssä, ja nämä rinnakkaisprosessorit haalistuivat PC-markkinoilta.

2D -käyttöliittymän kiihtyvyys kehittyi koko 1990 -luvun ajan. Valmistusominaisuuksien parantuessa parani myös grafiikkapiirien integrointitaso. Muita sovellusrajapintoja (API) saapui erilaisia tehtäviä, kuten Microsoftin siipi Graphics Library for Windows 3.x , ja niiden myöhemmin DirectDraw liittymä kiihdytystä 2D peleistä Windows 95 ja myöhemmin.

1990-luvun alussa ja puolivälissä reaaliaikainen 3D-grafiikka oli yleistymässä arcade-, tietokone- ja konsolipeleissä, mikä johti laitteistokiihdytetyn 3D-grafiikan yleiseen kysyntään . Varhaisia ​​esimerkkejä massamarkkinoiden 3D-grafiikkalaitteista löytyy arcade-emolevyistä, kuten Sega Model 1 , Namco System 22 ja Sega Model 2 , ja viidennen sukupolven videopelikonsoleista , kuten Saturn , PlayStation ja Nintendo 64 . Arcade -järjestelmät, kuten Sega Model 2 ja Namco Magic Edge Hornet Simulator vuonna 1993, kykenivät laitteistoon T&L ( muuntaminen, leikkaaminen ja valaistus ) vuosia ennen kuin ne näkyvät kuluttajagrafiikkakorteissa. Jotkut järjestelmät käyttivät DSP: itä muutosten nopeuttamiseen. Fujitsu , joka työskenteli Sega Model 2 arcade -järjestelmän parissa, aloitti T&L: n yhdistämisen yhdeksi LSI -ratkaisuksi kotitietokoneissa käytettäväksi vuonna 1995; Fujitsu Pinolite, ensimmäinen 3D geometrian prosessorin henkilökohtaisten tietokoneiden, julkaistiin vuonna 1997. Ensimmäiset laitteisto T & L GPU kodin pelikonsoleissa oli Nintendo 64 : n Reality Apuprosessori , julkaistiin vuonna 1996. Vuonna 1997 Mitsubishi julkaisi 3Dpro / 2MP , täysin varustettu grafiikkasuoritin, joka pystyy muuttamaan ja valaisemaan, työasemille ja Windows NT -pöytäkoneille; ATi käytti sitä FireGL 4000 -näytönohjaimessaan , joka julkaistiin vuonna 1997.

Termin "GPU" Sony keksi viitaten vuonna 1994 julkaistun PlayStation- videopelikonsolin 32-bittiseen Sony-näytönohjaimeen ( Toshiban suunnittelema ) .

PC-maailmassa merkittävät epäonnistuneet edulliset 3D-grafiikkapiirien ensimmäiset yritykset olivat S3 ViRGE , ATI Rage ja Matrox Mystique . Nämä sirut olivat lähinnä edellisen sukupolven 2D-kiihdyttimiä, joissa oli 3D-ominaisuuksia. Monet olivat jopa pin-yhteensopivia aikaisemman sukupolven sirujen kanssa, mikä helpotti toteutusta ja minimaalisia kustannuksia. Aluksi suorituskykyinen 3D -grafiikka oli mahdollista vain erillisillä levyillä, jotka on omistettu 3D -toimintojen kiihdyttämiseen (ja joissa ei ole 2D -käyttöliittymän kiihdytystä kokonaan), kuten PowerVR ja 3dfx Voodoo . Kuitenkin valmistustekniikan kehittyessä video, 2D -käyttöliittymän kiihdytys ja 3D -toiminnot integroitiin yhteen siruun. Renditionin Verite -piirisarjat olivat ensimmäisten joukossa, jotka tekivät tämän tarpeeksi hyvin ollakseen huomion arvoisia. Vuonna 1997 Rendition meni askeleen pidemmälle yhteistyössä Herculesin ja Fujitsun kanssa "Thriller Conspiracy" -projektissa, joka yhdisti Fujitsu FXG-1 Pinolite -geometriaprosessorin Vérité V2200 -ydinprosessoriin ja loi näytönohjaimen, jossa oli täysi T&L -moottori vuosia ennen Nvidian GeForcea 256 . Tämä kortti, joka on suunniteltu vähentämään järjestelmän suorittimen kuormitusta, ei koskaan tullut markkinoille.

OpenGL ilmestyi 90 -luvun alussa ammattimaisena grafiikkasovellusliittymänä, mutta se kärsi alun perin suorituskykyongelmista, jotka antoivat Glide -sovellusliittymän astua sisään ja tulla PC: n hallitsevaksi voimaksi 90 -luvun lopulla. Nämä ongelmat kuitenkin ratkaistiin nopeasti ja Glide -sovellusliittymä kaatui. OpenGL: n ohjelmistototeutukset olivat yleisiä tänä aikana, vaikka OpenGL: n vaikutus johti lopulta laajaan laitteistotukeen. Ajan myötä laitteiston ja OpenGL: n tarjoamien ominaisuuksien välillä on pariteetti. DirectX: stä tuli suosittu Windows -pelikehittäjien keskuudessa 90 -luvun lopulla. Toisin kuin OpenGL, Microsoft vaati tiukkaa henkilökohtaista tukea laitteistolle. Lähestymistapa teki DirectX: stä aluksi vähemmän suosittua erillisenä grafiikkarajapintana, koska monet grafiikkasuorittimet tarjosivat omat erityispiirteensä, joista nykyiset OpenGL -sovellukset pystyivät jo hyötymään, jättäen DirectX: n usein yhden sukupolven taakse. (Katso: OpenGL: n ja Direct3D : n vertailu .)

Ajan myötä Microsoft alkoi työskennellä tiiviimmin laitteistokehittäjien kanssa ja alkoi kohdistaa DirectX: n julkaisuja vastaamaan grafiikkalaitteistoa. Direct3D 5.0 oli ensimmäinen kasvavan sovellusliittymän versio, joka otettiin laajasti käyttöön pelimarkkinoilla, ja se kilpaili suoraan monien laitteistokohtaisten, usein omistettujen grafiikkakirjastojen kanssa, kun taas OpenGL piti yllä vahvaa seuraa. Direct3D 7.0 esitteli laitteistokiihdytetyn muunnoksen ja valaistuksen (T&L) tuen Direct3D: lle, kun taas OpenGL: llä oli tämä ominaisuus jo alusta alkaen. 3D -kiihdytyskortit muuttuivat vain yksinkertaisiksi rasteroijiksi lisätäkseen toisen merkittävän laitteistovaiheen 3D -renderöintiputkeen. Nvidia GeForce 256 (tunnetaan myös NV10) oli ensimmäinen kuluttajatason kortti julkaistiin markkinoille laitekiihdytetyt T & L, kun taas ammatilliset 3D kortteja jo tätä ominaisuutta. Laitteistomuutos ja valaistus, molemmat OpenGL: n jo olemassa olevia ominaisuuksia, tulivat kuluttajatason laitteistoihin 90-luvulla ja loivat ennakkotapauksen myöhemmille pikselivarjostimille ja vertex-varjostusyksiköille , jotka olivat paljon joustavampia ja ohjelmoitavampia.

2000-2010

Nvidia tuotti ensimmäisenä sirun, joka kykenee ohjelmoitavaan varjostamiseen ; GeForce 3 (koodinimellä NV20). Jokainen pikseli voitaisiin nyt käsitellä lyhyellä "ohjelmalla", joka voisi sisältää lisäkuvakuvioita syötteinä, ja jokainen geometrinen kärki voitaisiin myös käsitellä lyhyellä ohjelmalla ennen sen heijastamista valkokankaalle. Käytettynä Xbox -konsolissa se kilpaili PlayStation 2: n kanssa , joka käytti mukautettua vektoriyksikköä laitteistokiihdytettyyn pisteiden käsittelyyn (yleisesti kutsutaan nimellä VU0/VU1). Varhaisimmat Xboxissa käytetyt shader -suoritusmoottorien inkarnaatiot eivät olleet yleiskäyttöisiä eivätkä pystyneet suorittamaan mielivaltaisia ​​pikselikoodeja. Pisteitä ja pikseleitä käsittelivät eri yksiköt, joilla oli omat resurssinsa pikselivarjostimilla, joilla oli paljon tiukemmat rajoitukset (koska ne suoritetaan paljon korkeammilla taajuuksilla kuin kärkipisteillä). Pikselivarjostimet olivat itse asiassa enemmän samankaltaisia ​​kuin hyvin muokattavissa oleva toimintolohko, eivätkä ne oikeastaan ​​"suorittaneet" ohjelmaa. Monia näistä kärkipisteiden ja pikselien varjostuksen välisistä eroista ei käsitelty vasta paljon myöhemmin Unified Shader -mallilla .

Lokakuuhun 2002 mennessä, kun ATI Radeon 9700 (tunnetaan myös nimellä R300), maailman ensimmäinen Direct3D 9.0 -kiihdytin, pikselien ja kärkien varjostimet pystyivät toteuttamaan silmukointia ja pitkää liukulukulaskua , ja niistä tuli nopeasti yhtä joustavia kuin suorittimet, mutta tilaukset suuruusluokkaa nopeampi kuvaryhmän toiminnoissa. Pikselivarjostusta käytetään usein kuoppakartoitukseen , joka lisää tekstuuria, jotta esine näyttää kiiltävältä, tylsältä, karkealta tai jopa pyöreältä tai puristetulta.

Nvidia GeForce 8 -sarjan ja sitten uusien geneeristen prosessointiyksiköiden grafiikkasuorittimien käyttöönoton myötä tuli yleisempiä tietokonelaitteita. Nykyään rinnakkaiset GPU: t ovat alkaneet tehdä laskutoimituksia CPU: ta vastaan, ja tutkimuksen osa -alue, nimeltään GPU Computing tai GPGPU for General Purpose Computing on GPU , on löytänyt tiensä niin monille aloille kuin koneoppiminen , öljyntutkimus , tieteellinen kuvankäsittely , lineaarinen algebra , tilastot , 3D -rekonstruktio ja jopa osakeoptioiden hinnoittelu. GPGPU oli tuolloin nykyisen laskennan varjostimen (esim. CUDA, OpenCL, DirectCompute) edeltäjä ja todella väärinkäytti laitteistoa jossain määrin käsittelemällä algoritmeille välitetyt tiedot tekstuurikarttoina ja suorittamalla algoritmeja piirtämällä kolmion tai neliön sopivalla pikselivarjostimella. Tämä aiheuttaa tietysti yleiskustannuksia, koska skannausmuuntimen kaltaiset yksiköt ovat mukana siellä, missä niitä ei oikeastaan ​​tarvita (eikä kolmion manipulointi ole edes huolenaihe - paitsi kutsua pikselivarjostin).

Nvidian CUDA -alusta, joka esiteltiin ensimmäisen kerran vuonna 2007, oli varhaisin laajasti hyväksytty ohjelmointimalli GPU -tietojenkäsittelyyn. Viime aikoina OpenCL on tuettu laajalti. OpenCL on Khronos Groupin määrittelemä avoin standardi, joka mahdollistaa koodin kehittämisen sekä grafiikkasuorittimille että suorittimille painottaen siirrettävyyttä. Intel, AMD, Nvidia ja ARM tukevat OpenCL -ratkaisuja, ja Evan's Datan tuoreen raportin mukaan OpenCL on GPGPU -kehitysalusta, jota kehittäjät käyttävät eniten sekä Yhdysvalloissa että Aasian ja Tyynenmeren alueella.

2010 - tähän hetkeen

Vuonna 2010 Nvidia aloitti yhteistyön Audin kanssa autojensa kojelautojen tehostamiseksi käyttämällä Tegra -grafiikkasuorittimia autojen navigointi- ja viihdejärjestelmien toimivuuden parantamiseksi. Autojen GPU-tekniikan kehitys on auttanut itseohjautuvaa tekniikkaa . AMD: n Radeon HD 6000 -sarjan kortit julkaistiin vuonna 2010 ja vuonna 2011 AMD julkaisi 6000M -sarjan erilliset grafiikkasuorittimet käytettäväksi mobiililaitteissa. Nvidian Kepler -näytönohjainlinja julkaistiin vuonna 2012 ja sitä käytettiin Nvidian 600- ja 700 -sarjan korteissa. Tämän uuden GPU-mikroarkkitehtuurin ominaisuuksiin kuului GPU-tehostus, tekniikka, joka säätää näytönohjaimen kellonopeutta sen lisäämiseksi tai vähentämiseksi sen virrankulutuksen mukaan. Kepler mikroarkkitehtuuria on valmistettu on 28 nm prosessi.

PS4 ja Xbox Yksi julkaistiin vuonna 2013, molemmat käyttävät GPU perustuu AMD: n Radeon HD 7850 ja 7790 . Nvidian Kepler -grafiikkasuorittimia seurasi Maxwell -linja, joka valmistettiin samalla prosessilla. Nvidian 28 nm: n siruja valmisti TSMC, Taiwan Semiconductor Manufacturing Company, joka valmisti tuolloin 28 nm: n prosessilla. Verrattuna 40 nm: n tekniikkaan, tämä uusi valmistusprosessi mahdollisti 20 prosentin suorituskyvyn parannuksen samalla kun se kuluttaa vähemmän virtaa. Virtuaalitodellisuus kuulokkeet ovat erittäin korkeat järjestelmävaatimukset. VR -kuulokkeiden valmistajat suosittelivat GTX 970: tä ja R9 290X: ää tai parempia julkaisun aikaan. Pascal on Nvidian seuraavan sukupolven kuluttajagrafiikkakortit, jotka julkaistiin vuonna 2016. GeForce 10 -sarjan kortit kuuluvat tämän sukupolven näytönohjaimiin. Ne on valmistettu käyttämällä 16 nm: n valmistusprosessia, joka parantaa aiempia mikroarkkitehtuureja. Nvidia on julkaissut yhden muun kuin kuluttajakortin uuden Volta- arkkitehtuurin alla, Titan V. Muutokset Titan XP: stä, Pascalin huippuluokan kortista, sisältävät CUDA-ytimien määrän lisäämisen, tensorisydämien lisäämisen ja HBM2: n . Tensorisydämet ovat erityisesti syvään oppimiseen suunniteltuja ytimiä, kun taas suuren kaistanleveyden muisti on katkaistu, pinottu, alemman kellon muisti, joka tarjoaa erittäin laajan muistiväylän, joka on hyödyllinen Titan V: n aiottuun tarkoitukseen. Korostaakseen, että Titan V ei ole pelikortti, Nvidia poisti GeForce GTX -liitteen, jonka se lisää kuluttajapelikortteihin.

20. elokuuta 2018 Nvidia julkisti RTX 20 -sarjan grafiikkasuorittimet, jotka lisäävät GPU: eihin säteenseurantaytimiä ja parantavat niiden suorituskykyä valaistustehosteissa. AMD: n Polaris 11- ja Polaris 10 -näytönohjaimet valmistetaan 14 nanometrin prosessilla. Niiden julkaisu lisää huomattavasti AMD -näytönohjainten suorituskykyä wattia kohti. AMD on myös julkaissut Vega GPU -sarjan huippuluokan markkinoille kilpailijana Nvidian huippuluokan Pascal -korteille, joissa on myös HBM2, kuten Titan V.

Vuonna 2019 AMD julkaisi jatkajan Graphics Core Next (GCN) mikroarkkitehtuuria / käskykannan. RDNA -niminen ensimmäinen tuotevalikoima, jossa oli ensimmäisen sukupolven RDNA, oli Radeon RX 5000 -videokorttisarja, joka lanseerattiin myöhemmin 7. heinäkuuta 2019. Myöhemmin yhtiö ilmoitti, että RDNA -mikroarkkitehtuurin seuraaja olisi päivitys. Uudistettu RDNA 2, uusi mikroarkkitehtuuri oli tarkoitus julkaista vuoden 2020 viimeisellä neljänneksellä.

AMD julkisti Radeon RX 6000 -sarjan , sen seuraavan sukupolven RDNA 2 -näytönohjaimet, jotka tukevat laitteistokiihdytettyä säteenseurantaa, online-tapahtumassa 28. lokakuuta 2020. Kokoonpano koostuu aluksi RX 6800, RX 6800 XT ja RX 6900 XT . RX 6800 ja 6800 XT lanseerattiin 18. marraskuuta 2020, ja RX 6900 XT julkaistiin 8. joulukuuta 2020. RX 6700 XT, joka perustuu Navi 22: een, lanseerattiin 18. maaliskuuta 2021.

PlayStation 5 ja Xbox sarja X- ja S-sarja julkaistiin 2020, molemmat käyttävät GPU perustuu RDNA 2 -mikroarkkitehtuurin yrityskohtaiset parannuksia ja eri GPU kokoonpanoja kunkin järjestelmän toteuttamista.

GPU -yritykset

Monet yritykset ovat tuottaneet grafiikkasuorittimia useilla tuotenimillä. Vuonna 2009 Intelin , Nvidian ja AMD / ATI: n markkinaosuudet olivat 49,4%, 27,8% ja 20,6%. Nämä luvut sisältävät kuitenkin Intelin integroidut grafiikkaratkaisut GPU: na. Näitä lukuun ottamatta Nvidia ja AMD hallitsevat lähes 100% markkinoista vuodesta 2018. Niiden markkinaosuudet ovat 66% ja 33%. Lisäksi Matrox valmistaa grafiikkasuorittimia. Nykyaikaiset älypuhelimet käyttävät myös enimmäkseen Adreno GPU päässä Qualcomm , PowerVR GPU alkaen Imagination Technologies ja Mali GPU alkaen ARM .

Laskentatoiminnot

Nykyaikaiset grafiikkasuorittimet käyttävät suurinta osaa transistoreistaan 3D -tietokonegrafiikkaan liittyvien laskelmien tekemiseen . 3D -laitteiston lisäksi nykypäivän grafiikkasuorittimissa on perus 2D -kiihdytys- ja kehyspuskuritoiminnot (yleensä VGA -yhteensopivuustilassa). Uudemmissa korteissa, kuten AMD/ATI HD5000-HD7000, ei ole edes 2D-kiihdytystä; se on emuloitava 3D -laitteistolla. GPU alun perin käytettiin nopeuttamaan muisti-intensiivistä työtä teksturointi ja tekee monikulmioita, myöhemmin summausyksikköä nopeuttaa geometrinen laskelmia, kuten kierto ja kääntäminen on pisteiden eri koordinaatistossa . GPU: iden viimeaikainen kehitys sisältää tuen ohjelmoitaville varjostimille, jotka voivat manipuloida pisteitä ja tekstuureja monilla samoilla toiminnoilla, joita suorittimet tukevat , ylinäytteistys- ja interpolointitekniikat aliasoinnin vähentämiseksi ja erittäin tarkat väritilat . Koska useimmat näistä laskelmista sisältävät matriisi- ja vektoritoimintoja , insinöörit ja tiedemiehet ovat tutkineet yhä enemmän GPU: iden käyttöä ei-graafisissa laskelmissa; ne sopivat erityisesti muihin kiusallisesti rinnakkaisiin ongelmiin.

Useat GPU: n rakenteen tekijät vaikuttavat kortin suorituskykyyn reaaliaikaisessa renderöinnissä. Yhteisiä tekijöitä voi sisältää liittimen kokoa reaktioteitä puolijohdelaitteen valmistuksen , kellosignaalin taajuus, ja määrä ja koko eri-chip muisti välimuistit . Lisäksi NVidia-grafiikkasuorittimien (SM) suoratoistoprosessoreiden (AM) tai AMD-grafiikkasuorittimien laskentayksiköiden (CU) määrä, jotka kuvaavat ydinlaskennan suorittavien GPU-sirun sisältävien piin ydinprosessoriyksiköiden lukumäärän, jotka yleensä toimivat rinnakkain muut GPU: n SM/CU: t. Grafiikkasuorittimien suorituskykyä mitataan tyypillisesti liukulukuoperaatioissa sekunnissa tai FLOPS , kun GPU: t 2010- ja 2020 -luvuilla tuottavat tyypillisesti teraflops -mittauksen (TFLOPS). Tämä on arvioitu suorituskykymitta, koska muut tekijät voivat vaikuttaa todelliseen näyttöasteeseen.

Syväoppimisen myötä GPU: iden merkitys on kasvanut. Indigon tekemässä tutkimuksessa havaittiin, että kun syvän oppimisen hermoverkkoja koulutetaan, GPU: t voivat olla 250 kertaa nopeampia kuin suorittimet. Tällä alalla on ollut jonkin verran kilpailua ASIC -järjestelmien kanssa , joista tärkein on Googlen tekemä Tensor Processing Unit (TPU). ASICit vaativat kuitenkin muutoksia olemassa olevaan koodiin ja GPU: t ovat edelleen erittäin suosittuja.

GPU nopeuttaa videon dekoodausta ja koodausta

ATI HD5470 GPU: ssa (yllä) on UVD 2.1, jonka avulla se voi purkaa AVC- ja VC-1-videoformaatteja

Useimmat vuodesta 1995 valmistetut grafiikkasuorittimet tukevat YUV -väriavaruutta ja laitteistokerroksia , jotka ovat tärkeitä digitaalisen videotoiston kannalta, ja monet vuodesta 2000 lähtien valmistetut grafiikkasuorittimet tukevat myös MPEG -primitiivejä , kuten liikekompensointia ja iDCT: tä . Tätä laitteistokiihdytettyä videon dekoodausprosessia, jossa osa videon dekoodausprosessista ja videon jälkikäsittelystä ladataan GPU-laitteistoon, kutsutaan yleisesti nimellä "GPU-nopeutettu videon dekoodaus", "GPU-avusteinen videon dekoodaus", "GPU-laitteiston kiihdytetty" videon dekoodaus "tai" GPU -laitteistoavusteinen videon dekoodaus ".

Uudemmat näytönohjaimet purkavat jopa teräväpiirtovideon purkamisen kortille, mikä poistaa keskusyksikön. Yleisin API GPU kiihtyi Videodekoodauksen ovat DxVA for Microsoft Windows -käyttöjärjestelmän ja VDPAU , VAAPI , XvMC ja XvBA Linux-pohjainen ja UNIX kaltaisissa käyttöjärjestelmissä. Kaikki paitsi XvMC pystyvät dekoodaamaan videoita, jotka on koodattu MPEG-1 , MPEG-2 , MPEG-4 ASP (MPEG-4 osa 2) , MPEG-4 AVC (H.264 / DivX 6), VC-1 , WMV3 / WMV9 , Xvid / OpenDivX (DivX 4) ja DivX 5 -koodekit , kun taas XvMC pystyy dekoodaamaan vain MPEG-1- ja MPEG-2- koodekit .

On olemassa useita laitteistovideon dekoodaus- ja koodausratkaisuja .

Videoiden dekoodausprosesseja, joita voidaan nopeuttaa

Nykyiset modernit GPU -laitteistot voivat nopeuttaa videon dekoodausprosesseja:

Edellä mainituilla toiminnoilla on myös sovelluksia videon editointiin, koodaukseen ja transkoodaukseen

GPU -lomakkeet

Terminologia

Henkilökohtaisissa tietokoneissa on kaksi GPU: n päämuotoa. Jokaisella on monia synonyymejä:

Käyttökohtainen GPU

Useimmat grafiikkasuorittimet on suunniteltu tiettyyn käyttöön, reaaliaikaiseen 3D-grafiikkaan tai muihin massalaskelmiin:

  1. Pelaaminen
  2. Pilvipelit
  3. Työasema
  4. Cloud -työasema
  5. Tekoälyharjoittelu ja pilvi
  6. Automaattinen/kuljettajaton auto

Erilliset näytönohjaimet

GPU tehokkain luokka tyypillisesti rajapinta emolevyn avulla, joka laajennuspaikka kuten PCI Express (PCIe) tai Accelerated Graphics Port (AGP) ja voidaan yleensä korvata tai päivittää suhteellisen helposti, olettaen, että emolevy pystyy tukemaan päivitys. Muutamat näytönohjaimet käyttävät edelleen PCI ( Peripheral Component Interconnect ) -paikkoja, mutta niiden kaistanleveys on niin rajallinen, että niitä käytetään yleensä vain silloin, kun PCIe- tai AGP -paikka ei ole käytettävissä.

Omistettu grafiikkasuoritin ei ole välttämättä irrotettava, eikä se välttämättä liity emolevyyn tavalliseen tapaan. Termi "omistettu" viittaa siihen, että omistetuissa näytönohjaimissa on RAM -muistia, joka on omistettu kortin käyttöön, eikä siihen, että useimmat erilliset GPU: t ovat irrotettavia. Lisäksi tämä RAM -muisti valitaan yleensä erityisesti näytönohjaimen odotetulle sarjatyölle (katso GDDR ). Joskus järjestelmiä, joissa on erilliset erilliset GPU: t, kutsuttiin "DIS" -järjestelmiksi, toisin kuin "UMA" -järjestelmiksi (katso seuraava osa). Kannettaville tietokoneille tarkoitetut erilliset grafiikkasuorittimet liitetään yleisimmin epätyypillisen ja usein omistetun korttipaikan kautta koko- ja painorajoitusten vuoksi. Tällaisia ​​portteja voidaan edelleen pitää PCIe- tai AGP -järjestelminä loogisen isäntäliittymänsä suhteen, vaikka ne eivät ole fyysisesti vaihdettavissa vastaavien kanssa.

Teknologiat, kuten Nvidian SLI ja NVLink ja AMD: n CrossFire , mahdollistavat useiden grafiikkasuorittimien piirtämisen samanaikaisesti yhdelle näytölle, mikä lisää grafiikalle saatavaa käsittelytehoa. Nämä tekniikat ovat kuitenkin yhä harvinaisempia, koska useimmat pelit eivät käytä täysin useita grafiikkasuorittimia, koska useimmilla käyttäjillä ei ole varaa niihin. Useita grafiikkasuorittimia käytetään edelleen supertietokoneissa (kuten Summitissa ), työasemilla nopeuttamaan videota (käsittelemään useita videoita kerralla) ja 3D -renderointia, VFX: ssä ja simulaatioissa sekä tekoälyssä koulutuksen nopeuttamiseksi, kuten Nvidian kokoonpanossa DGX -työasemat ja -palvelimet sekä Teslan grafiikkasuorittimet ja Intelin tulevat Ponte Vecchio -näytönohjaimet.

Integroitu näytönohjain

Integroidun grafiikkasuorittimen sijainti pohjoisillan/eteläsillan järjestelmäasettelussa
ASRock emolevy integroitu näytönohjain, jossa on HDMI-, VGA- ja DVI out.

Integroitu grafiikkaprosessointiyksikkö (IGPU), integroitu grafiikka , jaetut grafiikkaratkaisut , integroidut grafiikkaprosessorit (IGP) tai yhtenäinen muistiarkkitehtuuri (UMA) käyttävät osaa tietokoneen järjestelmämuistista erillisen grafiikkamuistin sijasta. IGP: t voidaan integroida emolevyyn osana (northbridge) piirisarjaa tai samaan muottiin (integroitu piiri) CPU: n kanssa (kuten AMD APU tai Intel HD Graphics ). Tietyissä emolevyissä AMD: n IGP -laitteet voivat käyttää erillistä sivuporttimuistia. Tämä on erillinen kiinteä lohko korkean suorituskyvyn muistia, joka on omistettu GPU: n käyttöön. Vuoden 2007 alussa tietokoneet, joissa on integroitu grafiikka, muodostavat noin 90% kaikista PC -lähetyksistä. Ne ovat halvempia toteuttaa kuin omistettu grafiikkaprosessointi, mutta ne ovat yleensä huonompia. Historiallisesti integroitua käsittelyä pidettiin sopimattomana 3D -pelien pelaamiseen tai graafisesti intensiivisten ohjelmien suorittamiseen, mutta se saattoi suorittaa vähemmän intensiivisiä ohjelmia, kuten Adobe Flash. Esimerkkejä tällaisista IGP: istä ovat SiS: n ja VIA: n tarjoukset noin 2004. Kuitenkin modernit integroidut grafiikkaprosessorit, kuten AMD Accelerated Processing Unit ja Intel HD Graphics, ovat enemmän kuin kykeneviä käsittelemään 2D -grafiikkaa tai vähärasitusta 3D -grafiikkaa.

Koska GPU-laskennat ovat erittäin muistin intensiivisiä, integroitu käsittely saattaa kilpailla CPU: n kanssa suhteellisen hitaasta RAM-muistista, koska siinä on vain vähän tai ei lainkaan erillistä videomuistia. IGP -laitteissa voi olla jopa 29,856 Gt/s muistin kaistanleveyttä järjestelmän RAM -muistista, kun taas grafiikkakortilla voi olla jopa 264 GB/s kaistanleveyttä RAM -muistin ja GPU -ytimen välillä. Tämä muistiväylän kaistanleveys voi rajoittaa GPU: n suorituskykyä, vaikka monikanavainen muisti voi lieventää tätä puutetta. Vanhemmista integroiduista näytönohjaimista puuttui laitteistomuutos ja valaistus , mutta uudemmat sisältävät sen.

Hybridigrafiikan käsittely

Tämä uudempi GPU-luokka kilpailee integroidun grafiikan kanssa edullisten pöytä- ja kannettavien tietokoneiden markkinoilla. Yleisimpiä toteutuksia ovat ATI: n HyperMemory ja Nvidian TurboCache .

Hybridi -näytönohjaimet ovat jonkin verran kalliimpia kuin integroidut grafiikat, mutta paljon halvempia kuin erilliset näytönohjaimet. Nämä jakavat muistin järjestelmän kanssa ja niillä on pieni oma muistivälimuisti, joka korvaa järjestelmän RAM -muistin korkean viiveen . PCI Expressin tekniikat voivat tehdä tämän mahdolliseksi. Vaikka näitä ratkaisuja mainostetaan joskus niin, että niissä on jopa 768 Mt RAM -muistia, tämä viittaa siihen, kuinka paljon niitä voidaan jakaa järjestelmämuistin kanssa.

Stream -käsittely ja yleiskäyttöiset GPU: t (GPGPU)

Se on yhä yleisempää käyttää yleiskäyttöinen Grafiikkaprosessori (GPGPU) kuin modifioidun muodon virran prosessorin (tai vektori-prosessori ), käynnissä laskea ytimiä . Tämä konsepti muuttaa modernin grafiikkakiihdyttimen shader-putkilinjan valtavan laskentatehon yleiskäyttöiseksi laskentatehoksi sen sijaan, että se olisi kytketty pelkästään graafisiin toimintoihin. Tietyissä sovelluksissa, jotka vaativat massiivisia vektoritoimintoja, tämä voi tuottaa useita suuruusluokkia korkeamman suorituskyvyn kuin perinteinen suoritin. Kaksi suurinta erillistä (katso " Dedikoidut näytönohjaimet " yllä) GPU -suunnittelijat, AMD ja Nvidia , ovat alkaneet noudattaa tätä lähestymistapaa useilla sovelluksilla. Sekä Nvidia että AMD ovat tehneet yhteistyötä Stanfordin yliopiston kanssa luodakseen GPU-pohjaisen asiakkaan Folding@home- hajautetulle laskentaprojektille proteiinien taittolaskelmia varten. Tietyissä olosuhteissa GPU laskee neljäkymmentä kertaa nopeammin kuin tällaisten sovellusten perinteisesti käyttämät suorittimet.

GPGPU: ta voidaan käyttää monenlaisiin kiusallisesti rinnakkaisiin tehtäviin, mukaan lukien säteen jäljitys . Ne soveltuvat yleensä suuren suorituskyvyn tyyppisiin laskutoimituksiin, joissa on datan rinnakkaisuutta GPU: n laajan vektorileveyden SIMD- arkkitehtuurin hyödyntämiseksi.

Lisäksi GPU-pohjaisilla korkean suorituskyvyn tietokoneilla on alkanut olla merkittävä rooli laajamittaisessa mallinnuksessa. Kolme maailman 10 tehokkaimmasta supertietokoneesta hyödyntää GPU -kiihdytystä.

GPU: t tukevat API -laajennuksia C -ohjelmointikielelle, kuten OpenCL ja OpenMP . Lisäksi jokainen GPU -valmistaja esitteli oman sovellusliittymänsä, joka toimii vain korttiensa kanssa, AMD APP SDK ja CUDA AMD: ltä ja Nvidialta. Nämä tekniikat mahdollistavat normaalin C -ohjelman määritettyjen toimintojen, joita kutsutaan laskentaydiniksi , suorittamisen GPU: n virtaprosessoreilla. Tämä mahdollistaa sen, että C -ohjelmat voivat hyödyntää GPU: n kykyä toimia suurilla puskureilla rinnakkain ja silti käyttää CPU: ta tarvittaessa. CUDA on myös ensimmäinen sovellusliittymä, joka sallii CPU-pohjaisten sovellusten käyttää suoraan GPU: n resursseja yleiskäyttöiseen tietojenkäsittelyyn ilman graafisen sovellusliittymän käytön rajoituksia.

Vuodesta 2005 on ollut kiinnostusta käyttää suorituskyvyn tarjoamia GPU varten evoluutiolaskennan yleensä ja nopeuttaa kunnon arviointi geneettistä ohjelmointia erityisesti. Useimmat lähestymistavat kääntävät lineaarisia tai puuohjelmia isäntätietokoneelle ja siirtävät suoritettavan tiedoston suoritettavaksi GPU: lle. Yleensä suorituskykyetu saavutetaan vain suorittamalla yksittäinen aktiivinen ohjelma samanaikaisesti monissa esimerkkiongelmissa rinnakkain käyttämällä GPU: n SIMD -arkkitehtuuria. Merkittävää kiihtyvyyttä voidaan kuitenkin saavuttaa myös siten, että ohjelmia ei koota ja siirretään sen sijaan GPU: han, jotta ne tulkitaan siellä. Kiihtyvyys voidaan saavuttaa joko tulkitsemalla useita ohjelmia samanaikaisesti, suorittamalla samanaikaisesti useita esimerkkitehtäviä tai molempien yhdistelmiä. Nykyaikainen grafiikkasuoritin tulkitsee helposti samanaikaisesti satoja tuhansia hyvin pieniä ohjelmia.

Joissakin nykyaikaisissa työaseman grafiikkasuorittimissa, kuten Volta- ja Turing-arkkitehtuuria käyttävissä Nvidia Quadro -työasemakorteissa, on omistettu käsittelyydin tensoripohjaisille syväoppimissovelluksille. Nvidian nykyisessä GPU -sarjassa näitä ytimiä kutsutaan Tensor -ytimiksi. Näissä grafiikkasuorittimissa on yleensä merkittävä FLOPS -suorituskyvyn lisäys, jossa käytetään 4x4 -matriisin kertolaskua ja jakoa, mikä johtaa laitteistotehoon jopa 128 TFLOPS: iin joissakin sovelluksissa. Näitä tensorisydämiä on tarkoitus esiintyä myös Turing -arkkitehtuuria käyttävissä kuluttajakorteissa ja mahdollisesti AMD: n kuluttajakorttien Navi -sarjassa.

Ulkoinen grafiikkasuoritin (eGPU)

Ulkoinen GPU on grafiikkaprosessori, joka sijaitsee tietokoneen kotelon ulkopuolella, samanlainen kuin suuri ulkoinen kiintolevy. Ulkoisia grafiikkaprosessoreita käytetään joskus kannettavien tietokoneiden kanssa. Kannettavissa tietokoneissa saattaa olla huomattava määrä RAM-muistia ja riittävän tehokas keskusyksikkö (CPU), mutta niistä puuttuu usein tehokas grafiikkaprosessori, ja niissä voi olla vähemmän tehokas mutta energiatehokkaampi sisäinen grafiikkapiiri. Sisäänrakennetut grafiikkapiirit eivät usein ole tarpeeksi tehokkaita videopelien pelaamiseen tai muihin graafisesti intensiivisiin tehtäviin, kuten videon muokkaamiseen tai 3D-animaatioon/renderointiin.

Siksi on toivottavaa, että GPU voidaan liittää johonkin kannettavan tietokoneen ulkoiseen väylään. PCI Express on ainoa tähän tarkoitukseen käytetty väylä. Portti voi olla esimerkiksi ExpressCard- tai mPCIe -portti (PCIe × 1, enintään 5 tai 2,5 Gbit/s) tai Thunderbolt 1, 2 tai 3 -portti (PCIe × 4, enintään 10, 20 tai 40 Gbit/s). Nämä portit ovat käytettävissä vain tietyissä kannettavissa tietokoneissa. eGPU -koteloissa on oma virtalähde (PSU), koska tehokkaat grafiikkasuorittimet voivat helposti kuluttaa satoja wattia.

Virallinen toimittajien tuki ulkoisille grafiikkasuorittimille on saanut viime aikoina vetoa. Yksi merkittävä virstanpylväs oli Applen päätös virallisesti tukea ulkoisia grafiikkasuorittimia MacOS High Sierra 10.13.4: n kanssa. On myös useita suuria laitteistotoimittajia (HP, Alienware, Razer), jotka julkaisevat Thunderbolt 3 eGPU -koteloita. Tämä tuki on edelleen kannustanut harrastajien eGPU -toteutuksia.

Myynti

Vuonna 2013 maailmanlaajuisesti toimitettiin 438,3 miljoonaa grafiikkasuoritintä ja vuoden 2014 ennuste oli 414,2 miljoonaa.

Katso myös

Laitteisto

Sovellusliittymät

Sovellukset

Viitteet

Ulkoiset linkit