Chi -neliöjakauma - Chi-squared distribution

chi-neliö
Todennäköisyystiheysfunktio
Chi-square pdf.svg
Kumulatiivinen jakaumafunktio
Chi-neliö cdf.svg
Merkintä tai
Parametrit (tunnetaan "vapauden asteina")
Tuki jos , muuten
PDF
CDF
Tarkoittaa
Mediaani
-Tila
Varianssi
Vinous
Esim. kurtosis
Haje
MGF
CF
PGF

In todennäköisyys teoria ja tilastoja , chi-neliön jakauman (myös chi-neliö tai χ 2 -jakaumaa ), jossa k vapausastetta on jakelu neliöiden summa on k riippumaton standardi normaali satunnaismuuttujien. Chi-neliön jakauman on erikoistapaus gammajakauman ja on yksi yleisimmin käytetty jakaumat vuonna johdettu tilasto , erityisesti hypoteesien testaus ja rakentamisessa luottamusvälit . Tätä jakaumaa kutsutaan joskus keskimmäiseksi chi-neliöjakaumaksi , joka on yleisempi ei- keskimääräinen chi-neliöjakauma .

Chi-neliön jakauman käytetään yhteistä khiin neliö testejä varten sovituksen hyvyys on havaittu jakelu teoreettinen yksi, riippumattomuus kahden kriteerit luokittelua laadullisia tietoja , ja luottamusväli arvio populaation keskihajonta on normaalijakauma näytteen keskihajonnasta. Monet muut tilastolliset testit käyttävät myös tätä jakaumaa, kuten Friedmanin analyysi riveittäin .

Määritelmät

Jos Z 1 , ..., Z k ovat riippumattomia , normaalit normaalit satunnaismuuttujat, niiden neliöiden summa,

on jaettu chi-neliöjakauman mukaan k vapausastetta. Tämä on yleensä merkitty

Chi-neliöjakaumassa on yksi parametri: positiivinen kokonaisluku k, joka määrittää vapausasteiden lukumäärän (satunnaismuuttujien määrä lasketaan yhteen, Z i s).

Johdanto

Chi-neliöjakaumaa käytetään pääasiassa hypoteesitestauksessa ja vähemmässä määrin väestön varianssin luottamusväleillä, kun taustalla oleva jakauma on normaali. Toisin kuin laajemmin tunnetut jakaumat, kuten normaalijakauma ja eksponentiaalinen jakauma , chi-neliöjakaumaa ei käytetä niin usein luonnonilmiöiden suorassa mallinnuksessa. Se syntyy muun muassa seuraavissa hypoteesitesteissä:

Se on myös osa t-jakauman ja F-jakauman määritelmää t-testeissä, varianssianalyysissä ja regressioanalyysissä.

Ensisijainen syy, miksi chi-neliöjakaumaa käytetään laajalti hypoteesitestauksessa, on sen suhde normaalijakaumaan. Monet hypoteesitestit käyttävät testitilastoa, kuten t-testin t-tilastoa . Näissä hypoteesitesteissä otoksen koon n kasvaessa testitilaston otantajakauma lähestyy normaalia jakaumaa ( keskusraja -lause ). Koska testitilastot (kuten t) jakautuvat asymptoottisesti normaalisti, jos otoskoko on riittävän suuri, hypoteesitestauksessa käytetty jakauma voidaan arvioida normaalijakaumalla. Hypoteesien testaaminen normaalijakaumalla on hyvin ymmärretty ja suhteellisen helppoa. Yksinkertaisin chi-neliöjakauma on normaalin normaalijakauman neliö. Joten missä tahansa normaalijakaumaa voitaisiin käyttää hypoteesitestissä, chi-neliöjakaumaa voitaisiin käyttää.

Oletetaan, että on satunnaismuuttuja poimitaan normaalijakautuman, jossa keskiarvo on ja varianssi on : . Mieti nyt satunnaismuuttujaa . Satunnaismuuttujan jakauma on esimerkki chi-neliöjakaumasta: Alaindeksi 1 osoittaa, että tämä erityinen chi-neliöjakauma on muodostettu vain yhdestä normaalista normaalijakaumasta. Chi-neliöjakaumalla, joka on muodostettu neliöimällä yksi normaali normaalijakauma, sanotaan olevan 1 vapausaste. Näin ollen hypoteesitestin otoskoon kasvaessa testitilaston jakauma lähestyy normaalia jakaumaa. Aivan kuten normaalijakauman ääriarvoilla on pieni todennäköisyys (ja ne antavat pienet p-arvot), myös chi-neliöjakauman ääriarvoilla on pieni todennäköisyys.

Lisäsyy siihen, että chi-neliöjakaumaa käytetään laajalti, on se, että se esiintyy yleistetyn todennäköisyyssuhteen testien (LRT) suurena näytejakaumana . LRT: llä on useita toivottavia ominaisuuksia; erityisesti yksinkertaiset LRT: t tarjoavat yleensä suurimman voiman nollahypoteesin hylkäämiselle ( Neyman – Pearson -lemma ) ja tämä johtaa myös yleistettyjen LRT: iden optimaalisuusominaisuuksiin. Normaalit ja chi-neliölliset arviot ovat kuitenkin voimassa vain asymptoottisesti. Tästä syystä on suositeltavaa käyttää t-jakaumaa normaalin tai chi-neliöllisen approksimaation sijasta pienen otoskoon osalta. Samoin varautumistaulukoiden analyyseissä chi-neliöllinen lähentäminen on huono pienelle otoskolle, ja on suositeltavaa käyttää Fisherin tarkkaa testiä . Ramsey osoittaa, että tarkka binomitesti on aina tehokkaampi kuin normaali lähentäminen.

Lancaster näyttää binomi-, normaali- ja chi-neliöjakaumien väliset yhteydet seuraavasti. De Moivre ja Laplace totesivat, että binomijakauma voitaisiin arvioida normaalijakaumalla. Erityisesti ne osoittivat satunnaismuuttujan asymptoottisen normaalisuuden

missä on havaittu onnistumisten lukumäärä kokeissa, missä onnistumisen todennäköisyys on ja .

Neliöinti yhtälön molemmille puolille antaa

Käyttäen , ja , tämä yhtälö voidaan kirjoittaa uudelleen

Oikealla oleva ilmaisu on muodossa, jonka Karl Pearson yleistää muotoon

missä

= Pearsonin kumulatiivinen testitilasto, joka lähestyy asymptoottisesti jakaumaa.
= tyyppisten havaintojen lukumäärä .
= tyypin odotettu (teoreettinen) taajuus , jonka nollahypoteesi vahvistaa, että tyypin murto -osa populaatiossa on
= taulukon solujen lukumäärä.

Jos kyseessä on binomitulos (kolikon kääntäminen), binomijakauma voidaan arvioida normaalijakaumalla (riittävän suureksi ). Koska normaalin normaalijakauman neliö on chi-neliöjakauma yhdellä vapausasteella, tuloksen todennäköisyys, kuten 1 pää 10 kokeessa, voidaan arvioida joko käyttämällä normaalijakaumaa suoraan tai chi-neliöjakaumaa normalisoitu, neliöity ero havaitun ja odotetun arvon välillä. Moniin ongelmiin liittyy kuitenkin enemmän kuin kaksi mahdollista binomiaalisen lopputulosta, ja ne edellyttävät sen sijaan kolmea tai useampaa luokkaa, mikä johtaa moninomijakaumaan. Aivan kuten de Moivre ja Laplace etsivät ja löysivät normaalin lähentämisen binomiaaliin, Pearson etsi ja löysi rappeutuneen monimuuttujaisen normaalilähestymän moninomijakaumaan (kunkin luokan numerot muodostavat kokonaisnäytteen koon, jota pidetään kiinteänä) . Pearson osoitti, että chi-neliöjakauma syntyi tällaisesta monimuuttujaisesta normaalista lähentämisestä moninomijakaumaan ottaen tarkasti huomioon eri luokkien havaintojen välisen tilastollisen riippuvuuden (negatiiviset korrelaatiot).

Todennäköisyystiheysfunktio

Todennäköisyyden tiheysfunktio (PDF) chi-squared jakelu on

missä tarkoittaa gammafunktiota , jolla on suljetun muodon arvot kokonaisluvulle .

Katso pdf-johdannaiset yhden, kahden ja vapausasteen tapauksissa kohdasta Todisteet, jotka liittyvät chi-neliöjakaumaan .

Kumulatiivinen jakaumafunktio

Chernoff matkusti kymmenen vapausasteen ( = 10) chi-neliöisen satunnaismuuttujan CDF: ään ja häntä (1-CDF )

Sen kumulatiivinen jakelutoiminto on:

missä on alempi epätäydellinen gammafunktio ja on säännelty gammatoiminto .

Erikoistapauksessa = 2 tällä toiminnolla on yksinkertainen muoto:

joka voidaan helposti johtaa suoraan integroimalla . Gammafunktion toistuminen kokonaislukuna helpottaa muiden pienien, jopa parien laskemista .

Chi-neliö-kumulatiivisen jakaumatoiminnon taulukot ovat laajalti saatavilla, ja toiminto sisältyy moniin laskentataulukoihin ja kaikkiin tilastopaketteihin .

Vuokraaminen , Chernoff -rajat CDF: n ala- ja yläpuolelle voidaan saada. Tapaukset, joissa (mukaan lukien kaikki tapaukset, joissa tämä CDF on alle puolet):

Häntä sidottu tapauksiin , joissa vastaavasti on

Katso toinen arvio Gaussin kuution jälkeen mallinnetusta CDF: stä kohdasta Noncentral chi-square jakauma .

Ominaisuudet

Riippumattomien identtisesti jakautuneiden normaalien satunnaismuuttujien neliöiden summa vähennettynä niiden keskiarvolla

Jos Z 1 , ..., Z k ovat itsenäisiä identtisesti jakautuneita (iid), tavallisia normaaleja satunnaismuuttujia, niin

missä

Additiivisuus

Chi-neliöjakauman määritelmästä seuraa, että riippumattomien chi-neliömuuttujien summa on myös jaettu chi-neliö. Erityisesti, jos ovat riippumattomia chi-potenssiin muuttujat , vapausasteita, vastaavasti, niin on chi-potenssiin jakautunut vapausasteella.

Näytteen keskiarvo

Näytteen keskiarvo iid chi-neliön asteen muuttujista jakautuu gammajakauman mukaan muodon ja asteikon parametreilla:

Asymptoottisesti , kun tiedetään, että asteikolla parametrin menee äärettömyyteen, Gamma jakelu suppenee kohti normaalijakaumaa kanssa odotusarvo ja varianssi , näytteen keskiarvo konvergoi kohti:

Huomaa, että olisimme saavuttaa saman tuloksen vedoten sen sijaan keskeisen raja-lause , toteaa, että kunkin khiin neliö vaihteleva aste odotus on , ja sen varianssi (ja siten varianssi näytteen keskiarvon ollessa ).

Haje

Ero entropia saadaan

jossa ψ ( x ) on Digamma -funktio .

Chi-neliöjakauma on suurin entropian todennäköisyysjakauma satunnaismuuttujalle , jolle ja on kiinteä. Koska chi-neliö kuuluu gammajakaumien perheeseen, tämä voidaan johtaa korvaamalla sopivat arvot gamman logimomentin odotusarvossa . Katso perusperiaatteista johtaminen riittävien tilastojen johtamisesta momentinmuodostusfunktiosta .

Ei -keskitetyt hetket

Vapauden asteilla varustetun chi-neliöjakauman hetket, jotka ovat nolla, annetaan

Kumulantit

Kumulanttimenetelmää on helposti saatu (muodollinen) tehosarjalaajennusta logaritmin karakteristinen funktio:

Keskittyminen

Chi-neliöjakauma keskittyy voimakkaasti sen keskiarvon ympärille. Laurent-Massartin vakiorajat ovat:

Asymptoottiset ominaisuudet

Arvioitu kaava mediaanille (Wilson – Hilferty -muunnoksesta) verrattuna numeeriseen kvanttiin (ylhäältä); ja ero (sininen) ja suhteellinen ero (punainen) numeerisen kvantti- ja likimääräisen kaavan (alhaalla) välillä. Chi-neliöjakaumassa vain vapausasteiden (ympyrät) positiiviset kokonaisluvut ovat merkityksellisiä.

Jonka keskeisen raja-lause , koska chi-neliön jakauman on summa riippumaton satunnaismuuttujien äärellisen keskiarvo ja varianssi, se konvergoi normaalijakaumaa suuria . Monissa käytännön syissä jakauma on riittävän lähellä normaalia jakaumaa , jotta ero jätetään huomiotta. Erityisesti, jos , niin kuin yleensä äärettömyyteen, jakauma pyrkii normaaliin normaalijakaumaan. Kuitenkin lähentyminen on hidasta, koska vinous on ja ylimääräinen huipukkuus on .

Näytteenottojakauma lähenee normaalia paljon nopeammin kuin näytteenottojakauma , koska logaritmi poistaa suuren osan epäsymmetriasta. Muut chi-neliöjakauman toiminnot lähentyvät nopeammin normaalijakaumaan. Esimerkkejä ovat:

  • Jos sitten jakautuu suunnilleen normaalisti keskiarvon ja yksikkövarianssin mukaan (1922, RA Fisher , katso (18.23), s. 426, Johnson).
  • Jos sitten jakautuu suunnilleen normaalisti keskiarvolla ja varianssilla Tämä tunnetaan nimellä Wilson – Hilferty -muunnos, katso (18.24), s. 426 Johnsonista.
    • Tämä normalisoiva muutos johtaa suoraan yleisesti käytettyyn mediaanilähestymiseen muuntamalla taaksepäin normaalijakauman keskiarvosta, joka on myös mediaani.

Aiheeseen liittyvät jakelut

  • Kuten , ( normaalijakauma )
  • ( ei-keskitetty chi-neliöjakauma, jossa ei-keskeisyysparametri )
  • Jos niin on chi-squared jakelu
  • Erikoistapauksena, jos niin on chi-neliön jakauman
  • (Neliöity normi on k standardi normaalisti jakautunut muuttujat on khiin neliö jakauma k vapausasteella )
  • Jos ja , niin . ( gammajakauma )
  • Jos sitten ( chi -jakelu )
  • Jos , niin on eksponentiaalinen jakauma . (Katso lisää gammajakaumasta .)
  • Jos , niin on Erlangin jakelu .
  • Jos , niin
  • Jos ( Rayleigh -jakauma ) niin
  • Jos ( Maxwell -jakauma ) niin
  • Jos sitten ( käänteinen chi-neliöjakauma )
  • Chi-neliöjakauma on tyypin III Pearsonin jakauman erikoistapaus
  • Jos ja ovat riippumattomia ( beta -jakelu )
  • Jos ( tasainen jakautuminen ) niin
  • Jos sitten
  • Jos noudattaa yleistä normaalijakaumaa (versio 1), jossa parametrit sitten
  • chi-neliöjakauma on Pareto-jakauman muutos
  • Opiskelijan t-jakauma on chi-neliöjakauman muutos
  • Opiskelijan t-jakauma saadaan chi-neliöjakaumasta ja normaalijakaumasta
  • Epäkeskinen beetajakauma voidaan saada muuntamalla chi-neliöjakauma ja Noncentral chi-square -jakauma
  • Ei-keskitetty t-jakauma voidaan saada normaalijakaumasta ja chi-neliöjakaumasta

Chi-neliömuuttuja, jolla on vapausasteet, määritellään riippumattomien tavallisten normaalien satunnaismuuttujien neliöiden summana .

Jos on -ulotteinen Gaussin satunnaisvektori, jossa on keskimääräinen vektori ja sijoitus kovarianssimatriisi , niin se on jaettu chi -neliö vapausasteilla.

Tilastollisesti riippumattomien yksikkövarianssi-Gaussin muuttujien neliöiden summa, joilla ei ole keskimääräistä nollaa, antaa yleistyksen chi-neliöjakaumasta, jota kutsutaan ei- keskimääräiseksi chi-neliöjakaumaksi .

Jos on vektori iid standardin normaalin satunnaismuuttujien ja on symmetrinen , idempotentti matriisi kanssa listalla , niin neliöllinen muoto on khi-neliö-jakautunut vapausasteella.

Jos on positiivinen-semidefiniitti kovarianssimatriisi tiukasti positiivinen diagonaaliset merkinnät, sitten ja satunnainen vektorisysteemi riippumaton siten, että ja se katsoo, että

Chi-neliöjakauma liittyy luonnollisesti myös muihin Gaussin jakaumista. Erityisesti,

  • on F-jakautunut , jos , missä ja ovat tilastollisesti riippumattomia.
  • Jos ja ovat tilastollisesti riippumattomia, niin . Jos ja eivät ole riippumattomia, se ei ole jaettu chi-neliöön.

Yleistykset

Chi-neliöjakauma saadaan k: n riippumattoman, nollakeskisen, yksikkövarianssin Gaussin satunnaismuuttujan neliöiden summana . Tämän jakauman yleistyksiä voidaan saada laskemalla yhteen muun tyyppisten Gaussin satunnaismuuttujien neliöt. Seuraavassa kuvataan useita tällaisia ​​jakeluja.

Lineaarinen yhdistelmä

Jos ovat chi -neliön satunnaismuuttujia ja , jakelun suljettu lauseke ei ole tiedossa. Se voi olla kuitenkin arvioida tehokkaasti käyttäen omaisuutta ominaisuus, toimii chi-square satunnaismuuttujien.

Chi-neliöjakaumat

Ei-keskitetty chi-neliöjakauma

Ei-keskimääräinen chi-neliöjakauma saadaan riippumattomien Gaussin satunnaismuuttujien neliöjen summasta, joilla on yksikkövarianssi ja muut kuin nolla .

Yleinen chi-neliöjakauma

Yleistetty chi-neliöjakauma saadaan neliömuodosta z′Az, jossa z on nollan keskiarvon Gaussin vektori, jolla on mielivaltainen kovarianssimatriisi, ja A on mielivaltainen matriisi.

Gamma-, eksponentiaaliset ja niihin liittyvät jakaumat

Chi-neliöjakauma on gammajakauman erityistapaus , koska käytetään gammajakauman nopeusparametrointia (tai gammajakauman asteikon parametrointia), jossa k on kokonaisluku.

Koska eksponentiaalinen jakauma on myös gammajakauman erikoistapaus, meillä on myös, että jos , niin on eksponentiaalinen jakauma .

Erlang jakauma on myös erikoistapaus gammajakauman ja siten meillä on myös, että jos entistä , niin on Erlang jakautuneita muotoparametri ja asteikko parametri .

Esiintyminen ja sovellukset

Chi-neliön jakauman on lukuisia sovelluksia päättelymekanismien tilastoja , esimerkiksi khiin neliö testejä ja arvioinnissa varianssit . Siitä tulee ongelma normaalijakautuneen populaation keskiarvon arvioinnissa ja ongelma regressiolinjan kaltevuuden arvioimisessa sen roolin kautta Studentin t-jakaumassa . Se tulee kaikkiin varianssiongelmien analyysiin sen roolin kautta F-jakaumassa , joka on kahden riippumattoman chi-neliön satunnaismuuttujan suhteen jakauma , jaettuna kumpikin niiden vapausasteilla.

Seuraavassa on joitain yleisimpiä tilanteita, joissa chi-neliöjakauma syntyy Gaussin jakautuneesta näytteestä.

  • jos ovat iid satunnaismuuttujia , niin missä .
  • Alla oleva laatikko näyttää tilastoja, jotka perustuvat riippumattomiin satunnaismuuttujiin, joilla on todennäköisyysjakaumat, jotka liittyvät chi-neliöjakaumaan:
Nimi Tilastollinen
chi-neliöjakauma
ei-keskimääräinen chi-neliöjakauma
chi -jakelu
ei -keskimääräinen chi -jakauma

Chi-neliöjakauma esiintyy usein myös magneettikuvauksessa .

Laskentamenetelmät

Taulukko χ 2 arvosta vs. p -arvot

P -arvo on todennäköisyys havaitsemisen testin tilastollinen ainakin äärimmäisiä on chi-neliön jakauman. Näin ollen, koska kumulatiivinen jakautumisfunktio (CDF) sopiville vapausasteille (df) antaa todennäköisyyden saada arvo, joka on vähemmän kuin tämä piste, CDF -arvon vähentäminen yhdestä antaa p -arvon. Alhainen p -arvo, alle valitun merkitsevyystason, osoittaa tilastollista merkitsevyyttä eli riittävää näyttöä nollahypoteesin hylkäämiseksi. Merkitsevyystasoa 0,05 käytetään usein rajana merkittävien ja ei-merkittävien tulosten välillä.

Alla olevassa taulukossa on useita p -arvoja, jotka vastaavat ensimmäistä 10 vapausastetta.

Vapausasteet (df) arvo
1 0,004 0,02 0,06 0,15 0,46 1.07 1.64 2.71 3.84 6.63 10,83
2 0.10 0.21 0,45 0,71 1.39 2.41 3.22 4.61 5,99 9.21 13.82
3 0,35 0,58 1.01 1.42 2.37 3.66 4.64 6.25 7.81 11.34 16.27
4 0,71 1.06 1.65 2.20 3.36 4,88 5,99 7.78 9.49 13.28 18.47
5 1.14 1.61 2.34 3.00 4.35 6.06 7.29 9.24 11.07 15.09 20.52
6 1.63 2.20 3.07 3.83 5.35 7.23 8.56 10.64 12.59 16.81 22.46
7 2.17 2.83 3.82 4.67 6.35 8.38 9,80 12.02 14.07 18.48 24.32
8 2.73 3.49 4.59 5.53 7.34 9.52 11.03 13.36 15.51 20.09 26.12
9 3.32 4.17 5.38 6.39 8.34 10,66 12.24 14.68 16.92 21,67 27,88
10 3.94 4.87 6.18 7.27 9.34 11,78 13.44 15,99 18.31 23.21 29.59
p -arvo (todennäköisyys) 0,95 0,90 0,80 0,70 0,50 0,30 0,20 0.10 0,05 0,01 0,001

Nämä arvot voidaan laskea arvioimalla kvantiili toiminto (tunnetaan myös nimellä ”käänteinen CDF” tai ”ICDF”) chi-neliön jakauman; esimerkiksi, The χ 2 ICDF varten p = 0,05 ja df = 7 saannot 2,1673 ≈ 2,17 , kuten yllä olevassa taulukossa, huomata, että 1 - p on p -arvo taulukosta.

Historia

Saksalainen tilastotieteilijä Friedrich Robert Helmert kuvasi tätä jakaumaa ensimmäisen kerran julkaisuissa 1875–6, jossa hän laski normaalin väestön otosvarianssin otosjakauman. Saksassa tämä tunnettiin perinteisesti nimellä Helmert'sche ("Helmertian") tai "Helmert -jakelu".

Jakouuttaminen itsenäisesti uudestaan jonka Englanti matemaatikko Karl Pearson yhteydessä hyvyyttä , josta hän kehitti Pearsonin khiin neliö-testi , joka julkaistiin vuonna 1900, jonka tiedot on laskettu taulukon arvojen julkaistu ( Elderton 1902 ), kerätään ( Pearson 1914 , s. Xxxi – xxxiii, 26–28, taulukko XII) . Nimi "chi-neliö" lopulta on peräisin Pearsonin lyhenteenä eksponentille on monimuuttuja normaalijakaumaa Kreikan kirjain Chi , kirjoittaminen -½χ 2 mitä näyttäisi nykymerkinnöin kuin -½ x T Σ -1 x (Σ ollessa kovarianssimatriisi ). Ajatus "chi-neliöjakaumien" perheestä ei kuitenkaan johdu Pearsonista, vaan syntyi Fisherin 1920-luvulla kehittämänä kehityksenä.

Katso myös

Viitteet

Lue lisää

Ulkoiset linkit