Tiukasti standardoitu keskimääräinen ero - Strictly standardized mean difference

In tilastoja , tiukasti standardoitu keskimääräinen ero (SSMD) on mitta vaikutus koko . Se on keskiarvo jaettuna kahden satunnaisarvon välisen eron keskihajonnalla kustakin kahdesta ryhmästä. Se oli alun perin ehdotti laadunvalvonnan ja osuma valinta in high-throughput seulonta (HTS) ja siitä on tullut tilastollisen parametrin mittaamiseksi vaikutus koot vertailun minkä tahansa kahden ryhmän satunnaislukuja.

Tausta

In high-throughput seulonta (HTS), laadunvalvonta (QC) on kriittinen. Tärkeä QC ominaisuus on HTS -määritys on, kuinka paljon positiiviset kontrollit, testi yhdisteillä , ja negatiiviset kontrollit eroavat toisistaan. Tämä laadunvarmistusominaisuus voidaan arvioida kahden kaivotyypin vertailulla HTS -määrityksissä . Signaali-kohinasuhde (S/N), signaali-tausta-suhde (S/B) ja Z-kerroin on otettu käyttöön HTS- määritysten laadun arvioimiseksi vertaamalla kahta tutkittua kuoppatyyppiä. S/B ei kuitenkaan ota huomioon tietoja vaihtelusta; ja S/N voi kaapata vaihtelun vain yhdessä ryhmässä, joten se ei voi arvioida määrityksen laatua, kun näillä kahdella ryhmällä on erilaiset vaihtelut. Zhang JH et ai. ehdotti Z-tekijää . Z-kertoimen etuna S/N: ään ja S/B: hen on se, että se ottaa huomioon molempien vertailuryhmien vaihtelut. Tämän seurauksena Z-tekijää on käytetty laajasti laadunvalvontamittarina HTS-määrityksissä. Z-kertoimen absoluuttinen merkki tekee tilastollisten johtopäätösten johtamisesta matemaattisesti hankalaa.

Jotta saataisiin parempi tulkittava parametri kahden ryhmän välisen erilaisuuden mittaamiseksi, Zhang XHD ehdotti SSMD: tä positiivisen kontrollin ja negatiivisen kontrollin välisen eron arvioimiseksi HTS -määrityksissä. SSMD: llä on todennäköisyyspohja, koska sillä on vahva yhteys d + -todennäköisyyteen (eli todennäköisyys, että kahden ryhmän ero on positiivinen). D + -todennäköisyys vastaa jossain määrin vakiintunutta todennäköisyysindeksiä P ( X  >  Y ), jota on tutkittu ja sovellettu monilla aloilla. Todennäköisyysperusteisesti tuettua SSMD: tä on käytetty sekä laadunvalvontaan että osumien valintaan suuren suorituskyvyn seulonnassa.

Konsepti

Tilastollinen parametri

Tilastollisena parametrina SSMD (merkitty nimellä ) määritellään kahden satunnaisarvon erotuksen keskiarvon ja keskihajonnan suhteeksi kahdesta ryhmästä. Oletetaan, että yhdessä ryhmässä, jossa on satunnaisia ​​arvoja, on keskiarvo ja varianssi ja toisessa ryhmässä keskiarvo ja varianssi . Kovarianssi ryhmien välillä on Sitten SSMD vertailua näiden kahden ryhmän määritellään

Jos molemmat ryhmät ovat itsenäisiä,

Jos kahdella riippumattomalla ryhmällä on samanlaiset varianssit ,

Tilanteessa, jossa nämä kaksi ryhmää korreloivat, yleisesti käytetty strategia laskennan välttämiseksi on ensin hankkia pareittain havainnot molemmilta ryhmiltä ja sitten arvioida SSMD paritettujen havaintojen perusteella. Perustuu parilliseen eroon väestön keskiarvon ja kanssa , SSMD on

Tilastollinen arvio

Tilanteessa, jossa nämä kaksi ryhmää ovat riippumattomia, Zhang XHD johti SSMD: n maksimitodennäköisyysarvion (MLE) ja hetken menetelmä (MM) -arviosta. Oletetaan, että ryhmillä 1 ja 2 on otoksen keskiarvo ja otosvarianssit . SSMD: n MM -arvio on silloin

Kun molemmilla ryhmillä on normaalijakaumat yhtä suurella varianssilla , SSMD: n tasaisesti minimaalinen varianssin puolueeton arvio (UMVUE) on

missä ovat näytekokot kahdessa ryhmässä ja .

Tilanteessa, jossa nämä kaksi ryhmää korreloivat, perustuen parilliseen eroon otoksen koon , otoksen keskiarvon ja otoksen varianssin kanssa , SSMD: n MM -arvio on

SSMD: n UMVUE -arvio on

SSMD näyttää samanlaiselta kuin t-statistiikka ja Cohenin d, mutta ne eroavat toisistaan ​​kuten kuvassa.

Sovellus suuritehoisissa seulontamäärityksissä

SSMD on kahden ryhmän välisen eron keskiarvon ja keskihajonnan suhde . Kun dataa esikäsitellään käyttämällä log-muunnosta, kuten tavallisesti HTS-kokeissa, SSMD on lokin taitoksen muutoksen keskiarvo jaettuna lokitaitoksen muutoksen keskihajonnalla negatiivisen viittauksen suhteen. Toisin sanoen SSMD on keskimääräinen taittomuutos (lokiasteikolla), jota rangaistaan ​​taitoksen muutoksen vaihtelevuus (lokiasteikolla). Laadunvalvonnassa yksi HTS -määrityksen laatuindeksi on positiivisen kontrollin ja negatiivisen vertailukohdan välisen eron suuruus määrityslevyssä . Osumavalinnassa yhdisteen (eli pienen molekyylin tai siRNA: n ) vaikutusten kokoa edustaa yhdisteen ja negatiivisen vertailun välisen eron suuruus . SSMD mittaa suoraan kahden ryhmän välisen eron suuruuden. Siksi SSMD: tä voidaan käyttää sekä laadunvalvontaan että osuman valintaan HTS -kokeissa.

Laadunvalvonta

Positiivisten ja negatiivisten kontrollien kuoppien määrä 384-kuoppaisen tai 1536-kuoppaisen alustan levyllä on yleensä suunniteltu kohtuullisen suureksi. Oletetaan, että levyn positiivisilla ja negatiivisilla kontrolleilla on näytteen keskiarvo , näytteen vaihtelut ja otoskoko . Yleensä oletus, jonka mukaan säätimillä on yhtä suuri levyn vaihtelu, pitää paikkansa. Tällaisessa tapauksessa SSMD: n arvioidaan kyseisen levyn laadun arvioimiseksi

missä . Jos oletus yhtäläisestä varianssista ei pidä paikkaansa, kyseisen levyn laadun arvioimiseksi tarkoitettu SSMD arvioidaan

Jos ohjaimissa on selvästi poikkeamia , SSMD voidaan arvioida

missä ovat positiivisten ja negatiivisten kontrollien mediaanit ja absoluuttiset poikkeamat .

Z-tekijä perustuu QC kriteeri on kansa käytetään HTS määrityksissä. On kuitenkin osoitettu, että tämä QC -kriteeri soveltuu parhaiten määritykseen, jossa on erittäin tai erittäin vahva positiivinen kontrolli. Eräässä RNAi HTS-määritys, joka on voimakas tai kohtalainen positiivinen kontrolli on yleensä enemmän valaiseva kuin hyvin tai erittäin vahva positiivinen kontrolli, koska tehokkuus tämä valvonta on enemmän samanlainen kuin osumia etua. Lisäksi kahden HTS -kokeen positiivisilla kontrolleilla on teoriassa eri kokoisia vaikutuksia. Näin ollen kohtuullisen kontrollin QC -kynnysten tulisi olla erilaiset kuin vahvan kontrollin kynnysarvot näissä kahdessa kokeessa. Lisäksi on tavallista, että yhdessä kokeessa käytetään kahta tai useampaa positiivista kontrollia. Samojen Z -tekijäpohjaisten laadunvarmistuskriteerien soveltaminen molempiin kontrolleihin johtaa epäjohdonmukaisiin tuloksiin, kuten kirjallisuudessa on kuvattu.

Seuraavassa taulukossa luetellut SSMD-pohjaiset laadunvarmistuskriteerit ottavat huomioon positiivisen kontrollin vaikutuksen koon HTS-määrityksessä, jossa positiivisen kontrollin (kuten esto-kontrollin) arvot ovat teoriassa pienemmät kuin negatiivinen vertailu.

Laatu Tyyppi V: Kohtuullinen hallinta B: Vahva hallinta C: Erittäin vahva ohjaus D: Erittäin vahva ohjaus
Erinomainen
Hyvä
Huonompi
Huono

Jos positiivisen kontrollin vaikutuskoko on biologisesti tiedossa, hyväksy soveltuva kriteeri tämän taulukon perusteella. Muussa tapauksessa seuraavan strategian pitäisi auttaa määrittämään, mitä QC -kriteeriä tulisi soveltaa: (i) monissa pienimolekyylisissä HTS -määrityksissä, joissa on yksi positiivinen kontrolli, yleensä kriteeri D (ja toisinaan kriteeri C) olisi hyväksyttävä, koska tämä kontrolli on yleensä erittäin tai erittäin voimakkaat vaikutukset; (ii) RNAi -HTS -määrityksissä, joissa solujen elinkelpoisuus on mitattu vaste, kriteeri D olisi hyväksyttävä kontrolleille, joissa ei ole soluja (eli kuopat, joihin ei ole lisätty soluja) tai taustakontrollit; (iii) viruksen määrityksessä , jossa määrä viruksia isäntäsoluissa on etua, Kriteeri C on yleensä käytetään, ja kriteeri D toisinaan käytetään positiivisena kontrollina, joka koostuu siRNA viruksesta.

Samanlaisia ​​SSMD-pohjaisia ​​laadunvarmistuskriteerejä voidaan rakentaa HTS-määritystä varten, jossa positiivisella kontrollilla (kuten aktivointikontrollilla) on teoriassa suurempia arvoja kuin negatiivisella vertailulla. Lisätietoja SSMD-pohjaisten QC-kriteerien soveltamisesta HTS-kokeisiin löytyy kirjasta.

Osuman valinta

HTS -määrityksessä yksi ensisijainen tavoite on valita yhdisteitä, joilla on haluttu koko esto- tai aktivaatiovaikutus. Koko yhdisteen vaikutus edustaa suuruus ero testi yhdistettä ja negatiivisen vertailuryhmän ei spesifinen esto / aktivaation vaikutuksia. Yhdiste , jolla on haluttu koko vaikutusten HTS näyttö kutsutun osuma. Osumien valintaprosessia kutsutaan osumanvalintaksi. Suuria tehosteita sisältävien osumien valitsemiseen on kaksi päästrategiaa. Yksi on käyttää tiettyjä metrinen (t) sijoitus ja / tai luokitella yhdisteet niiden vaikutukset ja sitten valita eniten voimakkaita yhdisteitä, joka on käytännöllinen validointi määrityksissä . Toinen strategia on testata, onko yhdisteellä riittävän voimakkaita vaikutuksia saavuttaakseen ennalta asetetun tason. Tässä strategiassa vääriä negatiivisia lukuja (FNR) ja/tai vääriä positiivisia lukuja (FPR) on hallittava.

SSMD ei voi vain luokitella tehosteiden kokoa vaan myös luokitella vaikutukset seuraavan taulukon mukaisesti SSMD : n populaatioarvon ( ) perusteella.

Tehostealityyppi Negatiivisen SSMD: n kynnysarvot Positiivisen SSMD: n kynnysarvot
Erittäin vahva
Erittäin vahva
Vahva
Melko vahva
Kohtalainen
Melko kohtalainen
Melko heikko
Heikko
Erittäin heikko
Erittäin heikko
Ei vaikutusta

SSMD -estimaatti näytöille, joissa ei ole toisintoja, eroaa näytteistä, joissa on toisintoja.

Ensisijaisessa seulonnassa ilman toistoja olettaen, että testatun yhdisteen kuopassa mitattu arvo (yleensä log -asteikolla) on ja että kyseisen levyn negatiivisella vertailulla on näytteen koko , otoksen keskiarvo , mediaani , keskihajonta ja absoluuttinen poikkeama , Tämän yhdisteen SSMD: n arvioidaan olevan

missä . Kun määrityksessä on poikkeamia, jotka ovat tavallisia HTS -kokeissa, SSMD: n vankka versio voidaan saada käyttämällä

On vahvistava tai ensisijainen näytön rinnakkaista, että i: nnen testi yhdisteen kanssa rinnakkaista, laskemme pariksi ero mitatun arvon (tavallisesti log asteikko) ja yhdisteen ja mediaani arvo negatiivisena kontrollina levy, saada sitten paritettujen erojen keskiarvo ja varianssi toisintojen välillä. Tämän yhdisteen SSMD: n arvioidaan olevan

Useissa tapauksissa tutkijat voivat käyttää sekä SSMD -levyä että keskimääräistä taittomuutosta osuman valinnassa HTS -kokeissa. Dual-taskulamppu käyrä voidaan näyttää sekä keskimäärin kolminkertainen muutos ja SSMD kaikkien testi yhdisteiden käytettäessä määrityksessä ja auttavat yhdistää molemmat valita osumia HTS kokeissa. SSMD: n käyttöä osuman valinnassa HTS-kokeissa kuvataan vaihe vaiheelta

Katso myös

Lue lisää

Viitteet