Hämmentävää - Confounding

Esimerkki yksinkertaisesta hämmentävästä tekijästä. Toisin sanoen Z on X: n ja Y: n syy .

Tilastoja, joka on sekoitin (myös sekoittava muuttuja , sekoittava tekijä , vieraita determinantin tai piilee muuttuja ) on muuttuja, joka vaikuttaa sekä riippuva muuttuja ja riippumattoman muuttujan , joka aiheuttaa vääriä -alueella . Hämmennys on kausaalinen käsite, eikä sitä sellaisenaan voida kuvata korrelaatioilla tai assosiaatioilla.

Määritelmä

Kun välittäjä on syy -ketjun tekijä (1), sekava tekijä on väärä tekijä, joka antaa virheellisen syy -yhteyden (2)

Hämmennys määritellään tiedon generointimallin avulla (kuten yllä olevassa kuvassa). Olkoon X jokin riippumaton muuttuja ja Y jokin riippuvainen muuttuja . Arvioidakseen X: n vaikutuksen Y: hen statistiikan on estettävä sekä X: ään että Y: hen vaikuttavien vieraiden muuttujien vaikutukset . Sanomme, että jokin muu muuttuja Z sekoittaa X: n ja Y: n aina, kun Z vaikuttaa syy -yhteydellä sekä X: ään että Y: hen .

Olkoon tapahtuman Y = y todennäköisyys hypoteettisen toimenpiteen X = x alla . X ja Y eivät sekoitu, jos ja vain, jos seuraava pätee:

 

 

 

 

( 1 )

kaikille arvoille X = x ja Y = y , missä on ehdollinen todennäköisyys nähdessään X = x . Intuitiivisesti tämä tasa todetaan, että X ja Y eivät ole sekoitti aina havaintotasolla todisti yhdistyksen niiden välillä on sama kuin yhdistys, joka olisi mitattava hallinnassa kokeessa , jossa x satunnaistettiin .

Periaatteessa määrittelevä tasa -arvo voidaan todentaa tietojen tuottamismallista, olettaen, että meillä on kaikki malliin liittyvät yhtälöt ja todennäköisyydet. Tämä tehdään simuloimalla interventiota (katso Bayesin verkko ) ja tarkistamalla, onko Y: n todennäköisyys yhtä suuri kuin ehdollinen todennäköisyys . Osoittautuu kuitenkin, että kuvaajan rakenne yksinään riittää tasa -arvon tarkistamiseen .

Ohjaus

Harkitse tutkijaa, joka yrittää arvioida lääkkeen X tehokkuutta väestötiedoista, joissa lääkkeen käyttö oli potilaan valinta. Tiedot osoittavat, että sukupuoli ( Z ) vaikuttaa potilaan lääkevalintaan sekä heidän mahdollisuuksiinsa toipua ( Y ). Tässä skenaariossa sukupuoli Z sekoittaa X: n ja Y: n välisen suhteen, koska Z on sekä X: n että Y : n syy :

Causal diagram of Gender as common cause of Drug use and Recovery

Meillä on se

 

 

 

 

( 2 )

koska havaintomäärä sisältää tietoja X: n ja Z: n välisestä korrelaatiosta , ja interventiomäärä ei (koska X ei korreloi Z : n kanssa satunnaistetussa kokeessa). Tilastotieteilijä haluaa puolueettoman arvion , mutta tapauksissa, joissa on käytettävissä vain havainnointitietoja, puolueeton arvio voidaan saada vain "säätämällä" kaikkia hämmentäviä tekijöitä, nimittäin ehdollistamalla niiden eri arvot ja laskemalla tulos keskimäärin. Yhden sekoittimen Z tapauksessa tämä johtaa "säätökaavaan":

 

 

 

 

( 3 )

joka antaa puolueeton arvio syy vaikutuksen X on Y . Sama säätökaava toimii, kun sekoittimia on useita, paitsi tässä tapauksessa muuttujien joukon Z valinta, joka takaa puolueettomat arviot, on tehtävä varoen. Muuttujien oikean valinnan kriteeriä kutsutaan takaoveksi ja se edellyttää, että valittu joukko Z "estää" (tai sieppaa) kaikki polut X: stä Y: hen, jotka päättyvät nuolella X: hen. Tällaisia ​​joukkoja kutsutaan "takaoviksi" hyväksyttävä "ja voi sisältää muuttujia, jotka eivät ole yleisiä syitä X: lle ja Y: lle , vaan vain niiden välittäjiä.

Palataksemme huumeidenkäyttöesimerkkiin, koska Z täyttää takaoven vaatimukset (eli se sieppaa yhden takaoven oven polun ), takaoven säätökaava on voimassa:

 

 

 

 

( 4 )

Tällä tavalla lääkäri voi ennustaa lääkkeen antamisen todennäköisen vaikutuksen havainnointitutkimuksista, joissa yhtälön oikealla puolella esiintyvät ehdolliset todennäköisyydet voidaan arvioida regressiolla.

Toisin kuin yleisesti uskotaan, kovariaattien lisääminen säätöjoukkoon Z voi aiheuttaa harhaa. Tyypillinen vastaesimerkki esiintyy, kun Z on X: n ja Y: n yhteinen vaikutus, ja tapaus, jossa Z ei ole sekoitin (eli nollasarja on takaoven sallittu) ja Z: n säätäminen aiheuttaisi bias- ilmiön, joka tunnetaan nimellä " collider bias" tai " Berksonin paradoksi ."

Yleensä hämmennystä voidaan hallita säätämällä silloin ja vain, jos havaittuja kovariaatioita on joukko, jotka täyttävät takaoven ehdot. Lisäksi, jos Z on sellainen joukko, niin kaavan Eq säätökaava. (3) on voimassa <4,5>. Pearl's do-calculus tarjoaa lisäehtoja, joissa P ( y  | do ( x )) voidaan arvioida, ei välttämättä säätämällä.

Historia

Morabian (2011) mukaan sana on peräisin keskiaikaisesta latinalaisesta verbistä "confudere", joka tarkoitti "sekoittumista", ja se valittiin todennäköisesti edustamaan sekaannusta (latinaksi: con = with + fusus = mix or fuse together) halutaan arvioida ja muita syitä, jotka voivat vaikuttaa tulokseen ja siten hämmentää tai estää halutun arvioinnin. Fisher käytti sanaa "hämmentävä" vuonna 1935 julkaistussa kirjassaan "The Design of Experiments" merkitsemään mitä tahansa virheen lähdettä satunnaistetussa kokeessa. Vandenbroucken (2004) mukaan Kish käytti havainnointitutkimuksessa sanaa "hämmentävä" sanan nykyaikaisessa merkityksessä tarkoittamaan kahden tai useamman ryhmän (esim. Altistuneet ja paljastamattomat) "vertaansa vailla".

Muodolliset olosuhteet, jotka määrittelevät sen, mikä tekee tietyistä ryhmistä "vertailukelpoisia" ja toisia "vertaansa vailla", kehitettiin myöhemmin epidemiologiassa Grönlanti ja Robins (1986) käyttäen Neymanin (1935) ja Rubinin (1974) vastakielistä kieltä . Näitä täydennettiin myöhemmin graafisilla kriteereillä, kuten takaoven tila ( Pearl 1993; Grönlanti, Pearl ja Robins, 1999).

Graafisten kriteerien osoitettiin muodollisesti vastaavan vastakohtaista määritelmää, mutta läpinäkyvämpiä prosessimalleihin luottaville tutkijoille.

Tyypit

Kun on kyse riskinarvioinneista, joissa arvioidaan ihmisten terveydelle aiheutuvan riskin suuruutta ja luonnetta , on tärkeää valvoa sekaannusta, jotta voidaan eristää tietyn vaaran, kuten elintarvikelisäaineen, torjunta -aineen tai uuden lääkkeen, vaikutus. Tulevia tutkimuksia varten on vaikea rekrytoida ja seuloa vapaaehtoisia, joilla on sama tausta (ikä, ruokavalio, koulutus, maantiede jne.), Ja historiallisissa tutkimuksissa voi olla samanlaista vaihtelua. Koska kyvyttömyys kontrolloida vapaaehtoisten ja ihmistutkimusten vaihtelevuutta, hämmennys on erityinen haaste. Näistä syistä kokeet tarjoavat keinon välttää useimmat hämmennyksen muodot.

Joillakin tieteenaloilla hämmennys luokitellaan eri tyyppeihin. In epidemiologian , yksi tyyppi on "sekaannukselle", joka liittyy sekoittavat päässä havaintotutkimuksista . Koska ennustavat tekijät voivat vaikuttaa hoitopäätöksiin (ja hoitovaikutusten ennakkoarvioihin), tunnettujen ennustetekijöiden hallinta voi vähentää tätä ongelmaa, mutta on aina mahdollista, että unohdettu tai tuntematon tekijä ei sisällytetty tai tekijät ovat vuorovaikutuksessa monimutkaisesti. Hämmennys käyttöaiheiden mukaan on kuvattu havainnointitutkimusten tärkeimmäksi rajoitukseksi. Satunnaistettuihin kokeisiin ei vaikuta sekaannukset, jotka johtuvat satunnaisesta osoituksesta .

Hämmentävät muuttujat voidaan myös luokitella niiden lähteen mukaan. Mittauslaitteen valinta (toiminnallinen hämmennys), tilannekohtaiset ominaisuudet (menettelyhäiriö) tai yksilöiden väliset erot (henkilö sekoittaa).

  • Operatiivinen sekoittavia voi esiintyä sekä kokeellisen ja ei-kokeellisen tutkimusasetelman. Tämäntyyppinen hämmennys tapahtuu, kun tietyn rakenteen arvioimiseksi suunniteltu mitta mittaa vahingossa myös jotain muuta.
  • Menettelyyn sekoittavia voi esiintyä laboratoriokoe tai kvasi-koe . Tämäntyyppinen hämmennys tapahtuu, kun tutkija sallii virheellisesti toisen muuttujan muuttua yhdessä manipuloidun riippumattoman muuttujan kanssa.
  • Henkilö sekoittavia tapahtuu, kun kaksi tai useampia yksiköitä analysoidaan yhdessä (esim työntekijöiden eri ammateissa), vaikka mukaan vaihteleva yhden tai useamman muun (havaittu tai jätetyn) ominaisuudet (esim, sukupuoli).

Esimerkkejä

Oletetaan, että tutkitaan syntymäjärjestyksen (1. lapsi, 2. lapsi jne.) Ja Downin oireyhtymän välistä suhdetta lapsessa. Tässä skenaariossa äidin ikä olisi hämmentävä muuttuja:

  1. Korkeampi äidin ikä liittyy suoraan lapsen Downin oireyhtymään
  2. Korkeampi äidin ikä liittyy suoraan Downin oireyhtymään syntymäjärjestyksestä riippumatta (äiti, jolla on ensimmäinen tai kolmas lapsi 50 -vuotiaana, aiheuttaa saman riskin)
  3. Äidin ikä liittyy suoraan syntymäjärjestykseen (toinen lapsi, paitsi kaksoset, syntyy, kun äiti on vanhempi kuin ensimmäisen lapsen syntymässä)
  4. Äidin ikä ei ole syntymäjärjestyksen seuraus (toisen lapsen saaminen ei muuta äidin ikää)

Vuonna riskinarviointi , tekijät kuten ikä, sukupuoli ja koulutustaso vaikuttavat usein terveydentilaa ja niin olisi valvottava. Näiden tekijöiden lisäksi tutkijat eivät ehkä harkitse tai pääse käsiksi muihin syy -tekijöihin liittyviin tietoihin. Esimerkki on tupakoinnin tutkiminen ihmisten terveydelle. Tupakointi, alkoholin käyttö ja ruokavalio ovat elämäntapoihin liittyviä toimintoja. Riskinarviointi, jossa tarkastellaan tupakoinnin vaikutuksia mutta ei hallita alkoholin käyttöä tai ruokavaliota, voi yliarvioida tupakoinnin riskin. Tupakointia ja hämmennystä tarkastellaan ammatillisten riskien arvioinneissa, kuten hiilikaivostoiminnan turvallisuus. Jos tietyllä ammatilla ei ole paljon savuttomia tai juomattomia otospopulaatioita, riskinarviointi voi olla puolueellista, jotta löydettäisiin kielteinen vaikutus terveyteen.

Hämmennysmahdollisuuksien vähentäminen

Häiritsevien tekijöiden esiintymisen ja vaikutusten mahdollisuutta voidaan vähentää lisäämällä analyysissä suoritettujen vertailujen tyyppejä ja lukumääriä. Jos ydinrakenteiden toimenpiteet tai manipulaatiot ovat sekaisin (eli toiminnallisia tai menettelyllisiä seikkoja on olemassa), alaryhmäanalyysi ei välttämättä paljasta ongelmia analyysissä. Lisäksi vertailujen määrän lisääminen voi aiheuttaa muita ongelmia (katso useita vertailuja ).

Vertaisarviointi on prosessi, joka voi auttaa vähentämään sekaannustapauksia joko ennen tutkimuksen toteuttamista tai analyysin jälkeen. Vertaisarviointi perustuu tieteenalojen kollektiiviseen asiantuntemukseen tunnistamaan mahdolliset heikkoudet tutkimusten suunnittelussa ja analysoinnissa, mukaan lukien keinot, joilla tulokset voivat riippua sekavuudesta. Samoin replikointi voi testata yhden tutkimuksen tulosten luotettavuuden vaihtoehtoisissa tutkimusolosuhteissa tai vaihtoehtoisissa analyyseissä (esim. Mahdollisten sekaannusten hallinta, joita ei tunnistettu alkuperäisessä tutkimuksessa).

Hämmentäviä vaikutuksia voi esiintyä vähemmän ja ne toimivat samalla tavalla useita kertoja ja eri paikoissa. Kun valitaan tutkimuspaikkoja, ympäristöä voidaan karakterisoida yksityiskohtaisesti tutkimuspaikoilla sen varmistamiseksi, että alueet ovat ekologisesti samankaltaisia ​​ja siten vähemmän todennäköisiä, että niillä on sekoittavia muuttujia. Lopuksi voidaan tutkia analyysin mahdollisesti sekoittavien ympäristömuuttujien ja mitattujen parametrien suhdetta. Ympäristömuuttujia koskevia tietoja voidaan sitten käyttää laitekohtaisissa malleissa jäljellä olevan varianssin tunnistamiseksi, joka voi johtua todellisista vaikutuksista.

Käytettävissä olevan opintosuunnitelman tyypistä riippuen on olemassa useita tapoja muokata suunnitelmaa siten, että ne voivat aktiivisesti sulkea pois tai hallita sekoittavia muuttujia:

  • Tapausverrokkitutkimukset määrittää sekoittavat molempiin ryhmiin, tapausten ja verrokkien, tasapuolisesti. Jos joku esimerkiksi halusi tutkia sydäninfarktin syytä ja uskoo, että ikä on todennäköinen hämmentävä muuttuja, jokainen 67-vuotias infarktipotilas vastaa terveen 67-vuotiaan "kontrollin" kanssa. Tapaustarkastuksissa sovitetut muuttujat ovat useimmiten ikä ja sukupuoli. Haittapuoli: Tapaustarkastustutkimukset ovat mahdollisia vain, jos on helppo löytää kontrollit, eli henkilöt, joiden asema suhteessa kaikkiin tunnettuihin mahdollisiin sekoittaviin tekijöihin on sama kuin potilaan tilanne: Oletetaan, että tapaustarkastustutkimus yrittää löytää tietyn sairauden syy henkilöllä, joka on 1) 45-vuotias, 2) afroamerikkalainen, 3) Alaskasta , 4) innokas jalkapalloilija, 5) kasvissyöjä ja 6) työskentelee koulutuksessa. Teoreettisesti täydellinen kontrolli olisi henkilö, joka sen lisäksi, että hänellä ei ole tutkittavaa tautia, vastaa kaikkia näitä ominaisuuksia eikä hänellä ole sairauksia, joita potilaalla ei myöskään ole - mutta tällaisen kontrollin löytäminen olisi valtava tehtävä.
  • Kohorttitutkimukset : Tietty täsmäytysaste on myös mahdollista, ja se tehdään usein ottamalla vain tietyt ikäryhmät tai tietty sukupuoli tutkimuspopulaatioon, luomalla kohortti ihmisiä, joilla on samankaltaisia ​​piirteitä ja siten kaikki kohortit ovat vertailukelpoisia mahdollisen suhteen hämmentävä muuttuja. Jos esimerkiksi iän ja sukupuolen uskotaan olevan sekoittajia, vain 40-50 -vuotiaat miehet osallistuisivat kohorttitutkimukseen, jossa arvioitiin sydäninfarktiriskiä kohorteissa, jotka ovat joko fyysisesti aktiivisia tai passiivisia. Haittapuoli: Kohorttitutkimuksissa syöttötietojen liiallinen poissulkeminen voi saada tutkijat määrittelemään liian suppeasti samankaltaisten henkilöiden joukon, joille he väittävät tutkimuksen hyödylliseksi, jolloin muut henkilöt, joihin syy -yhteys tosiasiallisesti koskee, voivat menettää mahdollisuus hyötyä tutkimuksen suosituksista. Samoin tutkimuksen sisältämien syöttötietojen "liiallinen kerrostuminen" voi pienentää otoksen kokoa tietyssä osastossa siihen pisteeseen, että yleistykset, jotka on tehty yksinomaan kyseisen kerroksen jäsenten tarkkailulla, eivät ole tilastollisesti merkitseviä .
  • Kaksoissokkoutus : peittää koepopulaation ja tarkkailijat osallistujien kokeiluryhmän jäsenyyden. Estämällä osallistujia tietämästä, saavatko he hoitoa vai eivät, lumelääkkeen pitäisi olla sama kontrolliryhmässä ja hoitoryhmissä. Estämällä tarkkailijoita tietämästä jäsenyydestään ei pitäisi olla puolueellisuutta, jos tutkijat kohtelevat ryhmiä eri tavalla tai tulkitsevat tuloksia eri tavalla.
  • Satunnaistettu kontrolloitu tutkimus : Menetelmä, jossa tutkimuspopulaatio jaetaan satunnaisesti osallistujien itsevalinnan mahdollisuuksien tai tutkimuksen suunnittelijoiden puolueellisuuden vähentämiseksi. Ennen kokeen aloittamista testaajat nimeävät osallistujaryhmän jäsenet ryhmiinsä (ohjaus, väliintulo, rinnakkain) käyttäen satunnaistamisprosessia, kuten satunnaislukugeneraattorin käyttöä. Esimerkiksi harjoituksen vaikutuksia koskevassa tutkimuksessa johtopäätökset olisivat vähemmän päteviä, jos osallistujille annettaisiin mahdollisuus valita, haluavatko he kuulua kontrolliryhmään, joka ei harjoittaisi, tai interventioryhmään, joka olisi valmis osallistumaan harjoitukseen. harjoitusohjelma. Tutkimus ottaisi sitten mukaan muut muuttujat harjoituksen lisäksi, kuten kokeita edeltävä terveystaso ja motivaatio omaksua terveellistä toimintaa. Tarkkailijan puolelta kokeilija voi valita ehdokkaita, jotka todennäköisemmin näyttävät tulokset, joita tutkimus haluaa nähdä, tai voi tulkita subjektiivisia tuloksia (energisempi, positiivisempi asenne) heidän toiveilleen suotuisalla tavalla.
  • Kerrostuminen : Kuten yllä olevassa esimerkissä, liikunnan uskotaan olevan käyttäytymistä, joka suojaa sydäninfarktilta; ja iän oletetaan olevan mahdollinen hämmennys. Otetut tiedot kerrostetaan sitten ikäryhmittäin - tämä tarkoittaa, että aktiivisuuden ja infarktin välinen yhteys analysoitiin kussakin ikäryhmässä. Jos eri ikäryhmät (tai ikäkerrokset) tuottavat paljon erilaisia riskisuhteita , ikää on pidettävä hämmentävänä muuttujana. On olemassa tilastotyökaluja, muun muassa Mantel -Haenszel -menetelmiä, jotka ottavat huomioon tietojoukkojen kerrostumisen.
  • Kontrolloiden sekoittavat mittaamalla tunnettujen sekoittavat ja mukaan lukien ne kovariaatit on monimuuttuja-analyysi , kuten regressioanalyysin . Monimuuttuja -analyysit paljastavat paljon vähemmän tietoa sekoittavan muuttujan vahvuudesta tai napaisuudesta kuin kerrostusmenetelmät. Jos esimerkiksi monimuuttuja -analyysi kontrolloi masennuslääkettä eikä se kerrota masennuslääkkeitä TCA: lle ja SSRI: lle , se jättää huomiotta, että näillä kahdella masennuslääkeryhmällä on vastakkaiset vaikutukset sydäninfarktiin ja toinen on paljon voimakkaampi kuin toinen.

Kaikilla näillä menetelmillä on haittoja:

  1. Paras käytettävissä suojautua mahdollisuus vääriä tuloksia, koska sekoittavia on usein luopua pyrkimyksiä kerrostuminen ja sen sijaan suorittaa satunnaistettu tutkimus on riittävän suuri näyte kokonaisuutena siten, että kaikki mahdolliset sekoittavat muuttujat (tunnetut ja tuntemattomat) on jakautui sattumanvaraisesti kaikkiin tutkimusryhmiin, joten niitä ei korreloida binaarimuuttujan kanssa sisällyttämistä/poissulkemista varten missä tahansa ryhmässä.
  2. Eettiset näkökohdat: Kaksoissokkoutetuissa ja satunnaistetuissa kontrolloiduissa tutkimuksissa osallistujat eivät ole tietoisia siitä, että he ovat huijaushoitoja ja heiltä voidaan evätä tehokkaita hoitoja. On mahdollista, että potilaat suostuvat vain invasiiviseen leikkaukseen (joka sisältää todellisia lääketieteellisiä riskejä) sillä edellytyksellä, että he saavat hoitoa. Vaikka tämä on eettinen huolenaihe, se ei ole täydellinen kuvaus tilanteesta. Leikkauksissa, joita tehdään tällä hetkellä säännöllisesti, mutta joiden todellisesta vaikutuksesta ei ole konkreettisia todisteita, tällaisten leikkausten jatkaminen voi aiheuttaa eettisiä kysymyksiä. Tällaisissa olosuhteissa monet ihmiset ovat alttiina leikkauksen todellisille riskeille, mutta nämä hoidot eivät välttämättä tarjoa havaittavaa hyötyä. Sham-kirurginen ohjaus on menetelmä, jonka avulla lääketiede voi määrittää, onko kirurginen toimenpide tehokas vai ei. Kun otetaan huomioon, että lääketieteellisiin operaatioihin liittyy tunnettuja riskejä, on epäilyttävän eettistä sallia tarkistamattomien leikkausten tekeminen loputtomiin tulevaisuuteen.

Katso myös

Viitteet

Lue lisää

Ulkoiset linkit

Nämä sivustot sisältävät kuvauksia tai esimerkkejä sekavista muuttujista: