Avoin tieteellinen data - Open science data

Avoin tieteellinen data tai avoin tutkimusdata on avoimen datan tyyppi, joka keskittyy havaintojen ja tieteellisen toiminnan tulosten julkaisemiseen, jotka ovat kaikkien käytettävissä analysoitavaksi ja uudelleenkäytettäväksi. Päätavoite avoimen datan edistämisessä on mahdollistaa tieteellisten väitteiden todentaminen antamalla muiden katsoa tulosten toistettavuutta ja mahdollistaa monista lähteistä peräisin olevien tietojen yhdistäminen uuden tiedon antamiseksi. Vaikka ajatusta avoimesta tieteellisestä datasta on edistetty aktiivisesti 1950 -luvulta lähtien, Internetin yleistyminen on vähentänyt merkittävästi tietojen julkaisemiseen tai hankkimiseen tarvittavia kustannuksia ja aikaa.

Historia

Tieteellisen datan avoimen saatavuuden käsite perustettiin institutionaalisesti perustamalla World Data Center -järjestelmä (nykyään World Data System ), valmistautuen kansainväliseen geofysiikan vuoteen 1957–1958. Kansainvälinen tieteellisten liittojen neuvosto (nykyään kansainvälinen tiedeneuvosto ) perusti useita maailman tietokeskuksia tietojen menetyksen riskin minimoimiseksi ja tietojen saatavuuden maksimoimiseksi, ja suositteli edelleen vuonna 1955, että tiedot asetetaan saataville koneellisesti luettavassa muodossa.

Ensimmäinen aloite luoda tietokanta elektronisten bibliografian avoin pääsy oli oppimateriaali Information Centre (ERIC) vuonna 1966. Samana vuonna, MEDLINE luotiin - ilmainen pääsy sähköisen tietokannan hallinnoi kansalliskirjasto lääketieteen ja National Institute of Health (USA), jossa on bibliografisia viittauksia biolääketieteen alan aikakauslehdistä, joita myöhemmin kutsuttaisiin PubMediksi ja joissa on tällä hetkellä yli 14 miljoonaa täydellistä artikkelia.

Vuonna 1995 GCDIS (USA) ilmaisi kantansa selkeästi tieteellisten tietojen täydellisestä ja avoimesta vaihdosta (Geofysikaalisten ja ympäristötietojen komitean julkaisu - National Research Council):

"Maapallon ilmakehä, valtameret ja biosfääri muodostavat integroidun järjestelmän, joka ylittää kansalliset rajat. Ymmärtääksemme järjestelmän elementit, niiden vuorovaikutustavat ja miten ne ovat muuttuneet ajan myötä, on tarpeen kerätä ja analysoida ympäristötietoja kaikista Globaalin ympäristön tutkimukset edellyttävät kansainvälistä yhteistyötä monista syistä:

  • maailmanlaajuisten ongelmien ratkaisemiseksi on välttämätöntä saada maailmanlaajuiset tietojoukot ja niistä johdetut tuotteet;
  • kunkin kansakunnan on tehokkaampaa ja kustannustehokkaampaa jakaa tietojaan kuin kerätä kaikkea tarvitsemaansa itsenäisesti; ja
  • Maailmanlaajuisiin ympäristöasioihin liittyvien tehokkaiden politiikkojen toteuttaminen edellyttää lähes kaikkien maailman kansojen osallistumista alusta alkaen.

Maailmanlaajuisten muutostutkimusten ja ympäristön seurannan kansainväliset ohjelmat riippuvat ratkaisevasti täydellisen ja avoimen tiedonvaihdon periaatteesta (toisin sanoen tiedot ja tiedot asetetaan rajoituksetta saataville syrjimättömästi korkeimmalle kuin lisääntymis- ja jakelukustannukset) . "

Viimeinen lause korostaa perinteisiä kustannuksia tiedon levittämisestä painettuna ja postitse. Tämän hinnan poistaminen Internetin kautta on helpottanut tietojen teknistä levittämistä huomattavasti. Vastaavasti halvempaa on luoda, myydä ja hallita monia tietoresursseja, mikä on johtanut nykyiseen huoleen ei-avoimesta datasta.

Termin uusimpiin käyttötarkoituksiin kuuluvat:

  • SAFARI 2000 (Etelä -Afrikka, 2001) käytti ICSU: n ja NASAn käytäntöjen mukaista lisenssiä
  • Ihmisen genomi (Kent, 2002)
  • Paikkatietoa käsittelevä avoimen datan konsortio (2003)
  • Manifesti avoimelle kemialle (Murray-Rust ja Rzepa, 2004) (2004)
  • Esitykset JISC: lle ja OAI: lle otsikolla "avoin data" (Murray-Rust, 2005)
  • Science Commonsin julkaisu (2004)
  • Ensimmäiset avoimet tietofoorumit (Lontoo, Iso -Britannia), jota Open Knowledge Foundation (Lontoo UK) ylläpitää kansalaistietoon ja geotietoihin liittyvästä avoimesta datasta (helmikuu ja huhtikuu 2005)
  • Blue Obelisk ryhmä kemian (mantraa: Avoin data, Open Source, Open Standards) (2005) doi : 10,1021 / ci050400b
  • Crystallography Open Database Advisory Board käynnistää vetoomuksen kristallografian avoimesta datasta . (2005)
  • XML -konferenssi ja -näyttely 2005 (Connolly 2005)
  • SPARC Open Data -postituslista (2005)
  • Avoimen tiedon määritelmän ensimmäinen luonnos viittaa nimenomaisesti "avoimeen dataan" (2005)
  • XTech (Dumbill, 2005), (Bray ja O'Reilly 2006)

Vuonna 2004 kaikkien OECD-maiden (Taloudellisen yhteistyön ja kehityksen järjestö), mukaan lukien useimmat kehittyneet maat , tiedeministerit allekirjoittivat julistuksen, jossa todetaan, että kaikki julkisesti rahoitetut arkistotiedot on asetettava julkisesti saataville. Pyynnön johdosta ja intensiivisen keskustelun tietojen tuottavien laitosten jäsenvaltioissa, OECD julkaisi vuonna 2007 OECD periaatteita ja suuntaviivoja tutkimustiedon saatavuudesta julkiseen rahoitukseen kuin ei-sitovien suositus.

Vuonna 2005 Edd Dumbill esitteli "Open Data" -teeman XTechissä, mukaan lukien:

Vuonna 2006 Science Commons järjesti kahden päivän konferenssin Washingtonissa, jossa ensisijaisena aiheena voitaisiin kuvata avointa dataa. Tietojen mukaan mikroturvallisuuden määrä (esim. Lisenssillä) biotekniikan kaltaisilla aloilla loi yhteiskunnan vastaisen tragedian . Tässä suhteessa lisenssien hankkimiskustannukset useilta omistajilta tekivät epätaloudelliseksi tehdä tutkimusta alueella.

Vuonna 2007 SPARC ja Science Commons ilmoittivat konsolidoivansa ja parantaneet tekijän lisäyksiä.

Vuonna 2007 OECD (Taloudellisen yhteistyön ja kehityksen järjestö) julkaisi periaatteet ja ohjeet julkisen rahoituksen tutkimustietojen saatavuudesta. Periaatteissa todetaan seuraavaa:

Tutkimustietojen saatavuus lisää julkisten investointien tuottoa tällä alalla; vahvistaa avointa tieteellistä tutkimusta; kannustaa erilaisiin tutkimuksiin ja mielipiteisiin; edistää uusia työalueita ja mahdollistaa sellaisten aiheiden tutkimisen, joita ensimmäiset tutkijat eivät ole ajatelleet.

Vuonna 2010 lanseerattiin Pantonin periaatteet , jotka kannattavat avointa dataa tieteessä ja määrittelevät periaatteet, joita palveluntarjoajien on noudatettava, jotta niiden tiedot ovat avoimia.

Vuonna 2011 LinkedScience.org lanseerattiin ymmärtämään Linked Open Science -tapa lähestymistapaa jakaa ja yhdistää toisiinsa tieteellisiä resursseja, kuten tietojoukkoja, menetelmiä, työkaluja ja sanastoja.

Vuonna 2012 Royal Society julkaisi suuren raportin "Science as Open Enterprise", jossa kannatettiin avointa tieteellistä tietoa ja tarkasteltiin sen etuja ja vaatimuksia.

Vuonna 2013 G8 -tiedeministerit julkaisivat julkilausuman, joka tukee avointa tieteellistä tutkimustietoa koskevia periaatteita

Vuonna 2015 maailmassa tietojärjestelmästä että Kansainvälisen tiede- hyväksynyt uudet tietojen jakamista periaatteet ilmentää henkeä 'avoin tiede'. Nämä periaatteet ovat kansallisten ja kansainvälisten aloitteiden datapolitiikan mukaisia ​​ja ne ilmaisevat keskeiset eettiset sitoumukset, jotka on toteutettu luotettavien tietovarastojen ja palvelun WDS -sertifioinnissa.

Suhde avoimeen pääsyyn

Paljon tietoa on saatavilla kautta tieteellistä julkaisua, joka nyt houkuttelee vilkkaan keskustelun alla " Open Access " ja semanttisesti avoimia formaatteja - kuten tarjota tieteellisiä artikkeleita vuonna JATS muodossa. Budapestin Open Access Initiative (2001) loi tämän termin:

Tämän kirjallisuuden "avoimella pääsyllä" tarkoitamme sen vapaata saatavuutta julkisella internetillä, jonka avulla kaikki käyttäjät voivat lukea, ladata, kopioida, jakaa, tulostaa, hakea tai linkittää näiden artikkeleiden koko tekstejä, indeksoida niitä, siirtää niitä tietoina ohjelmistoihin tai käyttää niitä mihinkään muuhun lailliseen tarkoitukseen ilman taloudellisia, oikeudellisia tai teknisiä esteitä, jotka eivät ole erottamattomia pääsystä Internetiin. Ainoa jäljentämistä ja jakelua koskeva rajoitus ja tekijänoikeuden ainoa rooli tällä alalla pitäisi olla antaa tekijöille mahdollisuus valvoa työnsä eheyttä ja oikeus tulla tunnetuksi ja lainatuksi.

Julistuksen logiikka sallii tietojen uudelleenkäytön, vaikka termillä "kirjallisuus" on merkityksiä ihmisen luettavasta tekstistä ja se voi viitata tieteelliseen julkaisuprosessiin. Open Access -puheessa käytetään usein termiä "täysteksti", joka ei korosta julkaisun sisältämiä tai sen mukana toimitettuja tietoja.

Jotkut Open Access -julkaisijat eivät vaadi tekijöiltä tekijänoikeuden myöntämistä, ja näihin julkaisuihin liittyviä tietoja voidaan yleensä pitää avoimena datana. Joillakin julkaisijoilla on Open Access -strategioita, joissa julkaisija vaatii tekijänoikeuden siirtämistä ja joissa on epäselvää, että julkaisujen tietoja voidaan todella pitää avoimena datana.

ALPSP- ja STM -julkaisijat ovat antaneet lausunnon siitä, onko toivottavaa asettaa tiedot vapaasti saataville:

Kustantajat tunnustavat, että monilla tieteenaloilla data eri muodoissa on nyt keskeinen tutkimuksen tulos. Tietojen etsintä- ja louhintatyökalut mahdollistavat raakadatan yhä kehittyneemmän käytön. Lehden artikkelit tarjoavat tietysti yhden ”näkemyksen” näiden tietojen merkityksestä ja tulkinnasta - ja konferenssiesitykset ja epäviralliset keskustelut voivat tarjota muita ”näkemyksiä” - mutta data itsessään on yhä tärkeämpi yhteisön resurssi. Tiede on parhaiten edistynyt antamalla mahdollisimman monelle tiedemiehelle pääsy mahdollisimman moniin aiempiin tietoihin. Näin vältetään kalliit työn toistot ja mahdollistetaan luova uusi integrointi ja olemassa olevien tietojen uudelleenkäsittely.

ja

Katsomme, että pääsääntöisesti tietojoukot, tutkimuksen raakatiedot ja näiden tietojen joukot tai osajoukot, jotka toimitetaan paperille päiväkirjaan, olisi mahdollisuuksien mukaan saatettava muiden tutkijoiden vapaasti saataville. Uskomme, että tieteellisten aikakauslehtien kustantajien paras käytäntö on erottaa tukitiedot artikkelista itsestään eikä vaatia tällaisten tietojen tai tietojoukkojen siirtoa tai omistusta kyseisen artikkelin julkaisun ehdoksi.

Vaikka tällä lausunnolla ei ollut vaikutusta ALPSP- ja STM -jäsenten aikakauslehtien julkaisuihin liittyvien perustietojen avoimeen saatavuuteen. Tekijöiden toimittamat tietotaulukot paperin täydentämiseksi ovat edelleen vain tilaajien saatavilla.

Suhde vertaisarviointiin

Pyrkiessään käsittelemään tutkimustulosten toistettavuuteen liittyviä kysymyksiä jotkut tutkijat pyytävät, että kirjoittajat suostuvat jakamaan raakatietonsa osana tieteellistä vertaisarviointiprosessia . Esimerkiksi jo vuonna 1962 useat psykologit ovat yrittäneet saada raaka -aineistoja muilta tutkijoilta vaihtelevin tuloksin niiden uudelleenanalysoimiseksi. Äskettäinen yritys johti vain seitsemään tietojoukkoon viidestäkymmenestä pyynnöstä. Ajatus avoimen datan saamisesta, puhumattakaan sen vaatimisesta, vertaisarvioinnin ehtona on edelleen kiistanalainen.

Avoimen tutkimuksen laskenta

Tieteellisen tiedon ymmärtämiseksi ne on analysoitava. Kaikissa paitsi yksinkertaisimmissa tapauksissa tämä tehdään ohjelmistolla. Ohjelmistojen laaja käyttö aiheuttaa ongelmia tutkimuksen toistettavuudelle . Jotta tutkimus voidaan toistaa, on välttämätöntä julkaista kaikkien tietojen lisäksi myös kaikkien käytettyjen ohjelmistojen lähdekoodi ja kaikki tämän ohjelmiston käyttämisessä käytetyt parametrit. Tällä hetkellä näihin pyyntöihin ei harvoin vastata. Tapoja päästä lähemmäs toistettavaa tieteellistä laskentaa käsitellään tunnussanalla " avoimen tutkimuksen laskenta ".

Katso myös

Viitteet

Ulkoiset linkit