Google -kirjat - Google Books

Google -kirjat
Google -kirjojen logo 2015.svg
Kuvakaappaus
Google -kirjojen kuvakaappaus.png
Sivuston tyyppi
Digitaalinen kirjasto
Omistaja Google
URL -osoite kirjat .google .fi
Käynnistettiin Lokakuu 2004 ; 17 vuotta sitten (Google Print) ( 2004-10 )
Nykyinen tila Aktiivinen

Google-kirjat (tunnettiin aiemmin nimellä Google-teoshaku ja Google Print ja sen koodinimi Project Ocean ) on Google Inc: n palvelu, joka etsii Googlen skannaamien kirjojen ja aikakauslehtien koko tekstistä, muunnettuna tekstiksi optisen merkkitunnistuksen avulla ( OCR) ja tallennetaan sen digitaaliseen tietokantaan. Kirjoja tarjoavat joko kustantajat ja kirjoittajat Google -kirjojen kumppaniohjelman kautta tai Googlen kirjastokumppanit kirjastohankkeen kautta. Lisäksi Google on tehnyt yhteistyötä useiden aikakauslehtikustantajien kanssa arkistojensa digitalisoimiseksi.

Publisher -ohjelma tunnettiin ensimmäisen kerran nimellä Google Print, kun se esiteltiin Frankfurtin kirjamessuilla lokakuussa 2004. Google Books Library Project, joka skannaa teoksia kirjastokumppaneiden kokoelmista ja lisää ne digitaaliseen luetteloon, julkistettiin joulukuussa 2004 .

Google -kirjoja koskevaa aloitetta on kehuttu sen mahdollisuuksista tarjota ennennäkemätön pääsy siihen, mistä voi tulla suurin ihmisten tietämys verkossa, ja edistää tiedon demokratisoitumista . Sitä on kuitenkin kritisoitu myös mahdollisista tekijänoikeusloukkauksista ja siitä, että muokkaus puuttuu korjaamaan lukuisia virheitä, jotka OCR -prosessi tuo skannattuihin teksteihin.

Lokakuussa 2015 skannattujen kirjojen määrä oli yli 25 miljoonaa, mutta skannausprosessi on hidastunut amerikkalaisissa akateemisissa kirjastoissa. Google arvioi vuonna 2010, että maailmassa oli noin 130 miljoonaa erillistä nimikettä, ja ilmoitti aikovansa skannata ne kaikki. Lokakuusta 2019 lähtien Google juhli Google -kirjojen 15 -vuotispäivää ja tarjosi skannattujen kirjojen määräksi yli 40 miljoonaa nimikettä.

Google-kirjan skannaustyöt ovat olleet riita-asioita, kuten Authors Guild v. Google , ryhmäkanne Yhdysvalloissa. Tämä oli merkittävä tapaus, joka oli lähellä orpoteosten tekijänoikeuskäytäntöjen muuttamista Yhdysvalloissa.

Yksityiskohdat

Google -kirjojen tulokset näkyvät sekä yleisessä Google -haussa että omalla Google -kirjojen hakusivustolla ( books.google.com ).

Vastauksena hakukyselyihin Google -kirjojen avulla käyttäjät voivat tarkastella kirjojen kaikkia sivuja, joissa hakutermit esiintyvät, jos teoksella ei ole tekijänoikeuksia tai jos tekijänoikeuden omistaja on antanut luvan. Jos Google uskoo, että kirja on edelleen tekijänoikeuden alainen, käyttäjä näkee tekstinpätkiä haettujen hakutermien ympärillä. Kaikki kirjan tekstin hakutermit esiintyvät keltaisella korostuksella.

Google -kirjoissa käytetään neljää käyttöoikeustasoa:

  • Koko näkymä : Julkisesti saatavilla olevat kirjat ovat käytettävissä "koko näkymässä" ja ne voidaan ladata ilmaiseksi. Kumppaniohjelman kautta hankitut painetut kirjat ovat myös kokonaisuudessaan nähtävissä, jos kustantaja on antanut luvan, vaikka tämä on harvinaista.
  • Esikatselu : Tulostettavissa olevissa kirjoissa, joille on myönnetty lupa, katseltavien sivujen määrä on rajoitettu "esikatseluun", joka on asetettu useilla käyttörajoituksilla ja turvatoimilla, joista osa perustuu käyttäjän seurantaan. Yleensä kustantaja voi asettaa esikatseltavana olevan kirjan prosenttiosuuden. Käyttäjiä ei saa kopioida, ladata tai tulostaa kirjojen esikatseluja. Sivujen alareunaan tulee vesileima "Tekijänoikeudella suojattu materiaali". Kaikki kumppaniohjelman kautta hankitut kirjat ovat esikatselukelpoisia.
  • Katkelmanäkymä : " Katkelmanäkymä " - kaksi tai kolme tekstiriviä haetun hakutermin ympärillä - näytetään tapauksissa, joissa Googlella ei ole tekijänoikeuden omistajan lupaa esikatselun näyttämiseen. Tämä voi johtua siitä, että Google ei voi tunnistaa omistajaa tai omistaja hylkäsi luvan. Jos hakutermi esiintyy kirjassa monta kertaa, Google näyttää enintään kolme katkelmaa, mikä estää käyttäjää katsomasta liikaa kirjaa. Google ei myöskään näytä katkelmia tietyistä viitekirjoista, kuten sanakirjoista, joissa jopa katkelmien näyttäminen voi vahingoittaa teoksen markkinoita. Google väittää, että katkelmanäkymän näyttäminen tekijänoikeuslain mukaan ei vaadi lupaa.
  • Ei esikatselua : Google näyttää myös hakutuloksia kirjoista, joita ei ole digitoitu. Koska näitä kirjoja ei ole skannattu, niiden tekstiä ei voi hakea, ja vain metatiedot , kuten nimi, kirjoittaja, kustantaja, sivumäärä, ISBN, aihe ja tekijänoikeustiedot sekä joissakin tapauksissa sisällysluettelo ja kirjan yhteenveto saatavilla. Käytännössä tämä on samanlainen kuin online -kirjastokorttiluettelo.

Vastauksena kritiikkiin, kuten American Association of Publishers ja Authors Guild , Google julkisti elokuussa 2005 opt-out- käytännön, jonka avulla tekijänoikeuksien omistajat voivat antaa luettelon nimikkeistä, joita he eivät halua skannata, ja pyyntö olla kunnioitettu. Yhtiö ilmoitti myös, että se ei skannaa tekijänoikeuden alaisia ​​kirjoja elokuun ja 1. marraskuuta 2005 välisenä aikana, jotta omistajat voivat päättää, mitkä kirjat jätetään projektin ulkopuolelle. Tekijänoikeuksien omistajilla on siis kolme vaihtoehtoa minkä tahansa työn suhteen:

  1. Se voi osallistua kumppaniohjelmaan asettaakseen kirjan esikatselu- tai kokonaiskatselukäyttöön, jolloin se jakaisi tulot, jotka saadaan teoksen sivujen näyttämisestä vastauksena käyttäjien kyselyihin.
  2. Sen avulla Google voi skannata kirjan kirjastoprojektin alla ja näyttää katkelmia vastauksena käyttäjien kyselyihin.
  3. Se voi kieltäytyä kirjastoprojektista, jolloin Google ei skannaa kirjaa. Jos kirja on jo skannattu, Google nollaa sen käyttöoikeustasoksi Ei esikatselua.

Useimmat skannatut teokset eivät ole enää painettuja tai kaupallisia.

Sen lisäksi, että Google hankkii kirjoja kirjastoista, Google hankkii kirjoja kustantajakumppaneiltaan kumppaniohjelman kautta, jonka tarkoituksena on auttaa kustantajia ja kirjoittajia mainostamaan kirjojaan. Kustantajat ja kirjoittajat lähettävät Googlelle joko digitaalisen kopion teoksestaan EPUB- tai PDF -muodossa tai painetun kopion, joka on saatavana Google -kirjoissa esikatseltavaksi. Kustantaja voi hallita esikatseltavissa olevan kirjan prosenttiosuutta, vähintään 20%. He voivat myös tehdä kirjan kokonaan katseltavaksi ja jopa antaa käyttäjien ladata PDF -kopion. Kirjat voidaan asettaa myyntiin myös Google Playssa. Toisin kuin kirjastohanke, tämä ei aiheuta tekijänoikeusongelmia, koska se toteutetaan kustantajan kanssa tehdyn sopimuksen mukaisesti. Kustantaja voi milloin tahansa irtisanoa sopimuksen.

Monien kirjojen Google -kirjat näyttävät alkuperäiset sivunumerot. Kuitenkin Tim Parks , kirjallisesti New York Review of Books vuonna 2014, totesi, että Google oli lopettanut tarjoamalla sivunumerot monien viimeaikaisten julkaisujen (todennäköisesti niitä hankittu Partner Program) "oletettavasti liitossa kustantajien, jotta voimassa meistä, joiden on valmisteltava alaviitteitä paperiversioiden ostamiseksi. "

Kirjojen skannaus

Hanke alkoi vuonna 2002 koodinimellä Project Ocean. Googlen perustaja Larry Page oli aina ollut kiinnostunut kirjojen digitoinnista. Kun hän ja Marissa Mayer alkoivat kokeilla kirjojen skannaamista vuonna 2002, 300 sivun kirjan digitointi kesti 40 minuuttia. Mutta pian tekniikan kehittämisen jälkeen siinä määrin, että skannausoperaattorit pystyivät skannaamaan jopa 6000 sivua tunnissa.

Google perusti nimetyt skannauskeskukset, joihin kirjoja kuljetettiin kuorma -autoilla. Asemat voivat digitoida nopeudella 1000 sivua tunnissa. Kirjat sijoitettiin räätälöityyn mekaaniseen telineeseen, joka sääti kirjan selkärangan paikalleen, kun joukko valoja ja optisia instrumentteja skannasi kaksi avointa sivua. Jokaisella sivulla olisi kaksi kameraa, jotka olisi suunnattu kuvaamaan , kun taas etäisyysmittari LIDAR peitti kirjan pinnalla kolmiulotteisen laserverkon paperin kaarevuuden kuvaamiseksi . Ihmisoperaattori kääntäisi sivuja käsin käyttämällä valokuvia jalkapolkimella. Koska sivuja ei tarvitse litistää tai kohdistaa täydellisesti, Googlen järjestelmä saavutti huomattavan tehokkuuden ja nopeuden, mutta auttoi myös suojaamaan hauraita kokoelmia liialliselta käsittelyltä. Myöhemmin karkeat kuvat kävivät läpi kolme käsittelytasoa: ensin LIDAR-tietoja käyttävät vääntymisalgoritmit korjaavat sivujen kaarevuuden. Sitten optinen merkintunnistusohjelmisto (OCR) muutti raakakuvat tekstiksi ja lopuksi toinen algoritmikierros poimivat sivunumerot, alaviitteet, kuvat ja kaaviot.

Monet kirjat skannataan mukautetulla Elphel 323 -kameralla nopeudella 1000 sivua tunnissa. Patentti myönnetään Googlen vuonna 2009 paljasti, että Google oli keksittävä innovatiivinen skannaamiseen kirjojen joka käyttää kaksi kameraa ja infrapunavaloa automaattisesti oikea kaarevuus kirjan sivuja. Rakentamalla jokaisesta sivusta 3D-mallin ja sitten "vääntämällä" sen, Google pystyy esittämään litteän näköisiä sivuja ilman, että sivuja todella pitäisi tasata, mikä edellyttää tuhoavia menetelmiä, kuten sitomista tai lasilevyjen käyttämistä yksitellen tasoittaa jokaisen sivun, mikä ei ole tehokasta suuren mittakaavan skannauksessa.

Verkkosivuston toiminnallisuus

Google Kirjat luo jokaiselle teokselle automaattisesti yleiskatsaussivun. Tällä sivulla näkyvät kirjasta poimitut tiedot - sen julkaisutiedot, korkeataajuinen sanakartta, sisällysluettelo - sekä toissijaista materiaalia, kuten yhteenvetoja, lukijoiden arvosteluja ja linkkejä muihin aiheeseen liittyviin teksteihin. Esimerkiksi sivun kävijä saattaa nähdä luettelon kirjoista, joilla on samanlainen genre ja teema, tai hän voi nähdä luettelon kirjan nykyisistä stipendeistä. Tämä sisältö tarjoaa lisäksi vuorovaikutteisia mahdollisuuksia käyttäjille, jotka ovat kirjautuneet Google -tililleen . Ne voivat viedä bibliografiset tiedot ja viittausten on vakio muodoissa , kirjoittaa omia mielipiteitä, lisää se heidän kirjastoa tagged, järjestäytynyt, ja jakaa muiden ihmisten. Näin Google Books kerää näitä tulkitsevampia elementtejä useista lähteistä, mukaan lukien käyttäjät, kolmannen osapuolen sivustot, kuten Goodreads , ja usein kirjan kirjoittaja ja kustantaja.

Itse asiassa Google on lisännyt verkkosivustoon useita toimintoja kannustaakseen kirjoittajia lataamaan omia kirjojaan. Kirjoittajat voivat antaa kävijöiden ladata e -kirjansa ilmaiseksi tai he voivat määrittää oman ostohintansa. He voivat muuttaa hintaa edestakaisin ja tarjota alennuksia aina kun se heille sopii. Lisäksi, jos kirjan kirjoittaja päättää lisätä ISBN- , LCCN- tai OCLC -tietueen numeron, palvelu päivittää kirjan URL -osoitteen sisältämään sen. Tämän jälkeen kirjoittaja voi asettaa tietyn sivun linkin ankkuriksi. Tämä vaihtoehto helpottaa kirjan löytämistä.

Ngram Viewer

Ngram Viewer on Google -kirjoihin yhdistetty palvelu, joka kuvaa sanojen käytön taajuuden koko kirjakokoelmassaan. Palvelu on tärkeä historioitsijoille ja kielitieteilijöille, koska se voi tarjota sisäisen katsauksen ihmiskulttuuriin sanan käytön kautta koko ajanjakson ajan. Tätä ohjelmaa on kritisoitu ohjelmassa käytettyjen metatietojen virheiden vuoksi.

Sisältöongelmat ja kritiikki

Hanke on saanut kritiikkiä siitä, että sen ilmoitettu tavoite säilyttää orvot ja loppuneet teokset ovat vaarassa, koska skannatuissa tiedoissa on virheitä ja että näitä ongelmia ei ratkaista.

Käyttäjät voivat ilmoittaa virheistä Googlen skannatuissa kirjoissa osoitteessa support.google.com/books/partner/troubleshooter/2983879 .

Skannausvirheet

Käsi skannattu Google -kirjaan

Skannausprosessissa on virheitä. Jotkut sivut voivat esimerkiksi olla lukukelvottomia, ylösalaisin tai väärässä järjestyksessä. Tutkijat ovat jopa raportoineet rypistyneitä sivuja, peittäviä peukaloita ja sormia sekä likaisia ​​tai epäselviä kuvia. Tästä asiasta Googlen ilmoitus skannattujen kirjojen lopussa sanoo:

Perustason digitointi perustuu fyysisten kirjojen sivukuviin. Jotta tämä kirja olisi saatavana ePub -muotoisena tiedostona, otimme nämä sivukuvat ja poimimme tekstin käyttämällä optista merkintunnistustekniikkaa (tai lyhyesti OCR). Tekstin poimiminen sivukuvista on vaikea tekninen tehtävä. Tahrat fyysisten kirjojen sivuilla, hienot fontit, vanhat fontit, repeytyneet sivut jne. Voivat kaikki johtaa virheisiin poimitussa tekstissä. Epätäydellinen tekstintunnistus on vain ensimmäinen haaste lopullisessa tavoitteessa siirtyä sivukuvakokoelmista uutteisiin teksteihin perustuviin kirjoihin. Tietokonealgoritmiemme on myös määritettävä automaattisesti kirjan rakenne (mitkä ovat otsikot ja alatunnisteet, mihin kuvat on sijoitettu, onko teksti jae vai proosa jne.). Tämän oikein saaminen antaa meille mahdollisuuden esittää kirja tavalla, joka noudattaa alkuperäisen kirjan muotoa. Pyrkimyksistämme huolimatta saatat nähdä kirjoitusvirheitä, roskahahmoja, vieraita kuvia tai puuttuvia sivuja tässä kirjassa. Arvioidemme perusteella näiden virheiden ei pitäisi estää sinua nauttimasta kirjan sisällöstä. Täydellisen kirjan automaattisen rakentamisen tekniset haasteet ovat pelottavia, mutta parannamme edelleen tekstintunnistus- ja kirjarakennetekniikoitamme.

Vuodesta 2009 lähtien Google ilmoitti, että he alkavat käyttää reCAPTCHA -ohjelmaa korjaamaan Google -kirjan skannauksissa havaitut virheet. Tämä menetelmä parantaisi vain skannattuja sanoja, joita on vaikea tunnistaa skannausprosessin vuoksi, eikä voi ratkaista virheitä, kuten käännettyjä sivuja tai estettyjä sanoja.

Virhe metatiedoissa

Tutkijat ovat usein raportoineet rehottavista virheistä Google -kirjojen metatiedoissa - mukaan lukien väärin kirjoitetut kirjoittajat ja virheelliset julkaisupäivät. Geoffrey Nunberg , kielitieteilijä, joka tutkii sanankäytön muutoksia ajan myötä, huomasi, että ennen vuotta 1950 julkaistujen kirjojen, jotka sisälsivät sanan "internet", etsiminen osoitti epätodennäköistä 527 tulosta. Woody Allen mainitaan 325 kirjassa, jotka on julkaistu ennen syntymää. Google vastasi Nunbergiin syyttäen suurimman osan virheistä ulkopuolisista urakoitsijoista.

Muita raportoituja metatietovirheitä ovat julkaisupäivät ennen tekijän syntymää (esim. 182 Charles Dickensin teosta ennen hänen syntymäänsä vuonna 1812); virheelliset aiheluokitukset ( Moby Dickin painos, joka löytyi "tietokoneista", Mae Westin elämäkerta luokiteltu "uskontoon"), ristiriitaiset luokitukset (10 painosta Whitman's Leaves of Grassista, kaikki luokiteltu sekä "fiktioksi" että "tietokirjallisuudeksi"), väärin kirjoitettuja nimikkeitä, kirjoittajia ja kustantajia ( Moby Dick: tai valkoinen "muuri" ) ja yhden kirjan metatiedot, jotka on liitetty väärin täysin toiseen kirjaan (vuoden 1818 matemaattisen teoksen metatiedot johtavat vuoden 1963 romanssiromaaniin).

Tarkistettiin 400 satunnaisesti valitun Google -kirjojen tietueen tekijän, nimen, julkaisijan ja julkaisuvuoden metatietoelementit. Tulokset osoittavat, että 36% digitointiprojektin näytteistä otetuista kirjoista sisälsi metatietovirheitä. Tämä virhetaso on korkeampi kuin voisi olettaa tavallisesta kirjaston verkkoluettelosta.

Tässä tutkimuksessa havaittu kokonaisvirhetaso 36,75% viittaa siihen, että Google -kirjojen metatiedoissa on korkea virhetaso. Vaikka "suuret" ja "pienet" virheet ovat subjektiivinen ero, joka perustuu hieman määrittelemättömään "löydettävyyden" käsitykseen, tässä tutkimuksessa tutkituista neljästä metatietoelementistä löytyneitä virheitä on pidettävä vakavina.

Virheellisiin skannattuihin päivämääriin perustuvat metatietovirheet vaikeuttavat tutkimusta Google -kirjojen projektitietokannan avulla. Google on osoittanut vain vähän kiinnostusta näiden virheiden poistamiseen.

Kieliasiat

Jotkut eurooppalaiset poliitikot ja älymystöt ovat arvostelleet Googlen pyrkimyksiä kielellisen imperialismin perusteella. He väittävät, että koska valtaosa skannattavaksi ehdotetuista kirjoista on englanninkielisiä, se johtaa suhteettomaan luontaisten kielten esitykseen digitaalisessa maailmassa. Esimerkiksi saksa, venäjä, ranska ja espanja ovat suosittuja kieliä apurahoissa. Suhteeton online -painotus englantiin voi kuitenkin muokata historiallisen apurahan saatavuutta ja lopulta tulevan apurahan kasvua ja suuntaa. Näiden arvostelijoiden joukossa on Jean-Noël Jeanneney , Bibliothèque nationale de Francen entinen presidentti .

Google -kirjat vastaan ​​Google Scholar

Vaikka Google -kirjat on digitoinut suuren määrän aikakauslehtien numeroita, sen skannaukset eivät sisällä metatietoja, joita tarvitaan tiettyjen artikkeleiden tunnistamiseen tietyissä numeroissa. Tämä on johtanut siihen, että Google Scholarin päättäjät aloittavat oman ohjelmansa vanhempien aikakauslehtien artikkelien digitoimiseksi ja isännöimiseksi (yhteisymmärryksessä julkaisijoidensa kanssa).

Kirjaston kumppanit

Google -kirjojen kirjastohankkeen tarkoituksena on skannata ja tehdä haettaviksi useiden suurten tutkimuskirjastojen kokoelmia . Bibliografisten tietojen ohella kirjan katkelmat ovat usein nähtävissä. Jos kirja on tekijänoikeuden alainen ja julkinen, kirja on täysin luettavissa tai ladattavissa .

Kirjastoprojektin kautta skannatut tekijänoikeussuojatut kirjat ovat saatavana katkelmanäkymässä Google-kirjoissa. Skannausten laadun osalta Google myöntää, että ne eivät aina ole riittävän korkealaatuisia myytäväksi Google Playssa. Lisäksi oletettujen teknisten rajoitusten vuoksi Google ei korvaa skannauksia laadukkaammilla versioilla, joita julkaisijat voivat tarjota.

Hanke on tekijänoikeuskirjan v. Google oikeusjuttu, joka nostettiin vuonna 2005 ja joka päätti Googlen hyväksi vuonna 2013 ja jälleen valituksena vuonna 2015.

Tekijänoikeuksien omistajat voivat vaatia skannatun kirjan oikeuksia ja asettaa sen esikatselu- tai kokonaiskatselukäyttöön ("siirtämällä" sen kumppaniohjelman tililleen) tai pyytää Googlea estämään kirjan tekstin haun.

Kirjastohankkeeseen osallistuvien laitosten määrä on kasvanut sen alusta lähtien.

Ensimmäiset kumppanit

Huomaa projektista Michiganin yliopiston kirjastossa
  • Harvardin yliopisto , Harvardin yliopiston kirjasto
    Harvardin yliopiston kirjasto ja Google tekivät pilottihankkeen koko vuoden 2005 ajan. Projekti jatkui tavoitteena lisätä online -pääsyä Harvardin yliopiston kirjaston tietokantaan, joka sisältää yli 15,8 miljoonaa kappaletta. Vaikka fyysinen pääsy Harvardin kirjastoaineistoon rajoittuu yleensä nykyisiin Harvardin opiskelijoihin, opettajiin ja tutkijoihin tai tutkijoihin, jotka voivat tulla Cambridgeen, Harvard-Google-projekti on suunniteltu siten, että sekä Harvardin yhteisön jäsenet että käyttäjät kaikkialla voivat löytää toimii Harvardin kokoelmassa.
  • University of Michigan , University of Michigan kirjasto
Maaliskuussa 2012 skannattiin 5,5 miljoonaa kappaletta.

Muita kumppaneita

Muut institutionaaliset kumppanit ovat liittyneet projektiin kumppanuuden julkistamisen jälkeen:

Yhteistyön tarkoituksena oli digitoida kirjaston latinalaisamerikkalainen kokoelma - noin puoli miljoonaa kappaletta.
Maaliskuussa 2012 skannattiin noin 600 000 kappaletta.

Historia

2002 : Joukko Googlen tiimin jäseniä käynnistää virallisesti "salaiset kirjat" -projektin. Googlen perustajat Sergey Brin ja Larry Page keksivät ajatuksen, josta tuli myöhemmin Google -kirjoja, kun he olivat vielä jatko -opiskelijoita Stanfordissa vuonna 1996. Google -kirjojen verkkosivuston historiasivu kuvaa heidän alkuperäistä näkemystään tästä projektista: "tulevaisuuden maailmassa, jossa laaja kirjakokoelmat digitalisoidaan, ihmiset käyttävät " indeksointirobottia " indeksoimaan kirjojen sisältö ja analysoimaan niiden välisiä yhteyksiä, määrittäen minkä tahansa kirjan osuvuuden ja hyödyllisyyden seuraamalla muiden kirjojen viittausten määrää ja laatua. " Tämä tiimi vieraili joidenkin suurempien digitalisointitoimien sivustoilla, mukaan lukien Kongressin kirjaston American Memory Project , Project Gutenberg ja Universal Library selvittääkseen, miten ne toimivat, sekä Michiganin yliopistossa, Page's alma mater, ja perusta sellaisille digitointihankkeille kuin JSTOR ja Making of America. Keskustellessaan tuolloin yliopiston presidentin Mary Sue Colemanin kanssa , kun Page sai selville, että yliopiston nykyinen arvio kirjaston kaikkien tilavuuksien skannaamisesta oli 1 000 vuotta, Page kuulemma kertoi Colemanille, että hän "uskoo, että Google voi auttaa toteuttamaan sen kuudessa. "

2003 : Tiimi pyrkii kehittämään nopean skannausprosessin sekä ohjelmiston, joka ratkaisee ongelmat parittomissa kooissa, epätavallisissa kirjasimissa ja "muissa odottamattomissa ominaisuuksissa".

Joulukuu 2004 : Google ilmoitti laajentavansa Google Print -hankettaan, joka tunnetaan nimellä Google Print Library Project. Google ilmoitti yhteistyöstä useiden korkean profiilin yliopisto- ja julkisten kirjastojen kanssa, mukaan lukien Michiganin yliopisto , Harvard ( Harvardin yliopiston kirjasto ), Stanford ( vihreä kirjasto ), Oxford ( Bodleian-kirjasto ) ja New Yorkin julkinen kirjasto . Lehdistötiedotteiden ja yliopistokirjastonhoitajien mukaan Google suunnitteli digitoivansa ja asettavansa Google Books -palvelunsa kautta saataville noin 15 miljoonaa kappaletta vuosikymmenessä. Ilmoitus herätti pian kiistoja, koska kustantaja- ja kirjailijayhdistykset haastoivat Googlen suunnitelmat digitalisoida paitsi julkisesti saatavilla olevia kirjoja myös tekijänoikeuden alaisia ​​nimikkeitä.

Syyskuu – lokakuu 2005 : Kaksi Googlea vastaan ​​nostettua kannetta syyttävät yritystä siitä, ettei se ole kunnioittanut tekijänoikeuksia eikä ole maksanut hyvitystä tekijöille ja julkaisijoille. Toinen on ryhmäkanne kirjoittajien puolesta (Authors Guild v. Google, 20. syyskuuta 2005), ja toinen on siviilioikeudenkäynti, jonka nostivat viisi suurta kustantajaa ja Association of American Publishers . ( McGraw Hill v.Google, 19.10.2005)

Marraskuu 2005 : Google muutti tämän palvelun nimen Google Printistä Google -teoshauksi. Sen ohjelma, jonka avulla kustantajat ja kirjailijat voivat sisällyttää kirjojaan palveluun, nimettiin uudelleen Google -kirjojen kumppaniohjelmaksi, ja yhteistyöstä kirjastojen kanssa tuli Google -kirjojen kirjasto -projekti .

2006 : Google lisäsi "lataa pdf" -painikkeen kaikkiin julkisiin kirjoihinsa, joilla ei ole tekijänoikeutta. Se lisäsi myös uuden selausliittymän sekä uudet "Tietoja tästä kirjasta" -sivut.

Elokuu 2006 : University of California System ilmoitti liittyvänsä kirjojen digitointihankkeeseen. Tämä sisältää osan järjestelmän hallinnoimien noin 100 kirjaston 34 miljoonasta taltiosta.

Syyskuu 2006 : Madridin Complutense-yliopistosta tuli ensimmäinen espanjankielinen kirjasto, joka liittyi Google Books Library -hankkeeseen.

Lokakuu 2006 : Wisconsinin yliopisto - Madison ilmoitti liittyvänsä kirjanhaun digitointihankkeeseen yhdessä Wisconsin Historical Society Libraryn kanssa. Kirjastoissa on yhteensä 7,2 miljoonaa aineistoa.

Marraskuu 2006 : Virginian yliopisto liittyi projektiin. Sen kirjastoissa on yli viisi miljoonaa nidettä ja yli 17 miljoonaa käsikirjoitusta, harvinaisia ​​kirjoja ja arkistoja.

Tammikuu 2007 : Texasin yliopisto Austinissa ilmoitti liittyvänsä kirjahaun digitointihankkeeseen. Ainakin miljoona teosta digitoidaan yliopiston 13 kirjastopaikasta.

Maaliskuu 2007 : Baijerin osavaltion kirjasto ilmoitti yhteistyöstä Googlen kanssa, jotta se skannaa yli miljoona julkista ja tulostamatonta teosta saksaksi sekä englanniksi, ranskaksi, italiaksi, latinaksi ja espanjaksi.

Toukokuu 2007 : Google ja Lausannen kantoni- ja yliopistokirjasto julkistivat yhdessä kirjan digitalisointiprojektiyhteistyön .

Toukokuu 2007 : Gentin yliopiston Boekentoren -kirjasto ilmoitti osallistuvansa Googlen kanssa 1800 -luvun ranskan- ja hollanninkielisten kirjojen digitointiin ja digitaalisten versioiden saattamiseen saataville verkossa.

Toukokuu 2007: Mysoren yliopisto ilmoittaa, että Google digitalisoi yli 800 000 kirjaa ja käsikirjoitusta, mukaan lukien noin 100 000 käsikirjoitusta, jotka on kirjoitettu sanskritiksi tai kannadaksi sekä paperille että palmunlehdille.

Kesäkuu 2007 : Institutionaalisen yhteistyön komitea (uudelleen nimetty Big Ten Academic Allianceksi vuonna 2016) ilmoitti, että sen kaksitoista jäsenkirjastoa osallistuvat 10 miljoonan kirjan skannaamiseen seuraavan kuuden vuoden aikana.

Heinäkuu 2007 : Keio -yliopistosta tuli Googlen ensimmäinen kirjastokumppani Japanissa, kun se ilmoitti digitalisoivansa vähintään 120 000 julkista kirjaa.

Elokuu 2007 : Google ilmoitti digitalisoivansa Cornellin yliopiston kirjastosta jopa 500 000 tekijänoikeudella suojattua ja julkista kohdetta . Google toimittaisi myös digitaalisen kopion kaikista skannatuista teoksista sisällytettäväksi yliopiston omaan kirjastojärjestelmään.

Syyskuu 2007 : Google lisäsi ominaisuuden, jonka avulla käyttäjät voivat jakaa katkelmia julkisesti saatavilla olevista kirjoista. Katkelmat voivat näyttää täsmälleen samalta kuin kirjan skannauksessa tai tavallisena tekstinä.

Syyskuu 2007 : Google esitteli uuden ominaisuuden nimeltä "Oma kirjasto", jonka avulla käyttäjät voivat luoda henkilökohtaisia, räätälöityjä kirjastoja, valikoiman kirjoja, jotka he voivat merkitä, tarkistaa, arvioida tai hakea koko tekstiä.

Joulukuu 2007 : Columbian yliopisto lisättiin kumppaniksi julkisten teosten digitalisoinnissa.

Toukokuu 2008 : Microsoft supistui ja suunnitteli lopettavansa skannausprojektinsa , joka oli saavuttanut 750 000 kirjaa ja 80 miljoonaa aikakauslehti artikkelia.

Lokakuu 2008 : Kustannusteollisuuden ja Googlen välinen sopimus saavutettiin kahden vuoden neuvottelujen jälkeen. Google suostui korvaamaan tekijöille ja kustantajille vastineeksi oikeudesta saattaa miljoonia kirjoja yleisön saataville.

Lokakuu 2008 : Institutionaalisen yhteistyön komitea ja Kalifornian yliopiston järjestelmän 11 yliopistokirjastoa , jotka kaikki olivat Googlen kumppanikirjastoja, lanseeraavat yhdessä HathiTrustin "Jaetun digitaalisen arkiston" (tunnetaan myöhemmin nimellä HathiTrust Digital Library). arkistoida ja tarjota akateemisen pääsyn kirjoihin niiden kokoelmista, jotka Google ja muut ovat skannanneet.

Marraskuu 2008 : Google saavutti 7 miljoonan kirjan rajan Googlen ja julkaisukumppaneiden skannaamien kohteiden kohdalla. 1 miljoona oli täysin esikatselutilassa ja 1 miljoona oli täysin katseltavissa ja ladattavissa olevia julkisia teoksia. Noin viisi miljoonaa oli loppu .

Joulukuu 2008 : Google ilmoitti lehtien sisällyttämisestä Google -kirjoihin. Nimikkeitä ovat New York Magazine , Ebony ja Popular Mechanics

Helmikuu 2009 : Google julkaisi Google -teoshaun mobiiliversion, jonka avulla iPhonen ja Android -puhelimen käyttäjät voivat lukea yli 1,5 miljoonaa julkista teosta Yhdysvalloissa (ja yli 500 000 Yhdysvaltojen ulkopuolella) mobiiliselaimella. Sivukuvien sijasta näytetään kirjan pelkkä teksti.

Toukokuu 2009 : New Yorkissa pidetyssä BookExpo -vuosikongressissa Google ilmoitti aikovansa ottaa käyttöön ohjelman, jonka avulla kustantajat voivat myydä uusimpien kirjojensa digitaaliset versiot suoraan kuluttajille Googlen kautta.

Joulukuu 2009 : Ranskan tuomioistuin lopetti Ranskassa julkaistujen tekijänoikeudella suojattujen kirjojen skannaamisen sanoen, että tämä rikkoi tekijänoikeuslakia. Se oli skannausprojektin ensimmäinen suuri oikeudellinen menetys.

Huhtikuu 2010 : Kuvataiteilijoita ei otettu mukaan aiempaan oikeudenkäyntiin ja sovintoon, he ovat kantajaryhmiä toisessa oikeudenkäynnissä ja sanovat aikovansa tuoda muutakin kuin Google -kirjoja tutkittavaksi. "Uusi ryhmäkanne", lukee lausunto, "ylittää Googlen kirjastohankkeen ja sisältää Googlen muita järjestelmällisiä ja yleisiä loukkauksia valokuvaajien, kuvittajien ja muiden kuvataiteilijoiden oikeuksiin."

Toukokuu 2010 : Google ilmoitti käynnistävänsä digitaalisen kirjakaupan nimeltä Google Editions . Se kilpailee Amazonin, Barnes & Noblen, Applen ja muiden sähköisten kirjakauppojen kanssa omalla e-kirjakaupalla. Toisin kuin muut, Google Editions olisi täysin verkossa eikä vaadi tiettyä laitetta (kuten Kindle, Nook tai iPad).

Kesäkuu 2010 : Google läpäisi 12 miljoonaa skannattua kirjaa.

Elokuu 2010 : Ilmoitettiin, että Google aikoo skannata kaikki tunnetut olemassa olevat 129 864 880 kirjaa vuosikymmenen aikana, yhteensä yli 4 miljardia digitaalista sivua ja 2 biljoonaa sanaa.

Joulukuu 2010 : Googlen e -kirjat (Google Editions) julkaistiin Yhdysvalloissa.

Joulukuu 2010 : Google julkaisi Ngram Viewerin, joka kerää ja kuvaa kaavioita sanakäytöstä koko kirjakokoelmassaan.

Maaliskuu 2011 : Liittovaltion tuomari hylkäsi ratkaisun välillä saavutettu kustannusalalla ja Google.

Maaliskuu 2012 : Google läpäisi 20 miljoonaa skannattua kirjaa.

Maaliskuu 2012 : Google pääsi sopimukseen julkaisijoiden kanssa.

Tammikuu 2013 : Dokumentti Google ja World Brain esitettiin Sundance -elokuvajuhlilla .

Marraskuu 2013 : Asiassa Authors Guild v. Google annettu tuomio , Yhdysvaltain käräjätuomari Denny Chin on Googlen puolella, vedoten kohtuulliseen käyttöön. Kirjoittajat sanoivat valittavansa.

Lokakuu 2015 : Muutoksenhakutuomioistuin siirtyi Googlen puolelle ja totesi, että Google ei rikkonut tekijänoikeuslakia. New York Timesin mukaan Google on skannannut yli 25 miljoonaa kirjaa.

Huhtikuu 2016 : Yhdysvaltain korkein oikeus kieltäytyi käsittelemästä Tekijöiden killan valitusta, mikä tarkoittaa, että alemman oikeusistuimen päätös pysyi voimassa, ja Google saa skannata kirjastokirjoja ja näyttää katkelmia hakutuloksissa rikkomatta lakia.

Tila

Google on ollut melko salainen suunnitelmistaan ​​Google Books -projektin tulevaisuudesta. Skannaustoiminta on hidastunut ainakin vuodesta 2012 lähtien, kuten useiden Googlen kumppanilaitosten kirjastonhoitajat ovat vahvistaneet. Wisconsinin yliopistossa nopeus oli laskenut alle puoleen siitä, mitä se oli vuonna 2006. Kirjastonhoitajat ovat kuitenkin sanoneet, että hidastuva vauhti voi olla luonnollinen tulos projektin kypsymisestä - alun perin kirjat otettiin kokonaan käyttöön skannaus, kun taas nyt oli tarkasteltava vain niitä nimikkeitä, joita ei ollut jo skannattu. Yrityksen oma Google -kirjojen aikajanasivu ei maininnut mitään vuoden 2007 jälkeen edes vuonna 2017, ja Google -kirjojen blogi yhdistettiin Google -hakublogiksi vuonna 2012.

Vaikka The Atlantic voitti vuosikymmeniä kestäneen oikeudenkäynnin vuonna 2017, The Atlantic on sanonut, että Google on "lopettanut skannaustoimintansa". Huhtikuussa 2017 Wired ilmoitti, että projektissa työskenteli vain muutama Googlen työntekijä ja uusia kirjoja skannattiin edelleen, mutta huomattavasti hitaammin. Se kommentoi, että vuosikymmeniä kestänyt oikeudellinen taistelu oli saanut Googlen menettämään kunnianhimonsa.

Lakiasiat

Projektin aikana kirjaston kirjoja digitalisoitiin jonkin verran erottamattomasti tekijänoikeustilasta riippumatta, mikä johti useisiin Google -kanteisiin. Vuoden 2008 loppuun mennessä Google oli kuulemma digitoinut yli seitsemän miljoonaa kirjaa, joista vain noin miljoona oli julkisia teoksia. Muista miljoonista tekijänoikeuksista ja painetuista kirjoista ja viidestä miljoonasta tekijänoikeus, mutta ne ovat loppuneet. Vuonna 2005 ryhmä kirjoittajia ja kustantajia nosti suuren ryhmäkanteen Googlea vastaan ​​tekijänoikeudella suojattujen teosten loukkaamisesta. Google väitti säilyttävänsä orpoteoksia - kirjoja, jotka ovat edelleen tekijänoikeuden alaisia, mutta joiden tekijänoikeuksien haltijoita ei löytynyt.

Kirjailijoiden kilta ja Association of American Publishers erikseen haastaa Googlen vuonna 2005 sen kirja projekti, vedoten "massiivinen tekijänoikeusrikkomus ." Google vastusti, että sen projekti edusti kohtuullista käyttöä ja on digitaalisen ikäluokan vastine korttiluettelolle, jossa jokainen julkaisun sana on indeksoitu. Oikeudenkäynnit yhdistettiin, ja lopulta ehdotettiin ratkaisua . Sovinto sai merkittävää kritiikkiä monista eri syistä, mukaan lukien kilpailunrajoitukset, yksityisyys ja ehdotettujen tekijöiden ja kustantajien luokkien riittämättömyys. Sovinto hylättiin, ja julkaisijat sopivat Googlen kanssa pian sen jälkeen. Tekijöiden kilta jatkoi toimintaansa, ja vuonna 2011 heidän ehdotettu luokka sertifioitiin . Google valitti päätöksestä useilla amicilla, jotka väittivät luokan riittämättömyyden , ja Second Circuit hylkäsi luokitustodistuksen heinäkuussa 2013 ja palautti asian käräjäoikeuteen Googlen oikeudenmukaisen käytön puolustamista varten.

Vuonna 2015 Authors Guild teki toisen valituksen Googlea vastaan, jotta New Yorkin 2. Yhdysvaltain Circuit Court of Appeals käsittelee sitä. Google voitti asian yksimielisesti väitteen perusteella, että he eivät näyttäneet ihmisille kokonaisia ​​tekstejä vaan katkelmia, eivätkä ne salli ihmisten lukea laitonta kirjaa. Raportissaan tuomioistuimet totesivat, etteivät ne loukanneet tekijänoikeuslakeja, koska ne oli suojattu oikeudenmukaista käyttöä koskevalla lausekkeella.

Tekijöiden kilta yritti uudelleen valittaa päätöksestä vuonna 2016 ja vei heidän asiansa korkeimman oikeuden käsiteltäväksi. Tapaus hylättiin jättämällä toisen piirin päätös tapauksesta ennalleen, mikä tarkoittaa, että Google ei rikkonut tekijänoikeuslakeja. Tämä tapaus loi myös ennakkotapauksen muille vastaaville tapauksille oikeudenmukaista käyttöä koskevien lakien osalta, koska se selvensi lakia entisestään ja laajensi sitä. Tällainen selvennys vaikuttaa muihin Googlen kaltaisiin skannausprojekteihin.

Muut oikeusjutut seurasivat Tekijäkillan johtoa. Vuonna 2006 aiemmin nostettu Saksan oikeusjuttu peruutettiin. Kesäkuussa 2006 ranskalainen kustantaja Hervé de la Martinière, joka tunnetaan nimellä La Martinière ja Éditions du Seuil , ilmoitti aikovansa haastaa Google Francen oikeuteen. Vuonna 2009 Pariisin siviilituomioistuin määräsi 300 000 euroa (noin 430 000 USD ) vahingonkorvauksia ja korkoja ja määräsi Googlen maksamaan 10 000 euroa päivässä, kunnes se poistaa kustantajan kirjat tietokannastaan. Tuomioistuin kirjoitti: "Google rikkoi tekijänoikeuslakeja kopioimalla täysin ja asettamalla saataville" kirjoja, jotka Seuil omistaa ilman lupaa ja että Google "teki tekijänoikeusloukkauksia, jotka vahingoittavat julkaisijoita". Google sanoi, että se valittaa. Syndicat National de l'Edition, joka liittyi oikeusjuttuun, sanoi, että Google on skannannut noin 100 000 ranskalaista teosta tekijänoikeuden alla.

Joulukuussa 2009 kiinalainen kirjailija Mian Mian nosti siviilioikeudenkäynnin 8900 dollarilla Googlea vastaan ​​romaaninsa Acid Lovers skannaamisesta . Tämä on ensimmäinen tällainen oikeusjuttu, joka on nostettu Googlea vastaan ​​Kiinassa. Saman vuoden marraskuussa China Written Works Copyright Society (CWWCS) syytti Googlea 570 kiinalaisen kirjailijan 18 000 kirjan skannaamisesta ilman lupaa. Google sopi 20. marraskuuta toimittavansa luettelon skannatuista kiinalaisista kirjoista, mutta yritys kieltäytyi myöntämästä "loukanneensa" tekijänoikeuslakeja.

Maaliskuussa 2007 Thomas Rubin, Microsoftin tekijänoikeus-, tavaramerkki- ja liikesalaisuuksien lakiasiainjohtaja, syytti Googlea tekijänoikeuslain rikkomisesta kirjanhakupalvelunsa kanssa. Rubin arvosteli erityisesti Googlen käytäntöä kopioida vapaasti mitä tahansa teosta, kunnes tekijänoikeuden haltija on ilmoittanut lopettavansa.

Googlen lisensointi julkisiin teoksiin on myös huolenaihe, koska kirjojen kanssa käytetään digitaalisia vesileimaustekniikoita . Jotkin julkisesti julkaistut teokset, kuten kaikki Yhdysvaltain liittovaltion hallituksen luomat teokset , käsitellään edelleen tekijänoikeuden alaisina, joten ne lukitaan vuoden 1922 jälkeen.

Samanlaisia ​​projekteja

  • Gutenberg -projekti on vapaaehtoistyö kulttuuriteosten digitoimiseksi ja arkistoimiseksi "kannustaakseen e -kirjojen luomiseen ja jakeluun". Sen perusti vuonna 1971 Michael S. Hart ja se on vanhin digitaalinen kirjasto. 3. lokakuuta 2015 Project Gutenberg saavutti 50 000 kappaletta kokoelmassaan.
  • Internet-arkisto on voittoa tavoittelematon järjestö, joka digitalisoi yli 1000 kirjaa päivässä sekä peilaa kirjoja Google-kirjoista ja muista lähteistä. Toukokuussa 2011 se isännöi yli 2,8 miljoonaa julkista kirjaa, mikä on enemmän kuin noin miljoona Google -kirjojen julkista kirjaa. Open Library , Internet Archiven sisarprojekti, lainaa 80 000 skannattua ja ostettua kaupallista e -kirjaa 150 kirjaston kävijöille.
  • HathiTrust ylläpitää HathiTrustin digitaalista kirjastoa 13. lokakuuta 2008 lähtien. Se säilyttää ja tarjoaa pääsyn Googlen skannattuun aineistoon, osaan Internet -arkistokirjoista ja osaan paikallisesti kumppanilaitoksilta. Toukokuussa 2010 se sisältää noin 6 miljoonaa kappaletta, joista yli miljoona on julkista (ainakin Yhdysvalloissa).
  • ACLS Humanities E-Book , online-kokoelma, jossa on yli 5400 korkealaatuista kirjaa humanistisista ja niihin liittyvistä yhteiskuntatieteistä, ja joka on saatavilla institutionaalisen tilauksen kautta.
  • Microsoft rahoitti 300 000 kirjan skannauksen Live Search Books -kirjojen luomiseen vuoden 2006 lopussa. Se kesti toukokuuhun 2008 asti, jolloin projekti hylättiin ja kirjat saatettiin vapaasti saataville Internet -arkistossa.
  • Kansallinen digitaalinen kirjasto Intian (NDLI) on hanke ministeriön Human Resource Development, Intia. Tavoitteena on yhdistää useita kansallisia ja kansainvälisiä digitaalisia kirjastoja yhteen verkkoportaaliin. NDLI tarjoaa maksuttoman pääsyn moniin kirjoihin englanniksi ja intiaksi.
  • Europeana linkittää noin 10 miljoonaan digitaaliseen esineeseen vuodesta 2010, mukaan lukien videoita, valokuvia, maalauksia, ääntä, karttoja, käsikirjoituksia, painettuja kirjoja ja sanomalehtiä Euroopan viimeisen 2000 vuoden historiasta yli 1000 arkistosta Euroopan unionissa.
  • Gallica Ranskan kansalliskirjastosta linkittää noin 4 000 000 digitoituun kirjaan, sanomalehtiin, käsikirjoitukseen, karttaan ja piirustukseen jne. Vuonna 1997 luotu digitaalinen kirjasto laajenee edelleen noin 5000 uutta asiakirjaa kuukaudessa. Vuoden 2008 lopusta lähtien suurin osa uusista skannatuista asiakirjoista on saatavilla kuva- ja tekstimuodossa. Suurin osa näistä asiakirjoista on kirjoitettu ranskaksi.
  • Wikilähde
  • Runivers

Katso myös

Viitteet

Lue lisää

  • Hoffmann, Anna Lauren (2016). "Google-kirjat, kirjastot ja itsekunnioitus: tiedon oikeudenmukaisuus jakelun ulkopuolella". Kirjasto neljännesvuosittain . 86 : 76–92. doi : 10.1086/684141 . S2CID  146482065 .
  • Jeanneney, Jean-Noël (2008). Google ja universaalin tiedon myytti: näkymä Euroopasta . Chicago, IL: University of Chicago Press.

Ulkoiset linkit