11.12.2010

Kirjallisuus numeroina

Digitekniikka rynnii ryminällä myös nk. pehmeämpään tieteeseen. New York Times kertoo, että kahden amerikkalaisen tutkijan on onnistunut luoda tietotallenne, johon on tallennettu kaikki Brittein saarilla englanniksi julkaistujen kirjojen nimikkeet nk. viktoriaanisella ajalla, vuodesta 1789 vuoteen 1914 asti. Kokoelma käsittää näin lähes 1,7 miljoonaa kirjaa.

Mkä tarkoittaa muuten sitä, että Brittein saarilla julkaistiin tuolla aikavälillä keskimäärin 13 500 kirjaa vuodessa. Se on suurinpiirtein Suomen tämänhetkinen vuosikirjatuotanto.

Tietokoneen uumenista tuonkaltaista dataa tulkitsemalla on mahdollista saada tietoa, jonka käsittely on aiemmin ollut mahdotonta. Kun tutkijaparat ammoisina aikoina uhrasivat elämänsä lukemalla muutama sata tai tuhatkin kirjaa ja tulkitsivat otoksensa perusteella kokonaisen aikakauden kirjallista kulttuuria, uusi uljas tiedemies saa muutamalla klikkauksella eteensä järkyttävän määrän tilastomateriaalia. 

Kaiken taustalla on tietenkin Google, joka pyrkii ilmeisen tosissaan luomaan verkkoon virtuaalikirjaston, kaikille avoinna kaiken aikaa olevan tietopankin. Amerikkalaisten Dan Cohenin ja Fred Gibbsin hanke on yksi niistä projekteista, joita yhtiö tukee rahallisesti luovuttaen heidän käyttöönsä myös hallussaan olevan tietomateriaalin.

Cohenin ja Gibbsin tavoitteena on siirtää sähköiseen muotoon kaikki viktoriaanisella ajalla Englannissa julkaistut teokset. Tällä hetkellä tallessa ovat vain kirjojen nimet, jotka nekin kertovat omaa tarinaansa. Kun ohjelmaan syöttää sanat "Jumala", "rakkaus", "työ", "tiede" tai "teollisuus", esille pomppaavat lukemat, jotka osoittavat, että jo kirjojen nimien perusteella näkemystä aikakauden maallistumiskehityksestä ja luottamuksesta kehitykseen ja tieteeseen voidaan pitää oikeana.

Toisaalta, jos olemme olettaneet, että aikakauden ihmiset olivat myös epämääräisen kiinnostuneita luonnosta ja pahuuden alkuperästä, statistiikka ei tätä näkemystä tue. Kirjojen nimissä tämänkaltaista mentaliteettia ei voida löytää.

Kun Cohen & Gibbs pääsevät tilastoimaan kirjojen sisältöjä, kuvamme viktoriaanisesta lukijasta tarkentuu ja muuttaa ehkä myös muotoaan.

Tilastotiedettä on aiemminkin käytettä kirjallisuuden tutkimuksen apuvälineenä, mutta nykyaikainen tekniikka vie sen ihan uusiin sfääreihin. Pahimmillaan se voi johtaa hätäisten johtopäätösten tekoon ja tulkinnallisesti löyhään argumentointiin. Mutta kukaan tuskin epäilee siinä piileviä mahdollisuuksia. Mitä tarkemmin ja laajemmin pystymme tilastoimaan kirjallisia tuotteita sitä paremmat mahdollisuudet meillä on saada tietoa aikakautta muokkaavista näkemyksistä.

Raja unohdettujen ja muistettujen tekstien välillä hämärtyy. Numerot eivät valehtele...

Ei kommentteja:

Lähetä kommentti

Translate