Gloobális villanykatalógus és kiadói hidegfrász
print.google.com
Médiamix, 2005. szeptember

 

A Google tíz év alatt tizenötmillió könyvtári könyvet akar beszkennelni és teljes szövegüket kereshetővé tenni, hogy létrehozza – ahogy a Washington Post szerzője fogalmazott – „a XXI. század tizedes osztályozási rendszerét”. Mert az a küldetése, hogy mindenki által elérhetővé tegye az emberiség tudáskincsét. A könyvkiadókból agresszív reakciókat váltott ki az attól való félelem, hogy felkopik az álluk.

Essünk túl a közhelyeken! Először: Amióta Marshall McLuhan föltalálta a Gutenberg-galaxist (istenem, lassan fél évszázada), csak azért, hogy egy füst alatt bejelenthesse a kimúlását (mertmivelhogy a világfaluban a közeg az üzenet), közhely, hogy a kommunikációs eszköztárban a műszaki fejlődés (trendiül technológiai paradigmaváltást kéne mondani, de juszt se) hozta változások – írás, nyomtatás, hang- és képtovábbítás stb. – mélyreható társadalmi átrendeződéseket (és, tegyük hozzá, hangos gazdasági recsegést-ropogást) vonnak maguk után. Megváltoznak az emberiség ismerethalmazának mozgásformái, átrendeződik a szerkezete, és nyomában osztályok, privilégiumok, kultúrák és iparágak hanyatlanak a humuszba, illetve virágzanak ki a semmiből. Most – például és többek között – a digitális-elektronikus másolástechnika lovagjai tapossák a porba a másolási jogok – százados jogi bástyák mögül vicsorgó – haszonélvezőit. A csata zajos és véres; marha sok pénzről van szó.

Másodszor: A totális hálózati keresőgigász, a Google taknyos alapító atyái, Sergey Brin és Larry Page zigótakoruk óta azzal a küldetéssel élnek, hogy nekik kell a világban összekazlazott „tudást” használható rendbe szedniük. Magyarán: katalogizálni akarnak mindent, ami csak a leghalványabban is kapcsolatba kerülhet a dokumentum fogalommal. Mindent. Méghozzá nem is akárhogy. A Google tíz pontba szedett cégfilozófiájának első pontja szerint „első a kuncsaft (oppardon: felhasználó), minden más csak utána következik”. A harmadik meg az, hogy „gyorsan jobb, mint lassan”.

A guglis fiúk (és mások is, persze) azt a kommunikációseszközrendszer-váltást (mcluhani izét) használták ki, amit a számítógép és a hálózat hozott. A klasszikus információkeresés egyik törvénye, hogy egy keresés vagy pontos, vagy teljes (relevance és recall határozatlansági relációban vannak). A feltáró-osztályozó-katalogizáló könyvtáros ennek a törvénynek a béklyójában vergődik, ezért van – különösen, mert a könyvtáros szíve a pontosság felé húz –, hogy a könyvtárakban átláthatatlan osztályozási rendszerek és vérszofisztikált keresőeszközök „szolgálják” (teszik majdnem elviselhetetlenné) az információkeresést (érvényesnek mutatva azt a „heisenbergi elvet” is, hogy valami vagy működik, vagy használható).

ami a világ könyvtáraiban porosodik az alexandriai tűzvész óta

Az új keresőlovagok először is a sutba vágták a könyvtártudományt (később persze elővették, de csak a szükséges mértékben). Azt használták ki, hogy az újfajta villanyos adathalmazokban „szabad szavas” kereséssel hihetetlen gyorsasággal lehet nagy – és piszkos – találati halmazokhoz jutni. És nem azzal foglalkoztak, hogyan lehet a keresést finomítani, hanem azzal, hogy lehet azt a nagy és piszkos találati halmazt minél gyorsabban célszerű rendbe rendezni. Sikerült nekik, legjobban Brinéknek. Ezért övék a legtöbbet használt webkereső, az a rendszer, amivel ma már nyolcmilliárd webdokumentumban lehet gyorsan és hatékonyan turkálni.

Az a nyolcmilliárd webdokumentum azonban pipafüst ahhoz a könyv- és folyóirattömeghez képest, ami a világ könyvtáraiban porosodik az alexandriai tűzvész óta. A Google nem lenne Google, ha nem akarna a világ összes könyvének és folyóiratának szabadon és globálisan használható elektronikus „katalógusa” lenni. A faltörő kos, amivel a Google a könyvtárak falát döngeti, a Google Print.

Faltörő kos ide vagy oda, azért nem rohantak fejjel a falnak. Először is a műszaki megoldást valószínűleg már évekkel ezelőtt kifőzték a Google-laborban, lényege 2001 vége óta tanulmányozható a Google Catalogsban. (A Google Catalogs a nyomtatott árukatalógusok katalógusa. Beszkennelik a katalógusköteteket, aztán egy karakterfelismerő szoftver kibányássza a képek közül és rendes keresőindexbe gyúrja a szövegeket. Így aztán nemcsak lapozgathatunk a tematikusan elrendezett katalógusokban, de kereshetünk a szövegükben is úgy, ahogy a nyomtatott verzióban soha. A találatok katalógusoldalak képei, a kiadványokban a lapozgatást ügyes toolbar segíti. Aztán ha megvan az áru, ott a gyártó-kereskedő url-je, lehet rendelni online, vagy ott a postacím, a telefonszám.)

Másodszor: nem a könyvtárakkal kezdték. A kiadókkal. Úgy látszott, a Google egyszerűen csak le akarja törni az Amazon.com szarvát. A globális online könyvesbolt megállapodott vagy kétszáz kiadóval, beszkennelte pár százezer kötetüket, adatbázisba gyúrta a szövegüket, és elindította az Inside Search nevű szolgáltatást. Az Inside Searchcsel az Amazon olyan kereskedői katalógust hozott létre, amellyel már nemcsak a szerzők, műcímek, tárgyszavak mutatójában lehet keresni, hanem a kiadványok teljes szövegében is. Kicsit olyan, ahogy az ember a boltban beleolvas a könyvekbe. Arra azért nagyon vigyáznak, hogy csak annyit mutassanak meg a könyvből (a keresőkifejezést tartalmazó oldalakból), hogy össze ne tudjuk valahogy szedni az egész szöveget online és ingyen. Csak annyit, hogy meg akarjuk venni az árut.

A Google Print ugyanaz, tökben. A kiadó elküldi a könyvét a Google-nak (vagy egyszerűen feltölti pdf-ben), a Google beszkenneli, képként eltárolja az oldalakat, illetve egy szövegfeldolgozó programmal keresőindexbe gyúrja a szöveget.

Itt tegyünk egy kis műszaki kitérőt. Elektronikus könyvtárak, könyvdigitalizáló archívumok az elektronikus őskor óta épülgetnek a hálózaton, a Gutenberg projektumtól a Bartlebyn át a Magyar Elektronikus Könyvtárig (l. Full text, Médiamix, 2005. jan.). Közös „bajuk” – amiért még csak néhány ezer tétel van a MEK-ben –, hogy többé-kevésbé „valódi” könyvtárként működnek. A digitalizálást – begépelést, szkennelést-szövegfeldolgozást – szöveggondozás, feltárás, osztályozás, katalogizálás követi. Rengeteg energia, idő, pénz. A szerzői – pontosabban másolási – jogokkal való bíbelődésről nem is beszélve.

A perspektíva annyira nagyvonalú, szép, és lelkesítő, hogy kitört a pánik.

A Google Print mellőzi a könyvtárosi műveleteket. Nincs szüksége, például, szöveggondozásra: a szkennelés, feldolgozás okozta néhány százaléknyi szövegromlás nem rontja lényegesen a keresés hatékonyságát. A találatok pedig könyvoldalképek, azokon meg nincs szövegromlás (ezzel megspórolják az elektronikus formátumra hozás munkáját is). Ha a kereső eljut egy könyvig, megkapja a borító, a tartalomjegyzék és a tárgymutató képét, meg – naná! – a copyright-oldalt, valamint egy rövid szinopszist. És „belelapozhat” a könyvbe: megjeleníthetők a keresőkifejezést tartalmazó oldalak, egy-két oldalt lapozni is lehet előre-hátra. Természetesen – akár az Amazonnál – itt sem ügyeskedhetjük végig magunkat egy egész könyvön, a megjeleníthető oldalak száma véges, a korlátot a másolásijog-tulajdonos szabja meg. Ha elértük a limitet, a rendszer könyörtelenül kivág minket a hóra.

A kiadó többféleképpen is profitál a rendszerből. Egyrészt a tematikusan kapcsolódó hirdetések után a Google részesedést fizet a kiadónak, kattintásonként. Másrészt a találati oldalon ott van azoknak a kereskedéseknek a linkje, amelyektől a könyv megvásárolható. Vagyis a Google Print online könyváruház is.

Alig két hónapja működött ez a „Kiadói Program”, amikor – 2004 decemberében – a Google bejelentette, hogy elindítja a Google Print könyvtári programját is. „Már a Google előtt arról álmodtunk – nyilatkozta Page –, hogy online kereshetővé tesszük azt a hihetetlen tömegű információt, amelyről a könyvtárosok olyan szeretettel gondoskodnak.” Eljött az idő (hiszen „a Google küldetése, hogy megszervezze a világ információtartalmát”). Nem kapkodják el, tíz évet szánnak a programra. És kétszázmillió dollárt.

Megállapodást kötöttek négy amerikai egyetem (Stanford, Harvard, Oxford, Michigan) könyvtárával, meg a New York-i szabóervinnel. Oxford csak az 1901 előtti állományt adja, New York csak a másolási jogi korlátokkal már nem védett (public domain) anyagokat. A Harvard kiválogat negyvenezer tételt, a Stanford azonban nyolcmilliós állományának javát odaadja, a michigani egyetemi könyvtár meg mindent – hétmilliót. Összesen uszkve tizenötmillió könyvtári tételről van szó.

A Google a könyvtárakba telepíti saját műhelyeit – kifejlesztettek egy automata szkennert, amely képes kíméletesen, de gyorsan lapozni a könyvet, több ezer kötetet eszik meg hetente –, és a helyszínen végzi a feldolgozást. A könyvtár, azonkívül, hogy lesz egy népszerű, globális, elektronikus, teljes szöveges keresőrendszere (a már eddig is nyilván meglevő online katalógusa mellé), megkapja a kötetek elektronikus változatát is saját használatra, sőt, bár a szerződések titkosak, egyes hírek szerint a Google még fizet is tételenként tíz dollárt. A tervek szerint a kopirájtvédett könyvekből ugyanúgy csak foszlányokat (snippet) láthat a kuncsaft, mint a kiadói programban, a nem védett anyagokat azonban viheti cakumpakk.

a kopirájt azt jelenti, hogy a másolatok készítésének joga, pont

A perspektíva annyira nagyvonalú, szép, és lelkesítő, hogy kitört a pánik. Jött a nemzeti kulturális hideglelés, karöltve és megtámogatva jó kis fogvacogós könyvtárosfrásszal (éhen halnak a szakozók). A leghangosabbak – mily meglepő – a franciák voltak. A francia OSZK főnöke, monsieur Jeanneney „aggodalmát fejezte ki”, hogy a Google feltehetően az angol nyelvű könyveket részesíti majd előnyben, ami jelentős torzuláshoz, az angolszász gondolkodás és az amerikai nézetek egyeduralmához vezethet. Gyorsan hozzátette, hogy amúgy nem nézi le az angolszász gondolkodást. Mellesleg a francia nemzeti könyvtárnak egész jó kis digitalizációs projektje van, a Gallica már nyolcvanezer – nyilván vérfrancia – elektronizált kötetnél tart.

Áprilisban aztán a francia és a lengyel köztársasági elnök, a német kancellár, az olasz, a spanyol és a magyar miniszterelnök levelet írt az Európai Bizottságnak és az Európai Tanácsnak; ugyan, hoznánk már létre egy európai digitális könyvtárat az interneten. Különben az európai könyvtárak „páratlanul gazdag és sokszínű” öröksége „nem tudja majd elfoglalni méltó helyét a jövő tudásának tárházában”. Éljen!

Mindez csak könnyed fodrozódás a kiadók arcára kiült jeges rémülethez képest (amely kísértetiesen emlékezet arra, amit az újmódi digitális másolástechnika installált a hanglemezkiadókéra). Először is a Google becsapta a kiadókat, amikor befűzte őket a Google Printbe, egy büdös szót sem szólt, hogy a könyvtáraktól is akar valamit. Aztán ha a projektum megvalósul, és a Google szerverein ott az a tizenötmillió dokumentum, a Google Print gazdasági érdekekkel gondosan körülkarámolt árukatalógusból – ki tudja, mennyire féken tartható – globális könyvtári katalógussá, sőt óriási digitális archívummá válik. Jézusmáriauramatyám, mi lesz ebből!?

A kiadói ipartestületek vijjogó keselyűként csaptak le a Google-főnökök fejére. Egyáltalán, hogy képzeli a Google, hogy előzetes engedély nélkül magáévá tesz kopirájtos termékeket, pusztán azon az alapon, hogy valamely könyvtár vett belőlük egy-két példányt? És mi az, hogy utólag lehet tiltakozni, és akkor a Google hozzáférhetetlenné teszi? És mi lesz a „letiltás” után a Google-nál maradt elektronikus „példánnyal”? És mi lesz, ha rés támad a rendszeren? És mik a Google valódi távlati céljai? Nyilván keresni akar a gigantikus bóton. Hogyan? És így tovább, a végtelenségig.

A Google magyaráz, egyezkedik, tárgyal, engedményeket tesz, kevés sikerrel. Az amerikai egyetemi kiadók egyesületének elnöke, Mr. Givler, még májusban, 125 kiadó képviseletében tizenhat dörgedelmes kérdést vágott nyílt levél formájában Macgillivary Google-jogtanácsos fejéhez. A mennydörgő vád- és aggályhalmazt legjobban az a givleri tőmondat jellemzi, hogy „a kopirájt azt jelenti, hogy a másolatok készítésének joga, pont”.

A Google augusztusban bejelentette, hogy novemberig felfüggeszti a könyvtári programban a jogvédett anyagok feldolgozását. Pont.

Zsadon Béla