DIGITÁLIA: A PTE Egyetemi Könyvtár és Tudásközpont Digitális Univerzuma

Olvasási idő: 5 perc

Utoljára frissítve: 2023. 11. 23.

A Digitália PTE Egyetemi Könyvtár digitalizált tartalmait, illetve a Pécsi Tudományegyetem oktatói által felajánlott digitalizált műveket szolgáltatja az olvasók számára. A Digitália egy elektronikus könyvtár: más elektronikus könyvtárakhoz hasonlóan helytől és időtől függetlenül bármikor megtekinthető. A Digitáliára különféle formátumokban lehetséges könyveket, folyóiratokat, aprónyomtatványokat, képeket, hanganyagokat és videókat feltölteni.

A PTE Egyetemi Könyvtárban a széles körben elterjedt gyakorlatnak megfelelően zajlik a digitalizálás: a dokumentumokat szkenneljük, OCR-ezzük (az OCR [Optical Character Recognition] „egy olyan technológia, amely lehetővé teszi, hogy a szkenner vagy digitális fényképezőgép által alkotott képet, vagy valamilyen PDF fájlt szerkeszthető, szöveges tartalmú fájlformába alakítson át”),[1] majd mentjük kép- és TXT oldalanként. A dokumentumokról készült, majd feltöltött képek mellé bekerülnek az OCR-ezett képfájlokból készült szöveges dokumentumok (TXT-k). Megtekintéskor a keretprogram egy adott mappából kiválasztja a megjeleníteni kívánt képet (mely egy webre optimalizált, méretcsökkentett JPG fájl), és hozzárendeli az ugyanolyan fájlnéven található TXT-t is. Ezután készül el a rendkívül részletes tartalomjegyzék, mely egyrészt nagy segítséget jelenthet a felhasználó számára, hiszen így célzottan tud eljutni a dokumentum egy bizonyos fejezetére vagy oldalára, másrészt a keresők számára is elérhetővé válik a könyv tartalma, így a dokumentum minden szempontból sokkal átláthatóbbnak bizonyul.

A Digitália esetében a szöveges dokumentumokat két csoportra oszthatjuk: az egyik csoportba a szabadon szolgáltatható dokumentumok tartoznak, melyeken nincs szerzői jog, míg a másik csoportot a szerzői joggal védett dokumentumok alkotják. Mindkétfajta dokumentumot egy felületre töltjük fel, viszont a szerzői joggal védett dokumentumokban elhelyezésre kerül egy HTTP access szkript, amely csak azon a számítógépen engedi megjeleníteni a dokumentumot, aminek az IP címe előzetesen rögzítésre került a szkriptben. Ez azt jelenti, hogy ezeket a dokumentumokat csak a Tudásközpont 2. és 3. emeletén elhelyezett 2-2 gépen, illetve a műszaki karon kísérleti jelleggel üzemelő ún. terminálon lehet megtekinteni. Fontos, hogy a terminálokhoz nem lehet például pendrive-ot csatlakoztatni, mert a gép el van zárva a felhasználó elől: csak a monitor, a billentyűzet és az egér érhető el számára. Erre azért van szükség, hogy a szerzői joggal védett dokumentumokat ne lehessen lementeni, átmásolni. A terminálokon internetelérés sincs, mindegyik csak a belső hálózatra csatlakoztatott, így a rajtuk megtekintett dokumentum e-mailben sem küldhető tovább.

A Digitália nyitóoldalán, az újdonság fül alatt számos könyvborítót láthatunk. Mindig a legutóbb feltöltött dokumentum kerül legfelülre, hasonlóképpen, mint ahogy azt a blogoknál már megszokhattuk. A weblapon való eligazodást a bal oldali, függőleges navigációs oszlop segíti: legfelül a kategóriák között böngészhetünk. Amikor egy dokumentumot feltöltünk, egyúttal mindig besoroljuk valamilyen tudományági kategóriába. Ezek a kategóriák egy leegyszerűsített ETO-hoz hasonlítanak (az ETO-t – Egyetemes Tizedes Osztályozást – a könyvtár állományának tematikus csoportosítására használják. Az ETO jelzetek például képezhetik a szabadpolcon elhelyezett állomány helyrajzi számainak alapját).[2] A kategóriacsoportok összeállításánál viszont nem az ETO-t, hanem a Magyar Elektronikus Könyvtár által ajánlott kategóriarendszert vettük alapul: kismértékben átalakítottuk, bővítettük, egyszerűsítettük, az egyes tudományágakat besoroltuk főbb tudománycsoportokba, és egy lépcsőszintig bontottuk le. A kategóriacsoport alatt található menüpontban típus szerint lehet keresni: jelenleg aprónyomtatvány, könyv, kézirat, film, folyóirat és illusztráció típusú anyagok találhatók a Digitálián. Jelenleg a könyvek, a kéziratok és az aprónyomtatványok teszik ki a dokumentumok nagy részét. Az utóbbi két típusba tartozó anyagokat a Történeti Gyűjtemények Osztályán dolgozó munkatársak töltik fel, mivel ők rendelkeznek ezzel az anyaggal, míg a könyvek a Központi Könyvtárból kerülnek feltöltésre. Lehetőség van formátum szerinti keresésre is: a szöveges és kép formátumok a legelterjedtebbek, a szöveges fájlformátumokat tekintve HTML, PDF, EPUB, MOBI, RTF és TXT fájlokra is lehet keresni. A HTML és az OCR-ezett formátum a leggyakoribb, a többit egyelőre kísérleti jelleggel töltöttük fel, ugyanis, amikor a könyveket digitalizáljuk, ritka, hogy mobileszközre optimalizált EPUB, PRC vagy MOBI készüljön belőle. Ugyanakkor, ha egy felajánlott művet mobileszközös formátumban kapunk meg, természetesen abban is töltjük fel. Ugyanitt, az oldalsávon lehet kiadási év szerint is szűkíteni a találatokat: a csúszkával a keresésnél alkalmazott legkorábbi és a legújabb dátumot tudjuk beállítani. Nyelv szerint is kategorizáltuk a dokumentumokat: magyar, angol, német, latin és francia nyelvek érhetők el, de minden típus bővíthető, ha szükséges.

Blokkos nézet
Blokkos nézet

A főoldalon alapértelmezésként blokkos nézetbe rendezetten jelennek meg a dokumentumok, ami egy gombnyomással listanézetté alakítható. Minden könyvborítónál találhatók olyan ikonok, amik a dokumentum típusát jelzik. Minden dokumentumformátumnak más-más ikonja van. Amikor egy sorozatnak több kötete van, akkor a borító felett, bal oldalon megjelenik egy kisméretű szám egy félkörben, ami a további kötetek számát jelzi. Ha az adott dokumentum más formátumban is elérhető, akkor ezt a jobb felső sarokban megjelenő szám jelzi. A jobb alsó sarokban a megtekintések számát láthatjuk: ez azt jelzi, hányszor nyitották meg az adott dokumentum adatlapját. A jobb felső sarokban található kis lakat jelzi a felhasználónak, ha csak terminálról elérhető az adott tartalom. A honlap jobb felső sarkában egy gyorskeresőt helyeztünk el, ahol címre és szerzők között tudunk keresni. Jelen pillanatban akkor kaphatunk pontos találatot, ha a keresőbe teljes szót vagy karakterláncot írunk be. Csonkolni egyelőre nem lehet, ez a funkció fejlesztés alatt áll.

Ha belépünk egy könyv adatlapjára, a legalapvetőbb metaadatokat láthatjuk: szerző, cím, alcím, megjelenési adatok és ISBN szám. Megjelenik a könyv előnézeti képe, és vagy a könyv fülszövege, vagy előszava, vagy valamely, első oldalakról származó szöveg. Ezek alapján eldöntheti a látogató, érdemes-e az adott könyvet megnyitnia. A fülszöveg alatt láthatók a kategóriák és a tárgyszavak, a dokumentum formátuma és típusa, ez alatt helyezkedik el a tartalomjegyzék. Utóbbi teljes mértékben kézzel készül: átlapozzuk a képoldalakat, és egy szerkesztőfelületen hozzárendeljük az adott képet az adott tartalomjegyzéki ponthoz. Ha egy fejezetre kattintunk, és szabad hozzáférésű a könyv, azonnal megnyílik, ha nem szabad elérésű és nem terminálról nézzük, akkor egy felugró ablak jelzi a dokumentum terminálról való elérhetőségét. Ugyanezt terminálról megtekintve egy felhasználási nyilatkozatot láthatunk, amit el kell fogadnunk a megtekintéshez.

Amikor megnyitjuk a dokumentumot, és a lapozófelületre érkezünk, a bal felső sarokban látjuk a szerző nevét, illetve a könyv címét, melyre rákattintva visszaugorhatunk a dokumentum adatlapjára. Jobb oldalon információs és megosztás gombot találunk, továbbá kicsinyítő és nagyítóikont, amikkel a megjelenített oldal képét tudjuk méretezni. Alul helyezkedik el a görgetősáv, ami jelzi, hol tartunk éppen az olvasásban. A könyv ikonra kattintva balról beúszik a könyv tartalomjegyzéke. Ha rákattintunk egy fejezetre, a tartalomjegyzék becsukódik, és a könyv adott oldalára ugrik. A szöveges tartalom megjelenítésére vonatkozó ikonra kattintva jobb oldalról beúszik egy, az adott oldal szövegét tartalmazó doboz, ahonnan kimásolható a szöveg. Mivel az OCR-ezés során a felismertetett szöveget – kapacitás hiányában – nem tudjuk javítani, ezért előfordulhatnak benne hibák. Ennek megoldására született a következő ötlet, mely még egyelőre megvalósítás előtt áll. A felhasználó, ha használni szeretné a szöveget, az előbbi okok miatt ki kell javítania, ezért lehetővé tennénk, hogy az olvasófelületen tudja korrigálni a szöveget. A rendszer érzékelné a javítás tényét, a javított szöveg pedig egy átmeneti tárba kerülne, és az adminisztrátor kapna minderről egy értesítést. A régi és a javított szöveg összehasonlításra kerülne egy program segítségével, és ha megfelelően van kijavítva, az adminisztrátor jóváhagyja, így a következő felhasználónak már nem kell kijavítania az adott oldalt. Ezáltal tisztulhatna a dokumentum szövege.

Blokkos nézet
Szövegoldali kép

Az adott dokumentumban való keresés során kis jelölők jelennek meg a vízszintes gördítősávon, amik jelzik, hogy a keresett szó mely oldalakon található. A jelölőkre rákattintva az az oldal jelenik meg, ahol a szó található. Ha nyitva van mellette a szövegdoboz is, a rendszer kék háttérszínnel kiemeli a keresett szót. Emellett lehet egyoldalas, illetve kétoldalas nézetben is megjeleníteni a dokumentumot. Mindemellett bélyegkép-nézet is beállítható, a megjelenített oldalak száma a monitor felbontásától függ. Ez akkor lehet hasznos, amikor valaki egy könyvben egy ábrát vagy jellegzetes motívumot keres.

A Digitália a közelmúltban jelentős fejlesztésen esett át, azonban – ettől függetlenül – továbbra is igényt tartunk a megújulásra és fejlődésre. Ebben igyekszünk elsősorban az olvasói igényekre támaszkodni, hiszen csak ezek figyelembevételével nyújthatunk nekik személyre szabott és minőségi szolgáltatást.

Felhasznált források

[1] Mi az OCR technológia? https://ocrszoftver.hu/mi-az-ocr-technologia [2019.12.02.]
[2] ETO jelzetek. http://hu.wiki.lib.unideb.hu/index.php/ETO_jelzetek [2019.12.02.]

Pápai Dóra
PTE Egyetemi Könyvtár és Tudásközpont
Digitális Tartalomszolgáltatási Osztály

Hozzászólások letiltva.

PTE Egyetemi Könyvtár és Tudásközpont | 2023

Fel ↑