Home > Kódold a múltat! 1956 remixelve > Technikai segítség

Technikai segítség

Kedves Tanárok, Diákok!

Az alábbi néhány bekezdésben igyekszünk hasznos információkat, támpontokat adni az oldalon található gyűjteményekkel és elérésükkel kapcsolatban. Megpróbálunk szigorúan a lényegre szorítkozni, hiszen ki szeret sok felesleges információ között mazsolázni. Aki bővebben érdeklődik az archívumi informatikában használt technológia iránt, minden fejezet végén találhat néhány informatív linket.

Vágjunk is bele!

Omeka

Az 1956-os digitális gyűjtemény motorja egy Omeka nevű nyílt forráskódú szabad felhasználású szoftver. Az Omeka segítségével könnyen és gyorsan lehet online elérhetővé tenni digitális tartalmakat és ezekhez tartozó metaadatokat. De mi is az a metaadat?

A metaadatról röviden

A metaadat nem más, mint adat az adatról. Képzeljünk el egy digitalizált könyvet. Önmagában metaadatok nélkül a "csupasz" fájl vajmi keveset árul el egy könyvről az érdeklődő számára. A keresés és kutatás megkönnyítése érdekében ezért adunk hozzá különböző adatokat, mint pl. a szerző neve, a könyv címe, taratalomjegyzék, rövid ismertető, a kiadás helye, idje stb.

Az archívumi és könyvtári világban külön szabványok definiálják a rögzíthető adatok formátumát. Miért is fontosak ezek a szabványok? Képzeljünk el egy egyszerű esetet. Adott két, szabványt nem követő könyvtár. Egy angol könyvtár egy könyv ismertetőjét egy 'Summary' nevű mezőben tárolja egy adatbázisban, míg egy német könyvtár 'Zusammenfassung' mező alatt tárolja ugyanezt.

Tegyük fel, hogy a két könyvtár szeretné a készletét egy közös keresőben elérhetővé, felfedezhetővé tenni. Mivel az adataikat nem szabványosan fejezik ki, a rendszer nem fogja tudni, hogy a 'Summary' és a 'Zusammenfassung' mezők alatt tárolt értékek valójában ugyanazt az információt tartalmazzák. Ha a két könyvtár ugyanazt a szabványt követte volna, akkor mindkét esetben a szabványban definiált mezőnevek tartalmazták volna a logikailag rokon értékeket.

Az 1956-os repozitórium Dublin Core metaadat szabványt használ, hogy tárolja és kifejezze a metaadatokat. A Dublin Core egy 15 adatelemből álló leíró szabvány, amit kifejezetten adatcserére hoztak létre.

Adatok elérése

Térjünk rá a dolgok izgalmasabb, gyakorlatiasabb részére, amelyben elmagyarázzuk, hogyan lehet könnyen, egyszerűen hozzáférni az oldalon található anyagokhoz.

Az Omeka egy szimpla REST API-val rendelkező rendszer, amely lehetőséget biztosít az oldalon található anyagok http protokollon történő eléréséhez.

Mi is az az API?

Az API az Application Programming Interface rövidítése, amely csatornát biztosít két program közötti kommunikációhoz. A REST API, pedig egy olyan API, ahol a kommunikáció az interneten kersztül történik. Na de hogy is néz ez ki a gyakorlatban?

Példa

Nézzünk egy rekordot az 1956-os gyűjteményben, mondjuk egy képet Sztálin-szobor ledöntéséről:
http://1956.osaarchivum.org/items/show/9855

Amint az oldalon láthatjuk, a képnek van címe, tárgyszava, dátuma, forrásmegjelölése, illetve maga a digitális fájl is megjelenik. Ez így a böngészőnkben jól néz ki, ám mi a teendő, ha az adatokat saját alkalmazásunkban, programunkban is szeretnénk használni?

Ekkor jön képbe az OMEKA API. Az API dokumentációja alapján láthatjuk, hogy különböző kéréseket intézhetünk az API-hoz. 

Ekkor jön képbe az OMEKA API. Az API dokumentációja alapján láthatjuk, hogy különböző kéréseket intézhetünk az API felé. 

Ezen kérések a következőek lehetnek:

  • /collections
  • /items
  • /files
  • /item_types
  • /elements
  • /element_sets
  • /tags

Az API végpontja ezen a címen érhető el:
http://1956.osaarchivum.org/api

Minden egyes kérés ezzel az URL-lel kezdődik és a kérés szavával folytatódik. Ha pl. le szeretném kérni a példában is említett fotóhoz tartozó összes adatot (amiket az oldalon is láthatunk), nincs más dolgunk, mint meghívni a következő linket:
http://1956.osaarchivum.org/api/items/9855

A visszaadott szöveg számítógépek által könnyen értelmezhető és feldolgozható JSON formátumban található, erről bővebben itt olvashattok: JSON - Wikipedia

A böngészőben megtekintve ez elég kaotikusnak tűnik elsőre, inkább nézzük meg az előző linket egy hívási paraméterrel kiegészítve:
http://1956.osaarchivum.org/api/items/9855?pretty_print

Mindjárt más. Az eredményben láthatjuk az elem azonosítóját (id), a gyűjtemény (collection) azonosítóját, url-jét, az elemhez tartozó fájlok (files) számát (count), url-jét, illetve az elemhez tartozó metaadatok listáját (element_texts).

Tegyük fel, hogy alkalmazásunk szeretné megjeleníteni magát a képet. Ekkor ki kell olvasnunk a 'files' objektumhoz tartozó url értéket és meghívnunk azt:
http://1956.osaarchivum.org/api/files?item=9855&pretty_print

A visszaadott oldalon a file_urls objektumban láthatjuk, hogy az adott elemhez 4 típusú fájl tartozik:

Amennyiben egy teljes kollekcióban lévő elemekre vagyunk kíváncsiak, először a kollekciók listáját kell lekérdeznünk:
http://1956.osaarchivum.org/api/collections?pretty_print=true

Ebből kiválasztva a nekünk megfelelő kollekció azonosítóját (példánk alapján legyen ez a 7-es számú Fortepan Fotók kollekció) lekérdezhetjük a hozzátartozó elemeket:
http://1956.osaarchivum.org/api/items?collection=7&pretty_print=true

Alapértelmezésben az maximum 50 rekordot ad vissza, amennyiben a következő 50-re is kíváncsiak vagyunk, adjuk hozzá a page paramétert hívásunkhoz:
http://1956.osaarchivum.org/api/items?collection=7&page=2&pretty_print=true

Ha az 50 darab rekord túl sok, akkor a per_page paraméter hozzáadásával állíthatjuk be a visszaadott rekordok számát:
http://1956.osaarchivum.org/api/items?collection=7&page=2&per_page=20&pretty_print=true

Az API-ról bővebben olvashattok itt:

http://omeka.readthedocs.org/en/latest/Reference/api/index.html

Zárszó

Reméljük sikerült megadnunk a kezdő lökést és hamarosan a pályázók között üdvözölhetjük Önt/Téged is! Amennyiben bárminemű technikai kérdés, probléma merülne fel, ide várjuk a leveleket:

techhelp@osaarchivum.org

Sikeres és eredményes munkát kívánunk!
A Blinken OSA Archivum munkatársai