Slovakiana rok 1930 - sčítacie hárky

Tipy na online databázy užitočné pri genealogickom pátraní.
Kasci007
Príspevky: 15
Dátum registrácie: 08 Okt 2022, 08:58
Predkovia z oblasti: Bukovce, Ľubovec

Kto by vedel spustit python script, tak existuje riesenie. :)
https://github.com/Kasci/SlovakianaDownload
Kasci007
Príspevky: 15
Dátum registrácie: 08 Okt 2022, 08:58
Predkovia z oblasti: Bukovce, Ľubovec

Eventuelne pre technicky menej zdatnych, je to mozne spravit aj rucne, ale je to pracne.
  1. Z adresy zo slovakiany, je potrebne ziskat kod objektu. Ten je v adrese https://slovakiana.sk/kulturne-objekty/cair-xxxxxxx v tvare cair-xxxxxxx
  2. Tento kod vlozime na koniec URL https://wcm.slovakiana.sk/culturalobject/cair-xxxxxxx
  3. Dostaneme JSON. Mnohe prehliadace (Chrome, Firefox) bud automaticky upravuju objekt do citatelnejsiej podoby, alebo hore maju prepinac na formatovanie
  4. Hladame atribut digitalObjects, ktory obsahuje v sebe objekt, ale nas zaujima najma id. Mal by byt jeden, ale moze ich byt aj viac, pre kazdy zopakujeme nasledujuce kroky.
  5. ID by malo byt v tvare doid-yyyyy alebo pre cenzus 1940 SNA-00000000x
  6. ID vlozime na koniec adresy https://wcm.slovakiana.sk/digitalobject/doid-yyyyy alebo https://wcm.slovakiana.sk/digitalobject/SNA-0000000000x
  7. Znova dostaneme JSON, v ktorom hladame content a v nom images. Pocet objektov v images zavisi od poctu stran v scitacom harku.
  8. Pre kazdu stranu, je tam jeden zaznam a kazdy z nich obsahuje objekt full, ktory obsahuje fileUrl.
  9. (Je mozne vyhladat (Cez Ctrl+F) iba full a nasledne najst fileUrl za nim. fileUrl sa pouziva viac krat ale full je tam iba tolko krat kolko je stran harku.)
  10. Adresa fileUrl je adresou strany harka v plnej kvalite.
Napísať odpoveď