Kto by vedel spustit python script, tak existuje riesenie.
https://github.com/Kasci/SlovakianaDownload
Slovakiana rok 1930 - sčítacie hárky
Eventuelne pre technicky menej zdatnych, je to mozne spravit aj rucne, ale je to pracne.
- Z adresy zo slovakiany, je potrebne ziskat kod objektu. Ten je v adrese https://slovakiana.sk/kulturne-objekty/cair-xxxxxxx v tvare cair-xxxxxxx
- Tento kod vlozime na koniec URL https://wcm.slovakiana.sk/culturalobject/cair-xxxxxxx
- Dostaneme JSON. Mnohe prehliadace (Chrome, Firefox) bud automaticky upravuju objekt do citatelnejsiej podoby, alebo hore maju prepinac na formatovanie
- Hladame atribut digitalObjects, ktory obsahuje v sebe objekt, ale nas zaujima najma id. Mal by byt jeden, ale moze ich byt aj viac, pre kazdy zopakujeme nasledujuce kroky.
- ID by malo byt v tvare doid-yyyyy alebo pre cenzus 1940 SNA-00000000x
- ID vlozime na koniec adresy https://wcm.slovakiana.sk/digitalobject/doid-yyyyy alebo https://wcm.slovakiana.sk/digitalobject/SNA-0000000000x
- Znova dostaneme JSON, v ktorom hladame content a v nom images. Pocet objektov v images zavisi od poctu stran v scitacom harku.
- Pre kazdu stranu, je tam jeden zaznam a kazdy z nich obsahuje objekt full, ktory obsahuje fileUrl.
- (Je mozne vyhladat (Cez Ctrl+F) iba full a nasledne najst fileUrl za nim. fileUrl sa pouziva viac krat ale full je tam iba tolko krat kolko je stran harku.)
- Adresa fileUrl je adresou strany harka v plnej kvalite.