Diese Skripte laden alle Seiten des Sigelverzeichnisses herunter und prüfen diese auf folgende URLs:
Hildesheim Beispiel:
- SRU: http://sru.gbv.de/opac-de-hil2
- PAIA: https://paia.gbv.de/DE-Hil2/
- DAIA: https://paia.gbv.de/DE-Hil2/daia
Diese URLs werden dann in eine Liste geschrieben, sodass man das Vorhandensein überprüfen kann.
(Dies kann eine Weile dauern.)
catmandu convert SRU --base http://services.dnb.de/sru/bib --query "*" --recordSchema PicaPlus-xml --parser ppxml to PICA --type plain > sigelverzeichnis.pica
oder
./download.sh
catmandu convert plain --file sigelverzeichnis.pica --fix library-apis_fix.txt to JSON > library-apis.json
oder
./extract.sh
Zuletzt, um sich die Liste anzeigen zu lassen:
jq '.[]|select(.daia,.paia,.sru)' library-apis.json
-
Histogramm erstellen:
jq -r '.[].APIs[]' library-apis.json | sort | uniq -c | sort -n
-
JSON-Ansicht:
cat library-apis.json | jq
-
API-Typen ermitteln mit
api-Types_fix.txt
:
extract.sh
mit Editor öffnen, den ersten Befehl auskommentieren, den zweiten entkommentieren dannach aufrufen mit:
./extract.sh