-
Notifications
You must be signed in to change notification settings - Fork 5
/
Copy pathpica-rs.qmd
26 lines (17 loc) · 1.51 KB
/
pica-rs.qmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
# pica-rs {#sec-pica-rs}
pica-rs ist wie picadata (@sec-picadata) ein Kommandozeilenwerkzeug zur Auswertung von PICA-Daten.
::: {.callout-note appearance="simple"}
[Dokumentation von pica-rs](https://github.com/deutsche-nationalbibliothek/pica-rs#readme)
:::
## Installation
Am einfachsten die Installation einer Release-Version des Programms von der Seite <https://github.com/deutsche-nationalbibliothek/pica-rs/releases>. Unter "Assets" werden dort Pakete für verschiedene Betriebsysteme bereitgestellt. Alternativ kann die letzte Entwicklungsversion aus dem git-Repository installiert werden, wie in der Dokumentation von pica-rs beschrieben.
## Bedienung
::: {.callout-note appearance="simple"}
Siehe [pica-rs Anfänger-Tutorial](https://deutsche-nationalbibliothek.github.io/pica-rs/book/beginner-tutorial.html)
:::
Das Kommandozeilenprogramm von pica-rs heisst `pica`. Im Gegensatz zu `picadata` wird als Standard-Syntax normalisiertes PICA (mit einem Datensatz pro Zeile) angenommen. Das Programm stellt folgende Befehle bereit:
* `pica filter` zur Auswahl von Datensätzen, die ein bestimmtes Kriterium erfüllen
* `pica select` zur Auswahl von Unterfeldwerten und Ausgabe im CSV-Format
* `pica frequency` zur Erstellung einer Häufigkeitsverteilung von Unterfeldwerten (Histogramm)
* `pica partition`, `pica sample`, `pica slice` und `pica split` zur Reduktion von Datensätzen in kleinere Mengen
* `pica cat`, `pica print`, `pica xml` und `pica json` zur Ausgabe von Datensätzen in unterschiedlichen PICA-Serialisierungen