Skip to content

Commit

Permalink
Update Quellenarbeit.md
Browse files Browse the repository at this point in the history
  • Loading branch information
krugbuild committed Feb 28, 2020
1 parent 34f584a commit d6f5a44
Showing 1 changed file with 9 additions and 1 deletion.
10 changes: 9 additions & 1 deletion Quellenarbeit.md
Original file line number Diff line number Diff line change
Expand Up @@ -10,6 +10,8 @@ Jede Version verfügt zudem über eine einmalige ID, mittels derer sie eindeutig

[^2]: Versionsverwaltung, in: Wikipedia, 05.02.2020. Online: <https://de.wikipedia.org/w/index.php?title=Versionsverwaltung&oldid=196516773>, Stand: 20.02.2020.

---

## Methodik

Um Veränderungen über größere Zeiträume nachvollziehen zu können, ohne sich auf jeweils winzige sprachliche Veränderungen je Versionssprung beziehen zu müssen, bietet es sich an, die Verwendung von Bildern in Artikeln über die Versionsgeschichte zu analysieren. Im Gegensatz zum Text eines Artikels, der sich durchaus hochfrequent mit kleinen Änderungen entwickeln kann, ohne dass sich die Aussage signifikant ändert, sind Bilder relativ stabile Medien. Bilder werden im Mediawiki ähnlich wie Artikel behandelt, also werden auch bei ihnen sämtliche Änderungen gespeichert - gleichwohl sind diese eher die Ausnahme. Sie werden im HTML eines Artikels stets (und technisch zwangsläufig) mittels `<img>`-Tag eingebunden und sind damit über eine simple Mustererkennung zu identifizieren. Die inhaltliche Bewertung wird folglich über die Gegenwart oder Abwesenheit eines bestimmten Bildes in einer bestimmten Version durchgeführt. Diese Annäherung an den Untersuchungsgegenstand über den Quelltext der einzelnen Artikel ermöglicht es zudem, die Analyse unabhängig von spezialisierten Sprachkenntnissen durchzuführen, da der auszuwertende Quelltext stets in HTML geschrieben ist.
Expand All @@ -20,6 +22,8 @@ Dem Anspruch an eine freie Wissenschaft folgend, wurde bei der Wahl der technisc

[^3]: Siehe auch Grötschel, Martin: Elektronisches Publizieren, Open Access, Open Science und ähnliche Träume, in: Wissenschaftliches Publizieren: zwischen Digitalisierung, Leistungsmessung, Ökonomisierung und medialer Beobachtung, Berlin ; Boston 2016, S. 252.

---

## Exemplarischer Ablauf

Die im Folgenden genannten Skripte finden sich im Unterordner [~/Skripte](./Skripte) und sind in der zugehörigen ReadMe-Datei sowie im Quelltextkommentar ausführlich beschrieben. Weiterhin ist dort der idealtypische Ablauf des Datenabrufs in aller Kürze dargestellt.
Expand Down Expand Up @@ -77,6 +81,8 @@ In den ersten beiden Spalten der Tabelle finden sich die ID der einzelnen Versio

[^5]: Bei sehr großen Datenmengen kann es nötig sein, die `articleData.xml` in mehreren Schritten auszuwerten. Die dabei erzeugten `imageData.xml` können anschließend über das Schema `combineImages.xsl` zusammengefügt werden. Siehe hierzu die [entsprechende Dokumentation](./Skripte/README.md#combineimages-xsl).

---

## Erläuterung der Quellendokumention

Die Dokumentation und Auswertung der erhobenen Daten ist je Artikel in der zugehörigen ReadMe hinterlegt. Das Dokument folgt einem standardisierten Aufbau: Die Überschrift besteht stets aus der deutschen Übersetzung und dem originalen Titel des Artikels, zudem ist ihr ein Verweis zum Artikel hinterlegt. Unter **Auffällige Bilder** sind all jene Bilder aufgeführt, die durch ihr Motiv, die ermittelten Zeitreihen oder andere Details auffallen. Sie sind besonders, jedoch nicht exklusiv, für eine historiographische Auswertung geeignet. Datumsangaben in der zugehörigen Tabelle sind stets im Format `YYYY-MM-DD (ID)` wobei sich der Klammerausdruck auf die ID der zugehörigen Artikelversion bezieht. Solche Datumsangaben sind i.d.R. mit einem Link zur entsprechenden Artikelversion hinterlegt. Unter **Artikeldaten** ist der Zeitraum des Datenabrufs der einzelnen Artikelversionen angeben, zudem wird auf die zugehörigen Logdateien verwiesen. Zudem ist die Anzahl der abgerufenen Artikelversionen aufgeführt. Unter **Bilddaten** sind die Zeiträume zur Ermittlung der Bilddaten aus den Artikeldaten sowie zur Auswertung der Bilddaten durch Erstellung er Auswertungstabelle angegeben. Es wird auf die zugehörigen Logdateien und die Auswertungstabelle verwiesen. *Anzahl der Bilder* bezieht sich auf die in der Artikelhistorie vorkommenden, einzigartigen Bilder. Die *Anzahl der Bildreferenzen* hingegen bezieht sich auf die Summe aller in der Artikelhistorie referenzierten Bilder. Im Abschnitt **Ausgeschlossene Daten** sind all jene Dateien und deren Dateigröße aufgeführt, die im Rahmen der Auswertung angefallen sind, jedoch nicht mit ins Repositorium aufgenommen wurden. Diese Prozessdaten entsprechen üblicherweise den ursprünglichen Quelldaten und bieten nach erfolgter Auswertung keinen Mehrwert für die Untersuchung. Wenn es der Dokumentation oder Auswertung zuträglich war, wurde diese Struktur um neue Abschnitte erweitert.
Expand All @@ -91,6 +97,8 @@ Die Präsentation insbesondere der historiographischen Analyse im Markdownformat

Für folgende Untersuchungen ist die exakte Implementation der Versionsverwaltung der Bildartikel im Mediawiki zu klären. In Einzelfällen, wie dem Bild [Tiananmensquare.jpg](https://zh.wikipedia.org/wiki/File:Tiananmensquare.jpg) des Artikels zum Tiananmen Zwischenfall[^7], sind die Verweise im Artikel früher zu datieren, als die älteste Dateiversion. Der exakte Zustand des referenzierten Bildes kann für solche Zeiträume folglich nicht rekonstruiert werden.

---

[^6]: Zur Praxistauglichkeit verschiedener Applikationen und Vorgehensweisen beim Verfassen von Open Science Publikationen siehe: Heise, Christian: Von Open Access zu Open Science: zum Wandel digitaler Kulturen der wissenschaftlichen Kommunikation, Leuphana Universität Lüneburg, Lüneburg 2018, S. 223-233. Online: <http://offene-doktorarbeit.de/>.

[^7]: Siehe [Bildquellenauswertung des Artikels "Tiananmen Zwischenfall"](./Artikel/tiananmen/README.md).
[^7]: Siehe [Bildquellenauswertung des Artikels "Tiananmen Zwischenfall"](./Artikel/tiananmen/README.md).

0 comments on commit d6f5a44

Please sign in to comment.