v1.0 (22.02.2021)
by Thomas Jurczyk
Dieses Repository enthält die Dokumentation der Analyseergebnisse aus dem Artikel "Vorstellung eines (teil-)automatisierten Verfahrens zur Analyse der Multimodalität von Webseiten" (eingereicht bei Zeitschrift für digitale Geisteswissenschaften) und das im Kontext des Artikels genutzte Programm. Das Programm dient im derzeitigen Zustand nur zur Dokumentation und Nachvollzug der Analyse. Es ist nicht darauf ausgelegt, von anderen Personen, insbesondere solchen, die über keine Programmierkenntnisse verfügen, genutzt zu werden.
Dieser Ordner enthält die Ergebnisse der im Artikel besprochenen Analyse. Darunter sind:
- Die Datei
data_abs_values.csv
mit den absoluten Werten der Features des Webseiten-Samples. Diese Datei dient zum Nachvollzug des Clusterings (vgl. Kapitel 4 des Artikels). - Die Screenshots des Text-, Video- und Bild-Feature Clustering aus Kapitel 4.2. d) (im Ordner
Screenshots
). - Die während Corpus-Initialisierung heruntergeladenen Daten (vgl. Kapitel 4.1.). Diese Daten befinden sich im Ordner
CorpusData
. - Die Dateien
image_data.pickle
undmerged_data_dict.pickle
, welche die Resultate desDataPreparation()
Schritts enthalten (Kapitel 3.2. und 4.1.).
Dieser Ordner enthält die aktuellste im Kontext des Artikels genutzte Version des Programms zu Corpus-Initialisierung und -Analyse. Erneut ist darauf hinzuweisen, dass dieses Programm nicht für eine allgemeine Nutzung gedacht ist.
Der Ordner enthält die folgenden Dateien:
- Alle im Kontext des Programms genutzten Klassen
scraper.py
(für die Corpus-Initialisierung, vgl. Kapitel 3.1.),data_preparation.py
(Datengenerierung, vgl. Kapitel 3.2.) undanalyzer.py
(für die Analyse, vgl. Kapitel 3.3.). - Ein Jupyter Notebook (
Main_Program_Notebook.ipynb
), das die interaktive Ausführung des Programms inklusive Auswertung der Daten erlaubt. - Einen Ordner mit dem in diesem Programm genutzten Edge-Webdriver.
- Die
requirements.txt
mit den Abhängigkeiten der in diesem Programm genutzten Bibliotheken und Frameworks.
Für Kritik und Anmerkungen bin ich immer dankbar!