# Sharing is Caring ## Wie das Teilen von Annotationen urheberrechtlich geschützter Texte gelingen kann
[Robert Jäschke](https://hu.berlin/RJ/) Humboldt-Universität zu Berlin
Institut für Bibliotheks- und Informationswissenschaft 22. Mai 2026
This work is licensed under
Creative Commons Attribution-ShareAlike 4.0 International
.
Note: - 20min + 10min -- # Agenda 1. Motivation und Ausgangslage 2. Lösungsansätze 3. Vision und Diskussion --- # Motivation und Ausgangslage --


 Note: - Annotierte Daten sind für viele Disziplinen unverzichtbar ... - Texte: - Linguistik (Wortarten, Satzstruktur, Entitäten etc.) - LitWiss (komplexe Konzepte wie Emotion oder Handlung mit umfangreichen Annotationen/Richtlinien → SPP CLS!) - auch: Informatik zum Trainieren von Sprachmodellen (etwa zur Extraktion bibliographischer Metadaten aus wiss. Artikeln) - Bilder: Kunstgeschichte, Architektur, Layouterkennung - Musik: Musikwiss., Music-IR --  [Zenodo: "annotated text"](https://zenodo.org/search?q=annotated%20text&f=resource_type%3Adataset&f=file_type%3Atxt&l=list&p=1&s=10&sort=bestmatch) Note: - ... Forschende erfahren zunehmend Anerkennung für das Annotieren und Teilen von Daten - in FDM-Repos und auf Plattformen wie HuggingFace, Zenodo, TextGrid etc. - auch: "Datensatz-Paper" - FAIRer Zugang zu Forschungsdaten → essentieller Aspekt von "Open Science" --  [DARIAH Annotation Viewer](https://annotation.de.dariah.eu/AnnotationViewer/) Note: - Werkzeuge und Plattformen zur (kollaborativen) (Online-)Annotation -- ## Herausforderung Urheberrecht 
Karoline Krauss (1995): Das Offene Geheimnis in Annette von Droste-Hülshoffs „Judenbuche“, *Zeitschrift für deutsche Philologie* 114(4), S. 542-559
(Annotation im Rahmen des DFG-Projektes [Ist Expert:innenwissen der Schlüssel? Interpretationstexte als Ressource für die Analyse literarischer Werke in den Computational Literary Studies](https://www.projekte.hu-berlin.de/de/schluesselstellen))
Note: - Herausforderung: urheberrechtlich geschützte Werke - hier: Text von 1995, Annotation verschiedener Arten von Textbezugnahmen - rechtliche / technische Lösungen? --- # Lösungsansätze -- ## Stand-Off-Annotationen

 ```xml
...
```
O’Donnell, M. (2008). [Demonstration of the UAM CorpusTool for Text and Image Annotation](https://aclanthology.org/P08-4004/). In *Proceedings of the ACL-08: HLT Demo Session* (pp. 13–16). Association for Computational Linguistics. *siehe auch:* Burghardt, M., & Wolff, C. (2009). [Stand Off-Annotation für Textdokumente: Vom Konzept zur Implementierung (zur Standardisierung?)](https://epub.uni-regensburg.de/14223/1/Stand-off-AnnotationGSCL2009.pdf). In *Proceedings of the Biennial GSCL Conference* (pp. 53-59).
Note: - technische Lösung - Stand-Off-Annotationen: Trennung der Annotationen vom Inhalt - weit verbreitet; Beispiel hier: UAM CorpusTool → XML getrennt vom Text; bezieht sich auf Zeichenpositionen -- 
Rehm, G., Witt, A., Zinsmeister, H. & Dellert, J. (2007). [Corpus masking: Legally bypassing licensing restrictions for the free distribution of text collections](https://nbn-resolving.org/urn:nbn:de:bsz:mh39-45145). *Digital Humanities 2007*. Conference Abstracts (pp. 166-170).
Note: - hier "Corpus Masking" - Zusammenfügen bei Vorliegen eines bit-identischen Ursprungsdokuments technisch einfach - oft nicht der Fall (typischer Grund: PDF) → herausfordernd! -- ## Alignment 
Arnold, F. & Jäschke, R. (2025). [Sharing is Caring: A Text Alignment Approach for Sharing Annotations of Copyrighted Texts](https://doi.org/10.1007/978-3-032-06136-2_13). In *New Trends in Theory and Practice of Digital Libraries: TPDL 2025 Short Papers and Workshops* (pp. 135-145), Springer.
Note: - hier setzt SisC an: Fokus auf nicht bitgenaue Dokumente - statistischer Ansatz zum Zusammenfügen - Ungenauigkeiten! --- # Vision und Diskussion --
 
**SisC**: Arnold, F. & Jäschke, R. (2025). [Sharing is Caring: A Text Alignment Approach for Sharing Annotations of Copyrighted Texts](https://doi.org/10.1007/978-3-032-06136-2_13). In *New Trends in Theory and Practice of Digital Libraries: TPDL 2025 Short Papers and Workshops* (pp. 135-145), Springer.
Note: Deposit: 1. Forschende laden Annotationen hoch 2. Rechteklärung 3. Repository erstellt und speichert (Austausch-)Dateien Retrieval: 1. Repository zeigt (Art der) Verfügbarkeit von Annotation 2. Rekonstruktion des annotierten Textes Auch: - Integration in Discovery Systeme: verfügbare Annotationen anzeigen -- ## Diskussion - rechtliche Situation vs. Dateiformat PDF - Verknüpfung von FDM mit Digital Libraries, Discovery-Systemen, Katalogen - Vereinfachung des Teilens → Förderung von Open Science - Welche Hürden gibt es? - Wer implementiert es? ---
[](https://slides.igada.de/2026-05-22-bibliocon/) [https://slides.igada.de/2026-05-22-bibliocon/](https://slides.igada.de/2026-05-22-bibliocon/) [](https://www.bibsonomy.org/) [](http://weltliteratur.net/)

© [XKCD, Randall Munroe](https://xkcd.com/1256) / [CC BY-NC 2.5](https://creativecommons.org/licenses/by-nc/2.5/)
- Frederik Arnold - [robert.jaeschke@hu-berlin.de](mailto:robert.jaeschke@hu-berlin.de) - [https://hu.berlin/RJ](https://hu.berlin/RJ) -- [](https://slides.igada.de/2026-05-22-bibliocon/) ## [https://slides.igada.de/2026-05-22-bibliocon/](https://slides.igada.de/2026-05-22-bibliocon/)