Modellierung
Für die Beschreibung der in MeWiKo anfallenden Daten wurden ein semantischer Ansatz gewählt. Um dies zu realisieren wurde auf Standards oder Semi-Standards des Semantic Webs (insb. W3C) zurückgegriffen.
"In addition to the classic “Web of documents” W3C is helping to build a technology stack to support a “Web of data,” the sort of data you find in databases. The ultimate goal of the Web of data is to enable computers to do more useful work and to develop systems that can support trusted interactions over the network. The term “Semantic Web” refers to W3C’s vision of the Web of linked data. Semantic Web technologies enable people to create data stores on the Web, build vocabularies, and write rules for handling data. Linked data are empowered by technologies such as RDF, SPARQL, OWL, and SKOS."
Es wurden folgende Ontologie als Basis für das Modell genutzt:
- RDF Standards
Die Standards der Resource Description Language bilden der Kern der ontologischen Beschreibung (bspw. durch die Typenbeschreibung). - RDF:http://www.w3.org/1999/02/22-rdf-syntax-ns# .
- RDFS: http://www.w3.org/2000/01/rdf-schema# .
- Dublin Core http://purl.org/dc/elements/1.1/
- Friend-of-a-Friend foaf: http://xmlns.com/foaf/0.1/
- Prism http://prismstandard.org/namespaces/basic/2.0/
Spezielle domainspezifische Ontologien
-
Biro (http://purl.org/spar/biro/):
"Die Bibliographic Reference Ontology (BiRO) ist eine Ontologie, die bibliographische Einträge, bibliographische Referenzen und deren Zusammenstellung zu bibliographischen Sammlungen bzw. bibliographischen Listen definiert"
Siehe auch: https://sparontologies.github.io/biro/current/biro.html
-
Cito (http://purl.org/spar/cito/)
"Die Ontologie zur Zitattypisierung (Citation Typing Ontology, CiTO) ist eine Ontologie, die eine Charakterisierung der Art oder des Typs von Zitaten ermöglicht, und zwar sowohl faktisch als auch rhetorisch."
Siehe auch https://sparontologies.github.io/cito/current/cito.html -
Datacite (http://purl.org/spar/datacite/)
"Die DataCite-Ontologie ist eine Ontologie, die in OWL 2 DL geschrieben wurde, um die Metadateneigenschaften der DataCite-Metadaten-Kernspezifikation Version 3.1 in RDF beschreiben zu können."
Siehe auch https://sparontologies.github.io/datacite/current/datacite.html
-
Fabio (http://purl.org/spar/fabio/)
"Die FRBR-aligned Bibliographic Ontology (FaBiO) ist eine Ontologie zur Beschreibung von publizierten oder potentiell publizierbaren Entitäten (z.B. Zeitschriftenartikel, Konferenzbeiträge, Bücher), die bibliographische Referenzen enthalten oder auf die verwiesen wird."
Siehe auch https://sparontologies.github.io/fabio/current/fabio.html -
FRBR (http://purl.org/vocab/frbr/core#)
"Dieses Vokabular ist ein RDF der Konzepte und Beziehungen, die im IFLA-Bericht über die funktionalen Anforderungen an bibliographische Datensätze (FRBR) beschrieben werden."
Siehe auch https://vocab.org/frbr/core -
Scoro (http://purl.org/spar/scoro/)
"Die Ontologie Scholarly Contributions and Roles Ontology (SCoRO) ist eine auf PRO basierende Ontologie zur Beschreibung der Beiträge, die geleistet werden können, und der Rollen, die eine Person in Bezug auf einen Zeitschriftenartikel oder eine andere Publikation innehaben kann (z.B. die Rolle des Artikelgaranten oder des Illustrators)."
Siehe auch https://sparontologies.github.io/scoro/current/scoro.html
Literals und X-Standards
Diese Ontologien werden genutzt um Datentypen, wie etwa ein Datum, festzulegen. -
- http://www.essepuntato.it/2010/06/literalreification/> . -
- http://www.w3.org/XML/1998/namespace> . -
- http://www.w3.org/2001/XMLSchema#> . -
- http://purl.org/co/> (Für Listen)
Exemplarische Darstellung
Ein relativ einfaches Beispiel sei an dieser Stelle herausgegriffen um exemplarisch das (Meta-)modell vorzustellen.
- Zwei Embargo-Mails des Verlages PLOS (einmal über PLOS und einmal über den PLOS Biologie) verweisen auf einen Artikel.
- Dieser Artikel hat eine Reihe von Autoren, ein Embargo, ein Veröffentlichungsdatum, ein Journal etc..
- Der Artikel verweist auf eine andere Quelle, welche als Review vom Artikel gewertet werden kann
- Diese Quelle (Expression) hat wiederrum einen Autoren und ist mit dem selben Verlag verbunden
Folgende Konzepte sind nötig um dieses Szenario zu beschreiben
Diese Konzepte dienen als Ausgangsbasis für die Modelle:
Die Beschreibung des JournalArtikels kann wie folgt visualisiert werden:
Zu sehen ist hier das Embargodate, sowie die DOI und der Publisher. Darüber hinaus ist der Verweis zu dem Review zu sehen. Die darauf verweisende Email kann wie folgt visualisiert werden:
Hierbei sieht man den Verweis auf das Paper. Dieser Verweis kann auch entsprechend visualisert werden:
Das Review selbst kann wie folgt dargestellt werden
Diese Komplexität darzustellen ist extrem schwierig. Die Anzahl der Knoten und Edges entsprechend hoch. Für dieses vergleichbar einfache Szenario würde eine Netzwerkdarstellung wie folgt aussehen: