Erfüllung der PSI Richtlinie
Die Richtlinie für Public-Sector Information (PSI) der europäischen Union wurde 26.09.2019 neu gefasst. In dieser Neufassung 2019/1024 sind insbesondere Richtlinien zum Umgang mit Daten geregelt wie sie auch am Conrad Observatorium erworben werden. Im folgenden wird kurz zusammengefasst, wie diese Richtlinien das Observatorium betreffen und in welcher Form diese am Observatorium angewendet wird. Kursiv gedruckte Termini entsprechen in Inhalt und Form exakt dem Wortlaut des PSI-Richtlinie 2019/1024 Artikel 2 (Begriffsbestimmungen). Am Conrad Observatorium werden dynamische Daten, Forschungsdaten, sowie hochwertige Datensätze erworben und generiert. Diese Datensätze werden mit international anerkannten Standardlizenzen versehen, anonymisiert und in offenen, maschinenlesbaren Formaten publiziert.
Dynamische Daten und Datenformate:
Am Conrad Observatorium werden in allen geophysikalsischen Bereichen Erdbeobachtungsdaten kontinuierlich aufgezeichnet und gespeichert. Diese dynamischen Daten werden in Echtzeit erworben und wir unterscheiden hierbei nach rawdata, Daten welche exakte der Sensormessung entsprechen, sowie adjusted data, Daten welchen einen automatisierten Echtzeitprüfprozess sowie einfachen automatisiert Korrekturen (Offset, Baseline) oder Umrechnungen mit Kalibrationswerten unterliegen. Ebenfalls in Echtzeit werden daraus gefilterte Datenprodukte und analysierte Datensätze, schon der Kategorie hochwertigen Datensätze zuzuordnen, erzeugt. Alle Datensätze des Observatoriums werden inklusive aller Metainformationen in Form von SQL Datenbanken, sowie im Common data format (CDF) auf unbestimmte Zeit archiviert und mehrfach gesichert. Das CDF Format entspricht hierbei dem in der Richtlinie geforderten Standard vom maschinenlesbaren, offenen, zugänglichen und weiterverwendbaren Format. Metainformationen entsprechen dem internationalen Standard der jeweiligen Disziplin, wie von den entsprechenden internationalen Gremien gefordert. Da eine Detailbeschreibung aufgrund der Anzahl der Disziplinen den Rahmen einer Kurzzusammenfassung sprengen würde, sie hier auf einen noch zu erstellenden Anhang verwiesen. Neben diesen Archivierungsformaten werden zudem Datenformate generiert wie sie in jeder Disziplin von den internationalen Netzen gefordert werden und in der entsprechenden Community genutzt werden. Auch diese Datenformate sind alle offen, dokumentiert, und generell maschinenlesbar. Gemäß PSI-Richtlinie 2019/1024 Artikel 5 ist neben den Datenformaten auch noch die Zugänglichkeit zu den Daten zu beachten. Dynamisch Daten und hochwertige Daten sind über API (Anwendungsprogrammier-Interface) des offenen Datenportals des Conrad Observatoriums, Webservice, automatisiert, in Echtzeit und maschinenlesbar abrufbar . Die API ist auf der Webservice-Seite vollständig dokumentiert und orientiert sich an internationalen Standards.
Datenlizensierung, Weiterverwendung und Massendownload:
Alle Beobachtungsdaten des Conrad Observatoriums werden automatisch mit einer Standardlizenz entsprechend der PSI Richtlinie versehen. Dabei handelt es sich momentan (Stand Juni 2023) für alle verfügbaren Daten um eine Creative Common Lizenz CC-BY-4.0, welche besagt, dass die Daten in jedwedem Format oder Medium vervielfältigt und weiterverbreitet werden dürfen und dass es erlaubt ist die Daten zu remixen, verändern und darauf aufzubauen und zwar für beliebige Zwecke, auch kommerziell. Dabei müssen angemessene Urheber- und Rechteangaben gemacht werden, ein Link zur Lizenz beifügt und angeben werden, ob Änderungen vorgenommen wurden. Gemäß Artikel 6 der PSI Richtlinie 2019/1024 behalten wir uns vor, dass in Zukunft auch Daten aufgrund des Arbeitsaufwands zur Bereitstellung, Dokumentation, Reproduktion und Anonymisierung auch mit einschränkenden Lizensierungen (z.B. CC-BY-NC-4.0) und gegebenenfalls für kommerzielle Anwendungen nicht kostenfrei verfügbar gemacht werden. Die Lizenzangaben sind integraler Bestandteil der Daten-Metainformation und in jedem Datensatz, ob Webservice oder Massendownload, enthalten. Bei Forschungsdaten wird, falls nicht anderweitig von der jeweiligen Forschungsförderungsgesellschaft gefordert, ebenfalls CC-BY-4.0 angewendet, sowie die Datensätze auf der jeweiligen Projektseite im Datenportal des Observatoriums verlinkt (PSI Artikel 10). Neben den oben erwähnten Dynamischen Daten werden zwei weitere Datenformen am Observatorium generiert: quasi-definitive und definitive Daten. Diese Datensätze werden manuell geprüft. Die Datenprüfung erfolgt wiederum nach international festgelegten technischen Standards um die Vergleichbarkeit von Observatorien und deren Methoden/Daten zu gewährleisten. Als Beispiel sei hier das Technical Manual von INTERMAGNET genannt. Definitive Datensätze werden jährlich erstellt und werden nach der Publikation nicht mehr angepasst oder verändert. Sie stehen zum Massendownload im Datenarchiv des Datenportals zur Verfügung und werden ebenfalls über internationale Netze angeboten.
Technische Einschränkungen und Transparenz:
Aufgrund der enormen Anzahl an Daten die am Observatorium erworben werden stehen momentan nur die international gängigsten und häufig genutzten Daten zum Echtzeitdownload, sowie gefilterte Datenprodukte Online bzw via API zur Verfügung. Die IT Infrastruktur, die Netzanbindung und Personalausstattung des Observatoriums macht eine Echzeitverfügbarkeit als auch eine Bereitstellung aller, auch hochauflösender Daten unmöglich. Ein Verweis auf diese Einschränkung, eine Übersicht über alle Daten, sowie Möglichkeiten diese Datensätze zu beziehen finden sich ebenfalls im Datenportal des Observatoriums. Am Observatorium werden zudem zahlreiche für die Gebäude und Infrastruktursicherheit relevante Daten erworben, welche nicht unter die PSI-Richtlinie fallen.
Referenzierung und Monitoring:
Dynamische Datensätze unterliegen Änderungen und fortschreitenden Datenprüfverfahren, sowohl automatisiert als auch manuell. Nur bei definitive Daten können wir gewährleisten, dass sich enthaltene Informationen nicht ändern. Wenn Daten des Observatoriums weiterverwendet werden, erfordert die Standardlizenz eine Referenzierung. Bei definitiven Daten sollte hierbei das entsprechende Jahrbuch des Observatoriums mit Details zur Analyse und Datenprüfmethodik genannt werden. Bei dynamischen Daten ist eine eindeutige Referenzierung des Datensatzes momentan nicht möglich und man sollte sich an dem in den Meta-Informationen enthaltenen "DataTerms" Vorschlag halten. Die Datennutzung über die API's des Datenportals wird geloggt.