Alle Beiträge von Irene Schumm

BERD@BW bei den E-Science-Tagen 2021

Am 4.3. und 5.3. fanden – zum ersten Mal virtuell – die diesjährigen E-Science-Tage statt, die unter Beteiligung des Karlsruher Instituts für Technologie, der Universität Konstanz und der Universität Heidelberg im Rahmen des Projekts bw2FDM veranstaltet werden.

Unter dem Motto „Share Your Research Data“ boten die E-Science-Tage eine bunte Mischung aus Key-Note-Vorträgen, Poster-Sessions, Lightening Talks, Podiumsdiskussion und Workshops. Als besondere Veranstaltungen standen gemeinsame virtuelle Mittagspausen mit Fitnessprogramm sowie ein virtueller Apéro auf dem Programm. Das Tagungsprogramm sowie Downloads sind auf der Webseite der E-Science-Tage verfügbar.

BERD@BW war auf den E-Science-Tagen mit mehreren Beiträgen vertreten.

Renat Shigapov stellte in der Session „Vernetzung im Forschungsdatenmanagement in Baden-Württemberg“ den „BERD@BW-Wissensgraph für offene Firmendaten mit Wikibase“ vor. Mit Hilfe des Wissensgraphen soll die derzeit unbefriedigende Datenlage in Bezug auf deutsche Firmendaten im Sinne der FAIR-Kriterien für Forschungsdaten verbessert werden.

In der Poster-Session konnten Sabine Gehrlein und Irene Schumm einen Überblick über BERD@BW geben, die bereits entwickelten Tools und Services umreißen sowie Weiterentwicklungsmöglichkeiten skizzieren. Markus Herklotz schließlich präsentierte mit einem Poster unseren interaktiven virtuellen Assistenten iVA von BERD@BW zum Thema Anwendbarkeit der DSGVO.

Prof. Dr. Frauke Kreuter aus dem BERD@BW-Team nahm schließlich an der Podiumsdiskussion „Sharing data: Ideology or necessity?“ teil. Frau Kreuter thematisierte, dass die notwendigen Ressourcen für Datenmanagement bereits in der Projektplanung stärker berücksichtigt werden sollten. Denn möchte man Daten adäquat nachnutzbar machen, müssen diese im Projekt aufwändig aufbereitet werden.

Interaktiver Virtueller Assistent zum Thema DSGVO online

Unser erster Interaktiver Virtueller Assistent (IVA) ist online (klicken Sie hier)! Das erste Modul dreht sich um die Frage, in welchen Fällen die Datenschutzgrundverordnung (DSGVO) überhaupt Anwendung findet. Forschenden wird damit die Beurteilung erleichtert, ob ein Forschungsprojekt datenschutzrechtlich problematisch sein könnte. Nach Art eines asynchronen Online-Workshops werden Forschende anhand von Fragen durch den Themenkomplex geleitet, die sie – bei Bedarf mit Unterstützung von Tooltips – vor dem Hintergrund des eigenen Forschungsprojekts beantworten und so zu einer Einschätzung zur Anwendbarkeit der DSGVO kommen können.

Datenschutz- und Urheberrechtsregelungen sind im Rahmen des Forschungsdatenmanagements in den Wirtschafts- und Sozialwissenschaften regelmäßig relevant. Der Zugang zu den rechtlichen Regelungen gestaltet sich jedoch für Nicht-Juristen häufig schwer und nicht selten unterbleibt eine Publikation, das Teilen und schlimmstenfalls auch die Archivierung von Daten „sicherheitshalber“. Daher entwickeln wir in BERD@BW Interaktive Virtuelle Assistenten (IVA), die helfen sollen, einen Zugang zu den grundlegenden rechtlichen Regelungen zu finden.

Online-Kurs „Matlab on HPC“ am 10. Dezember

Am 10. Dezember bietet das Höchstleistungsrechenzentrum Stuttgart via Webex von 9-16 Uhr den Kurs „Matlab on HPC“ an. Schwerpunkte des Kurses liegen insbesondere auf grundlegenden Prinzipien des parallelen Programmierens, Vektorisierens und Optimierens mit Matlab sowie auf der Nutzung von Matlab auf bwUniCluster 2.0.

Eine ausführliche Beschreibung des Kurses finden Sie auf der bwHPC-Schulungsplattform (Kurse -> Matlab on HPC), die Teilnehmerzahl ist begrenzt. Um sich zum Kurs anzumelden, ist zunächst eine Registrierung auf der bwHPC-Schulungsplattform nötig („Entitlement“ beantragen). Sinnvoll ist es zudem, bereits einen Zugang zu einem bwHPC-Cluster zu haben. Wie Sie sich diesen einrichten lassen können, wird im bwHPC-Wiki beschrieben.

BERD@BW-Team erreicht Platz 3 bei der SemTab-Challenge 2020

Ein Team rund um BERD@BW-Data-Scientist Renat Shigapov hat mit der selbst entwickelten Software „boosted by wiki“ (bbw) bei der „Semantic Web Challenge on Tabular Data to Knowledge Graph Matching“ (SemTab-Challenge) teilgenommen und dort einen hervorragenden 3. Platz erreicht. Wir freuen uns sehr über dieses großartige Ergebnis!

In der Challenge ging es darum, einen Code zu entwickeln, der Tabellendaten (CSV-Dateien) mit Knowledge-Graph-Daten (z.B. Wikidata) abgleicht und mit deren Hilfe semantisch annotiert. Die verschiedenen Lösungen wurden in vier Runden anhand einer Vielzahl von Tabellendaten einem Benchmarking unterzogen. Herausforderungen in den Daten waren mehr oder weniger „unsaubere“ Angaben, d.h. fehlende Metadaten in den Tabellen (bspw. keine Spalten-/Zeilenbezeichnungen), unvollständige, fehlerhafte oder doppeldeutige Daten. Die Challenge war an die 19. International Semantic Web Conference (ISWC) und den 15. International Workshop on Ontology Matching (OM-2020) angegliedert.

Bei uns im BERD@BW-Projekt hat der bbw-Algorithmus auch praktisch eine große Bedeutung. So können wir Tabellen, die Firmendaten enthalten, mit unserem Open Firm Knowledge Graph matchen, den wir mit Wikibase umgesetzt haben. Auf diese Weise können wir zum einen den Knowledge Graph aktualisieren und anreichern, aber auch eine Entitätenidentifikation in CSV-Datensätzen durchführen, was ein Datenlinking verschiedener Datensätze stark erleichtert, oder Daten in CSV-Tabellen anreichern. Hierfür ist perpektivisch auch ein Webservice zur Nachnutzung für Forschende angedacht. Die Matching-Qualität spielt hierbei natürlich eine große Rolle. Insofern freut es uns sehr, dass unser bbw-Algorithmus in der internationalen und hochrangig besetzten Challenge im Benchmarking so gut abgeschnitten hat.

Jura-Studierende(r) als geprüfte wissenschaftliche Hilfskraft für BERD@BW gesucht!

Sie haben einen Abschluss als Bachelor of Law Unternehmensjurist/in (LL.B.) oder vergleichbar und Interesse an rechtlichen Fragestellungen des Forschungsdatenmanagements?

Für das BERD@BW-Team an der Universitätsbibliothek Mannheim suchen wir zum nächstmöglichen Zeitpunkt eine/einen Studierenden der Rechtswissenschaft als geprüfte wissenschaftliche Hilfskraft (m/w/d). Die Stelle ist zunächst auf 4 Monate befristet und umfasst mind. 30, idealerweise 40 Stunden im Monat.

Die Bewerbungsfrist ist abgelaufen.

Einführung in das bwForCluster MLS&WISO

Am 23. und 24. November findet eine Online-Einführung in die Benutzung des High-Performance-Computing-Clusters bwForCluster MLS&WISO statt. bwForCluster MLS&WISO wird im Rahmend der bwHPC-Infrastruktur gemeinsam von der Universitäts-IT Mannheim sowie dem Rechenzentren der Universität Heidelberg betrieben und bietet Hochleistungsrechenkapazitäten u.a. für die Wirtschafts- und Sozialwissenschaften an. Die Nutzung von bwForCluster MLS&WISO steht Universitätsanghörigen in Baden-Württemberg offen; Wie Sie Zugang erhalten können, können Sie auf im Wiki von bwForCluster nachlesen.

Bei Interesse können Sie sich bwHPC-Schulungsplattform zu dem Kurs anmelden (Kursangebot > Kurse > Introduction to MLS&WISO). Fragen rund um die Schulung und bwForCluster beantwortet Ihnen gerne das MLS&WISO-Team.

29. Wissenschaftliches Kolloquium des Statistischen Bundesamts

Beim 29. Wissenschaftlichen Kolloquium des Statistischen Bundesamts vom 10.-12.11.2020 war – dem Leitthema „Data Science für eine evidenzbasierte Wirtschafts- und Sozialpolitik“ entsprechend – auch das BERD (@BW und @NFDI)-Team mir Dr. Sabine Gehrlein, Prof. Dr. Frauke Kreuter, Prof. Dr. Goeran Kauermann und Prof. Dr. Florian Stahl stark vertreten.

Nach der Einführung in das Thema durch Prof. Dr. Kreuter wurde in der ersten Session von dem Trio Prof. Kauermann, Müller und Prof. Stahl die Frage „Data Science: Was ist das?“ diskutiert. Einigkeit herrschte hierbei, dass Data Science zwar durchaus Schnittstellen mit der statistischen Datenanalyse hat, jedoch auch ganz eigene und neue Herausforderungen mit sich bringt, für die nicht nur reines Methodenwissen, sondern auch ein gewisses Domänenwissen erforderlich sind. Data Science-Methoden sollten daher tief in die Fachstudiengänge verankert werden.

Dr. Sabine Gehrlein diskutierte in der Abschluss-Session schließlich die „Nutzersicht“. Als Vermittlerin zwischen Daten und Datennutzenden nimmt die Bibliothek eine Scharnierfunktion ein, die bspw. den Zugang zu Datenbanken anbietet oder bei Vertragsabschlüssen unterstützt. Wünschenswert wären im Bereich des Datenzugangs insbesondere Vereinfachungen und Standardisierungen auf rechtlicher wie technischer Ebene, sodass für die Forschung ein niedrigschwelliger und zeitgemäßer Zugriff auf die Daten möglich ist.

Dialogveranstaltung zur NFDI am 6.10.2020

Die Landesrektorenkonferenz der Universitäten NRW und der Landesinitiative für Forschungsdatenmanagement fdm.nrw hatte am 6.10.2020 zur virtuellen Dialogveranstaltung zur NFDI eingeladen. Von BERD@BW nahm Dr. Sabine Gehrlein an der Gesprächsrunde zum Thema „Was bringt uns die NFDI in NRW?“ als Diskutandin teil.

Hier gibt es einen ausführlichen Bericht zur Dialogveranstaltung auf den Webseiten der Landesinitiative für Forschungsdatenmanagement fdm.nrw.

82. Jahrestagung des Verbands der Hochschullehrer für Betriebswirtschaft

Vom 17.03.-20.03.2020 fand die 82. Jahrestagung des Verbands der Hochschullehrer für Betriebswirtschaft (VHB) statt. Eigentlich sollte die Tagung in Frankfurt/Main „über die Bühne“ gehen, aber infolge der Kontaktbeschränkungen zur Eindämmung des Coronavirus wurde sie als reine Online-Tagung durchgeführt. Für die Veranstalter war es sicherlich eine große Hau-Ruck-Aktion, diese „Digital Transformation“ im Sinne des Tagungsmottos relativ kurzfristig zu stemmen. Die Vorträge wurden in Web-Konferenzen präsentiert, parallel konnte man sich über den Chat der Tagungs-App austauschen und verschiedene Web-Meetings fanden statt. Nach meinen eigenen Erfahrungen bei der Teilnahme an der Tagung haben Technik und Ablauf ziemlich gut funktioniert. Hut ab vor den Organisatoren und den Helfern!

Vom BERD@BW-Projekt war Dr. Georg Licht mit einem Vortrag über BERD in der Session „Forschungsinfrastrukturen in BWL und Finance“ vertreten, um unseren Ansatz für unstrukturierte Daten (Bild, Video, Audio, Text) in den Wirtschaftswissenschaften vorzustellen. Ausgehend von der Tatsache, dass diese in der Forschung zunehmend wichtiger werden, soll mit BERD eine Infrastruktur entstehen, die (wirtschafts-)wissenschaftliche Daten aller Art und deren Auswertungsalgorithmen integriert. Auf diese Weise wird die Replizierbarkeit von Analyseergebnissen vereinfacht und neue Forschung durch eine erleichterte Nachnutzung der Daten und Algorithmen stimuliert. Der Fokus liegt dabei auf dem gesamten Forschungsprozess vom Preprocessing der Daten über die eigentliche Analyse bis hin zur Archivierung und ggf. Publikation, jeweils mit der Bereitstellung von entsprechender Rechen- und Speicherkapazität und unter Berücksichtigung der gängigen Standards bzgl. Datenaustausch und Metadaten. Als Initiative aus der Wissenschaft heraus, sind BERD das community involvement und die Nutzerzentriertheit ein besonderes Anliegen.

Weitere Vorträge, Workshops und Sessions bei der VHB Jahrestagung zum Machine Learning, Big Data, Textanalyse mittels Phython usw. bestätigen die Bedeutung von unstrukturierten Daten und entsprechenden Auswertungsmethoden für die betriebswirtschaftliche Forschung.

Das Tagungsprogramm mit Downloadbereich findet sich hier.