Archiv der Kategorie: News

Interaktiver Virtueller Assistent zum Thema DSGVO online

Unser erster Interaktiver Virtueller Assistent (IVA) ist online (klicken Sie hier)! Das erste Modul dreht sich um die Frage, in welchen Fällen die Datenschutzgrundverordnung (DSGVO) überhaupt Anwendung findet. Forschenden wird damit die Beurteilung erleichtert, ob ein Forschungsprojekt datenschutzrechtlich problematisch sein könnte. Nach Art eines asynchronen Online-Workshops werden Forschende anhand von Fragen durch den Themenkomplex geleitet, die sie – bei Bedarf mit Unterstützung von Tooltips – vor dem Hintergrund des eigenen Forschungsprojekts beantworten und so zu einer Einschätzung zur Anwendbarkeit der DSGVO kommen können.

Datenschutz- und Urheberrechtsregelungen sind im Rahmen des Forschungsdatenmanagements in den Wirtschafts- und Sozialwissenschaften regelmäßig relevant. Der Zugang zu den rechtlichen Regelungen gestaltet sich jedoch für Nicht-Juristen häufig schwer und nicht selten unterbleibt eine Publikation, das Teilen und schlimmstenfalls auch die Archivierung von Daten „sicherheitshalber“. Daher entwickeln wir in BERD@BW Interaktive Virtuelle Assistenten (IVA), die helfen sollen, einen Zugang zu den grundlegenden rechtlichen Regelungen zu finden.

Online-Kurs „Matlab on HPC“ am 10. Dezember

Am 10. Dezember bietet das Höchstleistungsrechenzentrum Stuttgart via Webex von 9-16 Uhr den Kurs „Matlab on HPC“ an. Schwerpunkte des Kurses liegen insbesondere auf grundlegenden Prinzipien des parallelen Programmierens, Vektorisierens und Optimierens mit Matlab sowie auf der Nutzung von Matlab auf bwUniCluster 2.0.

Eine ausführliche Beschreibung des Kurses finden Sie auf der bwHPC-Schulungsplattform (Kurse -> Matlab on HPC), die Teilnehmerzahl ist begrenzt. Um sich zum Kurs anzumelden, ist zunächst eine Registrierung auf der bwHPC-Schulungsplattform nötig („Entitlement“ beantragen). Sinnvoll ist es zudem, bereits einen Zugang zu einem bwHPC-Cluster zu haben. Wie Sie sich diesen einrichten lassen können, wird im bwHPC-Wiki beschrieben.

BERD@BW-Team erreicht Platz 3 bei der SemTab-Challenge 2020

Ein Team rund um BERD@BW-Data-Scientist Renat Shigapov hat mit der selbst entwickelten Software „boosted by wiki“ (bbw) bei der „Semantic Web Challenge on Tabular Data to Knowledge Graph Matching“ (SemTab-Challenge) teilgenommen und dort einen hervorragenden 3. Platz erreicht. Wir freuen uns sehr über dieses großartige Ergebnis!

In der Challenge ging es darum, einen Code zu entwickeln, der Tabellendaten (CSV-Dateien) mit Knowledge-Graph-Daten (z.B. Wikidata) abgleicht und mit deren Hilfe semantisch annotiert. Die verschiedenen Lösungen wurden in vier Runden anhand einer Vielzahl von Tabellendaten einem Benchmarking unterzogen. Herausforderungen in den Daten waren mehr oder weniger „unsaubere“ Angaben, d.h. fehlende Metadaten in den Tabellen (bspw. keine Spalten-/Zeilenbezeichnungen), unvollständige, fehlerhafte oder doppeldeutige Daten. Die Challenge war an die 19. International Semantic Web Conference (ISWC) und den 15. International Workshop on Ontology Matching (OM-2020) angegliedert.

Bei uns im BERD@BW-Projekt hat der bbw-Algorithmus auch praktisch eine große Bedeutung. So können wir Tabellen, die Firmendaten enthalten, mit unserem Open Firm Knowledge Graph matchen, den wir mit Wikibase umgesetzt haben. Auf diese Weise können wir zum einen den Knowledge Graph aktualisieren und anreichern, aber auch eine Entitätenidentifikation in CSV-Datensätzen durchführen, was ein Datenlinking verschiedener Datensätze stark erleichtert, oder Daten in CSV-Tabellen anreichern. Hierfür ist perpektivisch auch ein Webservice zur Nachnutzung für Forschende angedacht. Die Matching-Qualität spielt hierbei natürlich eine große Rolle. Insofern freut es uns sehr, dass unser bbw-Algorithmus in der internationalen und hochrangig besetzten Challenge im Benchmarking so gut abgeschnitten hat.

Jura-Studierende(r) als geprüfte wissenschaftliche Hilfskraft für BERD@BW gesucht!

Sie haben einen Abschluss als Bachelor of Law Unternehmensjurist/in (LL.B.) oder vergleichbar und Interesse an rechtlichen Fragestellungen des Forschungsdatenmanagements?

Für das BERD@BW-Team an der Universitätsbibliothek Mannheim suchen wir zum nächstmöglichen Zeitpunkt eine/einen Studierenden der Rechtswissenschaft als geprüfte wissenschaftliche Hilfskraft (m/w/d). Die Stelle ist zunächst auf 4 Monate befristet und umfasst mind. 30, idealerweise 40 Stunden im Monat.

Die Bewerbungsfrist ist abgelaufen.

Einführung in das bwForCluster MLS&WISO

Am 23. und 24. November findet eine Online-Einführung in die Benutzung des High-Performance-Computing-Clusters bwForCluster MLS&WISO statt. bwForCluster MLS&WISO wird im Rahmend der bwHPC-Infrastruktur gemeinsam von der Universitäts-IT Mannheim sowie dem Rechenzentren der Universität Heidelberg betrieben und bietet Hochleistungsrechenkapazitäten u.a. für die Wirtschafts- und Sozialwissenschaften an. Die Nutzung von bwForCluster MLS&WISO steht Universitätsanghörigen in Baden-Württemberg offen; Wie Sie Zugang erhalten können, können Sie auf im Wiki von bwForCluster nachlesen.

Bei Interesse können Sie sich bwHPC-Schulungsplattform zu dem Kurs anmelden (Kursangebot > Kurse > Introduction to MLS&WISO). Fragen rund um die Schulung und bwForCluster beantwortet Ihnen gerne das MLS&WISO-Team.

29. Wissenschaftliches Kolloquium des Statistischen Bundesamts

Beim 29. Wissenschaftlichen Kolloquium des Statistischen Bundesamts vom 10.-12.11.2020 war – dem Leitthema „Data Science für eine evidenzbasierte Wirtschafts- und Sozialpolitik“ entsprechend – auch das BERD (@BW und @NFDI)-Team mir Dr. Sabine Gehrlein, Prof. Dr. Frauke Kreuter, Prof. Dr. Goeran Kauermann und Prof. Dr. Florian Stahl stark vertreten.

Nach der Einführung in das Thema durch Prof. Dr. Kreuter wurde in der ersten Session von dem Trio Prof. Kauermann, Müller und Prof. Stahl die Frage „Data Science: Was ist das?“ diskutiert. Einigkeit herrschte hierbei, dass Data Science zwar durchaus Schnittstellen mit der statistischen Datenanalyse hat, jedoch auch ganz eigene und neue Herausforderungen mit sich bringt, für die nicht nur reines Methodenwissen, sondern auch ein gewisses Domänenwissen erforderlich sind. Data Science-Methoden sollten daher tief in die Fachstudiengänge verankert werden.

Dr. Sabine Gehrlein diskutierte in der Abschluss-Session schließlich die „Nutzersicht“. Als Vermittlerin zwischen Daten und Datennutzenden nimmt die Bibliothek eine Scharnierfunktion ein, die bspw. den Zugang zu Datenbanken anbietet oder bei Vertragsabschlüssen unterstützt. Wünschenswert wären im Bereich des Datenzugangs insbesondere Vereinfachungen und Standardisierungen auf rechtlicher wie technischer Ebene, sodass für die Forschung ein niedrigschwelliger und zeitgemäßer Zugriff auf die Daten möglich ist.

Dialogveranstaltung zur NFDI am 6.10.2020

Die Landesrektorenkonferenz der Universitäten NRW und der Landesinitiative für Forschungsdatenmanagement fdm.nrw hatte am 6.10.2020 zur virtuellen Dialogveranstaltung zur NFDI eingeladen. Von BERD@BW nahm Dr. Sabine Gehrlein an der Gesprächsrunde zum Thema „Was bringt uns die NFDI in NRW?“ als Diskutandin teil.

Hier gibt es einen ausführlichen Bericht zur Dialogveranstaltung auf den Webseiten der Landesinitiative für Forschungsdatenmanagement fdm.nrw.

Mannheim Open Science Meetup am 29.07.2020

Beim Mannheim Open Science Meetup waren wir von BERD@BW am 29.7.2020 mit einem Vortrag zu Rechtsfragen bei Open Science vertreten. Das Mannheim Open Science Meetup ist eine interdisziplinäre Graswurzelbewegung Mannheimer Wissenschaftlerinnen und Wissenschaftler, die sich der Förderung von Open Science durch Information und Vernetzung widmet. Aktuell finden die monatlichen Treffen online statt.

Programm des Meetups war ein Schlaglicht-Vortrag zu rechtlichen Fragestellungen und deren Handhabung im Bereich Open Science von Julia Wildgans und Lars Oberländer mit anschließender Diskussion. Der Fokus lag hierbei auf einer Sensibilisierung von Forschenden für Regelungen aus dem Bereich Urheberrecht und Datenschutz und insbesondere den Möglichkeiten im Bereich Nachnutzbarkeit und Veröffentlichung.

Als wichtigste Take-Away-Message wurde auf die Verhandlungsmöglichkeit von publizierenden Wissenschaftlern bezüglich ihrer Rechteinhaberschaft an der Forschungsarbeit gegenüber wissenschaftlichen Verlagen hingewiesen. Als Appell im Sinne von Open Science wird von der Übertragung exklusiver Rechte abgeraten um Zweitveröffentlichungen zu ermöglichen.

Darüber hinaus wurden Fragestellungen bezüglich urheberrechtlicher Beschränkungen von Nutzung fremder Werke, die Bedeutung und Anwendung von Lizenzen, Modalitäten der Veröffentlichung eigener Werke und Daten sowie aus dem Datenschutzrecht Fragen der Identifizierbarkeit und Abgrenzung und Bedeutung von Pseudonymisierung und Anonymisierung beleuchtet.

In der anschließenden Diskussion fand ein reger Austausch zwischen den Teilnehmenden statt, was das Interesse der Mannheimer Wissenschaftslandschaft für Open Science und deren Förderung widerspiegelt.

KIM-Workshop

Am 4. und 5. Mai 2020 fand der diesjährige KIM-Workshop (KIM steht für Kompetenzzentrum Interoperable Metadaten) statt. Aus gegebenem Anlass wurde der Workshop mit einem abgespeckten Programm virtuell abgehalten.

Mit BERD@BW waren wir in der Session “Daten aus Kultur und Wissenschaft in Wikibase” mit einem Vortrag unter dem Titel „BERD mit Wikibase: Instanzierung einer Wirtschaftsontologie im Wikiversum“ mit dabei. In unserem Vortrag haben wir erläutert, warum und wie wir die Wikibase-Software für die Ontologieentwicklung und im Frontend einsetzen. Die Ontologie soll Firmen und deren Identifikatoren inklusive deren Quelle und Gültigkeit, sowie bestimmte Beziehungen zwischen den Firmen darstellen. Aufgrund der einfachen Handhabung mit Referenzen, Änderungsverlauf und mehrsprachigen Elementen fiel die Wahl auf Wikibase als geeignetes Werkzeug für unsere Anforderungen. Die Datenabfrage funktioniert u.a. über ein Frontend, welches wir mittels der Flask-Bibliothek in Python über die SPARQL-Schnittstelle von Wikibase implementiert haben. Erste Tests zeigen, dass Wikibase und Python, die über einen SPARQL-Endpunkt verbunden sind, für relativ kleine Datenbanken auch bei vielen Werten pro Eigenschaft eine gute Performance aufweisen. Es sind jedoch weitere Tests erforderlich, um die Performance der Datenbank und des Frontends umfassend zu klären.

In der Session gab es zwei weitere Vorträge zu Anwendungen der Wikibase. Sarah Hartmann und Hans-Jürgen Becker von der Deutschen Nationalbibliothek berichteten von ihrer Evaluation der Wikibase-Software für die GND-Daten. Alan Riedel und Johannes Sperling von der SLUB Dresden testen Wikibase dagegen als mögliches Tool, das Forschenden die Ontologie-Erstellung erleichtern könnte und Datenabfragen sowie -visualisierung ermöglicht.
Zum Abschluss des Workshops bildete sich eine Interessengruppe aus den KIM-Workshop-Teilnehmern, die zukünftig regelmäßig Erfahrungen in der Anwendung mit Wikibase austauschen wollen. Weitere Interessenten sind natürlich gerne willkommen.

82. Jahrestagung des Verbands der Hochschullehrer für Betriebswirtschaft

Vom 17.03.-20.03.2020 fand die 82. Jahrestagung des Verbands der Hochschullehrer für Betriebswirtschaft (VHB) statt. Eigentlich sollte die Tagung in Frankfurt/Main „über die Bühne“ gehen, aber infolge der Kontaktbeschränkungen zur Eindämmung des Coronavirus wurde sie als reine Online-Tagung durchgeführt. Für die Veranstalter war es sicherlich eine große Hau-Ruck-Aktion, diese „Digital Transformation“ im Sinne des Tagungsmottos relativ kurzfristig zu stemmen. Die Vorträge wurden in Web-Konferenzen präsentiert, parallel konnte man sich über den Chat der Tagungs-App austauschen und verschiedene Web-Meetings fanden statt. Nach meinen eigenen Erfahrungen bei der Teilnahme an der Tagung haben Technik und Ablauf ziemlich gut funktioniert. Hut ab vor den Organisatoren und den Helfern!

Vom BERD@BW-Projekt war Dr. Georg Licht mit einem Vortrag über BERD in der Session „Forschungsinfrastrukturen in BWL und Finance“ vertreten, um unseren Ansatz für unstrukturierte Daten (Bild, Video, Audio, Text) in den Wirtschaftswissenschaften vorzustellen. Ausgehend von der Tatsache, dass diese in der Forschung zunehmend wichtiger werden, soll mit BERD eine Infrastruktur entstehen, die (wirtschafts-)wissenschaftliche Daten aller Art und deren Auswertungsalgorithmen integriert. Auf diese Weise wird die Replizierbarkeit von Analyseergebnissen vereinfacht und neue Forschung durch eine erleichterte Nachnutzung der Daten und Algorithmen stimuliert. Der Fokus liegt dabei auf dem gesamten Forschungsprozess vom Preprocessing der Daten über die eigentliche Analyse bis hin zur Archivierung und ggf. Publikation, jeweils mit der Bereitstellung von entsprechender Rechen- und Speicherkapazität und unter Berücksichtigung der gängigen Standards bzgl. Datenaustausch und Metadaten. Als Initiative aus der Wissenschaft heraus, sind BERD das community involvement und die Nutzerzentriertheit ein besonderes Anliegen.

Weitere Vorträge, Workshops und Sessions bei der VHB Jahrestagung zum Machine Learning, Big Data, Textanalyse mittels Phython usw. bestätigen die Bedeutung von unstrukturierten Daten und entsprechenden Auswertungsmethoden für die betriebswirtschaftliche Forschung.

Das Tagungsprogramm mit Downloadbereich findet sich hier.