Archiv der Kategorie: News

BERD@BW-Team erreicht Platz 3 bei der SemTab-Challenge 2020

Ein Team rund um BERD@BW-Data-Scientist Renat Shigapov hat mit der selbst entwickelten Software „boosted by wiki“ (bbw) bei der „Semantic Web Challenge on Tabular Data to Knowledge Graph Matching“ (SemTab-Challenge) teilgenommen und dort einen hervorragenden 3. Platz erreicht. Wir freuen uns sehr über dieses großartige Ergebnis!

In der Challenge ging es darum, einen Code zu entwickeln, der Tabellendaten (CSV-Dateien) mit Knowledge-Graph-Daten (z.B. Wikidata) abgleicht und mit deren Hilfe semantisch annotiert. Die verschiedenen Lösungen wurden in vier Runden anhand einer Vielzahl von Tabellendaten einem Benchmarking unterzogen. Herausforderungen in den Daten waren mehr oder weniger „unsaubere“ Angaben, d.h. fehlende Metadaten in den Tabellen (bspw. keine Spalten-/Zeilenbezeichnungen), unvollständige, fehlerhafte oder doppeldeutige Daten. Die Challenge war an die 19. International Semantic Web Conference (ISWC) und den 15. International Workshop on Ontology Matching (OM-2020) angegliedert.

Bei uns im BERD@BW-Projekt hat der bbw-Algorithmus auch praktisch eine große Bedeutung. So können wir Tabellen, die Firmendaten enthalten, mit unserem Open Firm Knowledge Graph matchen, den wir mit Wikibase umgesetzt haben. Auf diese Weise können wir zum einen den Knowledge Graph aktualisieren und anreichern, aber auch eine Entitätenidentifikation in CSV-Datensätzen durchführen, was ein Datenlinking verschiedener Datensätze stark erleichtert, oder Daten in CSV-Tabellen anreichern. Hierfür ist perpektivisch auch ein Webservice zur Nachnutzung für Forschende angedacht. Die Matching-Qualität spielt hierbei natürlich eine große Rolle. Insofern freut es uns sehr, dass unser bbw-Algorithmus in der internationalen und hochrangig besetzten Challenge im Benchmarking so gut abgeschnitten hat.

Jura-Studierende(r) als geprüfte wissenschaftliche Hilfskraft für BERD@BW gesucht!

Sie haben einen Abschluss als Bachelor of Law Unternehmensjurist/in (LL.B.) oder vergleichbar und Interesse an rechtlichen Fragestellungen des Forschungsdatenmanagements?

Für das BERD@BW-Team an der Universitätsbibliothek Mannheim suchen wir zum nächstmöglichen Zeitpunkt eine/einen Studierenden der Rechtswissenschaft als geprüfte wissenschaftliche Hilfskraft (m/w/d). Die Stelle ist zunächst auf 4 Monate befristet und umfasst mind. 30, idealerweise 40 Stunden im Monat.

Weitere Details finden Sie in der Stellenausschreibung.

Einführung in das bwForCluster MLS&WISO

Am 23. und 24. November findet eine Online-Einführung in die Benutzung des High-Performance-Computing-Clusters bwForCluster MLS&WISO statt. bwForCluster MLS&WISO wird im Rahmend der bwHPC-Infrastruktur gemeinsam von der Universitäts-IT Mannheim sowie dem Rechenzentren der Universität Heidelberg betrieben und bietet Hochleistungsrechenkapazitäten u.a. für die Wirtschafts- und Sozialwissenschaften an. Die Nutzung von bwForCluster MLS&WISO steht Universitätsanghörigen in Baden-Württemberg offen; Wie Sie Zugang erhalten können, können Sie auf im Wiki von bwForCluster nachlesen.

Bei Interesse können Sie sich bwHPC-Schulungsplattform zu dem Kurs anmelden (Kursangebot > Kurse > Introduction to MLS&WISO). Fragen rund um die Schulung und bwForCluster beantwortet Ihnen gerne das MLS&WISO-Team.

29. Wissenschaftliches Kolloquium des Statistischen Bundesamts

Beim 29. Wissenschaftlichen Kolloquium des Statistischen Bundesamts vom 10.-12.11.2020 war – dem Leitthema „Data Science für eine evidenzbasierte Wirtschafts- und Sozialpolitik“ entsprechend – auch das BERD (@BW und @NFDI)-Team mir Dr. Sabine Gehrlein, Prof. Dr. Frauke Kreuter, Prof. Dr. Goeran Kauermann und Prof. Dr. Florian Stahl stark vertreten.

Nach der Einführung in das Thema durch Prof. Dr. Kreuter wurde in der ersten Session von dem Trio Prof. Kauermann, Müller und Prof. Stahl die Frage „Data Science: Was ist das?“ diskutiert. Einigkeit herrschte hierbei, dass Data Science zwar durchaus Schnittstellen mit der statistischen Datenanalyse hat, jedoch auch ganz eigene und neue Herausforderungen mit sich bringt, für die nicht nur reines Methodenwissen, sondern auch ein gewisses Domänenwissen erforderlich sind. Data Science-Methoden sollten daher tief in die Fachstudiengänge verankert werden.

Dr. Sabine Gehrlein diskutierte in der Abschluss-Session schließlich die „Nutzersicht“. Als Vermittlerin zwischen Daten und Datennutzenden nimmt die Bibliothek eine Scharnierfunktion ein, die bspw. den Zugang zu Datenbanken anbietet oder bei Vertragsabschlüssen unterstützt. Wünschenswert wären im Bereich des Datenzugangs insbesondere Vereinfachungen und Standardisierungen auf rechtlicher wie technischer Ebene, sodass für die Forschung ein niedrigschwelliger und zeitgemäßer Zugriff auf die Daten möglich ist.

Dialogveranstaltung zur NFDI am 6.10.2020

Die Landesrektorenkonferenz der Universitäten NRW und der Landesinitiative für Forschungsdatenmanagement fdm.nrw hatte am 6.10.2020 zur virtuellen Dialogveranstaltung zur NFDI eingeladen. Von BERD@BW nahm Dr. Sabine Gehrlein an der Gesprächsrunde zum Thema „Was bringt uns die NFDI in NRW?“ als Diskutandin teil.

Hier gibt es einen ausführlichen Bericht zur Dialogveranstaltung auf den Webseiten der Landesinitiative für Forschungsdatenmanagement fdm.nrw.

Mannheim Open Science Meetup am 29.07.2020

Beim Mannheim Open Science Meetup waren wir von BERD@BW am 29.7.2020 mit einem Vortrag zu Rechtsfragen bei Open Science vertreten. Das Mannheim Open Science Meetup ist eine interdisziplinäre Graswurzelbewegung Mannheimer Wissenschaftlerinnen und Wissenschaftler, die sich der Förderung von Open Science durch Information und Vernetzung widmet. Aktuell finden die monatlichen Treffen online statt.

Programm des Meetups war ein Schlaglicht-Vortrag zu rechtlichen Fragestellungen und deren Handhabung im Bereich Open Science von Julia Wildgans und Lars Oberländer mit anschließender Diskussion. Der Fokus lag hierbei auf einer Sensibilisierung von Forschenden für Regelungen aus dem Bereich Urheberrecht und Datenschutz und insbesondere den Möglichkeiten im Bereich Nachnutzbarkeit und Veröffentlichung.

Als wichtigste Take-Away-Message wurde auf die Verhandlungsmöglichkeit von publizierenden Wissenschaftlern bezüglich ihrer Rechteinhaberschaft an der Forschungsarbeit gegenüber wissenschaftlichen Verlagen hingewiesen. Als Appell im Sinne von Open Science wird von der Übertragung exklusiver Rechte abgeraten um Zweitveröffentlichungen zu ermöglichen.

Darüber hinaus wurden Fragestellungen bezüglich urheberrechtlicher Beschränkungen von Nutzung fremder Werke, die Bedeutung und Anwendung von Lizenzen, Modalitäten der Veröffentlichung eigener Werke und Daten sowie aus dem Datenschutzrecht Fragen der Identifizierbarkeit und Abgrenzung und Bedeutung von Pseudonymisierung und Anonymisierung beleuchtet.

In der anschließenden Diskussion fand ein reger Austausch zwischen den Teilnehmenden statt, was das Interesse der Mannheimer Wissenschaftslandschaft für Open Science und deren Förderung widerspiegelt.

KIM-Workshop

Am 4. und 5. Mai 2020 fand der diesjährige KIM-Workshop (KIM steht für Kompetenzzentrum Interoperable Metadaten) statt. Aus gegebenem Anlass wurde der Workshop mit einem abgespeckten Programm virtuell abgehalten.

Mit BERD@BW waren wir in der Session “Daten aus Kultur und Wissenschaft in Wikibase” mit einem Vortrag unter dem Titel „BERD mit Wikibase: Instanzierung einer Wirtschaftsontologie im Wikiversum“ mit dabei. In unserem Vortrag haben wir erläutert, warum und wie wir die Wikibase-Software für die Ontologieentwicklung und im Frontend einsetzen. Die Ontologie soll Firmen und deren Identifikatoren inklusive deren Quelle und Gültigkeit, sowie bestimmte Beziehungen zwischen den Firmen darstellen. Aufgrund der einfachen Handhabung mit Referenzen, Änderungsverlauf und mehrsprachigen Elementen fiel die Wahl auf Wikibase als geeignetes Werkzeug für unsere Anforderungen. Die Datenabfrage funktioniert u.a. über ein Frontend, welches wir mittels der Flask-Bibliothek in Python über die SPARQL-Schnittstelle von Wikibase implementiert haben. Erste Tests zeigen, dass Wikibase und Python, die über einen SPARQL-Endpunkt verbunden sind, für relativ kleine Datenbanken auch bei vielen Werten pro Eigenschaft eine gute Performance aufweisen. Es sind jedoch weitere Tests erforderlich, um die Performance der Datenbank und des Frontends umfassend zu klären.

In der Session gab es zwei weitere Vorträge zu Anwendungen der Wikibase. Sarah Hartmann und Hans-Jürgen Becker von der Deutschen Nationalbibliothek berichteten von ihrer Evaluation der Wikibase-Software für die GND-Daten. Alan Riedel und Johannes Sperling von der SLUB Dresden testen Wikibase dagegen als mögliches Tool, das Forschenden die Ontologie-Erstellung erleichtern könnte und Datenabfragen sowie -visualisierung ermöglicht.
Zum Abschluss des Workshops bildete sich eine Interessengruppe aus den KIM-Workshop-Teilnehmern, die zukünftig regelmäßig Erfahrungen in der Anwendung mit Wikibase austauschen wollen. Weitere Interessenten sind natürlich gerne willkommen.

82. Jahrestagung des Verbands der Hochschullehrer für Betriebswirtschaft

Vom 17.03.-20.03.2020 fand die 82. Jahrestagung des Verbands der Hochschullehrer für Betriebswirtschaft (VHB) statt. Eigentlich sollte die Tagung in Frankfurt/Main „über die Bühne“ gehen, aber infolge der Kontaktbeschränkungen zur Eindämmung des Coronavirus wurde sie als reine Online-Tagung durchgeführt. Für die Veranstalter war es sicherlich eine große Hau-Ruck-Aktion, diese „Digital Transformation“ im Sinne des Tagungsmottos relativ kurzfristig zu stemmen. Die Vorträge wurden in Web-Konferenzen präsentiert, parallel konnte man sich über den Chat der Tagungs-App austauschen und verschiedene Web-Meetings fanden statt. Nach meinen eigenen Erfahrungen bei der Teilnahme an der Tagung haben Technik und Ablauf ziemlich gut funktioniert. Hut ab vor den Organisatoren und den Helfern!

Vom BERD@BW-Projekt war Dr. Georg Licht mit einem Vortrag über BERD in der Session „Forschungsinfrastrukturen in BWL und Finance“ vertreten, um unseren Ansatz für unstrukturierte Daten (Bild, Video, Audio, Text) in den Wirtschaftswissenschaften vorzustellen. Ausgehend von der Tatsache, dass diese in der Forschung zunehmend wichtiger werden, soll mit BERD eine Infrastruktur entstehen, die (wirtschafts-)wissenschaftliche Daten aller Art und deren Auswertungsalgorithmen integriert. Auf diese Weise wird die Replizierbarkeit von Analyseergebnissen vereinfacht und neue Forschung durch eine erleichterte Nachnutzung der Daten und Algorithmen stimuliert. Der Fokus liegt dabei auf dem gesamten Forschungsprozess vom Preprocessing der Daten über die eigentliche Analyse bis hin zur Archivierung und ggf. Publikation, jeweils mit der Bereitstellung von entsprechender Rechen- und Speicherkapazität und unter Berücksichtigung der gängigen Standards bzgl. Datenaustausch und Metadaten. Als Initiative aus der Wissenschaft heraus, sind BERD das community involvement und die Nutzerzentriertheit ein besonderes Anliegen.

Weitere Vorträge, Workshops und Sessions bei der VHB Jahrestagung zum Machine Learning, Big Data, Textanalyse mittels Phython usw. bestätigen die Bedeutung von unstrukturierten Daten und entsprechenden Auswertungsmethoden für die betriebswirtschaftliche Forschung.

Das Tagungsprogramm mit Downloadbereich findet sich hier.

Forschungsdatenzentrum (FDZ) eingerichtet

Das im Rahmen des BERD@BW-Projekts neu eingerichtete Forschungsdatenzentrum (FDZ) der Universitätsbibliothek (UB) Mannheim bündelt die Aktivitäten der Bibliothek auf diesem Gebiet. Thematischer Schwerpunkt sind Daten aus dem Bereich der Wirtschafts- und Sozialwissenschaften.

Das FDZ bietet Forschenden Zugang zum Datenangebot der UB:

Das FDZ beteiligt sich an innovativen Projekten in den Bereichen Digitalisierung, Konversion, OCR, Verknüpfung, Erschließung und Archivierung von Forschungsdaten:

Das FDZ berät zum Themenkomplex Forschungsdaten sowie Datenarchivierung und -publikation auf MADATA:

Bei Fragen zum Thema Forschungsdaten hilft das FDZ-Team gerne weiter (fdz@bib.uni-mannheim.de).