BIGGR

Entwicklung eines nutzerfreundlichen Werkzeugs zur effizienten Workflow-basierten Analyse sehr großer Netzwerke und Graphen (Big Graph Data) für Datenanalysten

Motivation

Die Analyse sehr großer und netzartig strukturierter Datenmengen wie etwa biologischer oder sozialer Netzwerke gewinnt aktuell stark an Bedeutung. Diese auch als Graphen bezeichneten Datenstrukturen werden in vielen Bereichen immer mehr zu zentralen Betriebsmitteln, aus denen entscheidungsrelevante Informationen abgeleitet werden. Typische Abläufe sind dabei meist gekennzeichnet durch eine Verkettung von Datenimport-, Integrations-, Transformations- und Analyseschritten auf Graphen bis hin zur Visualisierung mit dem Ziel, mögliche Einflüsse und Beziehungen in den Daten zu identifizieren. Allerdings zeigt sich, dass klassische Data-Warehouse-Lösungen zu unflexibel sind und kaum Unterstützung für Analyseworkflows und Algorithmen bieten. So können nicht modellierte Abhängigkeiten und Kenngrößen in der Analyse nicht berücksichtigt werden, obwohl gerade neu entdeckte Beziehungen von großem Interesse sind. Andererseits stoßen derzeit verfügbare Graph-Datenbanken bei sehr großen Graphen an ihre Grenzen hinsichtlich Verarbeitung und Visualisierung. Die für große Datenmengen entwickelten Systeme bieten wiederum meist nur sehr technische Schnittstellen und Verarbeitungsmodelle für einfache Graphen. Zudem sind die genannten Datenbanken und Systeme bisher weitgehend wenig benutzerfreundlich und damit nur begrenzt einsetzbar.

Zielsetzung

Ziel des Verbundprojekts BIGGR ist es, ein neuartiges Softwaresystem zur benutzerfreundlichen und effizienten Analyse und Visualisierung von großen Daten-Graphen zu entwickeln. Das System soll für Datenanalysten ohne vertiefte technische Kenntnisse gut nutzbar sein. Dabei sollen Graph-Analyse-Workflows graphisch aus einfachen Analyseoperatoren definiert und auf leistungsfähigen Systemen ausgeführt werden können. Während der Ausführung werden Berechnungsfortschritte sowie Zwischen- und Analyseergebnisse visualisiert. Das Softwaresystem besteht aus einer Desktopanwendung zur Workflow-basierten Analyse großer Daten-Graphen, einer Ausführungsschicht und dem Analyse-Framework.

Grundlage sind neben Analyseworkflows, die KNIME Analytics Plattform sowie das Gradoop-Framework als Open Source verfügbare Systeme beider Partner, die gezielt angepasst, erweitert und kombiniert werden. Außerdem soll das System leicht um neue Operatoren, Ausführungszielsysteme und Visualisierungstechniken erweitert werden können. Die Praxistauglichkeit wird anhand von zweier realer Anwendungsfälle dem Erkennen von Wirkzusammenhängen von Medikamenten bzw. zur Prozessanalyse im Customer Relationship Management evaluiert. Durch die Open-Source-Stellung werden die Ergebnisse zur nutzerfreundlichen Analyse netzartig strukturierter Daten für Datenanalysten am Standort Deutschland breit ein-setzbar. Mit diesem Technologietransfer in die deutsche Wirtschaft werden intelligentere Unternehmensentscheidungen unterstützt und wirtschaftliche Verluste aufgrund von Fehlentscheidungen verringert.

Projektdaten

Laufzeit 01.02.2017 – 31.01.2019
Mittelgeber Bundesministerium für Bildung und Forschung (BMBF)
Förderkennzeichen 01 IS 16030 B
letzte Änderung: 02.03.2017

Hilfe

Servicedesk

Neues Augusteum
2. Etage, Raum A252

Telefon: +49 341 97-33333
E-Mail

Suche

Kontakt

Dr. Stefan Kühne

Telefon +49 341 97-32360
E-Mail