Im Projekt MANGAN erforscht das Universitätsrechenzentrum der Universität Leipzig gemeinsam mit den zwei Leipziger Unternehmen BUCHFUNK GmbH und ifabrik GmbH Verfahren zur Metadatenextraktion in Audioinhalten sowie darauf basierenden innovativen Suchansätzen.

zur Vergrößerungsansicht des Bildes: Illustration einer Person mit Kopfhörern auf.
Grafik: Universitätsrechenzentrum/MANGAN

Laufzeit: 01.04.2022 – 31.03.2025

Mittelgeber: Bundesministerium für Bildung und Forschung (BMBF)

Beteiligte Einrichtungen der Universität Leipzig:
Universitätsrechenzentrum (Abteilung Forschung und Entwicklung)

Projektbeschreibung

Voraussetzungen

Das Angebot gesprochener Audioinhalte steigt rasant: Hörbücher, Hörspiele aber auch Podcasts, Radioreportagen, gesprochene Inhalte von Printmedien und nicht zuletzt filmische Inhalte von der Talkshow über Dokus bis hin zu Spielfilmen basieren auf gesprochenen Audioinhalten.

Herausforderung

Die Inhalte müssen den Nutzern zugänglich gemacht und vor allem von diesen gefunden werden. Dabei ist eine einfache und präzise Extraktion von Metadaten notwendig, um die Inhalte effektiv und effizient in die Wertschöpfungskette integrieren zu können. Auf der anderen Seite spielen leistungsfähige und intuitive Suchansätze eine immer größere Rolle - insbesondere vor dem Hintergrund einer zunehmenden Individualisierung des Konsums.

Projektziele

Die Ziele des Vorhabens sind zwei zentrale Innovationsschritte im Bereich gesprochener Audioinhalte:

  1. Es werden Verfahren zur automatisierten Metadatenextraktion entwickelt und angewendet, bei der z.B. der Inhalt einer gesprochenen Audiodatei, aber auch andere Aspekte, wie die Stimmlage- und -alter der Sprechenden, indiziert werden.
  2. Auf Basis dieser Metadaten wird eine intuitive Suche entwickelt und erprobt. Nutzenden soll ein zielgerichteter, individueller Zugang zu gesprochenen Inhalten auf Basis des MIC-Profils (Mood, Intent, Context) – also eines Suchverfahrens, das auf Stimmungen, Absichten und Zusammenhängen basiert – ermöglicht werden. Das Vorhaben macht Audioinhalte unmittelbar attraktiver und sichtbarer und bildet so einen wichtigen Baustein für die Unabhängigkeit kleinerer Akteure in einem von internationalen IT-Konzernen dominierten Markt - und hat positive Strahlkraft für die gesamte Branche.

Konsortium und assoziierte Partner:innen

Das Konsortium umfasst drei Partner aus der Leipziger IT-, Medien- und Kreativwirtschaft, welche die Schwerpunkte Anwendung (BUCHFUNK), wissenschaftlich-technische Fragestellungen (Universitätsrechenzentrum der Universität Leipzig) sowie Implementierung (ifabrik) abdecken. Als assoziierte Partner unterstützen der Argon Verlag, das Streamingportal BookBeat, der Contentaggregator Zebralution, das Deutsche Zentrum für barrierefreies Lesen (DZB), die Buchhandelsgruppe Thalia sowie die MVB als Wirtschaftstochter des Börsenvereins des Deutschen Buchhandels das Konsortium bei der Anforderungserhebung, Evaluation und Verbreitung der Ergebnisse.

  • Thalia
  • Bookbeat
  • Argon Verlag
  • Zebralution
  • DZB
  • MVB

Projektförderung

Dieses Projekt wird gefördert vom BMBF im Rahmen des Programms kmuInnovativ unter dem FKZ 01IS22011.

Beteiligte Personen

Dr. Stephan Klingner

Dr. Stephan Klingner

Projektleiter

Augustusplatz 10
04109 Leipzig

Default Avatar

Mihail Miller

Wiss. Mitarbeiter

Dittrichring 18-20
04109 Leipzig

Default Avatar

Wolfgang Görs

Wiss. Mitarbeiter

Dittrichring 18-20
04109 Leipzig