aureka, die Plattform für audio(visuelle) Forschung. Ein Interview mit den Gründer:innen Cecilia, Jan und Felix

Vor eineinhalb Jahren habt ihr euch entschlossen, den steilen Weg des Unternehmertums zu gehen, um aureka zu entwickeln. Was hat euch dazu motiviert?

Cecilia: “Alles fing damit an, dass Jan und ich in unserer Zeit als Promovierende keine guten digitalen Werkzeuge fanden, um mit audio(visuellen) Medien zu forschen. In meiner Promotion forschte ich zur Geschichte der Technologien der Ton- und Filmaufnahme im späten 19. und der ersten Hälfte des 20. Jahrhunderts und arbeitete entsprechend viel mit Video- und Tonaufnahmen. Ich hatte oft große Schwierigkeiten, an die Quellen zu kommen, die für meine Forschung erforderlich waren. Ich musste dafür viele E-Mails senden, dann zu den Archiven persönlich fahren und viele Stunden Audios anhören, um relevante Informationen zu finden. Das war sehr frustrierend. Parallel beobachtete ich jedoch, wie die technologischen Grundlagen in dem Bereich sich rasant weiterentwickelten. Da habe ich mich gefragt, warum gibt es denn noch nicht ein Werkzeug dafür?”

Jan: “Als dann der Lockdown kam und Gedächtnisinstitutionen komplett schließen mussten, war uns klar, dass der Zeitpunkt gekommen war, die Idee auszuprobieren. Wir suchten daher nach weiteren Mitstreiter:innen und nach Fördermittel, die uns ermöglichen würden, ein Prototyp zu erstellen und unsere Idee zu testen.”

Felix: “Ich kam dazu als ich mitbekam, dass das Team nach Unterstützung im Backend suchte. Ich hatte davor schon in Start-ups gearbeitet und wusste, ich möchte selbst etwas aufbauen. Was mich besonders an der Produktidee angesprochen hat, ist, dass es Methoden des Deep Learning für einen gesellschaftlichen Zweck einsetzt, indem aureka dazu beiträgt, kulturelles Erbe zu erhalten und zugänglich zu machen als auch die Forschung mit audio(visuellen) Medien unterstützt. Für mich ist es sehr wichtig, Produkte zu entwickeln, die unseren Gesellschaften einen realen Mehrwert bieten sowie in einem Team zu arbeiten, das auf eine ausgewogene und motivierende Arbeitsatmosphäre achtet. Beides habe ich in aureka gefunden und gestalte es seitdem mit.”

Cecilia, wenn du von technologischen Grundlagen sprichst, was meinst du genau? Wie funktioniert eure Plattform?

Cecilia: “In den letzten Jahren haben wir große Fortschritte in der Entwicklung von Sprachtechnologien beobachtet, die es ermöglichen, die gesprochenen Teile einer Aufnahme zu erkennen und automatisch zu transkribieren. Auf der Grundlage dieser Transkripte lassen sich viele weitere automatischen Analysen durchführen, wie z.B. Eigennamen erkennen von Orten, Personen und Zeitangaben”.

Felix: “Die Architektur unserer Plattform funktioniert so, dass eine Aufnahme hochgeladen wird, die daraufhin automatische transkribiert wird. Die erstellte Transkription bietet die Grundlage für alle weiteren Recherchefunktionen, sie ermöglicht bspw. dateiübergriefende Suchen als auch die Suche innerhalb der Dateien. Forscher:innen können ein Stichwort in unsere Suchmaske eingeben und erhalten einen Überblick aller Dateien wo dieses Wort und dessen Ableitungen vorkommen. Weiter können sie in der Einzelansicht einer Datei direkt im Transkript suchen und werden durch die Synchronisation der Audio bzw. Videospur mit dem Transkript immer direkt an die Orte geführt, wo die Begriffe auftauchen. Darüber hinaus bietet unsere Plattform auch automatisch generierte Überblicke der Inhalte als Rechercheunterstützung. Mittels Natural Language Processing werden Begriffe identifiziert, die besonders oft vorkommen und in Themen geclustert. Dass ist besonders bei großen Sammlungen von Vorteil, da Nutzer:innen dadurch gleich eine Idee erhalten, worüber in den Audios und Videos gesprochen wird. Mit diesen und weiteren kollaborativen Funktionen eröffnen wir neuartige Recherchemöglichkeiten im Umgang mit audio(visuellen) Medien.”

Jan: “Ein weiterer wichtiger Aspekt unserer Rechercheumgebung, der uns von anderen Anbieter:innen unterscheidet ist das Thema der Transparenz, der uns sehr wichtig ist! Als Sozialwissenschaftler:innen wissen wir, dass Technologien nicht frei sind von Biases. Deswegen legen wir wert darauf unsere Plattform so zu gestalten, dass Nutzer:innen aufgeklärt werden, wie die Daten von der Software generiert werden, mit denen sie arbeiten. Das ist wichtig einerseits um mögliche Biases frühzeitig zu erkennen bzw. bei der Analyse der Daten berücksichtigen zu können, andererseits möchten wir dadurch gewährleisten, dass unsere Kund:innen stets die Kontrolle und Souveränität über ihre Daten behalten. Erklärbarkeit… Mentorship der Human-Centered Computing Research Group.”

Wie war bisher der Draht zu potenziellen Kund:innen und Nutzer:innen eurer Plattform?

Felix: “Unser Produkt ist für Forscher:innen, Archivar:innen und Journalist:innen, die mit audio(visuellen) Quellen wie Interviews, Radio- und Fersehsendungen arbeiten gedacht. Gleich zu Beginn haben wir den Kontakt zu einem Archiv gesucht, da es uns wichtig war, unsere Software entlang ihren realen Anforderungen zu konzipieren und entwickeln. Im feministischen Archiv FFBIZ haben wir einen hilfsbereiten und [Adjektiv, vielleicht etwas mit Offenheit für Innovation/Technick?] Kooperationspartner gefunden. Das FFBIZ stellte uns ihre Radiosammlung “Dissonanzen” zur Verfügung, die aus etwa … besteht, mithilfe derer wir einen ersten Protoypen der Plattform erstellen konnten.

Jan: “Das führte dazu, dass wir auch das Interesse des Deutschen Digitalen Frauenarchivs wecken konnten, ein Dachverband das über 40 feministische Archive aus dem deutschsprachigen Raum vereint. Auf ihrem Meta-Katalog, dass sich speziell auf die Forschung im Bereich der Frauen- und Lesbenbewegungen fokussiert, führten wir in enger Zusammenarbeit die Einbindung des ersten Prototypens aus. Dadurch konnten wir … Zwei wichtige Aspekte von vornherein angegangen, interne Erschließungsarbeit und die Erweiterung der Recherchemöglichkeiten für externe Nutzer:innen, konkret für Forscher:innen.”

Cecilia: “Gerade arbeiten wir mit Gumelab…”

Was steht für euch nun bevor? Was sind die nächsten Schritte?

Cecilia: “Wir haben gerade unseren Website relauncht jetzt wo unserer Minimal Viable Product steht und sind nun auf der Suche nach…

Felix: “Parallel dazu führen wir gerade das Projekt SheeshCheck durch bei digital.engagiert durch, dass darauf abzielt jungen Menschen … und gleichzeitig ein Datensatz aufzubauen, mit dem Sprachmodelle traniert werden können um besser deutsche Jugendsprache und Kiezdeutsch zu erkennen.”

Jan: “Es ist eine besonders spannende Zeit, denn jetzt steht das Produkt zu …

Die Interviewten:

Cecilia Maas ist Historikerin, bei aureka übernimmt sie die Aufgaben des General und Produkt Managements. Sie promovierte in…

Felix Mertineit ist Wirtschaftsinformatiker und bei aureka verantwortlich für die Technische Entwicklung und Management. Sein Schwerpunkt liegt bei….

Jan Ullrich ist Politikwissenschaftler und ist für die Kund:innenakquise sowie die Organisationsentwicklung bei aureka zuständig. Sein Fokus liegt…