aureka Blog

KI-Bilderzeugung für Museumsausstellungen nutzen

Geschrieben von Dr. Cecilia Maas | 12.03.2024 16:39:03

KI-generierte Bilder in einer Museumsausstellung? Für viele mag das zunächst unakzeptabel erscheinen. Traditionell gelten Museen als Hüter der Geschichte, der Wissenschaft und der Wahrheit. Sie haben jedoch auch die Verantwortung, kritisches Denken und Reflexion zu fördern. Warum also nicht das enorme Potenzial der KI nutzen, um den Besucher greifbare und erfahrbare "Was wäre wenn..."-Szenarien zu präsentieren?

Wir hatten das Vergnügen, ein KI-gestütztes Bilderzeugungssystem für die neu bearbeitete Dauerausstellung "BerlinZEIT" des Stadtmuseums Berlin zu entwickeln. Das Projektteam entschied sich für diese Übersichtsausstellung zur Berliner Geschichte für einen Epilog-Raum, in dem die Zukunft der Stadt mit Hilfe künstlicher Intelligenz dargestellt wird. Wie könnte sich Berlin in den nächsten 50 Jahren entwickeln? Wie sieht jeder Besucher als Berliner oder Tourist sein Berlin der Zukunft?

Zusammen mit den Entwicklern der Medienstation Panorama-B und dem Projektteam des Museums starteten wir die Entwicklung einer KI. Diese sollte den Ausstellungsbesuchern helfen, über mögliche Zukunftsszenarien nachzudenken. In diesem Beitrag teilen wir unsere Erkenntnisse und Erfahrungen aus der Entwicklung dieses KI-Bilderzeugungssystems für eine Museumsausstellung.

Wie generiert KI Bilder?

Bevor wir die Herausforderungen und Vorteile der Verwendung von KI-generierten Bildern in Museumsausstellungen diskutieren, ist es wichtig zu verstehen, wie die KI-Bilderzeugung funktioniert. Diese Modelle werden auf umfangreichen Datensätzen mit einer Vielzahl von Bildern trainiert, und sie lernen aus den Mustern, Formen, Texturen und Farben in den Daten.

Einige Systeme sind Text-Bild-Modelle. Sie wandeln Texteingaben in entsprechende Bilder um. Dabei wird der Text in eine mathematische Darstellung umgewandelt, die Kontext und Bedeutung der Wörter erfasst. Diese Darstellung dient dann als Eingabe für das Modell, um Bilder zu erzeugen.

Beispielsweise, wenn das Modell "ein realistisches Bild von Berlin mit Menschen, die in der Nähe des Brandenburger Tors radeln" erstellen soll, muss es diesen Text zuerst verstehen. Nach der Analyse von Millionen Textfragmenten, die das Wort "Fahrrad" enthalten, erkennt es, dass es sich um ein zweirädriges Fahrzeug handelt. Ebenso identifiziert es das "Brandenburger Tor" als ein monumentales Gebäude in Berlin mit einer türähnlichen Form und Säulen. Dann erzeugt das Modell ein Bild, das der Beschreibung entspricht, indem es sein erlerntes Wissen über Bildmerkmale nutzt und es auf die mathematische Darstellung der Wörter im Text abbildet. Es könnte Farbpixel-Kombinationen verwenden, die die Form eines Fahrrads darstellen, basierend auf anderen Bildern, die es gesehen hat, und so weite

Entwicklung von Zukunftsvisionen für das Stadtmuseum Berlin

Die Generierung von Zukunftsbildern mithilfe von KI stellt eine mehrschichtige Herausforderung dar. Die Zukunft von Städten hat seit langem das Interesse von Architekten, Künstlern, Historikern und vielen anderen geweckt. KI fügt dieser Faszination nun eine neue Dimension hinzu, indem sie ein Werkzeug bereitstellt, mit dem tausende von möglichen Stadtlandschaften generiert werden können. Jede dieser Landschaften spiegelt unterschiedliche Möglichkeiten und Ergebnisse wider und erlaubt uns, potenzielle Entwicklungen eingehend zu diskutieren.

Das Spektrum möglicher Zukunftsvorstellungen ist breit. Wir könnten sie als lineare Fortsetzung der aktuellen Trends betrachten oder radikale Veränderungen erwarten. Es besteht die Hoffnung, dass positive Aspekte der heutigen Realität sich verstärken oder dass negative Aspekte dominieren. Wir könnten uns Utopien oder Dystopien vorstellen.

Im Epilog-Raum der BerlinZEIT-Ausstellung wurde Berlin in etwa 50 Jahren dargestellt und eine optimistische Zukunft mit Fortschritten in der ökologischen Nachhaltigkeit gezeigt. Das Projektteam wollte den Besuchern verschiedene Visionen für die Zukunft der Stadt präsentieren. Würde es eine Stadt sein, in der die Gemeinschaft im Freien gedeiht, oder würden komfortable Wohnungen zu mehr Zeit in Innenräumen führen? Würden öffentliche Verkehrsmittel dominieren oder private Autos weiterhin vorherrschen? Würde die Architektur modernistischen oder traditionellen Stilen folgen? Wäre die Stadt vor allem für jüngere oder ältere Menschen attraktiv?

Um diese Ziele in die technische Entwicklung zu integrieren, haben wir die folgenden Aufgaben durchgeführt:

  • Wir führten technische Tests und Experimente durch, um das am besten geeignete Technologiepaket zu ermitteln. Unser Bedarf war ein Modell, das eine große Menge an Bildern programmatisch generieren konnte, anstatt jedes einzelne Bild manuell zu erstellen. Wir prüften, ob wir bestehende Bilder umwandeln sollten, indem wir Teile davon veränderten, oder ob wir völlig neue Bilder erstellen sollten. Letztendlich haben wir uns für die Generierung neuer Bilder entschieden, da dies zu einer besseren Bildqualität führte. Zu Beginn betrachteten wir Midjourney, Stable Diffusion und DALLEE als führende Modelle zur Bildgenerierung. Nach gründlichen Tests und Bewertungen kamen wir zu dem Schluss, dass DALLEE unsere Anforderungen am besten erfüllte. 
  • In Zusammenarbeit mit dem Projektteam des Museums sammelten wir Bilder von bekannten Sehenswürdigkeiten und Stadtgebieten. Unser Ziel war es, Elemente zu identifizieren, die die Stadt am besten repräsentieren. Danach haben wir festgestellt, welche Wahrzeichen vom ausgewählten Bildgenerierungsmodell am besten dargestellt werden können. Insbesondere analysierten wir, welche Wahrzeichen in Kombination mit verschiedenen Merkmalen noch erkennbar sind. Unsere Auswahl beschränkte sich auf sechs Wahrzeichen: Das Brandenburger Tor, den Berliner Dom, den Fernsehturm, die Oberbaumbrücke, das Reichstagsgebäude und die Siegessäule.
  • Wir definierten Eigenschaften, die in allen Bildern zukünftige Aspekte der Stadt darstellen sollten. Wir untersuchten wissenschaftliche und künstlerische Werke und konzentrierten uns auf Elemente, die eine etwas utopische, aber realistische Sicht auf die städtische Zukunft darstellten. Wir wählten einige Merkmale aus: Solarpaneele, Grünflächen, moderne und umweltfreundliche Baumaterialien sowie moderne Telekommunikation.
  • Für jede Option, die den Besucher angeboten wurde, identifizierten wir visuelle Elemente, die sie in einem Bild darstellen sollten. Diese Aufgabe war eine Herausforderung, da die Vorstellung von der Zukunft oft abstraktes Denken voraussetzt, das mehr mit Emotionen als mit konkreten Elementen zu tun hat. Wir stellten eine Stadt dar, die für jüngere Menschen attraktiv ist, mit Merkmalen wie Spielplätzen, Straßencafés und Live-Musik. Für ältere Menschen haben wir Sitzgelegenheiten, Rampen und Aufzüge für unterstützte Mobilität und Treffpunkte im Freien vorgesehen. Eine Stadt, in der öffentliche Verkehrsmittel im Vordergrund stehen, wurde mit Bussen, Zügen, Fahrradstationen, breiten Bürgersteigen und engen Straßen dargestellt. Eine Stadt, die für den Autoverkehr konzipiert wurde, hatte dagegen breitere Straßen und schmalere Bürgersteige. Wir wiederholten diese Elemente in den Eingabeaufforderungen, bis wir zufriedenstellende Ergebnisse erzielten.

Chancen und Herausforderungen der KI-gestützten Bilderzeugung im Museumskontext

Die Nutzung von KI-generierten Bildern im Museumskontext ist attraktiv, da sie das Besuchererlebnis auf verschiedene Weisen verbessern kann:

  • Sie stellt eine interaktive und ansprechende Methode dar, um potenzielle Szenarien zu erkunden. Dadurch werden Besucher zum aktiven Teilnehmer der Ausstellung.
  • KI-generierte Bilder können Ideen darstellen, für die es in den Sammlungen der Institution womöglich keine geeigneten Objekte gibt.
  • Als hochwertige Visualisierungen können KI-generierte Bilder in großen Formaten projiziert werden, um ein immersives Erlebnis zu erzeugen.
  • Modulare Systeme können mit technologischen Fortschritten aktualisiert werden und mit einem eher geringen technischen Entwicklungsaufwand neue Ergebnisse erzeugen.

Die Verwendung von KI-generierten Bildern im Museumskontext stellt allerdings auch einige Herausforderungen dar:

  • Rechtliche Aspekte müssen berücksichtigt werden. Es muss geklärt sein, ob die vom Modell erzeugten Bilder im geplanten Kontext frei genutzt werden dürfen.
  • Die Erwartungen der Besucher können variieren. Während einige eine experimentelle Erfahrung mit von einem Computersystem generierten Bildern begrüßen, könnten andere skeptisch sein.
  • Das System sollte entsprechend der vorhandenen Infrastruktur konzipiert sein. Abhängig von der Internetverbindung im Ausstellungsraum könnte es möglich sein, Bilder "on the fly" zu erzeugen oder nicht. Die Bildgröße sollte an den verfügbaren Speicherplatz und die Projektionshardware angepasst werden können.

Insgesamt ist die Implementierung von KI-generierten Bildern im Museumskontext ein vielversprechendes Projekt, das Technologie und Kreativität verbindet, um das Besuchererlebnis zu bereichern.

 

Info zu der Austellung BerlinZEIT: https://www.stadtmuseum.de/ausstellung/berlinzeit