Ziel der Gruppenarbeit zum Thema der generativen Geschichten war es Bilder für eine Graphic Novel zu generieren. Dabei sollten die Bilder möglichst gut zueinander passen und mit den dazugehörigen Texten eine Geschichte erzählen.
Funktionsweise
Es gibt unterschiedlichste KI Werkzeuge, welche Bilder generieren können. Die Bildgenerierung funktioniert, indem eine detaillierte Bildbeschreibung in Textform eingegeben wird. Ein neuronales Netzwerk verarbeitet diese Beschreibung, interpretiert die visuellen Elemente und erzeugt ein passendes Bild. Das Modell, das dafür verwendet wird, ist speziell darauf trainiert, aus Texten Bilder zu erstellen. Die KI kann dabei auch auf spezifische Stile oder Themen trainiert werden, um die Bilder entsprechend anzupassen. Zudem ist das Bearbeiten einzelner Stellen eines Generierten Bildes möglich, sowie die Vorgabe eines anderen Bildes als Beispiel.
Das Projekt
Das Projekt ist in einer Gruppenarbeit mit Mirea Černota entstanden.
Die Idee
In unserer Geschichte soll eine Erzählung über einen Traum entwickelt werden, die sowohl Spannung als auch Skurrilität beinhaltet. Ein zentrales Anliegen dieses Projekts war die vollständige Generierung des Textes und der dazugehörigen Bilder durch künstliche Intelligenz. Dabei lag der Fokus darauf, einen Stil zu kreieren, der nicht zu realistisch ist, aber dennoch eine anschauliche Illustration des Textes ermöglicht.
Vorgehensweise
Zu Beginn wurde durch GPT-4 eine Geschichte generiert und wiederholt umgeschrieben, bis das Ergebnis weitestgehend zufriedenstellend war und lediglich kleinere Anpassungen erforderlich waren. Anschließend wurde überlegt, wie sich die Erzählung in kleinere Abschnitte unterteilen ließe und welche Bilder für diese Abschnitte passend wären. Zur Erstellung der Bilder wurden verschiedene Programme getestet, und letztlich fiel die Entscheidung auf DALL-E. Nach umfangreichen Experimenten mit dem Bildstil wurde ein abstrakter Ansatz mit einem stark sichtbaren Pinselduktus gewählt, der an den Stil von Vincent van Gogh erinnert. Das letzte Bild sollte jedoch einen stilistischen Bruch darstellen, indem es in einem realistischeren Stil gehalten ist, um deutlich zu machen, dass die vorangegangenen Darstellungen lediglich einen Traum repräsentieren. Parallel zur Bildgenerierung wurde die zugehörige Webseite erstellt, auf der mithilfe von Flexbox die Texte in Kombination mit den entsprechenden Bildern platziert wurden.
Schwierigkeiten
Herausforderungen traten insbesondere bei der Konsistenz des Bildstils auf. Es hat uns viel Zeit gekostet, die geeignete Stichworte für die Bildgenerierung zu finden. Die von DALL-E generierten Bilder wiesen häufig einen zu realistischen Stil auf und enthielten wiederholt Elemente aus Van Goghs „Sternennacht“, obwohl dieser explizit ausgeschlossen worden wurde. Auch das beibehalten einer Farbpalette war schwierig, da die KI oft Farben hinzufügte, die nicht zu den vorherigen Bildern passten.
Darstellung
Die Webseite wurde in einem schlichten Design gestaltet, um den Fokus auf die Geschichte und die dazugehörigen Bilder zu legen. Für eine klare und übersichtliche Darstellung, wurden mit Hilfe von Flexbox jeweils zwei Bilder nebeneinander mit dem entsprechenden Text darunter positioniert.
Mögliche Anwendungen
Die KI-gestützte Bildgenerierung bietet vielfältige Einsatzmöglichkeiten, etwa in Werbung und Design, muss jedoch kritisch betrachtet werden. Ein zentrales Problem ist die mögliche Reproduktion rassistischer oder sexistischer Stereotype, bedingt durch Verzerrungen in den Trainingsdaten.
Ein Beispiel aus unserer eigenen Arbeit zeigt diese Problematik deutlich: Obwohl wir dem Protagonisten unserer Geschichte bewusst keine spezifischen äußeren Merkmale oder ein festgelegtes Geschlecht zugeordnet hatten, generierte das System ausschließlich Bilder eines jungen, weißen Mannes.
Zusätzlich stellt die KI-basierte Bildgenerierung die Frage nach dem Schutz künstlerischer Stile. Es besteht das Risiko, dass KIs ohne Zustimmung der Urheber Kunststile kopieren oder imitieren. Insbesondere dann, wenn bekannte Künstler oder Werke, wie beispielsweise der Stil von Vincent van Gogh, als Grundlage für die Generierung genutzt werden, kann dies zu einer Form der Aneignung führen, die Urheberrechte und den Schutz geistigen Eigentums verletzt.
Daher ist ein verantwortungsvoller Umgang mit KI-Modellen sehr wichtig, um sowohl die Echtheit der originalen Kunstwerke als auch die Vielfalt der Darstellungsmöglichkeiten zu wahren. Es ist dringend notwendig, ethische Leitlinien für den verantwortungsvollen Einsatz von KI-Tools zu entwickeln.
Fazit
Im Verlauf des Projekts wurde deutlich, wie wichtig präzise und detaillierte Textbeschreibungen für die Bildgenerierung sind. Die besten Ergebnisse wurden erzielten, indem die KI ein Beispielbild als Referenz erhielt. Die Arbeit mit KI hat gezeigt, dass Geduld und das Finden des passenden Vokabulars entscheidend sind, um die gewünschten Bilder zu erhalten. Gleichzeitig hat das Projekt die Notwendigkeit eines kritischen und reflektierten Umgangs mit KI-Tools verdeutlicht, insbesondere in Bezug auf ethische Fragestellungen und die Wahrung künstlerischer Authentizität.