Wer sich immer schon gefragt hat, wie unsere von allgegenwärtiger Schrift geprägte Welt für einen Analphabeten aussieht, kann einfach mit Stable Diffusion Dinge erzeugen, die typischerweise Schrift tragen und die Antwort durch schlichtes Hinschauen selbst finden: Die Form ist da, der Geist ist verdunstet, der entfleuchte Sinn schwebt flutschig über unruhigen Wassern.
Und das sagt im übrigen auch alles über die Bilder, die man mit einem neuronalen Netzwerk generiert. Nicht, dass es keinen Spaß machte, aber es bleibt ein Würfeln, und die guten Ergebnisse sind Glückssache.
Würfeln ermüdet den Geist. Irgendwann beginnt der Geist damit, etwas zu tun, um das Ergebnis des Wurfes zu formen. Es wirkt natürlich nicht, wenn man kleine Zauber ausprobiert, aber der dürre Geist hat keine andere Wahl, weil ihm der Schlund des geistigen Vakuums unerträglich wird. Wenn ich lese, wie viel Aufwand einige Menschen mit den Prompts treiben, die sie auf ein angelerntes neuronales Netzwerk loslassen, sehe ich vor meinem inneren Auge einen Glücksspieler, der vor jedem Einsatz aufsteht, einmal um seinen Stuhl geht und dabei ein Hufeisen in der Tasche streichelt oder ähnlich grenzneurotisch-magische Rituale ausführt. Gewinnt er, liegt es an seinem Zauber, verliert er, liegt es daran, dass er seinen Zauber nicht gut genug ausgeführt hat. Vermutlich sind schon ganze Religionen und ganze politische Parteien so entstanden.
Neurose ist leicht, der Weg ist breit und viele sinds, die darauf wandeln. Kunst wird so niemals entstehen. Dafür bedarf es eines aktiv formenden Geistes, und der wird vielleicht auch würfeln, aber sich nicht so sehr auf die Ausführung der Würfeltechnik konzentrieren¹.
Und er wird sich über einen guten Wurf freuen. Für seine Auswahl. Das kann das neuronale Netzwerk nicht.
¹Ich habe zum Beispiel schon Musik algorithmisch erzeugt. Ganz ohne neuronale Netzwerke. Es geht schnell und einfach, und beinahe alles ist unbrauchbar.
[…] möglichkeit zur entfehlerung oder verbesserung) zugängliches verfahren ein paar texte — oder schon etwas länger: bilder — auswirft, die zwar kleine fehlerchen haben, aber oft formal gut gebaut sind und gängigen […]
[…] (Und ja, es hat mir einen gewissen spaß bereitet, die weniger gelungenen bilder rauszupicken, als ich mal mit stable diffusion rumgespielt habe. Diese sind übrigens die mehrzahl. Ich habe mich auch an anderer stelle mal drüber ausgelassen.) […]
[…] haben. Denn die meisten bilder aus dem angelernten neuronalen netzwerk eher unbrauchbar sind, egal, wie viel neurose man beim prompten an den tag legt. Da muss man ein bisschen […]