PROMPT-L’ŒIL: DIE VERSPRECHUNGEN UND TÄUSCHUNGEN (DE)GENERATIVER INTELLIGENZ Ein E-Mail-Austausch zwischen Paul Feigelfeld und David Joselit
Holly Herndon and Mat Dryhurst, “I’M HERE 17.12.2022 5:44,” 2023
Stan Douglas, “Win, Place or Show,” 1998
Trevor Paglen, “Machine Readable Holly Herndon,” 2017
JOSELIT: Die geordneten Prozeduren des Algorithmus sind – selbst wenn viele von ihnen parallel arbeiten – nicht inspiriert, oder wörtlich: in-spiriert, also von Atem oder Geist erfüllt, um auf deine Anrufung der Natur zurückzukommen, sondern führen dieselben Schrittfolgen mechanisch oder auswendig aus. Ich stimme dir zu, dass Intelligenz eine Kunst im weitesten Sinne ist – vielleicht im Sinne der Inspiration – und dass es viele Wege gibt, eine solche Kunst oder Künstlichkeit zu definieren. Ein Aspekt, der mir an generativen KI-Werkzeugen auffällig erscheint, ist, dass sie prädiktiv sind, indem sie ein Archiv heranziehen, um einen statistisch plausiblen Output zu produzieren. Die westliche Kunst wurde im Allgemeinen als Repräsentation aufgefasst, was nahelegt, dass es eine Bedeutung hinter dem Kunstwerk gibt, die es zu entschlüsseln gilt. (Weite Teile der Kunstgeschichte und der zeitgenössischen Kritik unternehmen solche Entschlüsselungsbemühungen.) Was aber, wenn wir stattdessen – wie viele Künstler*innen – die Kunst mit Bezug auf ihre Leistungsfähigkeit als Modell nicht für die Prädiktion oder Repräsentation, sondern für die Hervorbringung von Sinn denken – als eine Form von Intelligenz, deren Sinn sich vor statt hinter dem Kunstwerk befindet? Darin, so meine ich, bestand der Einsatz der Konzeptkunst und ihrer Nachfolger: im Hinweis darauf, dass Kunst Objekte hervorbringt und nicht aus ihnen besteht. Konzeptkunst war eine Art generative KI, bevor es eine Technologie dieses Namens gab. Aber deine Kritik der Genealogie hat noch eine andere Dimension, die ich aufgreifen möchte. Diachronische Formen, in denen Geschichte erzählt wird, wie Genealogien, scheinen ihre Überzeugungskraft verloren zu haben. Das Ergebnis ist meines Erachtens eine Art Dissemination oder Gleichzeitigkeit verschiedener Zeitlichkeiten in der Gegenwart. Vereinfacht lässt sich das anhand der Tatsache veranschaulichen, dass wir inzwischen alle in unseren je eigenen Zeitlichkeiten leben, hervorgebracht von Geräten, die unserem Alltag einen Rhythmus geben. Aber in der Medienkunst nimmt man durch den andauernden Einsatz von Schleifen, mehreren Bildschirmen und/oder Kanälen sowie permutativen Narrativen diese Art zeitliches Stottern wahr. Manchmal fühlt es sich an, als sei man in einer ewigen Gegenwart eingesperrt, und das scheint mir Probleme beim Erzählen von Geschichte aufzuwerfen. Neue Technologien lassen sich in meinen Augen oft am besten durch die ästhetischen Verfahren verstehen, die Künstler*innen vor diesen Medien entwickelt haben. Stan Douglas’ lang geübte Methode, permutative Variationen einer einzigen Szene zu schaffen – etwa in seinen Videoarbeiten –, wirkt auf mich beinahe wie eine vorwegnehmende Thematisierung des prädiktiven Modells von KI. Ich finde das wesentlich überzeugender als einen Formalismus à la schmelzender Bildschirmschoner von jemandem wie Anadol.
FEIGELFELD: Könnten wir nicht Prädiktion als die Möglichkeitsbedingung von Intelligenz, als ihre beherrschende Motivation, betrachten? Um zu überleben, aber auch um sich als Spezies weiterzuentwickeln, muss man ein Stück weit die Zukunft kennen. Unsere Evolution führt von der Mustererkennung hin zur Musterhervorbringung: Wir erkennen Gezeiten, Planeten auf ihren Umlaufbahnen, Rhythmen in der Natur usw. und bringen neue Muster hervor entlang einer Linie wachsender Komplexität von Modellen und Schrift bis hin zu Kunst und Wissenschaft. Es begann mit der Weissagekunst, zu einer Zeit, da der Zusammenhang zwischen Wirklichkeit, Modell und Vorhersage noch Glückssache war, und setzte sich mit der Prognostik fort. Wir haben begriffen, dass eine endliche Menge und ausreichende kombinatorische Regeln scheinbar unendliche Bedeutungen hervorbringen können: Permutation. Im 17. Jahrhundert eröffnete uns die Infinitesimalrechnung das unendlich Kleine und ließ uns erahnen, was echte Generativität sein könnte, sobald wir über die Rechenkapazität verfügen würden. In jüngster Zeit sind wir von der Prädiktion zur Produktion fortgeschritten; wir bringen Wirklichkeit hervor, statt sie nur vorherzusagen und darzustellen. Ich möchte dir einen Begriff hinwerfen, den wir im Hinblick auf die Frage „vor oder hinter dem Kunstwerk“ diskutieren können, bevor wir vielleicht auf die Frage der Geschichte zurückkommen: Prompt-l’Œil.
Pere Borrell del Caso, “Escaping Criticism,” 1874
JOSELIT: Prädiktion ist sicher ein Modus von Intelligenz, aber was, wenn wir neben oder gegen sie den Drang zur oder das Verlangen nach der Utopie, nach dem Unvorhersagbaren stellen, die zweifellos große Teile der modernen Kunst angetrieben haben? Ebenso in der Politik, wo jemand wie Hannah Arendt das Versprechen der Politik als die Produktion von etwas Neuem in einem Raum der Begegnung und des Dialogs bestimmen würde. Ist Dialog eigentlich etwas, das man vollständig vorhersagen kann? Wäre ChatGPT vorhersagbar gewesen? Ist Prädiktion ein Moment der Ausführung nach einem Moment – oder Momenten – der Erfindung? Und natürlich beruht, wie viele Denker*innen im Hinblick auf die Einseitigkeiten des maschinellen Lernens hervorgehoben haben, die Art der Vorhersage, die man treffen kann, auf den Daten, die man extrahiert hat, was zu allerlei gefährlichen Verzerrungen führen kann. Aber um mir an dieser Stelle selbst zu widersprechen: Ich glaube, dem Interesse an Science-Fiction, insbesondere an Octavia Butler in den Vereinigten Staaten sowie an Saidiya Hartmans Praxis und der anderer wichtiger afroamerikanischer Denker*innen, für die Hartman die einflussreiche Bezeichnung „kritisches Fabulieren“ geprägt hat, entspricht tatsächlich eine Epistemologie der Prädiktion. Doch das, was in diesen Entwürfen vorhergesagt wird, beruht auf anderen Geschichten, politischen Einsätzen, literarischen Techniken und Haltungen gegenüber der Zukunft. Das bringt mich auf deinen provokanten Neologismus Prompt-l’Œil. Ich fände es toll, wenn du mehr über diesen Begriff sagen könntest, aber zunächst ein paar spontane Gedanken dazu: Erstens nehme ich an, dass sich die Gattung oder Kunst des Prompts unweigerlich als Ort der Kreativität weiterentwickeln wird (ebenso die Einrichtung von Datenbanken und Archiven). Das Œil dagegen würde ich infrage stellen, denn am heutigen Stand des maschinellen Lernens finde ich auffällig – sag mir bitte, wenn ich falsch liege –, dass Bilder auf diversen Ebenen in Text übersetzt werden müssen, bevor sie als visueller Output hervorgebracht werden können. Der Prompt ist demnach eine höchst diskursive Form der Bildlichkeit, die den Produktionsmöglichkeiten erhebliche Beschränkungen auferlegt. Diese andauernde Übersetzung in Text hemmt die Spontaneität und den Erfindungsreichtum der visuellen Form.
FEIGELFELD: Vielleicht war Prädiktion von vornherein die falsche Fährte, und wir sollten uns stattdessen auf das konzentrieren, was wir mit Hervorbringung (dein Wort) oder Produktion (meines) benannt haben. Ich ziehe den Begriff Produktion vor, weil er die Aspekte von Arbeit und Macht hervorhebt, die hier so eine riesige Rolle spielen. Vielleicht ist es schon lange viel einfacher, Wirklichkeiten zu produzieren, als sie vorherzusagen und entsprechend zu (re)agieren – vorausgesetzt, man hat die Macht über die Produktionsmittel. Womit wir bei der Macht des Prompts wären. Ich glaube nicht, dass wir es sind, die die Prompts vorgeben. Solange die Large Language Models von jenen gebaut werden, die sie derzeit bauen, habe ich Zweifel, ob da viel Kreativität drinsteckt. Natürlich haben Kunst und Künstler*innen seit Jahrtausenden immer wieder die Produktionsmittel und Medien kritisch und schöpferisch zweckentfremdet. Doch die Handlungsmacht des Mediums, sein eigenes künstlerisches Potenzial, seine Autonomie, sind erheblich gewachsen und haben vielleicht sogar eine kritische Schwelle überschritten. Womöglich sind es also LLMs, die vorneweg die Menschen prompten und nicht umgekehrt, und uns so zu unablässiger Datenproduktion anhalten und mit recht austauschbarem KI-Slop, ob in Form von Bildern, Texten oder Klängen, bezahlen. Ich habe den Eindruck, dass das, was wir heutzutage von unseren Technologien zurückbekommen – seien es die angebliche Gemeinschaft der sozialen Medien oder fabelhaft schlechte KI-Kunst –, oft aus Oberflächeneffekten besteht, aus einem faschistisch-kapitalistischen Tarnanstrich, der nur notdürftig eine in erster Linie mit Ausbeutung, Ausdehnung, Ausschließung und Totalitarismus beschäftigte planetarische Recheninfrastruktur verdeckt. Vorbild für das Prompt-l’Œil ist schließlich das Trompe-l’Œil, bei dem es im Kern um die Täuschung des Auges, des Blicks geht, um den Begriff des Realen als solchen und die Idee der Kunst und darum, was hinter der Leinwand oder dem Vorhang ist. Ich weiß, dass ich mich wie ein Untergangsprophet anhöre und andere das an anderer Stelle schon festgestellt haben, aber ich glaube wirklich, wir können und dürfen nicht über KI und Kunst nachdenken, ohne das zu unterstreichen. Was das Auge, l’œil, angeht, da hast du recht: Letztlich ist es alles Text – oder genauer: symbolische Repräsentation –, und wir sind nicht die Ersten, die das registrieren. Wie Vilém Flusser, Friedrich Kittler und viele andere im Zuge des Iconic Turn der späten 1980er und 1990er Jahre betonten, sind unter den technologischen Bedingungen mimetischer Turing-Maschinen das Reale und das Imaginäre – um Jacques Lacan mit reinzuziehen – der Ordnung des Symbolischen unterworfen. Alles ist Text, und aller Text ist Code; aller Code sind Zahlen, alle Zahlen letztlich physische Zustände von Elektrizität in Transistoren. Aber dieser unglaublich reduktionistischen Fantasie muss doch, wie du sagst, etwas entgegenzusetzen sein, oder? Im Grunde bedeutet sie einen unendlichen Regress. Ich finde es wunderbar, dass du in diesem Zusammenhang den Begriff des „kritischen Fabulierens“ ins Gespräch bringst. Glaubst du, dass wir mittels kritischen Fabulierens, spekulativer Fiktion, alternativer Zukünfte und weiterer ähnlicher Techniken unsere technologische Verfassung umgestalten könnten? Kunst, so meine ich, hat nicht nur das Potenzial, sondern auch die Verantwortung, Technologien zu formen. Aber ich bin pessimistisch, was das Ausmaß angeht, in dem die Tech-Industrie ihre Aufmerksamkeit genau auf dieses Risiko gerichtet hat und kreative Produktion vereinnahmt, während sie die Kreativen in Belastungstester und Fehlerjäger ihrer Systeme verwandelt.
Kandis Williams, “We have spared no expense. scope, scalpel, axe, drill. The Sort of Thing You Should Not Admit: violent death, turns out to be puzzlingly complex and if you have a problem figuring out whether you’re for me or, then you ain’t black.,” 2020
Automatic Computing Engine pilot model (based on designs by Alan Turing), National Physical Laboratory, Teddington, 1949
Trevor Paglen, “The Treachery of Object Recognition,” 2019
Übersetzung: Gerrit Jackson
David Joselit ist Arthur Kingsley Porter-Professor und Leiter des Lehrstuhls für Kunst, Film und Bildwissenschaft an der Harvard University. Zuletzt veröffentlichte er Art’s Properties (Princeton University Press, 2023).
Paul Feigelfeld ist Professor für Digitalität und kulturelle Vermittlung an der Universität Mozarteum Salzburg, wo er auch Teil des Instituts für Open Arts und das Data-Arts-Forum ist.
Image credits: 1. Courtesy Herndon Dryhurst Studio; 2. © Stan Douglas, courtesy of the artist, Victoria Miro, and David Zwirner; 3. © Trevor Paglen, Altman Siegel, and Pace Gallery, courtesy of the artist and Museo Tamayo, photo Agustín Garza; 4. public domain; 5. © Kandis Williams, courtesy of the artist and Heidi; 6. © The Board of Trustees of the Science Museum, Science Museum Group Collection, public domain, 7. © Trevor Paglen, Altman Siegel, and Pace Gallery
