Live-Demos und die Distanz zur Produktion
Bei dem VDMA-Praxistag KI in Frankfurt gab es Live-Demonstrationen von KI-Agenten — echte, auf einer Bühne, vor achtzig Menschen. Anbieter zeigten, was ihre Plattformen können: autonome Fehlerdiagnose, verbundene Agenten, die in ERP-Systeme hineinreichen, Entscheidungen in Echtzeit ohne einen Menschen in der Schleife. Beeindruckend. Erwähnenswert. Ich habe einiges davon gefilmt.
Und ich habe die Heimfahrt damit verbracht, über die Lücke nachzudenken — zwischen dem, was ich eben gesehen hatte, und dem, was es braucht, um das in Produktion zum Laufen zu bringen. Diese Lücke ist die ganze Geschichte.
**Die Demo-Götter sind real**
Eine Live-Demonstration eines KI-Agenten ist das verführerischste Artefakt in der Enterprise-Technologie. Sie zeigt den Happy Path — die Anfrage, die sich auflöst, den Fehler, der diagnostiziert wird, die Empfehlung, die sitzt — und verdichtet Monate von Engineering in vier Minuten Glätte. Nicht gezeigt wird: der Netzwerk-Request, der um drei Uhr morgens am Dienstag auf eine Zeitüberschreitung läuft; der Spaltenname im Produktions-Datensatz, der sich um einen Unterstrich vom Spaltennamen im Test-Datensatz unterscheidet; oder der Agent, der vor acht Senior-Ingenieuren beschloss, etwas zu tun, das niemand erwartet hatte, und für das man drei Minuten Erklärungszeit brauchte.
Das ist keine Bosheit. Das ist einfach, was Live-Demos sind. Sie sind die Vision, nicht das Produkt. Die Demo-Götter — kein WLAN, API-Rate-Limits, ein Latenz-Spike, der eine Drei-Sekunden-Pause wie ein Einfrieren wirken lässt, wenn achtzig Menschen zuschauen — interessieren Ihr Foliendeck nicht. Jedes Team, das je eine Live-Demo gemacht hat, kennt das. Die guten haben einen Notfallplan. Die mutigen verzichten darauf.
**Die Falle der vorbereiteten Daten**
Das subtilere Risiko ist nicht das Netzwerk. Es sind die Daten. Ein Agent, der letzte Woche auf dem Test-Datensatz fehlerfrei lief, trifft auf der Bühne auf den Produktions-Datensatz — und findet eine Spalte, die anders benannt ist, einen Null-Wert in einem Feld, das befüllt sein sollte, ein Zeitstempel-Format, das sich von dem unterscheidet, auf das er trainiert wurde. Die Demo bricht zusammen, auf eine Weise, die aussieht, als wäre das System kaputt — obwohl es die Daten sind, die nie ganz das waren, was sie aussahen.
Das ist kein Demo-Problem. Es ist ein Produktions-Problem, das die Demo offenbart hat. Die Distanz zwischen einem vorbereiteten Datensatz und echten Produktionsdaten ist dieselbe Distanz zwischen einer kontrollierten Laborumgebung und einer Werkstatt. Diese Distanz verschwindet nicht, wenn Sie ausliefern. Sie ist die Engineering-Arbeit.
**Der Fluch des „es hat heute Morgen noch funktioniert"**
Es gibt eine Regression zwischen der Generalprobe und der Live-Session, auf die jedes Team mindestens einmal trifft. Um neun hat das System funktioniert. Um zwei nicht mehr. Nichts wurde geändert. Niemand hat es angefasst. Und dennoch. Der Fluch ist real — teilweise, weil komplexe Systeme Abhängigkeiten haben, die nicht vollständig sichtbar sind; teilweise, weil die Demo-Umgebung nie ganz identisch ist mit dem Raum, in dem man landet; und teilweise, weil das die Entropie ist.
Die Antwort auf den Fluch ist nicht Aberglaube. Es ist Observability: wissen, was sich geändert hat, wann, und warum. Das ist keine Demo-Fähigkeit. Das ist eine Produktionsdisziplin, und die meisten Demo-Umgebungen haben sie nicht.
**Der Agent, der improvisierte**
Autonome Systeme tun unerwartete Dinge. Das ist teilweise der Punkt — wenn sie nur täten, was man explizit programmiert hat, bräuchte man keine Agenten, man bräuchte Scripts. Aber unerwartetes Verhalten vor achtzig Kunden ist ein anderes Problem als unerwartetes Verhalten in einer kontrollierten Staging-Umgebung. Der Agent, der selbstbewusst eine Aktion vorschlägt, die außerhalb seines eigentlichen Rahmens liegt, oder der vor Senior-Ingenieuren einen plausibel klingenden, aber falschen Datenwert halluziniert, verursacht nicht nur ein technisches Problem. Er verursacht ein Vertrauensproblem. Und Vertrauen, einmal in einem Raum gebrochen, braucht länger zum Wiederaufbau, als die Demo brauchte, um zu laufen.
Das ist ein Teil des Grundes, warum „ein Mensch entscheidet — im Design" keine Einschränkung ist, die wir widerstrebend hinzugefügt haben. Es ist eine Anerkennung: Live-Systeme mit echter Autonomie überraschen Sie. Die Überraschung ist ein Merkmal der Technologie. Der menschliche Kontrollpunkt ist ein Merkmal des Designs.
**Die Vier-Minuten-Demo versus das Drei-Jahre-Produktionssystem**
Die Lücke zwischen dem, was auf der Bühne zu sehen ist, und dem, was es braucht, um etwas in Produktion zu betreiben, ist kein Versagen des Ehrgeizes. Es ist ein Versagen des Rahmens. Eine Demo ist ein Machbarkeitsnachweis. Ein Produktionssystem ist eine Lieferkette: Datenprovenienz, Zugriffskontrollen, Audit-Trail, Fehlermodi, Rollback-Verfahren, Monitoring, die langsame Ansammlung von Edge Cases, die der Happy Path nie gezeigt hat.
Die Anbieter, die auf der VDMA-Konferenz Live-Agent-Demos zeigen, sind nicht unehrlich. Sie zeigen reale Fähigkeiten. Aber das ehrliche Gespräch — das es lohnt, an jedem Tisch des World Café zu führen — geht um die Distanz zwischen der Bühne und der Werkstatt. Diese Distanz ist der Ort, wo die Arbeit ist. Diese Distanz ist das, was die meisten KI-Projekte unterschätzen.
**Die Versuchung, es zu fälschen**
Es gibt einen Shortcut, den manche Teams nehmen: die „Live"-Demo, die in Wahrheit gegen einen festen Datensatz geschrieben ist, oder vorab aufgezeichnet, oder subtil nachgebaut. Das beseitigt die Demo-Götter. Es produziert vier fehlerlose Minuten. Und es untergräbt das Vertrauen in dem Moment, in dem jemand nachfragt — eine Frage zur Datenquelle, eine Bitte, eine etwas andere Anfrage zu versuchen, ein neugieriger Ingenieur, der die Logs sehen möchte. Die gefälschte Demo ist schlimmer als die gescheiterte, weil die gescheiterte Demo ehrlich darüber ist, wo das System tatsächlich steht.
**Reputations-Asymmetrie**
Eine großartige Demo wird bis Freitag vergessen. Eine gescheiterte wird auf der nächsten Konferenz weitererzählt — mit Ausschmückungen. Die Asymmetrie ist brutal und vollständig konsistent mit der Art, wie menschliches Gedächtnis funktioniert. Sie spielen nicht für den Raum am Tag. Sie spielen für die Geschichte, die danach erzählt wird. Die beste Absicherung gegen das Schlimmste ist nicht eine bessere Demo. Es ist ein ehrlicheres Framing dessen, was die Demo zeigt — und was nicht.
Apuna macht auch Live-Dinge. Wir kennen dieses Risiko von innen, nicht von außen. Die Lektion ist nicht „Demo nie". Sie ist: respektieren Sie die Distanz zwischen der Bühne und der Werkstatt. Wissen Sie, auf welcher Seite dieser Distanz Sie stehen — und sagen Sie es.
*Der VDMA-Praxistag KI im Maschinen- und Anlagenbau fand am 18. Juni 2026 in Frankfurt am Main statt, veranstaltet von VDMA Software & Digitalisierung.*