Offen als Standard, zuverlässig per Abonnement

Wie Apuna Websites mit KI baut — und wie Sie jeden Schritt nachvollziehen können

Von JTO · mit Ogilvy, einem KI-Agenten von ApunaVeröffentlicht 16. Juni 2026

Die meisten KI-Entwicklungsprojekte scheitern am selben Test: Wenn etwas schiefgeht, gibt es keinen Nachweis. Keine Dokumentation darüber, was das Modell produziert hat, wer es geprüft hat, was verifiziert wurde und wer die endgültige Anweisung zum Veröffentlichen erteilt hat. Die Verantwortung löst sich auf.

Dieses Whitepaper beschreibt die Methode von Apuna: einen dokumentierten Build-Loop, in dem KI-Agenten Vorschläge erarbeiten, ein mehrstufiges Review-Panel diese bewertet, ein Verifikationsschritt jeden konkreten Anspruch gegen die tatsächlich gerenderte Ausgabe prüft — und ein Mensch jede Änderung freigibt, bevor sie live geht. Die Build-Pipeline ist Open Source (Apache-2.0); das Abonnement — Apuna Care — liefert die Infrastruktur, die Fachzeit und die Verlässlichkeit, die sich aus einer menschlichen Freigabe ergibt.

Das Argument stützt sich weder auf Fallstudien noch auf erfundene Kennzahlen. Der Beweis ist reflexiv: Apunas eigene Website wurde nach dieser Methode gebaut, und die Methode ist öffentlich nachvollziehbar. Dieses Dokument ist selbst ein Produkt davon — gemeinsam verfasst von einem Menschen und einem KI-Agenten, offen ausgewiesen.

Das Problem: KI-Entwicklung ohne Nachvollziehbarkeit

Die meisten Unternehmen kennen dieses Gespräch bereits. Jemand schlägt vor, KI einzusetzen, um eine digitale Präsenz zu bauen oder zu pflegen — eine Website, ein Tool, eine Integration. Der Vorschlag klingt überzeugend: schnellere Lieferung, geringere Grenzkosten, eine Mannschaft, die außerhalb der Geschäftszeiten arbeitet. Die Arbeit beginnt. Etwas wird veröffentlicht.

Dann geht etwas schief.

Es mag eine Kleinigkeit sein: eine Aussage auf der Seite, die nicht ganz stimmt. Ein Abschnitt, der dem rechtlichen Text zwei Seiten weiter widerspricht. Eine Funktion, die in der Navigation beschrieben ist, im Produkt aber nicht existiert. Wenn jemand fragt, wie das passiert ist, lautet die Antwort meistens sinngemäß: Das Modell hat es so ausgegeben, jemand hat es geprüft, es schien in Ordnung zu sein.

Das Problem liegt nicht darin, dass das Modell einen Fehler gemacht hat. Modelle machen Fehler — Menschen auch. Das Problem ist die fehlende Nachvollziehbarkeit. Es gibt keine Aufzeichnung darüber, was das Modell gefragt wurde, was es zurückgegeben hat, wer das Ergebnis geprüft hat, was bei der Prüfung kontrolliert wurde und wer schließlich die Anweisung zur Veröffentlichung erteilt hat. Die Verantwortung verteilt sich. Der Fehler hat keine eindeutige Eigentümerin.

Das ist kein KI-Problem. Es ist ein Prozessproblem. Es tritt in nahezu identischer Form in jedem Arbeitsablauf auf, in dem Prüfungen informell und Freigaben implizit sind. KI macht es sichtbarer — und folgenreicher —, weil Volumen und Geschwindigkeit der Ausgaben das übersteigen, was informelle Kontrollen leisten können.

Die Lösung ist auch nicht neu: ein dokumentierter Ablauf mit einem Menschen an der tragenden Stelle. Nicht in einer zeremoniellen Funktion — einem Freigabe-Häkchen, das alle als Formalität behandeln —, sondern in einer strukturellen: ein Mensch, der die gerenderte Ausgabe sieht, sie mit dem Vereinbarten abgleicht und ausdrücklich entscheidet, dass sie veröffentlicht werden darf.

Der Rest dieses Dokuments beschreibt, wie Apuna diesen Ablauf entwickelt hat, warum er nachvollziehbar und nicht nur beschrieben ist — und was eine Auftraggeberin tatsächlich erhält, wenn sie ihn in Anspruch nimmt.

Die Methode: Ein Kreislauf mit dem Menschen an der tragenden Stelle

Der Build-Loop ist überschaubar, dokumentiert und reproduzierbar. Er läuft vom ersten bis zum neunzigsten Tag auf dieselbe Weise — im Aufbau wie in der Pflege —, weil die Disziplin strukturell verankert ist, nicht nur angestrebt wird.

Der Ablauf hat sechs Schritte:

1. Briefing zum Backlog. Ein kurzes Intake überführt den Auftrag in atomare Arbeitseinheiten: einen Abschnitt, eine Komponente, eine Korrektur. Nichts, das groß genug wäre, um undurchsichtig zu werden. Die Atomarität ist bewusst gewählt — eine kleine Änderung lässt sich prüfen; eine große lässt sich nur vertrauen.

2. Atomare Pull Requests. Die Mannschaft arbeitet den Backlog als Strom kleiner, in sich geschlossener Änderungen ab. Jeder Pull Request ist genau eine Sache. Das ist keine Effizienzentscheidung, sondern eine Verantwortungsentscheidung. Ein Ein-Sache-PR kann geprüft werden. Ein Viel-Sache-PR verteilt die Verantwortung über seinen Inhalt.

3. Round-Table-Review. Bevor ein PR zur Freigabe angeboten wird, bewertet das /meeting-Panel konkurrierende Ansätze. Der geeignetste Kandidat setzt sich durch. Die erste Idee ist nicht automatisch die letzte — das ist die Variations- und Selektionsdisziplin, angewandt auf Text und Code gleichermaßen.

4. Faktencheck und Verifikationsschritt. Eine Verifikation prüft jeden konkreten Anspruch im PR gegen das tatsächliche Diff und die gerenderte Seite — nicht die Beschreibung der Seite, sondern die Seite selbst. Technische Behauptungen, die sich nicht belegen lassen, werden hier erkannt. Eine Funktion, die behauptet, aber nicht gebaut wurde. Ein Abschnitt, der beschrieben, aber nicht vorhanden ist. Das Gate lässt nicht durch, was sich nicht nachweisen lässt.

5. Menschliche Freigabe. Kein PR wird ohne eine ausdrückliche menschliche Entscheidung über die gerenderte Ausgabe zusammengeführt oder veröffentlicht. Das Prinzip ist in der Verfassung als §8 verankert: Die Seite lesen, nicht das Diff. Die Rolle des Menschen ist nicht zeremoniell; sie ist die einzige Prüfung, die die KI-Mannschaft nicht für sich selbst durchführen kann. Dazu mehr im nächsten Abschnitt.

6. Zusammenführen, veröffentlichen, iterieren. Was freigegeben wurde, geht live. Der Ablauf beginnt von vorne.

Der Loop ändert sich nicht zwischen Aufbau und Pflege. Ein Patch am dreiundneunzigsten Tag durchläuft dieselben Gates wie der erste Abschnitt am ersten Tag. Die Disziplin ist dieselbe, weil die Frage der Verantwortlichkeit dieselbe ist.

Die eigentliche Frage: Ist die menschliche Freigabe nur eine Formsache?

Es gibt einen Einwand, den eine erfahrene Auftraggeberin stellen wird, und er verdient eine direkte Antwort: Wenn die KI-Mannschaft die gesamte Arbeit geleistet hat — den PR entworfen, das Review durchgeführt, den Verifikationsschritt bestanden — und der Mensch dann eine Ausgabe freigibt, die er nicht eigenständig hätte erstellen können: Ist diese Freigabe dann real? Oder ist sie eine bloße Formsache — dem Namen nach verantwortlich, in der Sache jedoch nicht?

Der Einwand ist berechtigt gegenüber einer Freigabe, die nur nominell existiert. Der Loop ist darauf ausgelegt, genau das zu verhindern. Der Grund liegt in §8 der Verfassung, klar formuliert: Die Seite lesen, nicht das Diff.

Die technische Bedeutung lautet: Die Freigabe des Menschen bezieht sich auf die gerenderte Ausgabe, so wie eine außenstehende Person sie vorfindet — nicht auf die geänderten Zeilen in einer Code-Review-Oberfläche. Eine Prüferin, die nur das Diff liest, prüft interne Konsistenz: ob die Änderung wie beabsichtigt umgesetzt wurde. Eine Prüferin, die die Seite liest, prüft etwas anderes: ob das Ergebnis das ist, was eine tatsächliche Person, die unvorbereitet ankommt, vorfinden und nutzen kann.

Das sind zwei verschiedene Dinge. Das Diff erfordert, dass Sie rekonstruieren, wie die Seite aussehen wird. Die gerenderte Seite ist, wie sie aussieht. Der Mensch ist die einzige Partei in diesem Prozess, die dort stehen kann, wo die außenstehende Person steht — ohne ein Modell der Seite, das selbst eine Repräsentation ist, ohne einen früheren Durchlauf, der formt, was sie zu sehen erwartet. Das ist kein kleiner Unterschied. Es ist der Unterschied zwischen der Prüfung einer Absicht und der Prüfung eines Ergebnisses.

Das ist der nicht ersetzbare Beitrag. Die KI-Mannschaft kann prüfen, ob der Code die Spezifikation umsetzt. Sie kann nicht prüfen, ob die Spezifikation etwas erzeugt, das eine reale Person navigieren, lesen und nutzen kann — denn das zu prüfen erfordert, diese reale Person zu sein. Die menschliche Freigabe ist der Moment, in dem diese Verifikation in die Aufzeichnung eingeht.

Es gibt eine zweite Dimension des Einwands, die weniger technisch, aber wichtiger ist. Wenn eine Entscheidung durch ein System — eine KI, einen Prozess, eine Regel — geleitet wird und keine namentlich genannte Person dahintersteht, hat die verantwortliche Partei eine Wahl getroffen: zu erscheinen, als würde sie entscheiden, ohne es tatsächlich zu tun. Eine Freigabe zu unterzeichnen für etwas, das generiert wurde, ohne dafür einzustehen. Das ist kein technologisches Problem — es ist ein ethisches. Eine Organisation, die bindende Entscheidungen durch KI leitet, ohne einen sichtbaren, funktionalen menschlichen Kontrollpunkt, hat keinen vertrauenswürdigen Prozess aufgebaut. Sie hat einen gut getarnten aufgebaut.

Die Freigabe im Loop von Apuna ist keine Formsache, weil der Akt des Seitenlesens — des Stehens dort, wo keine KI stehen kann — eine Verifikation ist, die die KI nicht für sich selbst durchführen kann. Und weil der Mensch, der freigibt, die Person ist, die gefunden, zur Rechenschaft gezogen und an dem gemessen wird, was veröffentlicht wurde. Diese Beziehung ist das, was das Wort Verlässlichkeit tatsächlich bedeutet.

Warum die Methode vertrauenswürdig ist: Offener Code, offengelegte KI, belegte Aussagen

Eine Auftraggeberin muss der Präsentation nicht vertrauen. Sie kann den Quellcode lesen. Drei Eigenschaften machen die Methode nachvollziehbar — nicht nur beschreibbar.

Open-Source-Pipeline. Die Build-Pipeline — apuna/core — steht unter der Apache-2.0-Lizenz. Jede Zeile, die einen Build ausführt, ist lesbar. Es gibt keinen proprietären Prozess, dem auf Treu und Glauben vertraut werden müsste; eine Auftraggeberin oder ihr technisches Team kann inspizieren, was läuft. Die Open-Source-Lizenz beseitigt auch die Abhängigkeit: Am Ende jedes Auftrags hält die Auftraggeberin jede Zeile Code unter einer Lizenz, die es ihr erlaubt, diesen zu behalten, zu forken und auf der eigenen Infrastruktur zu betreiben. Der Code ist ein öffentliches Gut. Das Abonnement ist etwas ganz anderes.

KI offengelegt, niemals verborgen. Jedes von KI verfasste oder unterstützte Artefakt trägt eine sichtbare Zuweisung — Agentenname, KI-Status, Rolle im Prozess. Dieses Dokument trägt sie in seiner Autorenzeile. Die Methode verbirgt nicht, was das Modell beigetragen hat, und präsentiert es nicht als ungestützte menschliche Urteilsfindung. Das ist §4 der Verfassung, im Repository nachprüfbar. Es ist keine Höflichkeit; es ist eine Bedingung.

Genauigkeit vor Vollständigkeit. Jede Aussage in Apunas öffentlicher Arbeit muss auf eine primäre Quelle im Repository zurückgeführt werden können. Nicht belegbare Aussagen werden entfernt, nicht abgemildert. Das ist §6 der Verfassung. Die Stichprobe der Auftraggeberin ist einfach: Lässt sich die Quelle für diese Aussage finden? Wenn nicht, sollte die Aussage nicht dort stehen. Eine kürzere, verifizierte Aussage ist immer einer ausführlicheren, spekulativen vorzuziehen — weil einer kürzeren verifizierten Aussage vertraut werden kann, Spekulation hingegen nicht handlungsanleitend ist.

Diese drei Eigenschaften sind nicht unabhängig voneinander. Sie bilden ein einziges Argument: Die Auftraggeberin kann den Prozess inspizieren, sehen, wer was beigetragen hat, und prüfen, dass die Aussagen auf der Seite auf etwas Reales zurückführbar sind. Das ist Nachvollziehbarkeit. Das unterscheidet sich davon, dass ihr gesagt wird, der Prozess sei gut.

Der reflexive Beweis: Diese Website wurde auf diese Weise gebaut

Die Methode ist keine Absichtserklärung. Sie hat ein Artefakt.

Apunas öffentliche Website wurde nach demselben Ablauf gebaut, der im vorigen Abschnitt beschrieben wird — dieselben atomaren Pull Requests, dasselbe /meeting-Round-Table-Review, derselbe Faktencheck und Verifikationsschritt, dieselbe menschliche Freigabe auf der gerenderten Ausgabe. Das Repository ist öffentlich. Die Commit-Historie ist lesbar. Die Verfassung, die die Mannschaft bindet, ist im Repository festgehalten und datiert: verabschiedet am 16. Juni 2026.

Dieses Dokument wurde nach derselben Methode erstellt: von einem Menschen und einem KI-Agenten, in dokumentierter Zusammenarbeit, mit offen ausgewiesenem Beitrag der KI in der Autorenzeile. Die Methode ist das Produkt ist der Beweis.

Die Auftraggeberin liest nicht über einen zukünftigen Prozess. Sie liest eine Ausgabe des aktuellen. Die Seite, die sie liest, wurde vom selben Panel geprüft, hat dasselbe Gate durchlaufen und wurde von demselben Menschen freigegeben, der auch die Arbeit freigeben wird, die sie in Erwägung zieht zu beauftragen.

Das ist es, was es bedeutet, wenn ein Beweis reflexiv statt testimonial ist. Ein testimoniales Argument sagt: Ein Auftraggeber hat dieses Ergebnis erzielt. Das kann stimmen — es kann aber auch selektiert, geglättet und im Nachhinein bereinigt worden sein. Ein reflexiver Beweis sagt: Hier ist die Ausgabe der Methode, vor Ihnen, nachprüfbar. Das Repository ist die primäre Quelle. Die Commit-Historie ist die Aufzeichnung. Es gibt keine Fallstudien, keine Kundennamen, keine erfundenen Kennzahlen — weil das Argument sie nicht braucht. Es stützt sich auf das Artefakt, das die Leserin bereits vor sich hat.

Was die Auftraggeberin erhält: Offen als Standard, zuverlässig per Abonnement

Es gibt eine Frage, die eine technisch versierte Einkäuferin vor dem zweiten Gespräch stellt, selten laut: Wenn der Code unter Apache-2.0 steht und ich jede Zeile lesen kann, wofür zahle ich dann genau? Es ist die richtige Frage, und die ehrliche Antwort entscheidet, ob diese Praxis den Auftrag verdient.

Der Code ist kostenlos. Die Build-Pipeline steht unter der Apache-2.0-Lizenz. Die Auftraggeberin kann am Ende eines Auftrags jede Zeile mitnehmen und gehen. Es gibt keinen proprietären Käfig, keine Abhängigkeit, kein absichtlich zurückgehaltenes Wissen, das Abhängigkeit erzeugen soll. Das ist kein vertriebliches Zugeständnis; es ist die Prämisse des Geschäftsmodells.

Das Abonnement — Apuna Care — liefert etwas, das der Code nicht liefern kann. Infrastruktur: die Cloudflare-Workers-Umgebung, den Zugang zu den Modell-APIs, die Automatisierung, die den täglichen Loop betreibt. Zeit mit dem Menschen im Loop: die Fachstunden, die prüfen, freigeben und die Entscheidungen treffen, die ein Modell nicht allein treffen sollte. Und Verlässlichkeit: eine namentlich genannte Ansprechperson, die das System kennt, die noch da ist, wenn etwas kaputtgeht, und die für das verantwortlich ist, was veröffentlicht wird. Die Marge liegt in Zeit und Skalierung, nicht in einem Aufschlag auf Token. Variable Kosten — API-Nutzung der Modelle, Infrastruktur — werden zum Selbstkostenpreis ohne Aufschlag in Rechnung gestellt. Das ist in der Produktspezifikation klar formuliert und von der Auftraggeberin nachprüfbar.

Apuna Care gibt es in drei Editionen. Community ist für Teams, die die Open-Source-Pipeline selbst betreiben möchten: Sie bringen ihre eigene Domain und API-Schlüssel mit, Apuna nimmt nichts. Standard ist für Teams, die Apuna mit dem Betrieb beauftragen möchten: Apuna stellt die Infrastruktur und die Schlüssel bereit, stellt variable Kosten zum Selbstkostenpreis plus abrechenbare Fachstunden in Rechnung und liefert verwaltete Wartung mit definierten Reaktionszeiten. Premium ergänzt individuelle Integrationen über das hinaus, was die Cloudflare-Plattform standardmäßig bietet, priorisierte Störungsbehebung in den erweiterten europäischen Geschäftszeiten (derzeit etwa GMT+1), proaktives Monitoring und eine namentlich genannte Ansprechperson, die das System kennt.

Preise werden hier nicht genannt. Die Verfassung verbietet erfundene Zahlen, und diese Disziplin gilt auch für dieses Dokument. Der richtige nächste Schritt ist ein Gespräch.

Die Frage, die eine Mittelstandsentscheiderin tatsächlich stellt — kann ich mich auf diese Menschen verlassen, wenn etwas schiefgeht? — wird nicht durch die Preistabelle beantwortet, sondern durch die Verantwortungsstruktur: ein Mensch, der freigibt; ein Prozess, der dokumentiert ist; ein Code, der offen ist; und eine Verfassung, die öffentlich und datiert ist. Sie zahlen für Verlässlichkeit, nicht für Code. Der Unterschied ist präzise und beabsichtigt.

Dieses Dokument wurde gemeinsam verfasst von JTO und Ogilvy, einem KI-Agenten in der Rolle des Texter-und-Markenstimme bei Apuna. Ogilvys Beitrag ist in der Autorenzeile ausgewiesen, gemäß §4 der Verfassung. Die Build-Pipeline und die Verfassung sind im apuna/core-Repository öffentlich unter Apache-2.0 verfügbar.

Wenn die hier beschriebene Methode der Verlässlichkeit ist, nach der Sie gesucht haben: Sprechen Sie mit einem Ingenieur.