Warum eine 2.400 Jahre alte Kritik am Text erklärt, warum verlässliche AI mehr braucht als gute Outputs
Kurz zur Einordnung: Wer war Platon – und was ist der Phaidros?
Platon war ein griechischer Philosoph, der etwa 400 v. Chr. lebte und lehrte. Er ist vor allem bekannt für seine Dialoge – Texte, in denen sein Lehrer Sokrates mit anderen Menschen über grundlegende Fragen diskutiert: Was ist Wahrheit? Was ist Wissen? Wie entsteht echtes Verständnis?
Einer dieser Dialoge heißt Phaidros. Darin geht es unter anderem um Sprache, Rhetorik und – überraschend modern – um die Frage, ob das geschriebene Wort überhaupt geeignet ist, Wissen zu vermitteln.
Platons Antwort: nur bedingt. Und diese Einschränkung ist bis heute relevant.
Ich bin kein Platon-Spezialist. Aber als ich mich intensiver mit verlässlicher AI beschäftigte, wurde mir irgendwann bewusst, dass Systeme überzeugend klingen können – und trotzdem falsch liegen. Mein Kollege Harald Huber machte mich dann auf den Zusammenhang mit Platon aufmerksam. Und seitdem lässt mich dieser Gedanke nicht mehr los.
Ein altes Problem, neu gestellt
Im Phaidros formuliert Platon eine Kritik an der Schrift, die auf den ersten Blick seltsam anmutet: Ein Text, so sein Argument, kann nicht reagieren. Er stellt keine Rückfragen, korrigiert keine Missverständnisse und bleibt stumm – egal wie gut oder wie falsch er verstanden wird.
Das klingt zunächst wie eine Randnotiz aus der Philosophiegeschichte. Dennoch: Für verlässliche AI-Systeme ist es das nicht.
Was LLMs scheinbar lösen
Large Language Models wirken auf den ersten Blick wie eine direkte Antwort auf Platons Kritik.
Ein klassischer Text ist statisch. Ein LLM hingegen ist reaktiv – es antwortet auf Fragen. Außerdem ist es iterativ – man kann nachhaken. Und schließlich ist es adaptiv – es passt sich dem Gesprächsverlauf an.
Oberflächlich betrachtet ist das genau das, was Platon an der Schrift vermisste: die Fähigkeit zum Dialog. Damit entsteht der Eindruck, dass das Problem gelöst ist.
Aber das greift zu kurz.
Simulation ist kein Verstehen
Platons Kritik war tiefer als das bloße Problem der Statik. Sein eigentliches Argument lautet: Ohne echten Dialog entsteht kein echtes Verständnis. Ein Text kann Wissen transportieren – er kann jedoch nicht prüfen, ob es angekommen ist. Und ein System, das lediglich so tut, als ob es antwortet, löst dieses Problem ebenfalls nicht.
Ein LLM besteht diesen Test daher nur bedingt.
Es generiert Sprache auf Basis statistischer Muster – ohne eigenes Wahrheitsinteresse und ohne Verantwortung für seine Aussagen. Zudem merkt das System nicht, wenn eine Antwort falsch ist – es sei denn, man konfrontiert es gezielt damit. Warum LLMs dabei so überzeugend klingen und trotzdem falsch liegen, erklären wir ausführlicher in unserem Beitrag zu Spilled Energy in Large Language Models.
Platon würde das wahrscheinlich so formulieren: KI ist kein Gesprächspartner. Sie ist ein animierter Text.
Ein konkretes Beispiel verdeutlicht das: Der 115-Chatbot – der digitale Assistent der deutschen Behördenrufnummer – kann Bürger über die beste Reihenfolge von Behördengängen beraten und führt dabei einen scheinbar hilfreichen Dialog. Er kennt jedoch nicht die realen Abläufe, Wartezeiten oder lokalen Zuständigkeiten dahinter. Er berät folglich nicht aus Wissen heraus, sondern aus Text. Und weil das notwendige Wissen im Text schlicht nicht enthalten ist, bleibt der Text – trotz allem Dialog – Text. Fast schon platonisch.
Das konkrete Risiko für QA
Für Qualitätssicherung hat das direkte Konsequenzen.
Antworten klingen plausibel, auch wenn sie falsch sind. Unsicherheiten werden selten explizit gemacht. Außerdem fallen Widersprüche oft nur bei gezielter Prüfung auf.
Folglich kann ein AI-System den Eindruck von Qualität erzeugen, ohne tatsächlich zuverlässig zu sein.
In klassischen QA-Prozessen prüft man Ergebnisse. Bei AI muss man darüber hinaus prüfen, wie diese Ergebnisse zustande kommen – und wie stabil sie unter Variation sind. Andernfalls bewertet man nicht das System, sondern lediglich einen günstigen Moment. Wie man dabei konkret vorgeht, zeigt unser Beitrag zu Context Engineering für Chatbots.
QA als Dialektik
Wenn man Platons Argument ernst nimmt, dann ist zuverlässige QA kein statischer Prüfprozess. Vielmehr ist sie ein dialogischer.
Das hat vier praktische Konsequenzen:
Prompting ist Methodik. Die Qualität der Frage bestimmt die Qualität der Antwort. Wer das nicht berücksichtigt, bewertet daher nicht das System – er bewertet seine eigene Fragestellung. Mehr dazu in unserem Beitrag Mit der richtigen Frage zur richtigen Antwort.
Single-Shot-Antworten sind strukturell unsicher. Verlässlichkeit entsteht erst durch Iteration, Variation und Gegenprüfung. Einzelne Antworten sind folglich immer mit Vorsicht zu interpretieren.
Erklärungen sind keine Beweise. Nur weil ein Modell etwas nachvollziehbar erklärt, heißt das nicht, dass es korrekt ist. Im Gegenteil: Gut klingende Antworten sind besonders gefährlich, weil sie selten hinterfragt werden.
Verifikation muss systematisch sein. Cross-Checks, alternative Formulierungen und externe Referenzen sind deshalb kein Luxus – sie sind Teil der Methodik.
Einschätzung
Platon hatte recht: Ein Text allein reicht nicht aus, um Wissen zuverlässig zu vermitteln – weil ohne echten Dialog kein echtes Verständnis entsteht.
LLMs ändern daran weniger, als es zunächst scheint. Zwar verwandeln sie Text in einen scheinbaren Dialog – echtes Verstehen entsteht dabei jedoch nicht.
Das gilt ebenso für einen aktuellen Trend in der Softwareentwicklung: Vibe Coding. Der Begriff beschreibt die Praxis, KI-generierten Code zu übernehmen, ohne ihn vollständig zu verstehen – solange er funktioniert. Genau das ist Platons Problem in moderner Form: Output ohne Dialog, Ergebnis ohne Verständnis. Was im Kleinen harmlos wirkt, wird in komplexen Systemen deshalb zum strukturellen Risiko.
Für AI-basierte QA bedeutet das: Verlässlichkeit entsteht nicht durch das Modell allein, sondern durch den Prozess, in dem es eingesetzt wird.
Letztlich zeigt sich die Qualität eines AI-Systems nicht in seinen Antworten – sondern darin, wie gut wir gelernt haben, es zu hinterfragen.
Weiterführende Ressourcen
Philosophischer Hintergrund
- Platons Phaidros – Wikipedia-Einstieg zum Dialog
- Dialektik bei Platon – Begriffsklärung


Schreibe einen Kommentar