Rely-QA

Platon und das Problem mit KI-Antworten

April 27, 2026

Warum eine 2.400 Jahre alte Kritik am Text erklärt, warum verlässliche AI mehr braucht als gute Outputs

Kurz zur Einordnung: Wer war Platon – und was ist der Phaidros?

Platon war ein griechischer Philosoph, der etwa 400 v. Chr. lebte und lehrte. Er ist vor allem bekannt für seine Dialoge – Texte, in denen sein Lehrer Sokrates mit anderen Menschen über grundlegende Fragen diskutiert: Was ist Wahrheit? Was ist Wissen? Wie entsteht echtes Verständnis?

Einer dieser Dialoge heißt Phaidros. Darin geht es unter anderem um Sprache, Rhetorik und – überraschend modern – um die Frage, ob das geschriebene Wort überhaupt geeignet ist, Wissen zu vermitteln.

Platons Antwort: nur bedingt. Und diese Einschränkung ist bis heute relevant.

Ich bin kein Platon-Spezialist. Aber als ich mich intensiver mit verlässlicher AI beschäftigte, wurde mir irgendwann bewusst, dass Systeme überzeugend klingen können – und trotzdem falsch liegen. Mein Kollege Harald Huber machte mich dann auf den Zusammenhang mit Platon aufmerksam. Und seitdem lässt mich dieser Gedanke nicht mehr los.

Ein altes Problem, neu gestellt

Im Phaidros formuliert Platon eine Kritik an der Schrift, die auf den ersten Blick seltsam anmutet: Ein Text, so sein Argument, kann nicht reagieren. Er stellt keine Rückfragen, korrigiert keine Missverständnisse und bleibt stumm – egal wie gut oder wie falsch er verstanden wird.

Das klingt zunächst wie eine Randnotiz aus der Philosophiegeschichte. Dennoch: Für verlässliche AI-Systeme ist es das nicht.

Was LLMs scheinbar lösen

Large Language Models wirken auf den ersten Blick wie eine direkte Antwort auf Platons Kritik.

Ein klassischer Text ist statisch. Ein LLM hingegen ist reaktiv – es antwortet auf Fragen. Außerdem ist es iterativ – man kann nachhaken. Und schließlich ist es adaptiv – es passt sich dem Gesprächsverlauf an.

Oberflächlich betrachtet ist das genau das, was Platon an der Schrift vermisste: die Fähigkeit zum Dialog. Damit entsteht der Eindruck, dass das Problem gelöst ist.

Aber das greift zu kurz.

Simulation ist kein Verstehen

Platons Kritik war tiefer als das bloße Problem der Statik. Sein eigentliches Argument lautet: Ohne echten Dialog entsteht kein echtes Verständnis. Ein Text kann Wissen transportieren – er kann jedoch nicht prüfen, ob es angekommen ist. Und ein System, das lediglich so tut, als ob es antwortet, löst dieses Problem ebenfalls nicht.

Ein LLM besteht diesen Test daher nur bedingt.

Es generiert Sprache auf Basis statistischer Muster – ohne eigenes Wahrheitsinteresse und ohne Verantwortung für seine Aussagen. Zudem merkt das System nicht, wenn eine Antwort falsch ist – es sei denn, man konfrontiert es gezielt damit. Warum LLMs dabei so überzeugend klingen und trotzdem falsch liegen, erklären wir ausführlicher in unserem Beitrag zu Spilled Energy in Large Language Models.

Platon würde das wahrscheinlich so formulieren: KI ist kein Gesprächspartner. Sie ist ein animierter Text.

Ein konkretes Beispiel verdeutlicht das: Der 115-Chatbot – der digitale Assistent der deutschen Behördenrufnummer – kann Bürger über die beste Reihenfolge von Behördengängen beraten und führt dabei einen scheinbar hilfreichen Dialog. Er kennt jedoch nicht die realen Abläufe, Wartezeiten oder lokalen Zuständigkeiten dahinter. Er berät folglich nicht aus Wissen heraus, sondern aus Text. Und weil das notwendige Wissen im Text schlicht nicht enthalten ist, bleibt der Text – trotz allem Dialog – Text. Fast schon platonisch.

Das konkrete Risiko für QA

Für Qualitätssicherung hat das direkte Konsequenzen.

Antworten klingen plausibel, auch wenn sie falsch sind. Unsicherheiten werden selten explizit gemacht. Außerdem fallen Widersprüche oft nur bei gezielter Prüfung auf.

Folglich kann ein AI-System den Eindruck von Qualität erzeugen, ohne tatsächlich zuverlässig zu sein.

In klassischen QA-Prozessen prüft man Ergebnisse. Bei AI muss man darüber hinaus prüfen, wie diese Ergebnisse zustande kommen – und wie stabil sie unter Variation sind. Andernfalls bewertet man nicht das System, sondern lediglich einen günstigen Moment. Wie man dabei konkret vorgeht, zeigt unser Beitrag zu Context Engineering für Chatbots.

QA als Dialektik

Wenn man Platons Argument ernst nimmt, dann ist zuverlässige QA kein statischer Prüfprozess. Vielmehr ist sie ein dialogischer.

Das hat vier praktische Konsequenzen:

Prompting ist Methodik. Die Qualität der Frage bestimmt die Qualität der Antwort. Wer das nicht berücksichtigt, bewertet daher nicht das System – er bewertet seine eigene Fragestellung. Mehr dazu in unserem Beitrag Mit der richtigen Frage zur richtigen Antwort.

Single-Shot-Antworten sind strukturell unsicher. Verlässlichkeit entsteht erst durch Iteration, Variation und Gegenprüfung. Einzelne Antworten sind folglich immer mit Vorsicht zu interpretieren.

Erklärungen sind keine Beweise. Nur weil ein Modell etwas nachvollziehbar erklärt, heißt das nicht, dass es korrekt ist. Im Gegenteil: Gut klingende Antworten sind besonders gefährlich, weil sie selten hinterfragt werden.

Verifikation muss systematisch sein. Cross-Checks, alternative Formulierungen und externe Referenzen sind deshalb kein Luxus – sie sind Teil der Methodik.

Einschätzung

Platon hatte recht: Ein Text allein reicht nicht aus, um Wissen zuverlässig zu vermitteln – weil ohne echten Dialog kein echtes Verständnis entsteht.

LLMs ändern daran weniger, als es zunächst scheint. Zwar verwandeln sie Text in einen scheinbaren Dialog – echtes Verstehen entsteht dabei jedoch nicht.

Das gilt ebenso für einen aktuellen Trend in der Softwareentwicklung: Vibe Coding. Der Begriff beschreibt die Praxis, KI-generierten Code zu übernehmen, ohne ihn vollständig zu verstehen – solange er funktioniert. Genau das ist Platons Problem in moderner Form: Output ohne Dialog, Ergebnis ohne Verständnis. Was im Kleinen harmlos wirkt, wird in komplexen Systemen deshalb zum strukturellen Risiko.

Für AI-basierte QA bedeutet das: Verlässlichkeit entsteht nicht durch das Modell allein, sondern durch den Prozess, in dem es eingesetzt wird.

Letztlich zeigt sich die Qualität eines AI-Systems nicht in seinen Antworten – sondern darin, wie gut wir gelernt haben, es zu hinterfragen.

Weiterführende Ressourcen

Philosophischer Hintergrund

Platons Phaidros – Wikipedia-Einstieg zum Dialog
Dialektik bei Platon – Begriffsklärung

2 Antworten zu „Platon und das Problem mit KI-Antworten“

raimund vollmer

Mai 1, 2026

Sokrates wollte nicht schriftlich fixiert werden, sein Schüler Platon hat diesem Wunsch zuwidergehandelt, obwohl er darob selber skeptisch war (Siehe Deinen Beitrag). Von Jesus gibt es kein einziges von ihm persönlich niedergeschriebenes Wort. Es sind alles nur Zietierungen durch Dritte (Evangelisten). Im Alten Testament diktiert Gott nur einmal etwas direkt einem Menschen: die zehn Gebote an Moses. Und im Neuen Testament haben wir so etwas nur in der Johannes-Offenbarung, die deshalb meines Erachtens gar nicht ins Neue Testament gehört. Der islamische Glaube hingegen basiert vollständig auf der Offenbarung Gottes durch den Propheten Mohammed. Unser ganzes Leben basiert aber auf der Verschriftlichung aller Verhältnisse. Software ist schreiben und maßt sich nun an, unser Leben zu bestimmen – in mehr oder minder gut kaschierter Befehlsform. Der Befehl ist die Satzform, die keine Zeit kennt, die ohne Subjekt und ohne Objekt auskommt, also beide nivelliert. Der alte Spruch: Dem Internet ist es egal, ob du ein Hund bist, gilt nach wie vor. Es ist ihm auch egal, ob Du ein Mensch bist. Und darin liegt alle Gefahr. Wir eliminieren uns selbst durch die AI. Und die IT-Leute betreiben fleißig dieses Geschäft, bis sie selbst dran sind… So, das wirf mal dem Positivisten Harald als Papierknüll hinüber. Herzlichst Raimund

Antworten
1. Anonym
  
  Juni 3, 2026
  
  Ein bemerkenswerter Kommentar, der die technologische Entwicklung unserer Zeit aus einer fast schon theologiegeschichtlichen Perspektive betrachtet. Genau dies habe ich von dir erwartet ;-).
  
  Die Parallele zwischen der Skepsis gegenüber der Verschriftlichung (Sokrates/Platon) und unserer heutigen Skepsis gegenüber der algorithmischen ‚Verschriftlichung‘ unseres Lebens ist bestechend. Du beschreibst die KI-Struktur als einen Befehl ohne Subjekt – eine Art ‚technologische Gesetzestafel‘, die aber im Gegensatz zu den zehn Geboten keinen göttlichen Anspruch auf Ethik hat, sondern lediglich auf statistischer Wahrscheinlichkeit basiert.
  
  Dass Software den Anspruch erhebt, unser Leben zu organisieren, ohne ein ‚Gegenüber‘ zu besitzen, ist in der Tat der Kern des Unbehagens. Wenn das System den Menschen als Subjekt nivelliert, weil es nur noch in Input-Output-Relationen rechnet, verlieren wir in der Tat die diskursive Dimension, die Sokrates noch im lebendigen Gespräch einforderte.
  
  Ich werfe diesen Gedankenball (statt des Papierknülls) mal Harald zu: Ist die KI wirklich nur die Perfektionierung der ‚Schrift‘, die uns – wie Sokrates befürchtete – das Gedächtnis und die kritische Prüfung nimmt, oder ist sie eine neue Form der Autorität, der wir uns mangels eigener Orientierung freiwillig unterwerfen?
  
  Danke für diesen tiefgründigen Beitrag, der zeigt, dass es in der IT-Debatte eben nicht nur um Effizienz geht, sondern um die Frage, wer oder was in unserer Kultur das ‚Subjekt‘ bleiben darf.
  
  Antworten