Chain of Thought (CoT)

Details

Kernkonzepte:

Schrittweises Denken: Zwischenschritte des Denkprozesses explizit zeigen, bevor eine Schlussfolgerung erreicht wird
Transparente Argumentation: Den Denkprozess sichtbar machen, nicht nur die endgültige Antwort
Zwischenrepräsentationen: Komplexe Probleme in kleinere, handhabbare Schritte zerlegen
Fehlerreduzierung: Offengelegtes Denken ermöglicht Erkennung logischer Fehler im Prozess
Zerlegung komplexer Aufgaben: Mehrstufige Probleme bewältigen, die nicht in einem Schritt gelöst werden können
Zero-Shot CoT: Einfacher Prompt wie "Lass uns Schritt für Schritt denken" löst CoT-Verhalten aus
Few-Shot CoT: Beispiele mit Argumentationsketten bereitstellen, um das Modell zu leiten
Selbstkonsistenz: Mehrere Argumentationspfade generieren und konsistenteste Antwort wählen
Schlüsselvertreter: Wei et al. (Google Research, 2022), "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models"
Historischer Kontext: Durchbruch in der LLM-Prompting-Forschung, deutlich verbesserte Leistung bei Argumentationsaufgaben (Mathematik, Logik, gesunder Menschenverstand)

Komplexe Argumentationsprobleme (mehrstufige Mathematik, Logikrätsel)
Wenn Sie den Argumentationsprozess verifizieren müssen, nicht nur die Antwort
Debugging fehlerhafter LLM-Ausgaben durch Sehen, wo die Argumentation schiefging
Lehren oder Erklären komplexer Themen, bei denen Schritte wichtig sind
Probleme, die Planung oder Strategie erfordern
Jede Aufgabe, bei der Zwischenschritte Wert bieten

Problem: [Komplexe Frage]
Lass uns das Schritt für Schritt lösen:
1. [Erster Schritt]
2. [Zweiter Schritt]
...
Daher: [Schlussfolgerung]

Der Kernbefund (Wei et al., NeurIPS 2022) ist stabil, seine praktische Relevanz aber cutoff-gebunden: Reasoning-Modelle (ab Ende 2024) internalisieren Chain-of-Thought im Training — OpenAIs eigene Doku rät für diese Modelle inzwischen von "think step by step"-Prompts ab
CoT-Output ist ein nützliches, aber unzuverlässiges Fenster ins Modell-Reasoning: Turpin et al., "Language Models Don’t Always Say What They Think" (2023) und Anthropics Follow-up von 2025 zeigen, dass das geäußerte Reasoning den tatsächlichen Entscheidungsfaktoren untreu sein kann — keine Safety- oder Audit-Garantie