Chain of Thought (CoT)
Details
- Vollständiger Name
-
Chain of Thought Prompting (Gedankenketten-Prompting)
Kernkonzepte:
- Schrittweises Denken
-
Zwischenschritte des Denkprozesses explizit zeigen, bevor eine Schlussfolgerung erreicht wird
- Transparente Argumentation
-
Den Denkprozess sichtbar machen, nicht nur die endgültige Antwort
- Zwischenrepräsentationen
-
Komplexe Probleme in kleinere, handhabbare Schritte zerlegen
- Fehlerreduzierung
-
Offengelegtes Denken ermöglicht Erkennung logischer Fehler im Prozess
- Zerlegung komplexer Aufgaben
-
Mehrstufige Probleme bewältigen, die nicht in einem Schritt gelöst werden können
- Zero-Shot CoT
-
Einfacher Prompt wie "Lass uns Schritt für Schritt denken" löst CoT-Verhalten aus
- Few-Shot CoT
-
Beispiele mit Argumentationsketten bereitstellen, um das Modell zu leiten
- Selbstkonsistenz
-
Mehrere Argumentationspfade generieren und konsistenteste Antwort wählen
- Schlüsselvertreter
-
Wei et al. (Google Research, 2022), "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models"
- Historischer Kontext
-
Durchbruch in der LLM-Prompting-Forschung, deutlich verbesserte Leistung bei Argumentationsaufgaben (Mathematik, Logik, gesunder Menschenverstand)
Wann zu verwenden:
-
Komplexe Argumentationsprobleme (mehrstufige Mathematik, Logikrätsel)
-
Wenn Sie den Argumentationsprozess verifizieren müssen, nicht nur die Antwort
-
Debugging fehlerhafter LLM-Ausgaben durch Sehen, wo die Argumentation schiefging
-
Lehren oder Erklären komplexer Themen, bei denen Schritte wichtig sind
-
Probleme, die Planung oder Strategie erfordern
-
Jede Aufgabe, bei der Zwischenschritte Wert bieten
Verwandte Forschung:
-
Tree of Thoughts (ToT): Erweiterung, die Verzweigung und Backtracking erlaubt
-
Self-Consistency: Mehrere Argumentationspfade samplen
-
Least-to-Most Prompting: Von einfach zu komplex aufbauen
Beispiel-Prompt-Muster:
Problem: [Komplexe Frage] Lass uns das Schritt für Schritt lösen: 1. [Erster Schritt] 2. [Zweiter Schritt] ... Daher: [Schlussfolgerung]
Aktueller Stand:
-
Der Kernbefund (Wei et al., NeurIPS 2022) ist stabil, seine praktische Relevanz aber cutoff-gebunden: Reasoning-Modelle (ab Ende 2024) internalisieren Chain-of-Thought im Training — OpenAIs eigene Doku rät für diese Modelle inzwischen von "think step by step"-Prompts ab
-
CoT-Output ist ein nützliches, aber unzuverlässiges Fenster ins Modell-Reasoning: Turpin et al., "Language Models Don’t Always Say What They Think" (2023) und Anthropics Follow-up von 2025 zeigen, dass das geäußerte Reasoning den tatsächlichen Entscheidungsfaktoren untreu sein kann — keine Safety- oder Audit-Garantie