Teil 1: Das Sprachmodell liegt falsch
Gemeinsames Experiment
- Öffne dein Sprachmodell (ChatGPT, Copilot, Claude, oder Gemini)
- Kopiere den Prompt unten und füge ihn ein
- Sende die Anfrage ab
- Notiere dir die Zahl, die das Modell nennt
- Falls du Zeit hast: öffne einen neuen Chat und wiederhole Schritte 2-4 (mindestens zweimal)
Wie hoch ist der Anteil der Studierenden an Schweizer Universitäten, die ihr Bachelorstudium in der Regelstudienzeit abschliessen?
- Teile deine Antwort mit der Gruppe
- Vergleicht die Zahlen: Sind sie gleich oder unterschiedlich?
Die zentrale Erkenntnis: Weder Variabilität noch Konsistenz sagen dir, ob eine Antwort stimmt. Das kannst du nur durch externe Verifikation herausfinden.
Wir prüfen jetzt gemeinsam:
- Neuen Browser-Tab öffnen
- Suchen:
BFS Studiendauer Bachelor Schweiz - Zur BFS-Seite (bfs.admin.ch) navigieren
- Die Behauptung überprüfen: Kannst du die genannten Zahlen (z.B. “25-30%”) verifizieren?
Hintergrund: Warum variieren die Antworten?
Sprachmodelle sind stochastische Textgeneratoren: Jede Antwort wird neu “gewürfelt”. Wenn verschiedene Durchläufe sehr unterschiedliche Zahlen liefern, zeigt das: Das Modell hat wenig Anhaltspunkte zu diesem Thema.
Aber Vorsicht: Wenn das Modell immer dieselbe Zahl nennt, heisst das nicht, dass sie stimmt. Es heisst nur, dass das Modell stark darauf festgelegt ist, diese Antwort zu geben. Konsistenz ist kein Beweis für Korrektheit.
Hintergrund: Warum fühlt sich das so vertrauenswürdig an?
Chatbots präsentieren Informationen in einem freundlichen, sicheren Ton, der menschliche Experten imitiert. Im Gespräch mit einem Menschen ist Flüssigkeit und Selbstsicherheit oft ein Signal für Kompetenz. Bei Sprachmodellen funktioniert diese Heuristik nicht: Sie klingen gleich überzeugend, ob die Antwort stimmt oder nicht.
Das kann dazu führen, dass wir Prüfschritte überspringen, die wir bei anderen Quellen automatisch machen würden.
- Wie stark variierten deine Antworten bei mehreren Durchläufen?
- Konntest du die Zahlen des Sprachmodells auf BFS verifizieren?
- Klang die Antwort vorsichtig oder sehr sicher?
Vier wichtige Erkenntnisse:
Variabilität zeigt Unsicherheit, aber Konsistenz beweist nichts. Wenn das Modell bei jedem Durchlauf andere Zahlen nennt, ist es unsicher. Aber wenn es immer dieselbe Zahl nennt, heisst das nur, dass es stark darauf festgelegt ist: nicht, dass die Zahl stimmt.
Spezifität täuscht Zuverlässigkeit vor. Genaue Zahlen, Spannen oder Details klingen vertrauenswürdig, sind aber kein Beweis für Richtigkeit.
Unverifizierbar = unbrauchbar. Wenn du eine Behauptung nicht mit einer verlässlichen Quelle belegen kannst, darfst du sie nicht in formellen Dokumenten verwenden.
Nachfragen hilft nicht. Das Modell kann seine eigenen Aussagen nicht überprüfen (das kommt in Teil 2).
Vertrauen ist gut, Verifikation ist besser.
Auch qualifizierte, vorsichtig formulierte Antworten brauchen externe Verifikation. Du kannst nicht an der Formulierung erkennen, ob eine Antwort richtig ist.
Das einzige verlässliche Kriterium: Kannst du die Behauptung mit einer vertrauenswürdigen Quelle belegen?