Informationsanlass zu KI/ChatGPT

Andrew Ellis

15 June, 2023

Here’s What Happens When Your Lawyer Uses ChatGPT

The Best Prompts For ChatGPT: The ultimate list

Inhalt

Was ist künstliche Intelligenz?
Was ist ChatGPT?
Wie wurde ChatGPT trainiert?
Energieverbrauch, Bias, Ethik
Wie “denkt” ChatGPT?
Zukünftige Verwendungen von LLMs
Wissenschaftliches Arbeiten

Was ist künstliche Intelligenz?

1 2 3 4 5 6 7

Was ist Künstliche Intelligenz?

Quelle: derbund.ch/so-funktioniert-kuenstliche-intelligenz-599276436215

Machine Learning

Regelbasierte Systeme müssen programmiert werden.
ML Modelle lernen implizit, d.h. ohne Regeln einprogrammiert zu bekommen.
Wichtige Begriffe:
- Trainingsdaten: Modelle werden mit Daten gefüttert, und Parameter des Modells werden so eingestellt, dass das Modell möglichst “gut” ist.
- Supervised learning: Aufgabe ist bekannt, z.B. Bilder - klassifizieren.
- Unsupervised learning: Unbekannte Muster entdecken.
- Reinforcement learning: Ziel ist vorgegeben, Modell lernt durch Feedback (Belohnung) wie Ziel erreicht werden kann.

We have to learn the bitter lesson that building in how we think we think does not work in the long run. We should stop trying to find simple ways to think about space, objects, multiple agents, or symmetries… instead we should build in only the meta-methods that can find and capture this arbitrary complexity. We want AI agents that can discover like we can, not which contain what we have discovered (Sutton 2019).

Supervised learning

Bilder von Hunden und Katzen klassifizeren: Was sind die Merkmale, die Hunde von Katzen unterscheiden?

Reinforcement learning

Was ist ChatGPT?

1 2 3 4 5 6 7

Natural Language Processing

Speech recognition
Text-to-speech synthesis
Machine translation
Information extraction
Information retrieval
Question answering

Sentiment analysis
- 😊 I love this movie!
- 😐 This movie is ok.
- 😠 This movie is terrible!

Tokenization

Quelle: State of ChatGPT

Embeddings

Numerische Tokens werden in einem hochdimensionalen Vektorraum abgebildet.
Distanz zwischen Vektoren misst Ähnlichkeit zwischen Tokens.

ChatGPT

Besteht aus 2 Modellen:

Large language model (LLM): GPT-3.5 oder GPT-4 (generative pre-trained transformer): das eigentliche Sprachmodell
Assistant: Ein für Dialoge spezialisiertes Modell

LLM

Aufgabe eines LLMs: “auto-regressive next word prediction” (eigentlich “token prediction”):

\[ P(w_{w+1} | w_1, w_2, ..., w_t) \]

Das nächste Wort wird vorhergesagt, basierend auf den vorherigen Worten.
Diese vorherigen Wörter werden als “context” bezeichnet.

Assistant

LLM produziert Text, aber nicht menschliche Konversationen.
Weiteres Training ist erforderlich, damit das Modell lernt, wie ein Mensch “Konversationen” zu führen.

Wie wurde ChatGPT trainiert?

1 2 3 4 5 6 7

Daten

Methoden

We trained this model using Reinforcement Learning from Human Feedback (RLHF), using the same methods as InstructGPT, but with slight differences in the data collection setup. We trained an initial model using supervised fine-tuning: human AI trainers provided conversations in which they played both sides—the user and an AI assistant. We gave the trainers access to model-written suggestions to help them compose their responses. We mixed this new dialogue dataset with the InstructGPT dataset, which we transformed into a dialogue format.

To create a reward model for reinforcement learning, we needed to collect comparison data, which consisted of two or more model responses ranked by quality. To collect this data, we took conversations that AI trainers had with the chatbot. We randomly selected a model-written message, sampled several alternative completions, and had AI trainers rank them. Using these reward models, we can fine-tune the model using Proximal Policy Optimization. We performed several iterations of this process.

Pre-training

Reinforcement Learning from Human Feedback (RLHF)

Benutzt Feedback vom Menschen um “schlechte” Outputs zu minimieren.

Quelle: openai.com/blog/chatgpt

Energieverbrauch, Bias, Ethik

1 2 3 4 5 6 7

Energieverbrauch

Training: “What we do know is that training ChatGPT used \(1.287\) GWh, roughly equivalent to the consumption of 120 US homes for a year.” Quelle: Heating up: how much energy does AI use?
Patterson et al. (2022) schätzen die Trainingskosten auf 502 Tonnen \(\text{CO}_2\) (RLHF würde etwas mehr kosten, ca. 1% der ursprünglichen Kosten).
Benutzung: 7 Tonnen \(\text{CO}_2\) pro Tag (Ende Februar). Quelle: How much energy does ChatGPT use?
Der Energieverbrauch von ChatGPT ist equivalent zu 400-800 US Haushalten. Das ist beträchtlich, im Vergleich zu z.B. Kryptowährungen eher gering.

Bias

Da LLMs von Texten lernen, die von Menschen geschrieben wurden, können sie auch Vorurteile lernen.

Quelle: Hast du Vorurteile?

Ethik

Auf Grund der grossen Menge von Trainingsdaten, die für Sprachmodelle benötigt werden, ist Qualitätskontrolle schwierig.
Diskriminierende oder beleidigende Aussagen werden von einem Chatbot generiert.
Solche Antworten können als unerwünscht markiert werden.
Toxische Inhalte wie körperliche und sexuelle Gewalt, Suizide und Tierquälerei, müssen beim Trainieren aus den Antworten gefiltert werden. Dabei mussten angestellte Arbeitskräfte für weniger als 2 Dollar die Stunde teils schockierende Inhalte lesen.

Quelle: Traumatische Klickarbeit

Use Cases

Wie “denkt” ChatGPT?

1 2 3 4 5 6 7

Wie generiert ChatGPT Text?

LLM: Gegeben eine Input-Sequenz von Tokens (Wörter, Teile von Wörtern, Satzzeichen, Emojis, etc.), was sind die wahrscheinlichsten nächsten Tokens?
Auto-regressiv: Ein Token wird generiert, wird dem Kontext hinzugefügt.

Der neue Kontext wird verwendet, um das nächste Token zu generieren, etc.
Wichtig: Jedes Token erhält gleich viel Zeit. Es gibt keine Tokens, die mehr oder weniger wichtig sind (Computation per Token ist konstant).

Prompt

Der ursprüngliche Kontext wird Prompt (Eingabetext) genannt.
Dieser ist entscheidend für die Qualität der Antwort.
Weil jedes Token gleich gewichtet wird, kann es an jeder Stelle im Ouptut zu “ungünstigen” Pfaden führen.

Prompt

Role-Playing Simulator

We can think of an LLM as a non-deterministic simulator capable of role-playing an infinity of characters, or, to put it another way, capable of stochastically generating an infinity of simulacra.

Quelle: Shanahan, McDonell, and Reynolds (2023)

Bei jeder Interaktion mit ChatGPT wird neu simuliert.

Role-Playing Simulator

Ein LLM ist keine Entität mit Handlungsabsichten, sondern ein Simulator von möglichen Konversationen.
ChatGPT hat kein Konzept von Wahrheit, sondern generiert Antworten, die plausibel sind.
Somit kann ChatGPT weder die Wahrheit sagen noch lügen - diese Konzepte sind für ein LLM vorerst irrelevant.

Was kann ChatGPT?

Weitere Beispiele: Bubeck et al. (2023)

Denkt ChatGPT?

System 1 vs System 2

Thinking Fast and Slow
System 1: schnell, instinktiv, automatisch
System 2: langsam, deliberativ, anstrengend

Prompt Engineering

Qualität der Antwort hängt sehr von der Qualität des Prompts ab.
2 Möglichkeiten, um die Qualität der Antworten zu verbessern:
- Incrementelle Prompts: Schritt für Schritt durch die Konversation führen (dialogisches Prompting).
- Mega-Prompts: Alle Informationen auf einmal geben.
Am besten selber ausprobieren.

Mega-Prompt

Rolle: Wer oder was wird simuliert?
Aufgabe: Was ist zu tun?
Arbeitschritte: Was ist in welcher Reihenfolge zu tun?
Kontext, Einschränkungen
Ziel: Was soll am Ende herauskommen?
Format: Wie soll das Ergebnis aussehen?

Beispiel Hochschullehre: Feedback

“I want you to act as a harsh critic. Criticize what I will write to you and show me where my argumentation is lacking. Start by ask- ing me what text I want to have feedback on. Then ask me questions about my context to create the best feedback possible. If you feel you have all the context necessary, think step by step when creating your feedback” (Lenk-Ostendorf & Folgmann 2023)

Weitere Beispiele

OpenAI Discord Server discord.com/invite/openai
Prompting Guide

Zukünftige Verwendungen von LLMs

1 2 3 4 5 6 7

Plug-ins

Retrieval-augmented LLMs

Beispiel: Assistant für KI in der Hochschullehre

Wissenschaftliches Arbeiten

1 2 3 4 5 6 7

Zitieren

Es existieren noch keine Richtlinien für das Zitieren von ChatGPT oder anderen KI-basierte Schreibtools.
ChatGPT ist rein rechtlich keine zitierfähige Quelle und damit auch nicht zitierpflichtig (Fleck 2023).

Möglicher Pauschalverweis

“Beim Verfassen der Arbeit habe ich das KI-gestützte Schreibwerkzeug ChatGPT zur Textoptimierung verwendet. Wörtlich aus dem Tool übernommene Passagen wurden im Text als persönliche Kommunikation zitiert.”

Plagiate und Detektion

Texte von ChatGPT werden jedes Mal individuell erstellt. Es handelt sich nicht um Plagiate.
Die klassischen Tools zur Aufdeckung von Plagiaten wie z.B. TurnItIn funktionieren hier nicht.

Kompetenznachweise

Siehe KI-basierte Schreibtools in der Lehre – ChatGPT im Fokus

Rechtliche Aspekte

ChatGPT kann keine Urheberschaft und keine Autorenschaft beanspruchen, da dies nur natürliche Personen können.
Menschen können die Urheberschaft eines Textes beanspruchen, auch wenn sie auf Unterstützung durch ChatGPT zurückgegriffen haben – sofern sie eine wesentliche gestalterische Eigenleistung am Text erbracht haben.

Quelle: Salden (2023)

Datenschutz

Anonyme Nutzung von ChatGPT ist mit persönlichen Konto nicht möglich (über Handynummer identifizierbar).
Alle Eingaben und alle Antworten werden bei ChatGPT unverschlüsselt abgespeichert.
Daten liegen auf amerikanischen Servern und sind damit für amerikanische Ermittlungsbehörden grundsätzlich zugänglich.

References

Broschinski, Sebastian, Titus Plattner, Patrick Meier, and Patrick Vögeli. 2023. “In 9 Grafiken erklärt – So funktioniert künstliche Intelligenz.” Der Bund. June 10, 2023. https://www.derbund.ch/so-funktioniert-kuenstliche-intelligenz-599276436215.

Bubeck, Sébastien, Varun Chandrasekaran, Ronen Eldan, Johannes Gehrke, Eric Horvitz, Ece Kamar, Peter Lee, et al. 2023. “Sparks of Artificial General Intelligence: Early Experiments with GPT-4.” April 13, 2023. http://arxiv.org/abs/2303.12712.

Fleck, Tilmann. 2023. “Prüfungsrechtliche Fragen zu ChatGPT.”

Patterson, David, Joseph Gonzalez, Quoc Le, Chen Liang, Lluis-Miquel Munguia, Daniel Rothchild, David So, Maud Texier, and Jeff Dean. 2022. “Carbon Emissions and Large Neural Network Training.”

Salden, Peter. 2023. “Didaktische und rechtliche Perspektiven auf KI-gestütztes Schreiben in der Hochschulbildung.” Ruhr-Universität Bochum. https://doi.org/10.13154/294-9734.

Shanahan, Murray, Kyle McDonell, and Laria Reynolds. 2023. “Role-Play with Large Language Models.” May 25, 2023. https://doi.org/10.48550/arXiv.2305.16367.

Sutton, Rich. 2019. “The Bitter Lesson.” 2019. http://incompleteideas.net/IncIdeas/BitterLesson.html.

Wolfram, Stephen. 2023. “What Is ChatGPT Doing … and Why Does It Work?” February 14, 2023. https://writings.stephenwolfram.com/2023/02/what-is-chatgpt-doing-and-why-does-it-work/.