15 June, 2023
Here’s What Happens When Your Lawyer Uses ChatGPT
The Best Prompts For ChatGPT: The ultimate list
1 2 3 4 5 6 7
Regelbasierte Systeme müssen programmiert werden.
ML Modelle lernen implizit, d.h. ohne Regeln einprogrammiert zu bekommen.
Wichtige Begriffe:
We have to learn the bitter lesson that building in how we think we think does not work in the long run. We should stop trying to find simple ways to think about space, objects, multiple agents, or symmetries… instead we should build in only the meta-methods that can find and capture this arbitrary complexity. We want AI agents that can discover like we can, not which contain what we have discovered (Sutton 2019).
Bilder von Hunden und Katzen klassifizeren: Was sind die Merkmale, die Hunde von Katzen unterscheiden?
1 2 3 4 5 6 7
Besteht aus 2 Modellen:
Large language model (LLM): GPT-3.5 oder GPT-4 (generative pre-trained transformer): das eigentliche Sprachmodell
Assistant: Ein für Dialoge spezialisiertes Modell
Aufgabe eines LLMs: “auto-regressive next word prediction” (eigentlich “token prediction”):
\[ P(w_{w+1} | w_1, w_2, ..., w_t) \]
1 2 3 4 5 6 7
Benutzt Feedback vom Menschen um “schlechte” Outputs zu minimieren.
1 2 3 4 5 6 7
Training: “What we do know is that training ChatGPT used \(1.287\) GWh, roughly equivalent to the consumption of 120 US homes for a year.” Quelle: Heating up: how much energy does AI use?
Patterson et al. (2022) schätzen die Trainingskosten auf 502 Tonnen \(\text{CO}_2\) (RLHF würde etwas mehr kosten, ca. 1% der ursprünglichen Kosten).
Benutzung: 7 Tonnen \(\text{CO}_2\) pro Tag (Ende Februar). Quelle: How much energy does ChatGPT use?
Der Energieverbrauch von ChatGPT ist equivalent zu 400-800 US Haushalten. Das ist beträchtlich, im Vergleich zu z.B. Kryptowährungen eher gering.
Quelle: Hast du Vorurteile?
Quelle: Traumatische Klickarbeit
1 2 3 4 5 6 7
We can think of an LLM as a non-deterministic simulator capable of role-playing an infinity of characters, or, to put it another way, capable of stochastically generating an infinity of simulacra.
Quelle: Shanahan, McDonell, and Reynolds (2023)
Weitere Beispiele: Bubeck et al. (2023)
System 1: schnell, instinktiv, automatisch
System 2: langsam, deliberativ, anstrengend
Qualität der Antwort hängt sehr von der Qualität des Prompts ab.
2 Möglichkeiten, um die Qualität der Antworten zu verbessern:
Am besten selber ausprobieren.
Beispiel Hochschullehre: Feedback
“I want you to act as a harsh critic. Criticize what I will write to you and show me where my argumentation is lacking. Start by ask- ing me what text I want to have feedback on. Then ask me questions about my context to create the best feedback possible. If you feel you have all the context necessary, think step by step when creating your feedback” (Lenk-Ostendorf & Folgmann 2023)
Weitere Beispiele
1 2 3 4 5 6 7
Beispiel: Assistant für KI in der Hochschullehre
1 2 3 4 5 6 7
Möglicher Pauschalverweis
“Beim Verfassen der Arbeit habe ich das KI-gestützte Schreibwerkzeug ChatGPT zur Textoptimierung verwendet. Wörtlich aus dem Tool übernommene Passagen wurden im Text als persönliche Kommunikation zitiert.”
Quelle: Salden (2023)