GPT-5.3 Instant & GPT-5.4: Was OpenAIs zwei neue Modelle können
Instant für bessere Alltagsgespräche, GPT-5.4 für professionelle Wissensarbeit mit Computer-Bedienung und einer Million Token Kontext.

Auf einen Blick
- GPT-5.4 vereint Reasoning, Coding und Computer-Bedienung in einem Modell — das erste OpenAI-Modell, das Anwendungen eigenständig per Maus und Tastatur steuern kann
- Gleichzeitig macht GPT-5.3 Instant alltägliche Gespräche flüssiger und direkter — weniger Phrasen, weniger unnötige Ablehnungen
- OpenAI trennt damit klar: Instant für den Alltag, Thinking für komplexe Aufgaben — ein Auto-Modus wählt automatisch das passende Modell
Das solltest du tun
- 1Prüfe, ob Computer-Use für deine wiederkehrenden Büroaufgaben relevant ist — besonders bei Workflows über mehrere Anwendungen hinweg
- 2Teste GPT-5.3 Instant für Kunden-Chatbots und interne Assistenten: Die natürlicheren Antworten könnten die Akzeptanz bei Mitarbeitern steigern
Am 5. März 2026 hat OpenAI zwei neue Modelle vorgestellt, die unterschiedliche Aufgaben erfüllen sollen. Während GPT-5.3 Instant die täglichen Gespräche mit KI verbessert, richtet sich GPT-5.4 klar an professionelle Wissensarbeit — mit einer Fähigkeit, die es bisher bei OpenAI nicht gab: dem eigenständigen Bedienen von Anwendungen.
Was das für Unternehmen bedeutet, wo die Modelle verfügbar sind und ob OpenAIs wachsende Modellpalette noch übersichtlich bleibt.
1 Mio.
Token Kontext
ca. 3.000 Seiten Text
−33 %
weniger Fehler
vs. GPT-5.2
83 %
GDPval-Score
Wissensarbeit-Benchmark
75 %
OSWorld
Computer-Bedienung
GPT-5.3 Instant: Bessere Gespräche, weniger Phrasen
GPT-5.3 Instant ist kein Modell für komplexe Analyse. Es ist ein Update für den Alltag: Wenn du ChatGPT für E-Mails, Zusammenfassungen oder schnelle Fragen nutzt, sollen die Antworten jetzt flüssiger, relevanter und direkter sein.
"Es ist wichtig zu beachten, dass diese Frage verschiedene Perspektiven berücksichtigen sollte. Grundsätzlich lässt sich sagen..."
"Das hängt von drei Faktoren ab: [1], [2] und [3]. Hier die Details..."
Weniger unnötige Ablehnungen, weniger moralisierende Einschübe, direkte Antworten. Laut OpenAI sinkt die Fehlerrate (Halluzinationen) um rund 27 % gegenüber dem Vorgängermodell. Einen ausführlichen Blick auf das Instant-Modell bietet unser GPT-5.3 Instant Artikel.
GPT-5.4: Professionelle Wissensarbeit
GPT-5.4 ist OpenAIs neues Flaggschiff-Modell. Es kombiniert drei Fähigkeiten, die bisher auf verschiedene Modelle verteilt waren:
Reasoning — komplexe Denkaufgaben
Analysen, Strategien, mehrstufige Probleme lösen. Die Reasoning-Fähigkeit von GPT-5.2 ist jetzt direkt integriert.
Coding — Software entwickeln und prüfen
Erstmals sind die Coding-Fähigkeiten von GPT-5.3-codex im Hauptmodell integriert. Code schreiben, testen und verifizieren in einem Schritt.
Computer-Use — Anwendungen eigenständig bedienen
Die KI analysiert Bildschirminhalte und simuliert Maus- und Tastatureingaben. Sie kann Formulare ausfüllen, Tabellen bearbeiten oder Änderungen in Programmen prüfen.
Drei Varianten: Standard, Thinking, Pro
GPT-5.4 gibt es in drei Ausführungen. Der Unterschied liegt in der Denktiefe und dem Preis:
| Variante | Stärke | Für wen | Zugang |
|---|---|---|---|
| GPT-5.4 | Schnelle, effiziente Antworten | Allround-Nutzung, API-Entwickler | Alle Tarife |
| GPT-5.4 Thinking | Tiefes Reasoning, zeigt Denkschritte | Analyse, Strategie, Coding | Plus, Team, Pro |
| GPT-5.4 Pro | Maximale Leistung, dedizierte GPU | Finanzmodelle, Forschung, Enterprise | Pro ($200/Mo) |
In ChatGPT gibt es einen Auto-Modus, der automatisch zwischen den Varianten wechselt — je nachdem wie komplex die Aufgabe ist. Für die meisten Nutzer heißt das: Du musst dich nicht aktiv für ein Modell entscheiden.
Benchmarks: Zahlen eingeordnet
Benchmarks sind standardisierte Tests, die messen, wie gut eine KI bestimmte Aufgaben löst. Hier die wichtigsten Ergebnisse im Vergleich:
| Benchmark | Was er misst | GPT-5.2 | GPT-5.4 |
|---|---|---|---|
| GDPval | Wissensarbeit über 44 Berufe hinweg | — | 83 % |
| OSWorld | Desktop-Bedienung per Maus/Tastatur | 47,3 % | 75,0 % |
| BrowseComp | Eigenständiges Recherchieren im Web | — | 89,3 % |
| Fehlerrate | Wahrscheinlichkeit falscher Behauptungen | Basis | −33 % |
ChatGPT für Excel: KI direkt in der Tabelle
Zusammen mit GPT-5.4 hat OpenAI ein Excel-Add-in vorgestellt. ChatGPT arbeitet damit direkt in Excel-Arbeitsmappen — nicht als separates Fenster, sondern eingebettet in die Tabelle.
Formeln generieren — Beschreibe in Alltagssprache, was berechnet werden soll. Die KI erstellt die passende Excel-Formel.
Szenarien durchspielen — "Was passiert, wenn der Umsatz um 15 % sinkt?" Die KI passt das Modell an und zeigt die Auswirkungen.
Finanzmodelle bauen — Auf OpenAIs Investment-Banking-Benchmark stieg die Leistung von 43,7 % (GPT-5) auf 87,3 % (GPT-5.4 Thinking).
Was kostet es?
GPT-5.4 ist in allen ChatGPT-Tarifen verfügbar — allerdings mit unterschiedlichen Limits:
| Tarif | Preis | GPT-5.4 Thinking | Computer-Use |
|---|---|---|---|
| Free | $0 | Nicht enthalten | Nicht enthalten |
| Plus | $20/Mo | 80 Nachrichten / 3 Std. | Über API |
| Pro | $200/Mo | Unlimitiert + dedizierte GPU | In Codex + API |
Einordnung: Sinnvoll oder Modell-Chaos?
Die Trennung zwischen Instant (Alltag) und Thinking (komplexe Aufgaben) ergibt Sinn. Nicht jede Frage braucht tiefes Nachdenken — und nicht jede Analyse profitiert von Geschwindigkeit auf Kosten der Gründlichkeit.
Aber: OpenAIs Modellpalette wird zunehmend unübersichtlich. Neben GPT-5.4 (Standard, Thinking, Pro) gibt es weiterhin GPT-5.3 Instant, GPT-5.3 voll, o3, o4-mini und diverse Spezialmodelle für Codex. In der Codex-App sind mittlerweile zahlreiche Abstufungen verfügbar, die selbst für erfahrene Nutzer schwer zu unterscheiden sind.
Der Auto-Modus in ChatGPT federt die Komplexität ab — die meisten Nutzer werden nie aktiv ein Modell wählen müssen. Die Frage ist, ob das auch bei API-Integrationen und Enterprise-Einsätzen funktioniert, wo Teams bewusst steuern wollen, welches Modell welche Aufgabe übernimmt.
Zum Vergleich: Anthropic setzt mit Claude Opus, Sonnet und Haiku auf drei klar abgegrenzte Stufen. Google fährt mit Gemini einen ähnlichen Ansatz. OpenAIs Strategie, viele spezialisierte Varianten anzubieten, ist leistungsfähiger — aber auch erklärungsbedürftig.
Was dafür spricht
- + Computer-Use öffnet neue Automatisierungsmöglichkeiten
- + 1 Mio. Token Kontext für große Dokumente und Codebasen
- + Auto-Modus macht die Modellwahl unsichtbar
- + Excel-Integration bringt KI direkt in den Workflow
Was dagegen spricht
- - Wachsende Modellpalette kann verwirren
- - Computer-Use nur über API/Codex, nicht in ChatGPT
- - Excel-Add-in noch nicht in Europa verfügbar
- - Pro-Tarif ($200/Mo) für volle Leistung nötig
Was das für dein Unternehmen bedeutet
Computer-Use wird Enterprise-relevant
Wenn KI Anwendungen eigenständig bedienen kann, verändern sich Automatisierungs-Workflows grundlegend. Statt APIs zu programmieren, kann die KI Programme so nutzen, wie ein Mensch es tun würde. Besonders für Legacy-Software ohne API-Schnittstellen ist das relevant.
Die Modellwahl wird zur IT-Entscheidung
Mit GPT-5.4, Claude Opus 4.6 und Gemini 3.1 Pro gibt es jetzt drei Flaggschiff-Modelle mit unterschiedlichen Stärken. Unternehmen sollten nicht mehr fragen "Welche KI nutzen wir?", sondern "Welche KI für welche Aufgabe?" Ein Modell-Vergleich hilft bei der Orientierung.
Sofort testen: GPT-5.3 Instant für interne Tools
Die verbesserte Gesprächsqualität von GPT-5.3 Instant ist direkt nutzbar — ohne Zusatzkosten für bestehende ChatGPT-Nutzer. Ideal für einen Pilottest: Ersetze probeweise den bisherigen Chatbot in einem internen Tool und miss die Mitarbeiter-Zufriedenheit.
Quellen
- OpenAI: "Introducing GPT-5.4" (5. März 2026)
- TechCrunch: "OpenAI launches GPT-5.4 with Pro and Thinking versions" (5. März 2026)
- OpenAI: "Introducing ChatGPT for Excel" (5. März 2026)
- DataCamp: "GPT-5.4: Native Computer Use, 1M Context Window, Tool Search" (2026)
- The Decoder: "OpenAI launches GPT-5.4 Thinking and Pro" (März 2026)
Weiterlesen
GPT-5.3 Instant: Schneller, direkter, weniger Phrasen
Was das Instant-Modell für den Arbeitsalltag ändert.
Modell-Blitz: 3 KI-Riesen droppen gleichzeitig neue Modelle
Claude 4.6, GPT-5.3 und Gemini 2.5 Pro im Vergleich.
Claude Code vs. OpenAI Codex: Welcher Coding-Agent passt?
Die zwei größten Coding-Agenten im direkten Vergleich.