GPT-5.3 Instant & GPT-5.4: OpenAIs zwei neue Modelle

Am 5. März 2026 hat OpenAI zwei neue Modelle vorgestellt, die unterschiedliche Aufgaben erfüllen sollen. Während GPT-5.3 Instant die täglichen Gespräche mit KI verbessert, richtet sich GPT-5.4 klar an professionelle Wissensarbeit — mit einer Fähigkeit, die es bisher bei OpenAI nicht gab: dem eigenständigen Bedienen von Anwendungen.

Was das für Unternehmen bedeutet, wo die Modelle verfügbar sind und ob OpenAIs wachsende Modellpalette noch übersichtlich bleibt.

1 Mio.

Token Kontext

ca. 3.000 Seiten Text

−33 %

weniger Fehler

vs. GPT-5.2

83 %

GDPval-Score

Wissensarbeit-Benchmark

75 %

OSWorld

Computer-Bedienung

GPT-5.3 Instant: Bessere Gespräche, weniger Phrasen

GPT-5.3 Instant ist kein Modell für komplexe Analyse. Es ist ein Update für den Alltag: Wenn du ChatGPT für E-Mails, Zusammenfassungen oder schnelle Fragen nutzt, sollen die Antworten jetzt flüssiger, relevanter und direkter sein.

Vorher (GPT-5.2)

"Es ist wichtig zu beachten, dass diese Frage verschiedene Perspektiven berücksichtigen sollte. Grundsätzlich lässt sich sagen..."

Nachher (GPT-5.3 Instant)

"Das hängt von drei Faktoren ab: [1], [2] und [3]. Hier die Details..."

Weniger unnötige Ablehnungen, weniger moralisierende Einschübe, direkte Antworten. Laut OpenAI sinkt die Fehlerrate (Halluzinationen) um rund 27 % gegenüber dem Vorgängermodell. Einen ausführlichen Blick auf das Instant-Modell bietet unser GPT-5.3 Instant Artikel.

GPT-5.4: Professionelle Wissensarbeit

GPT-5.4 ist OpenAIs neues Flaggschiff-Modell. Es kombiniert drei Fähigkeiten, die bisher auf verschiedene Modelle verteilt waren:

Reasoning — komplexe Denkaufgaben

Analysen, Strategien, mehrstufige Probleme lösen. Die Reasoning-Fähigkeit von GPT-5.2 ist jetzt direkt integriert.

Coding — Software entwickeln und prüfen

Erstmals sind die Coding-Fähigkeiten von GPT-5.3-codex im Hauptmodell integriert. Code schreiben, testen und verifizieren in einem Schritt.

Computer-Use — Anwendungen eigenständig bedienen

Die KI analysiert Bildschirminhalte und simuliert Maus- und Tastatureingaben. Sie kann Formulare ausfüllen, Tabellen bearbeiten oder Änderungen in Programmen prüfen.

Was bedeutet "Computer-Use"? Stell dir vor, ein Mitarbeiter sitzt an deinem Bildschirm und bedient Programme für dich — klickt Buttons, füllt Formulare aus, kopiert Daten zwischen Anwendungen. Genau das macht GPT-5.4, nur automatisiert. Auf dem OSWorld-Benchmark — einem Test für Desktop-Bedienung — erreicht es 75 %, mehr als der menschliche Durchschnitt von 72,4 %.

Drei Varianten: Standard, Thinking, Pro

GPT-5.4 gibt es in drei Ausführungen. Der Unterschied liegt in der Denktiefe und dem Preis:

Variante	Stärke	Für wen	Zugang
GPT-5.4	Schnelle, effiziente Antworten	Allround-Nutzung, API-Entwickler	Alle Tarife
GPT-5.4 Thinking	Tiefes Reasoning, zeigt Denkschritte	Analyse, Strategie, Coding	Plus, Team, Pro
GPT-5.4 Pro	Maximale Leistung, dedizierte GPU	Finanzmodelle, Forschung, Enterprise	Pro ($200/Mo)

In ChatGPT gibt es einen Auto-Modus, der automatisch zwischen den Varianten wechselt — je nachdem wie komplex die Aufgabe ist. Für die meisten Nutzer heißt das: Du musst dich nicht aktiv für ein Modell entscheiden.

Benchmarks: Zahlen eingeordnet

Benchmarks sind standardisierte Tests, die messen, wie gut eine KI bestimmte Aufgaben löst. Hier die wichtigsten Ergebnisse im Vergleich:

Benchmark	Was er misst	GPT-5.2	GPT-5.4
GDPval	Wissensarbeit über 44 Berufe hinweg	—	83 %
OSWorld	Desktop-Bedienung per Maus/Tastatur	47,3 %	75,0 %
BrowseComp	Eigenständiges Recherchieren im Web	—	89,3 %
Fehlerrate	Wahrscheinlichkeit falscher Behauptungen	Basis	−33 %

GDPval erklärt: Dieser Benchmark vergleicht die KI-Ausgabe mit der Arbeit menschlicher Experten in 44 verschiedenen Berufen — von Finanzanalyse bis Rechtsberatung. 83 % bedeutet: In mehr als 4 von 5 Fällen liefert GPT-5.4 Ergebnisse, die mindestens so gut sind wie die von Fachleuten.

ChatGPT für Excel: KI direkt in der Tabelle

Zusammen mit GPT-5.4 hat OpenAI ein Excel-Add-in vorgestellt. ChatGPT arbeitet damit direkt in Excel-Arbeitsmappen — nicht als separates Fenster, sondern eingebettet in die Tabelle.

Formeln generieren — Beschreibe in Alltagssprache, was berechnet werden soll. Die KI erstellt die passende Excel-Formel.

Szenarien durchspielen — "Was passiert, wenn der Umsatz um 15 % sinkt?" Die KI passt das Modell an und zeigt die Auswirkungen.

Finanzmodelle bauen — Auf OpenAIs Investment-Banking-Benchmark stieg die Leistung von 43,7 % (GPT-5) auf 87,3 % (GPT-5.4 Thinking).

Einschränkungen: Aktuell ist das Excel-Add-in in der Beta — verfügbar für ChatGPT Plus, Pro, Team, Business und Enterprise in den USA, Kanada und Australien. Wann es nach Europa kommt, hat OpenAI noch nicht bekannt gegeben.

Was kostet es?

GPT-5.4 ist in allen ChatGPT-Tarifen verfügbar — allerdings mit unterschiedlichen Limits:

Tarif	Preis	GPT-5.4 Thinking	Computer-Use
Free	$0	Nicht enthalten	Nicht enthalten
Plus	$20/Mo	80 Nachrichten / 3 Std.	Über API
Pro	$200/Mo	Unlimitiert + dedizierte GPU	In Codex + API

API-Preise für Entwickler: GPT-5.4 kostet $2,50 pro Million Input-Tokens (ca. 3.000 Seiten einlesen) und $15 pro Million Output-Tokens. Ab 272.000 Token Kontext verdoppelt sich der Input-Preis auf $5. Zum Vergleich: Claude Opus 4.6 kostet $15/$75.

Einordnung: Sinnvoll oder Modell-Chaos?

Die Trennung zwischen Instant (Alltag) und Thinking (komplexe Aufgaben) ergibt Sinn. Nicht jede Frage braucht tiefes Nachdenken — und nicht jede Analyse profitiert von Geschwindigkeit auf Kosten der Gründlichkeit.

Aber: OpenAIs Modellpalette wird zunehmend unübersichtlich. Neben GPT-5.4 (Standard, Thinking, Pro) gibt es weiterhin GPT-5.3 Instant, GPT-5.3 voll, o3, o4-mini und diverse Spezialmodelle für Codex. In der Codex-App sind mittlerweile zahlreiche Abstufungen verfügbar, die selbst für erfahrene Nutzer schwer zu unterscheiden sind.

Der Auto-Modus in ChatGPT federt die Komplexität ab — die meisten Nutzer werden nie aktiv ein Modell wählen müssen. Die Frage ist, ob das auch bei API-Integrationen und Enterprise-Einsätzen funktioniert, wo Teams bewusst steuern wollen, welches Modell welche Aufgabe übernimmt.

Zum Vergleich: Anthropic setzt mit Claude Opus, Sonnet und Haiku auf drei klar abgegrenzte Stufen. Google fährt mit Gemini einen ähnlichen Ansatz. OpenAIs Strategie, viele spezialisierte Varianten anzubieten, ist leistungsfähiger — aber auch erklärungsbedürftig.

Was dafür spricht

+ Computer-Use öffnet neue Automatisierungsmöglichkeiten
+ 1 Mio. Token Kontext für große Dokumente und Codebasen
+ Auto-Modus macht die Modellwahl unsichtbar
+ Excel-Integration bringt KI direkt in den Workflow

Was dagegen spricht

- Wachsende Modellpalette kann verwirren
- Computer-Use nur über API/Codex, nicht in ChatGPT
- Excel-Add-in noch nicht in Europa verfügbar
- Pro-Tarif ($200/Mo) für volle Leistung nötig

Was das für dein Unternehmen bedeutet

Computer-Use wird Enterprise-relevant

Wenn KI Anwendungen eigenständig bedienen kann, verändern sich Automatisierungs-Workflows grundlegend. Statt APIs zu programmieren, kann die KI Programme so nutzen, wie ein Mensch es tun würde. Besonders für Legacy-Software ohne API-Schnittstellen ist das relevant.

Die Modellwahl wird zur IT-Entscheidung

Mit GPT-5.4, Claude Opus 4.6 und Gemini 3.1 Pro gibt es jetzt drei Flaggschiff-Modelle mit unterschiedlichen Stärken. Unternehmen sollten nicht mehr fragen "Welche KI nutzen wir?", sondern "Welche KI für welche Aufgabe?" Ein Modell-Vergleich hilft bei der Orientierung.

Sofort testen: GPT-5.3 Instant für interne Tools

Die verbesserte Gesprächsqualität von GPT-5.3 Instant ist direkt nutzbar — ohne Zusatzkosten für bestehende ChatGPT-Nutzer. Ideal für einen Pilottest: Ersetze probeweise den bisherigen Chatbot in einem internen Tool und miss die Mitarbeiter-Zufriedenheit.

Quellen

Weiterlesen

Tools & Systeme

GPT-5.3 Instant: Schneller, direkter, weniger Phrasen

Was das Instant-Modell für den Arbeitsalltag ändert.

Tools & Systeme

Modell-Blitz: 3 KI-Riesen droppen gleichzeitig neue Modelle

Claude 4.6, GPT-5.3 und Gemini 2.5 Pro im Vergleich.

Strategie

Claude Code vs. OpenAI Codex: Welcher Coding-Agent passt?

Die zwei größten Coding-Agenten im direkten Vergleich.

GPT-5.3 Instant & GPT-5.4: Was OpenAIs zwei neue Modelle können

Auf einen Blick

Das solltest du tun