TTools & Systeme[03_03]

GPT-5.3 Instant & GPT-5.4: Was OpenAIs zwei neue Modelle können

Instant für bessere Alltagsgespräche, GPT-5.4 für professionelle Wissensarbeit mit Computer-Bedienung und einer Million Token Kontext.

GPT-5.3 Instant & GPT-5.4: Was OpenAIs zwei neue Modelle können

Auf einen Blick

  • GPT-5.4 vereint Reasoning, Coding und Computer-Bedienung in einem Modell — das erste OpenAI-Modell, das Anwendungen eigenständig per Maus und Tastatur steuern kann
  • Gleichzeitig macht GPT-5.3 Instant alltägliche Gespräche flüssiger und direkter — weniger Phrasen, weniger unnötige Ablehnungen
  • OpenAI trennt damit klar: Instant für den Alltag, Thinking für komplexe Aufgaben — ein Auto-Modus wählt automatisch das passende Modell

Das solltest du tun

  1. 1Prüfe, ob Computer-Use für deine wiederkehrenden Büroaufgaben relevant ist — besonders bei Workflows über mehrere Anwendungen hinweg
  2. 2Teste GPT-5.3 Instant für Kunden-Chatbots und interne Assistenten: Die natürlicheren Antworten könnten die Akzeptanz bei Mitarbeitern steigern
Relevant für:
IT-LeitungGeschäftsführungProduktmanagement

Am 5. März 2026 hat OpenAI zwei neue Modelle vorgestellt, die unterschiedliche Aufgaben erfüllen sollen. Während GPT-5.3 Instant die täglichen Gespräche mit KI verbessert, richtet sich GPT-5.4 klar an professionelle Wissensarbeit — mit einer Fähigkeit, die es bisher bei OpenAI nicht gab: dem eigenständigen Bedienen von Anwendungen.

Was das für Unternehmen bedeutet, wo die Modelle verfügbar sind und ob OpenAIs wachsende Modellpalette noch übersichtlich bleibt.

1 Mio.

Token Kontext

ca. 3.000 Seiten Text

−33 %

weniger Fehler

vs. GPT-5.2

83 %

GDPval-Score

Wissensarbeit-Benchmark

75 %

OSWorld

Computer-Bedienung

GPT-5.3 Instant: Bessere Gespräche, weniger Phrasen

GPT-5.3 Instant ist kein Modell für komplexe Analyse. Es ist ein Update für den Alltag: Wenn du ChatGPT für E-Mails, Zusammenfassungen oder schnelle Fragen nutzt, sollen die Antworten jetzt flüssiger, relevanter und direkter sein.

Vorher (GPT-5.2)

"Es ist wichtig zu beachten, dass diese Frage verschiedene Perspektiven berücksichtigen sollte. Grundsätzlich lässt sich sagen..."

Nachher (GPT-5.3 Instant)

"Das hängt von drei Faktoren ab: [1], [2] und [3]. Hier die Details..."

Weniger unnötige Ablehnungen, weniger moralisierende Einschübe, direkte Antworten. Laut OpenAI sinkt die Fehlerrate (Halluzinationen) um rund 27 % gegenüber dem Vorgängermodell. Einen ausführlichen Blick auf das Instant-Modell bietet unser GPT-5.3 Instant Artikel.

GPT-5.4: Professionelle Wissensarbeit

GPT-5.4 ist OpenAIs neues Flaggschiff-Modell. Es kombiniert drei Fähigkeiten, die bisher auf verschiedene Modelle verteilt waren:

1

Reasoning — komplexe Denkaufgaben

Analysen, Strategien, mehrstufige Probleme lösen. Die Reasoning-Fähigkeit von GPT-5.2 ist jetzt direkt integriert.

2

Coding — Software entwickeln und prüfen

Erstmals sind die Coding-Fähigkeiten von GPT-5.3-codex im Hauptmodell integriert. Code schreiben, testen und verifizieren in einem Schritt.

3

Computer-Use — Anwendungen eigenständig bedienen

Die KI analysiert Bildschirminhalte und simuliert Maus- und Tastatureingaben. Sie kann Formulare ausfüllen, Tabellen bearbeiten oder Änderungen in Programmen prüfen.

Was bedeutet "Computer-Use"? Stell dir vor, ein Mitarbeiter sitzt an deinem Bildschirm und bedient Programme für dich — klickt Buttons, füllt Formulare aus, kopiert Daten zwischen Anwendungen. Genau das macht GPT-5.4, nur automatisiert. Auf dem OSWorld-Benchmark — einem Test für Desktop-Bedienung — erreicht es 75 %, mehr als der menschliche Durchschnitt von 72,4 %.

Drei Varianten: Standard, Thinking, Pro

GPT-5.4 gibt es in drei Ausführungen. Der Unterschied liegt in der Denktiefe und dem Preis:

VarianteStärkeFür wenZugang
GPT-5.4Schnelle, effiziente AntwortenAllround-Nutzung, API-EntwicklerAlle Tarife
GPT-5.4 ThinkingTiefes Reasoning, zeigt DenkschritteAnalyse, Strategie, CodingPlus, Team, Pro
GPT-5.4 ProMaximale Leistung, dedizierte GPUFinanzmodelle, Forschung, EnterprisePro ($200/Mo)

In ChatGPT gibt es einen Auto-Modus, der automatisch zwischen den Varianten wechselt — je nachdem wie komplex die Aufgabe ist. Für die meisten Nutzer heißt das: Du musst dich nicht aktiv für ein Modell entscheiden.

Benchmarks: Zahlen eingeordnet

Benchmarks sind standardisierte Tests, die messen, wie gut eine KI bestimmte Aufgaben löst. Hier die wichtigsten Ergebnisse im Vergleich:

BenchmarkWas er misstGPT-5.2GPT-5.4
GDPvalWissensarbeit über 44 Berufe hinweg83 %
OSWorldDesktop-Bedienung per Maus/Tastatur47,3 %75,0 %
BrowseCompEigenständiges Recherchieren im Web89,3 %
FehlerrateWahrscheinlichkeit falscher BehauptungenBasis−33 %
GDPval erklärt: Dieser Benchmark vergleicht die KI-Ausgabe mit der Arbeit menschlicher Experten in 44 verschiedenen Berufen — von Finanzanalyse bis Rechtsberatung. 83 % bedeutet: In mehr als 4 von 5 Fällen liefert GPT-5.4 Ergebnisse, die mindestens so gut sind wie die von Fachleuten.

ChatGPT für Excel: KI direkt in der Tabelle

Zusammen mit GPT-5.4 hat OpenAI ein Excel-Add-in vorgestellt. ChatGPT arbeitet damit direkt in Excel-Arbeitsmappen — nicht als separates Fenster, sondern eingebettet in die Tabelle.

1

Formeln generieren — Beschreibe in Alltagssprache, was berechnet werden soll. Die KI erstellt die passende Excel-Formel.

2

Szenarien durchspielen — "Was passiert, wenn der Umsatz um 15 % sinkt?" Die KI passt das Modell an und zeigt die Auswirkungen.

3

Finanzmodelle bauen — Auf OpenAIs Investment-Banking-Benchmark stieg die Leistung von 43,7 % (GPT-5) auf 87,3 % (GPT-5.4 Thinking).

Einschränkungen: Aktuell ist das Excel-Add-in in der Beta — verfügbar für ChatGPT Plus, Pro, Team, Business und Enterprise in den USA, Kanada und Australien. Wann es nach Europa kommt, hat OpenAI noch nicht bekannt gegeben.

Was kostet es?

GPT-5.4 ist in allen ChatGPT-Tarifen verfügbar — allerdings mit unterschiedlichen Limits:

TarifPreisGPT-5.4 ThinkingComputer-Use
Free$0Nicht enthaltenNicht enthalten
Plus$20/Mo80 Nachrichten / 3 Std.Über API
Pro$200/MoUnlimitiert + dedizierte GPUIn Codex + API
API-Preise für Entwickler: GPT-5.4 kostet $2,50 pro Million Input-Tokens (ca. 3.000 Seiten einlesen) und $15 pro Million Output-Tokens. Ab 272.000 Token Kontext verdoppelt sich der Input-Preis auf $5. Zum Vergleich: Claude Opus 4.6 kostet $15/$75.

Einordnung: Sinnvoll oder Modell-Chaos?

Die Trennung zwischen Instant (Alltag) und Thinking (komplexe Aufgaben) ergibt Sinn. Nicht jede Frage braucht tiefes Nachdenken — und nicht jede Analyse profitiert von Geschwindigkeit auf Kosten der Gründlichkeit.

Aber: OpenAIs Modellpalette wird zunehmend unübersichtlich. Neben GPT-5.4 (Standard, Thinking, Pro) gibt es weiterhin GPT-5.3 Instant, GPT-5.3 voll, o3, o4-mini und diverse Spezialmodelle für Codex. In der Codex-App sind mittlerweile zahlreiche Abstufungen verfügbar, die selbst für erfahrene Nutzer schwer zu unterscheiden sind.

Der Auto-Modus in ChatGPT federt die Komplexität ab — die meisten Nutzer werden nie aktiv ein Modell wählen müssen. Die Frage ist, ob das auch bei API-Integrationen und Enterprise-Einsätzen funktioniert, wo Teams bewusst steuern wollen, welches Modell welche Aufgabe übernimmt.

Zum Vergleich: Anthropic setzt mit Claude Opus, Sonnet und Haiku auf drei klar abgegrenzte Stufen. Google fährt mit Gemini einen ähnlichen Ansatz. OpenAIs Strategie, viele spezialisierte Varianten anzubieten, ist leistungsfähiger — aber auch erklärungsbedürftig.

Was dafür spricht

  • + Computer-Use öffnet neue Automatisierungsmöglichkeiten
  • + 1 Mio. Token Kontext für große Dokumente und Codebasen
  • + Auto-Modus macht die Modellwahl unsichtbar
  • + Excel-Integration bringt KI direkt in den Workflow

Was dagegen spricht

  • - Wachsende Modellpalette kann verwirren
  • - Computer-Use nur über API/Codex, nicht in ChatGPT
  • - Excel-Add-in noch nicht in Europa verfügbar
  • - Pro-Tarif ($200/Mo) für volle Leistung nötig

Was das für dein Unternehmen bedeutet

1

Computer-Use wird Enterprise-relevant

Wenn KI Anwendungen eigenständig bedienen kann, verändern sich Automatisierungs-Workflows grundlegend. Statt APIs zu programmieren, kann die KI Programme so nutzen, wie ein Mensch es tun würde. Besonders für Legacy-Software ohne API-Schnittstellen ist das relevant.

2

Die Modellwahl wird zur IT-Entscheidung

Mit GPT-5.4, Claude Opus 4.6 und Gemini 3.1 Pro gibt es jetzt drei Flaggschiff-Modelle mit unterschiedlichen Stärken. Unternehmen sollten nicht mehr fragen "Welche KI nutzen wir?", sondern "Welche KI für welche Aufgabe?" Ein Modell-Vergleich hilft bei der Orientierung.

3

Sofort testen: GPT-5.3 Instant für interne Tools

Die verbesserte Gesprächsqualität von GPT-5.3 Instant ist direkt nutzbar — ohne Zusatzkosten für bestehende ChatGPT-Nutzer. Ideal für einen Pilottest: Ersetze probeweise den bisherigen Chatbot in einem internen Tool und miss die Mitarbeiter-Zufriedenheit.

Quellen