OpenAI stellt GPT-5.4 mit Pro- und Thinking-Versionen vor
OpenAI hat GPT-5.4 vorgestellt, ein neues Basismodell für professionelle Aufgaben. Das Unternehmen bezeichnet es als sein bisher leistungsfähigstes und effizientestes Frontier-Modell. Neben der Standardversion gibt es auch GPT-5.4 Thinking, eine Version mit stärkerem Fokus auf logisches Denken, sowie GPT-5.4 Pro, die für besonders hohe Leistung optimiert ist.
Eine der wichtigsten Neuerungen ist das Context Window der API-Version. Dieses kann nun bis zu eine Million Tokens umfassen. Damit ist es das bisher größte Kontextfenster, das OpenAI für ein Modell anbietet.
OpenAI hebt außerdem eine verbesserte Token-Effizienz hervor. Laut Unternehmen kann GPT-5.4 viele Aufgaben mit deutlich weniger Tokens lösen als das vorherige Modell GPT-5.2.
Auch bei verschiedenen Benchmarks erreicht das neue Modell bessere Ergebnisse. GPT-5.4 erzielte Rekordwerte in den Computer-Nutzungs-Benchmarks OSWorld-Verified und WebArena Verified. Außerdem erreichte das Modell 83 Prozent im GDPval-Test von OpenAI, der Aufgaben aus der Wissensarbeit bewertet.
Auch im APEX-Agents Benchmark von Mercor schnitt das Modell besonders gut ab. Dieser Test bewertet professionelle Fähigkeiten in Bereichen wie Recht und Finanzen. Laut Mercor-CEO Brendan Foody ist GPT-5.4 besonders stark bei Aufgaben mit längerer Planung, zum Beispiel beim Erstellen von Präsentationen, Finanzmodellen oder juristischen Analysen. Gleichzeitig arbeite das Modell schneller und kostengünstiger als vergleichbare KI-Modelle.
OpenAI erklärt außerdem, dass GPT-5.4 weniger anfällig für Halluzinationen und sachliche Fehler ist. Im Vergleich zu GPT-5.2 sei das Modell 33 Prozent weniger anfällig für Fehler in einzelnen Aussagen, während die gesamten Antworten 18 Prozent weniger Fehler enthalten.
Mit der neuen Version wurde auch die Nutzung von Tools in der API überarbeitet. OpenAI führt ein neues System namens Tool Search ein. Statt alle verfügbaren Tools im Prompt zu definieren, kann das Modell die benötigten Tool-Informationen nun bei Bedarf abrufen. Dadurch werden Anfragen schneller und effizienter, besonders in Systemen mit vielen Tools.
Zusätzlich hat OpenAI neue Sicherheitsbewertungen für KI-Modelle eingeführt. Dabei wird geprüft, wie Modelle ihren Gedankengang bei komplexen Aufgaben darstellen. Die Tests zeigen, dass die Thinking-Version von GPT-5.4 weniger wahrscheinlich versucht, ihre Argumentation zu verbergen. Laut OpenAI bleibt die Überwachung dieses Denkprozesses deshalb ein wichtiges Sicherheitsinstrument.
Werbung
Werbung