OpenAI stellt ChatGPT Images 2.0 Modell vor

Neues KI Bildmodell mit besseren Funktionen.

OpenAI stellt ChatGPT Images 2.0 Modell vor

Photo Credit: OpenAI

ChatGPT Images 2.0 bringt bessere KI Bilder.

Höhepunkte
  • Mehr Präzision und bessere Bildqualität
  • Unterstützung für viele Sprachen
  • Neue Denkfähigkeiten für komplexe Aufgaben
Werbung

OpenAI hat am Dienstag sein neues Bildgenerierungsmodell vorgestellt. Es trägt den Namen ChatGPT Images 2.0 und soll präzisere, nutzbarere und kontextbezogene Bilder liefern, basierend auf den Eingaben der Nutzer. Das Modell bringt Verbesserungen bei der Umsetzung von Anweisungen, mehrsprachiger Darstellung und Bildkomposition. Das Unternehmen aus San Francisco gibt an, dass es auch Denk- und Analysefähigkeiten für komplexere Aufgaben bietet. ChatGPT Images 2.0 wird über ChatGPT, Codex und die API bereitgestellt.

Verfügbarkeit von Images 2.0
ChatGPT Images 2.0 ist ab sofort für alle Nutzer von ChatGPT und Codex verfügbar. Erweiterte Funktionen, einschließlich der neuen Denkfähigkeiten, stehen Abonnenten von ChatGPT Plus, Pro und Business zur Verfügung.

Entwickler können über die gpt-image-2 API auf das Modell zugreifen. Die Preise hängen von der gewählten Bildqualität und Auflösung ab. Das Modell unterstützt Bilder mit bis zu 2K-Auflösung, während höhere Auflösungen noch in der Testphase sind.

Funktionen und Fähigkeiten von ChatGPT Images 2.0
Laut OpenAI bietet das neue Modell mehr Präzision und Kontrolle als die vorherige Version. Nutzer können Bilder erstellen, die sehr genau zu ihren detaillierten Eingaben passen. Es ist darauf ausgelegt, komplexe Inhalte darzustellen, wie Benutzeroberflächen, viel Text und strukturierte Layouts, die bisher schwer umzusetzen waren.

Eine wichtige Verbesserung ist die Unterstützung mehrerer Sprachen. Das Modell kann Texte in Sprachen wie Hindi, Bengali, Chinesisch, Japanisch und Koreanisch genauer darstellen. Dadurch können Nutzer Poster, Diagramme und Infografiken in verschiedenen Sprachen erstellen.

Das Modell bietet auch eine bessere Konsistenz bei verschiedenen Stilen, wie fotorealistischen Bildern, filmischen Darstellungen, Pixel-Art und Manga. Außerdem wurden Licht, Texturen und Komposition verbessert. Es unterstützt verschiedene Bildformate, von sehr breiten (3:1) bis zu hohen (1:3) Layouts.

Neu ist auch die Fähigkeit zum „Denken“. Das Modell kann komplexere Aufgaben lösen und mit einem ChatGPT-Modell kombiniert werden, um Informationen aus dem Internet abzurufen, Ergebnisse zu prüfen und Bilder zu erstellen – alles mit nur einer Eingabe. Das Wissensniveau reicht bis Dezember 2025.

OpenAI sagt, dass das Modell bis zu acht Bilder gleichzeitig erzeugen kann und dabei Konsistenz bei Figuren und Objekten beibehält. Es eignet sich für viele Anwendungen wie Design, Marketing, Bildung und Produktentwicklung. Es kann Informationen strukturieren und visuell darstellen.

Das Unternehmen weist jedoch darauf hin, dass das Modell noch Grenzen hat. Es kann Probleme bei Aufgaben haben, die ein genaues physisches Verständnis erfordern, wie komplexe Rätsel oder Origami-Anleitungen. Auch bei sehr detaillierten oder sich wiederholenden Mustern kann es Schwierigkeiten geben. Einige Ergebnisse, wie Diagramme, sollten überprüft werden. Höhere Auflösungen über 2K sind noch nicht stabil und befinden sich in der Testphase.

Verwandte Neuigkeiten

Werbung

Werbung

© Copyright Red Pixels Ventures Limited 2026. All rights reserved.
Trending Products »
Latest Tech News »