Cookie Consent by Free Privacy Policy Generator

OpenAI führt GPT-4o Bildgenerierung ein

Die neue Funktion zur Bildgenerierung, die direkt in das GPT-4o-Modell integriert ist, ermöglicht es Nutzern, auf kreative und präzise Weise Bilder aus Textbeschreibungen zu erstellen.

A candid paparazzi-style photo of Karl Marx hurriedly walking through the parking lot of the Mall of America,
Bild generiert mit GPT4o von OpenAI (Quelle: openai.com)

OpenAI hat mit der Einführung von GPT-4o eine bahnbrechende Technologie vorgestellt. Die neue Funktion zur Bildgenerierung, die direkt in das GPT-4o-Modell integriert ist, ermöglicht es Nutzern, auf kreative und präzise Weise Bilder aus Textbeschreibungen zu erstellen. Auf den ersten Blick nichts Neues. Also, wo liegt die Innovation? Während bisherige Modelle Probleme bei der genauen Darstellung von Details, Grafiken oder Texten hatten, ist 4o in der Lage, fehlerfreien Text in Bildern oder Grafiken darzustellen.

At OpenAI, we have long believed image generation should be a primary capability of our language models. That’s why we’ve built our most advanced image generator yet into GPT‑4o. The result—image generation that is not only beautiful, but useful. ~ OpenAI

Laut den Quellen von OpenAI und Medienberichten bietet GPT-4o die Möglichkeit, Bilder direkt aus konversationellen Eingaben zu erstellen UND zu bearbeiten. Hier die wichtigsten Features:

  1. Präzise Texterstellung: Das System kann nicht nur Bilder generieren, sondern auch Text innerhalb dieser Bilder genau wiedergeben.
  2. Interaktive Bildbearbeitung: Nutzer können im Dialog mit der KI spezifische Änderungen vornehmen, wodurch ein dynamischer Anpassungsprozess entsteht.
  3. Komplexe Prompts: GPT-4o kann mit bis zu 20 verschiedenen Objekten in einem einzigen Bild umgehen, was es zu einem leistungsstarken Werkzeug für Designer und Marketer macht.
  4. Bildreferenzen: Nutzer können vorhandene Bilder hochladen, die als Inspiration oder Basis für neue Kreationen dienen.
Make me a professionally shot photorealistic diagram of the top selling cocktails in my bar with recipes labeled on each drink. put the recipes on handwritten cards in front of each drink.the cards are brown, and the text is black. background is white. Title is "4 most popular cocktails"
A professionally shot photorealistic diagram of the top selling cocktails in my bar with recipes labeled on each drink. put the recipes on handwritten cards in front of each drink.
von GPT 4o generiertes Bild mit Text (Quelle: OpenAI)Bild Bild gBi

Es gibt natürlich auch technische Einschränkungen. OpenAI hat bereits angekündigt, dass das Modell Schwierigkeiten mit der konsistenten Wiedergabe von nicht-lateinischen Schriftzeichen hat. Außerdem hat OpenAI noch Probleme mit dem Rollout des Features, weshalb es bisher nur für Pro-Nutzer zur Verfügung steht. Zusammenfassend lässt sich sagen, dass die Einführung des Tools einen signifikanten Schritt in der KI-gestützten Bildgenerierung darstellt. Es kombiniert die Technologien der Texterstellung und Bildgenerierung in einem einzigen, benutzerfreundlichen Tool. Die Frage bleibt, wie diese Technologie in Zukunft genutzt wird und welche Richtlinien notwendig sind, um eine verantwortungsvolle Entwicklung zu gewährleisten.


Quellen:

https://openai.com/index/introducing-4o-image-generation/

OpenAI Rolls Out GPT-4o Image Creation To Everyone
OpenAI integrates free image generation into GPT-4o, creating context-aware visuals with text capabilities for all users.
‘Insane’: OpenAI introduces GPT-4o native image generation and it’s already wowing users
As AI-generated images become more precise and accessible, GPT-4o represents a significant step forward in the space.