OpenAI vient de dévoiler la troisième version de son outil de génération d’images par intelligence artificielle, Dall-E 3. Ce dernier promet des performances impressionnantes et une intégration directe dans ChatGPT et Bing Conversations.
Qu’est-ce que Dall-E 3 ?
Dall-E 3 est le successeur de Dall-E 2, un générateur d’images par IA qui peut créer des images à partir de descriptions textuelles. Par exemple, si vous demandez à Dall-E 2 de générer une image d’un chat avec des lunettes, il vous proposera plusieurs images inédites. Dall-E 2 est basé sur le modèle GPT-3, qui est capable de générer du texte cohérent et créatif à partir d’un prompt.
La nouvelle génération de Dall-E reprend le principe de la version précédente, mais avec des améliorations significatives. Selon OpenAI, Dall-E 3 comprend beaucoup plus de nuances et de détails que les versions précédentes, ce qui permet de traduire facilement les idées en images exceptionnellement précises. Il vous offrira des images plus fidèles à votre description que Dall-E 2.
Une intégration de Dall-E 3
La grande nouveauté de Dall-E 3, c’est qu’il sera intégré à ChatGPT-4 et à Bing Conversations, le chatbot de Microsoft qui utilise le même modèle GPT-4. Bing Conversations est un agent conversationnel qui peut répondre à vos questions, vous aider à effectuer des recherches sur le web, ou encore vous divertir avec des contenus créatifs.
Avec l’intégration de Dall-E 3, Bing Conversations pourra également générer des images à partir de vos demandes. Il suffira de lui écrire ce que vous voulez voir en image, et il vous proposera quatre images possibles. Vous pourrez ensuite lui demander des ajustements sur une image spécifique pour gagner en précision. Il sera également capable de générer du texte descriptif sur votre image si vous souhaitez obtenir plus de contexte.
Face à la concurrence
Dall-E 3 se positionne comme un outil de génération d’images par IA très performant et polyvalent. Il présente plusieurs différences par rapport à ses concurrents, tels que Midjourney, leader dans le domaine actuellement.
Les deux outils ont des approches différentes. Dall-E peut combiner des concepts, des attributs et des styles, alors que Midjourney est plutôt axé sur l’amélioration de la qualité et de la cohérence du contenu généré. , Dall-E 3 pourrait être capable de générer des images plus réalistes et plus variées que Midjourney.
Dall-E 3 est plus respectueux des droits d’auteur que Midjourney. Midjourney a été critiqué pour avoir généré des images de célébrités ou d’artistes sans leur consentement, ce qui pose des problèmes éthiques et juridiques. OpenAI a pris des précautions pour éviter que Dall-E 3 ne génère des contenus violents, pour adultes, ou haineux. Il a également mis en place des mesures pour refuser les requêtes qui demandent le nom d’un personnage public ou le style d’un artiste vivant.
Comment y accéder ?
Dall-E 3 sera disponible en octobre pour les abonnés ChatGPT Plus ou ChatGPT Enterprise. Ces abonnements permettront d’accéder à la version native de DallL-E 3. Mais il y aura également un moyen d’y accéder gratuitement ! En effet, Microsoft a confirmé que la nouvelle version serait intégrée à Bing Conversations, son chatbot gratuit, ainsi que dans son outil Bing Image Creator, que l’on peut utiliser directement dans le navigateur.
Un modèle offrant quelques limites
D’une part, Dall-E 3 n’est pas infaillible. Il peut parfois générer des images qui ne correspondent pas à la description, qui sont floues, ou qui contiennent des erreurs. Il faut donc toujours vérifier la qualité et la pertinence des images générées avant de les utiliser.
D’autre part, l’outil d’OpenAI n’est pas neutre. Il peut refléter les biais et les stéréotypes présents dans les données utilisées pour entraîner le modèle GPT-4. Il faut donc être conscient que les images générées par l’IA ne représentent pas forcément la réalité ou la diversité du monde.
Enfin, l’utiliser n’est pas sans conséquences. Il peut avoir un impact sur la créativité humaine, sur la propriété intellectuelle, ou sur la confiance en l’information. Il faut donc être responsable et éthique dans l’utilisation de Dall-E 3, et respecter les droits d’auteur et les règles de citation.
Illustration en Une : © OpenAI
Sur le même sujet
Faut-il avoir peur de l’intelligence artificielle ? Définitions de l’IA.