Ideogram

Un nouveau type d’intelligence artificielle (IA) capable de générer du texte dans les images vient de faire son apparition : Ideogram. Cette startup, fondée par d’anciens chercheurs de Google Brain, promet de faciliter la création de contenus visuels originaux et personnalisés.

Qu’est-ce que l’IA générative ?

L’intelligence artificielle générative ou IA générative est un type de système d’intelligence artificielle (IA) capable de générer du texte, des images ou d’autres médias en réponse à des invites / requètes (ou prompts en anglais). Les modèles génératifs apprennent les modèles et la structure des données d’entrée. Ils génèrent un nouveau contenu similaire aux données d’apprentissage mais avec un certain degré de nouveauté.

L’IA générative peut être unimodale ou multimodale. Les systèmes unimodaux n’acceptent qu’un seul type d’entrée (par exemple, du texte). A contrario, ndis que les systèmes multimodaux peuvent accepter plusieurs types d’entrée (par exemple, du texte et des images). Les cadres les plus importants pour aborder l’IA générative comprennent les réseaux antagonistes génératifs (GAN) et les transformateurs génératifs pré-entraînés (GPT).

Qu’est-ce qu’Ideogram ?

Ideogram est une startup qui utilise l’IA générative pour créer des images avec des éléments de texte, rendus dans différentes couleurs, polices, tailles et styles. La plateforme permet aux utilisateurs de sélectionner et de combiner plusieurs styles de manière transparente, allant des rendus 3D à la mode à l’art conceptuel.

Ideogram a été fondée par d’anciens chercheurs de Google Brain et a reçu un financement de démarrage de 16,5 millions de dollars provenant d’investisseurs comme a16z (Andreessen Horowitz) et Index Ventures. L’équipe fondatrice est composée d’experts en IA de renommée mondiale, qui ont déjà dirigé des projets d’IA transformatrice à Google Brain, à l’UC Berkeley, à la CMU et à l’Université de Toronto.

Image générée par Ideogram, par l’utilisateur Sants, à l’aide de ce prompt « fried chickens with the clothes of the characters from stranger things with the typography « stranger wings » written correctly. Based on the Netflix series Stranger Things, 3d render, illustration, conceptual art, poster »

Quel est le défi du texte dans les images ?

Le défi consistant à incorporer avec précision du texte dans les images générées (pensez aux lettres sur les panneaux ou aux logos d’entreprise) est un problème de longue date pour de nombreuses plateformes d’IA. En effet, il faut non seulement que le texte soit lisible et cohérent avec le contexte de l’image, mais aussi qu’il respecte les règles typographiques et orthographiques du langage utilisé.

Ideogram est une IA qui semble avoir déchiffré le code de l’ajout de texte. L’application Web, disponible pour l’inscription bêta, propose un préréglage « typographie » parmi ses options de style. Cela permet aux utilisateurs de créer des images avec des éléments de texte, rendus dans différentes couleurs, polices, tailles et styles. Des exemples apparaissent déjà sur le serveur Discord d’Ideogram et sur son application Web, présentant des images générées qui intègrent du texte.

Quelles sont les applications potentielles d’Ideogram ?

Ideogram offre un service spécialisé qui comble une lacune dans le paysage actuel de l’imagerie générée par l’IA. Cela en fait un nouveau venu important dans ce secteur en évolution rapide. Ideogram peut être utilisé pour diverses applications créatives, telles que :

  • La création d’affiches, de flyers, de logos ou de cartes de visite
  • La conception graphique, la publicité ou le marketing
  • L’illustration, la bande dessinée ou le roman graphique
  • La mode, le textile ou la décoration
  • L’éducation, la formation ou la sensibilisation

Malgré ses avantages, Ideogram n’est pas sans limites. Nos tests ont révélé des incohérences dans la qualité des résultats. Parfois, le texte est mal aligné, déformé ou illisible. De plus, la plate-forme ne fonctionne pas encore avec du texte français. Votre texte sera donc obligatoirement en anglais, même si votre prompt est en français.

Image générée par Ideogram, par l’utilisateur Moodyy, à l’aide de ce prompt « a angry turtle screaming in race and caption is « not fast just furious », typography, illustration, cinematic, dark fantasy »
Autre déclinaison du même prompt, par le même utilisateur.

Quelles sont les perspectives d’avenir d’Ideogram ?

Ideogram est une startup prometteuse qui apporte une innovation dans le domaine de l’IA générative. En permettant aux utilisateurs de créer des images avec du texte, Ideogram ouvre de nouvelles possibilités de création et d’expression. Cependant, Ideogram doit encore faire face à des défis techniques et éthiques, tels que la qualité, la fiabilité et la responsabilité de ses contenus générés (et surtout la possibilité d’utiliser la langue française). Ideogram sera-t-il capable de s’imposer comme un leader dans le marché de l’IA générative ? Quels seront les impacts sociaux et culturels de ses images avec du texte ?

Illustration en Une : Image générée par Iddeogram, avec le prompt suivant : « Boisdron.com logo very colourful paint splatter, 3d render, vibrant, graffiti »

Lien vers Ideogram.


Sur le même sujet

Faut-il avoir peur de l’intelligence artificielle ? Définition de l’IA.