Mistral AI, la startup française, dévoile des améliorations majeures pour son assistant conversationnel, Le Chat.
Une Mise à Jour Majeur pour Le Chat
Mistral AI, acteur français en pleine ascension dans le domaine de l’intelligence artificielle, a dévoilé le lundi 18 novembre 2024 des améliorations importantes pour son assistant conversationnel, Le Chat. En se dotant de nouvelles fonctionnalités, telles que l’analyse de visuels et de documents, la compréhension et la génération d’images, ou la recherche sur le web, l’outil ambitionne de répondre aux besoins variés des utilisateurs et utilisatrices, tout en complétant son offre pour concurrencer sérieusement ChatGPT ou Claude. Tour d’horizon des principales nouveautés.
Recherche Web et Analyse de Documents
La mise à jour du Chat marque une avancée majeure dans sa capacité à offrir des réponses précises et adaptées. Parmi les ajouts notables, on retrouve une fonctionnalité de recherche web avec citations. Ce nouvel ajout permet de recevoir des réponses appuyées par des sources fiables issues du web, nommément citées et accessibles afin de permettre aux utilisatrices et utilisateurs de vérifier par eux-mêmes l’information fournie. Ces derniers mois, ChatGPT, Claude ou encore Perplexity se sont renforcés avec ce type d’accès en temps réel à la recherche web.
Canvas : Un Espace de Collaboration
Autre nouveauté, l’interface au nom très « original » de Canvas se définit comme un espace de collaboration. Cette fonctionnalité, qui n’est bien sûr pas sans rappeler les Artefacts de Claude, et encore moins les Canvas de ChatGPT, destinée à la création de contenu, offre des outils pour élaborer des documents, des présentations, du code ou encore des maquettes. L’objectif de Mistral est ainsi de permettre une interaction fluide entre les utilisateurs et l’IA, favorisant ainsi la créativité et l’efficacité, grâce une interface double-fenêtrée.
Améliorations Techniques et Génération d’Images
Sur le plan technique, Le Chat améliore également la gestion des contenus complexes. Grâce au modèle multimodal Pixtral Large, il devient possible d’analyser et de résumer des documents PDF volumineux, mais aussi de traiter des éléments visuels tels que des graphiques ou des tableaux. Cette avancée vient également rejoindre les fonctionnalités déjà proposées par les principaux concurrents de Mistral.
Flux Pro : Un Générateur d’Images Intégré
Pour parfaire les capacités du Chat, Mistral intègre désormais un véritable générateur d’images, grâce à un partenariat avec Black Forest Labs permettant l’utilisation du modèle Flux Pro. Il sera donc désormais possible de créer des visuels et des images directement depuis l’interface du chatbot. Le modèle Flux Pro est l’un des tout meilleurs développés par Black Forest Labs et se placent en haut des benchmarks, en compagnie de Midjourney ou Ideogram.
Les Agents : Automatisation et Personnalisation
Enfin, Mistral déploie enfin une dernière fonctionnalité majeure : les Agents. Ils permettent de mémoriser des consignes, prompts ou processus récurrents, puis d’automatiser l’IA afin de configurer des séquences de travail personnalisées. Ce système fonctionne de la même manière que les instructions personnalisées dans ChatGPT. Les Agents pourront être publiés et partagés, se rapprochant-là des GPT personnalisés disponibles dans le GPT Store en version gratuite.
Optimisation des Performances
Mistral précise pour conclure que les performances de son modèle ont été optimisées : une nouvelle méthode, basée sur l’édition spéculative, accélère le traitement des requêtes, offrant ainsi des réponses plus rapides et fluides. Pour rappel, Le Chat est toujours entièrement gratuit, en bêta, et accessible sur simple inscription.
Pour sa mise à jour du Chat, Mistral n’a que très peu fait évoluer son interface. Cette dernière reste toujours très sobre et fonctionnelle. Mistral a simplement rationalisé encore un peu plus son interface. La colonne de gauche, avec l’historique des conversations, apparait maintenant au survol avec la souris. L’espace conversationnel occupe maintenant tout l’espace disponible. Nouveauté majeure : il n’est plus possible de sélectionner le modèle Mistral à utiliser dans la conversation. Le système semble utiliser plusieurs modèles Mistral AI selon la complexité de la requête. Une évolution qui permet vraisemblablement à Mistral de réduire ses coûts d’inférence globaux.
Pour la multimodalité, on sait en revanche que Mistral fait appel à son nouveau flagship : Pixtral Large. Ce dernier est, selon les benchmarks, excellent dans l’analyse des documents, de diagrammes et de graphiques complexes et surpasse même GPT-4o et Claude 3.5 Sonnet. En revanche, le modèle pèche légèrement sur le raisonnement multimodal complexe. En clair, le modèle est parfait pour analyser des documents avec de nombreux graphiques, un cas d’usage courant en entreprise.
Performances Supérieures aux Concurrents
Le modèle peut ainsi comprendre et expliquer des documents, des diagrammes, des images avec un niveau équivalent ou supérieur à GPT4-o, Claude 3,5 Sonnet, LLama 3.2 90B et Gemini 1.5 Pro, selon les benchmarks effectués par la startup. Pixtral Large dépasse de quelques points ses adversaires dans les tests MathVista, DocVQA, VQAv2 et MM MT-Bench. En clair, il comprend autant ou mieux les documents que ses concurrents et obtient de meilleures notes dans l’interprétation d’images relatives aux mathématiques.
Avec ces améliorations, Le Chat de Mistral se positionne comme un concurrent sérieux de ChatGPT. Mais la question reste ouverte : faut-il abandonner ChatGPT pour Le Chat ? De mon côté, le switch est opéré depuis 3 jours.
Illustration en Une : Généré par Piclumen.
Sur le même sujet
Les IA génératives sont-elles meilleures pour la création de contenus vidéos ?