Bing Chat vs Google Lens

Microsoft a activé une fonction multimodale sur son assistant de recherche Bing Chat, mais les premiers tests montrent que son concurrent Google Lens est plus performant dans la reconnaissance d’images.

Bing Chat intègre une fonction multimodale

Bing Chat est un assistant de recherche basé sur l’intelligence artificielle (IA) qui permet aux utilisateurs de poser des questions en langage naturel et d’obtenir des réponses détaillées, visuelles et interactives. L’application Bing Chat est accessible depuis le site web de Bing, mais aussi depuis le navigateur Microsoft Edge, où il peut être utilisé comme un copilote pour la navigation web.

Le moteur de Bing Chat utilise le modèle GPT-4 d’OpenAI (comme ChatGPT 4), qui est capable de générer du texte cohérent et pertinent à partir de n’importe quelle entrée. Bing Chat peut ainsi répondre à des questions variées, allant de la météo aux mathématiques, en passant par la culture générale ou la création de contenu.

Microsoft a récemment introduit une fonction multimodale sur Bing Chat, qui permet aux utilisateurs d’utiliser des images comme entrée pour la recherche. Cette fonction utilise la reconnaissance d’images, qui consiste à identifier et à comprendre les objets présents dans une image.

Les utilisateurs peuvent ainsi coller des images web dans le chat et demander des explications, ou télécharger directement des images pour les analyser. Bing Chat fournit alors des informations détaillées accompagnées d’exemples réels.

Un concurrent existant déjà depuis 2017

Google Lens est une technologie de reconnaissance d’images développée par Google, qui vise à fournir des informations pertinentes liées aux objets qu’il identifie en utilisant une analyse visuelle basée sur un réseau neuronal. L’outil de Google a été annoncé pour la première fois lors de la conférence Google I/O 2017, et il était initialement fourni comme une application autonome, avant d’être intégré à l’application standard de l’appareil photo Android.

Google Lens permet aux utilisateurs de rechercher ce qu’ils voient en utilisant leur appareil photo ou une image. Lens peut ainsi reconnaître des vêtements, des meubles, des plantes, des animaux, des monuments, des textes, etc. Google Lens peut également traduire du texte en temps réel à partir de plus de 100 langues, aider aux devoirs en fournissant des explications et des résultats sur le web pour diverses matières, ou encore ouvrir du contenu multimédia ou des pages web spécifiques en réponse à l’entrée visuelle.

Google Lens est disponible sur tous les appareils et dans les applications préférées des utilisateurs, comme l’application Google, Google Photos ou Google Camera, mais aussi sur le moteur de recherche Google Images.

Bing Chat vs Google Lens

Nous avons effectués quelques tests de reconnaissance d’image entre les deux outils. Nous avons notamment testé l’efficacité des deux moteurs sur une photo prise près d’une plage vendéenne avec un papillon. Les deux outils ont donné des réponses différentes. Seul Google Lens proposait une réponse cohérente.

Bing Chat a cru reconnaître un héliconien zébré et celui-ci ne ressemble en rien au spécimen photographié.
Google Lens a parfaitement reconnu un flambé, proche cousin du machaon.

Les résultats montrent que Google Lens est plus performant que Bing Chat dans la plupart des cas. Google Lens est capable de reconnaître plus précisément et plus rapidement les objets présents dans les images. Google Lens peut également interagir avec les images en proposant des actions possibles, comme acheter un produit similaire, écouter une chanson ou visiter un site web.

Bing Chat, quant à lui, présente plusieurs limites dans la reconnaissance d’images. L’outil a parfois du mal à identifier correctement les objets ou à les distinguer du fond. Bing Chat fournit des informations sur ce qu’il voit mais celles-ci sont trop générales ou parfois hors sujet. Bing Chat ne propose pas non plus d’actions liées aux images, se contentant de renvoyer vers des résultats de recherche web.

Quelles sont les perspectives d’amélioration pour Bing Chat ?

Microsoft n’a pas encore communiqué officiellement sur les résultats des tests comparatifs entre Bing Chat et Google Lens, ni sur les éventuelles améliorations qu’il compte apporter à sa fonction multimodale. Toutefois, il est probable que Microsoft continue à travailler sur la reconnaissance d’images au sein de Bing Chat, en s’appuyant sur les retours des utilisateurs et sur les avancées de l’intelligence artificielle.

Microsoft a déjà annoncé qu’il prévoyait d’intégrer des plugins de Bing dans Bing Chat, qui permettront aux utilisateurs de personnaliser et d’enrichir leur expérience de recherche, en améliorant divers aspects de la plateforme. Microsoft espère ainsi renforcer les capacités de Bing Chat et le rendre plus compétitif face à Google Lens.

Bing Chat pourra-t-il rattraper son retard face à Google Lens ? Probablement, dans les prochains mois.

Illustration en Une : © Babeth B.


Sur le même sujet

Faut-il avoir peur de l’intelligence artificielle ? Définitions de l’intelligence artificielle.