👀 Webinar Devenir freelance en 2022 le 8 février de 13h à 14h.
Dans toute la France
Dans toute la France

3/4 Intelligence artificielle générative : le match !

3/4 Intelligence artificielle générative : le match !

Fin 2022, l’intelligence artificielle se fait connaître de manière tonitruante avec l’ouverture au grand public de ChatGPT, l’IA générative de OpenAI.

Depuis toutes les grandes firmes de l’IT sont dans une course effrénée à qui proposera un outil plus puissant que le précédent !

Sommaire

course à l'IA générative

Mais au fait, c’est quoi au juste une IA générative ?

L’intelligence artificielle générative est un type de système d’IA capable de générer du texte, des images ou d’autres médias en réponse à des invites (ou “prompts”). Les modèles génératifs apprennent les modèles et la structure des données d’entrée. Ils génèrent ensuite un contenu similaire aux données d’apprentissage mais avec un certain degré de nouveauté. Les anciens modèles se contentaient de simplement classer ou prédire les données. Pour aborder l’IA générative, les cadres les plus importants comprennent les réseaux antagonistes génératifs (GAN) et les transformateurs génératifs pré-entraînés (GPT).

L’IA générative peut être unimodale ou multimodale. Les systèmes unimodaux n’acceptent qu’un seul type d’entrée (par exemple, du texte). De leur côté, les systèmes multimodaux peuvent accepter plusieurs types d’entrée (par exemple, du texte et des images).

Les applications potentielles de l’IA générative sont nombreuses, notamment dans des domaines créatifs tels que l’art, la musique et l’écriture, ou les soins de santé, la finance et les jeux. Cependant, il existe des inquiétudes quant à l’utilisation abusive potentielle de l’IA générative. Citons par exemple la création de fake news ou de deepfakes, qui sont utilisés pour tromper ou manipuler les gens.

Les intelligences artificielles génératives d’images

Deux IAs sortent aujourd’hui du lot (août 2023) : Midjourney et Dall E.

Le match !

Prise en main :

DALL-E 2 est accessible sur le site internet d’OPEN AI. Il vous suffit d’un navigateur internet et c’est parti ! Vous pouvez également utiliser une autre version de DALL-E, via Bing Creator.

Accéder à Midjourney demandera que vous possédiez un compte Discord, puis que vous rejoignez le serveur de Midjourney, puis en tant que débutant, un salon « Newbies ». Ce sera donc moins facile pour le grand public de prendre la main sur l’IA !

Interface de dall-e avec une barre pour saisir son prompt et quelques visuels en exemple
Interface Midjourney : sur Discord, au milieu les messages générés par d'autres utilisateurs, à gauche les différents salon, en bas la barre pour saisir ses prompts

Résultats :

Nous avons testé les trois plateformes avec un même prompt. Une image (ou plutôt 4) valant mieux que 1000 mots, observons le résultat.

Voici le prompt qui a été utilisé : Bear and 3 years old boy Adventures in dark caves It’s raining, so let’s take a break.

DALL E (version Bing) 

4 images représentants un ours brun et un petit garçon assis dans une grotte alors qu'il pleut à l'extérieur

DALL-E 2 :

4 images photo réalistes représentants un ours brun et un petit garçon assis dans une grotte alors qu'il pleut à l'extérieur

Midjourney :

4 images représentants un ours brun et un petit garçon assis dans une grotte alors qu'il pleut à l'extérieur

Notons que les tests semblent révéler que DALL-E dans sa version Bing Creator est plus efficace que dans sa version officielle DALL-E 2 – et gratuit !

Prix :

Deux salles, deux ambiances ! DALL-E 2 fonctionne au crédit :  15 $ pour 115 crédits. L’offre de Midjourney est beaucoup moins claire. À partir de 8 $ / mois vous devriez pouvoir générer environ 200 images chaque mois.

Intégration :

Avantage clair et net pour DALL-E. En effet OpenAI fournit des API qui permettent aux développeurs de créer des intégrations personnalisées.  Midjourney ne le propose pas de son côté. 

Pour conclure :

Les images proposées par Midjourney lors de notre test ont fait l’unanimité auprès de notre équipe, suivies de près par celles proposées par la version Bing de DALL-E.

Toutefois les facilités d’intégration de DALL-E et sa tarification claire lui confèrent des avantages non négligeables.

Votre choix dépendra donc de l’utilisation que vous comptez faire de ces outils.

Gageons de toute façon que rien n’est figé ! Cet article écrit à la fin de l’été 2023 pourrait ne plus être aussi pertinent dans 6 mois : l’émergence de nouveaux concurrents et l’apprentissage des IA existantes pouvant rabattre les cartes à tout moment. 

Les intelligences artificielles génératives conversationnelles

Cette nouvelle génération d’intelligence artificielle générative est capable d’interagir avec les humains en langage naturel. ChatGPT est celle qui a fait connaître cette technologie au grand public. Depuis, toutes les grandes entreprises de la tech veulent développer leur propre IA : de Facebook à Amazon en passant par Google ou Microsoft.

Dans cet article, nous allons vous présenter ChatGPT et son concurrent Bard.

Le match !

Trois intelligences artificielles vont être passées au grill :

ChatGPT4, la dernière version – payante, d’OpenAI, Bing Chat, qui repose sur la version 4 de ChatGPT, et Bard, le chatbox de Google.

Prise en main :

Accéder à ChatGPT 4 se fait via une webapp : il vous suffira de rentrer l’URL dans votre barre de recherche, sur votre ordinateur ou votre téléphone.

Il est tout aussi facile d’utiliser Bard, comme tous les outils Google, il est accessible simplement sur le net.

Bing Chat est le moins accessible : il va vous falloir vous rendre sur le moteur de recherche Bing, pour accéder à l’onglet Conversation.

Résultats :

Afin de savoir ce que ces trois intelligences artificielles ont dans le ventre, nous les avons testé sur un prompt simple : Je suis un développeur Java freelance et Wekey m’a proposé une mission. Que peux-tu me dire sur cette société ?

Les réponses pouvant être longues, elles sont développées dans les onglets suivants afin de vous faciliter la lecture de cet article.

Bilan

ChatGPT 4 n’est plus relié au web depuis 2021, il n’a donc aucune information récente. Par ailleurs, il semble qu’avant cette date, l’intelligence artificielle ne s’intéressait qu’aux entreprises ayant une notoriété importante. C’est donc un échec sur cette requête, ChatGPT4 nous explique à la place comment trouver les informations par nous-même.

De son côté Bing Chat dispose d’un accès au web : il est allé chercher des informations sur Wekey sur notre site internet et dans l’annuaire des entreprises de l’état. Les informations fournies, bien que limitées sont totalement exactes, et sourcées.

Pour finir Bard ! Il présente correctement Wekey et rentre plus dans le détail que son prédécesseur. Toutefois, nous sommes face à ce que l’on appelle une IA Hallucination ! Il a ajouté des avis clients complément inventés. Ils sont certes très positifs pour Wekey, mais ils n’ont d’existence que sur Bard. Comme ChatGPT4, il nous fournit quelques conseils, cette fois pour s’assurer que la mission que nous proposons est conforme aux attentes du développeur Java. Note : le 20 septembre, Bard a annoncé faciliter la recherche web grâce à l’amélioration de son bouton intégré “Google it” qui permettra de fact-checker les réponses de l’intelligence artificielle. Fini les hallucinations ?

La réponse apportée par chacune des 3 IA est soit parcellaire ou inexistante, soit inventée. Cela démontre que si les IA génératives conversationnelles sont de puissants outils, elles sont encore en apprentissage et tout ce qu’elles disent ne doit pas être pris pour argent comptant. N’hésitez pas à consulter nos articles sur les avantages et dangers de l’IA pour en savoir plus à ce sujet !

Prix :

Bard et Bing Chat sont gratuits. ChatGPT 4 coûte 20 $ / mois, et propose des réponses plus rapides que GPT-3.5 et donne accès à de nouvelles features en avant-première. Son modèle est mieux entrainé que son prédécesseur.

Intégration :

ChatGPT propose plusieurs API, et Microsoft a confirmé l’existence d’API Bing pour les applications tierces et devrait ouvrir cette possibilité aux développeurs prochainement.

Même son de cloche chez Google : il existe une API pour Bard, accessible pour l’instant à un nombre limité d’utilisateurs. Une liste d’attente existe pour y avoir accès. Les Bard Extensions font leur apparition mi septembre : Elles vont permettre de lier Bard à Gmail, Googles Docs ou Youtube….

Pour conclure :

Il n’y a pas vraiment de gagnant à l’heure actuelle dans ce match opposant les intelligences artificielles génératives conversationnelles.

La course à l’innovation en cours peut rabattre les cartes à tout moment. Votre choix se fera probablement en fonction de l’UX des plateformes et du tarif proposé.

La bataille est toutefois pour l’instant gagnée par ChatGPT en termes d’image ! Le fait d’avoir été le premier et d’avoir popularisé les intelligences artificielles génératives conversationnelles lui conférant une nette avance sur ses concurrents. Preuve en est avec Google, qui n’avait pas prévu de sortir Bard si tôt, mais à dû réagir face à la menace venue d’OpenAI.

Pour aller plus loin

Le blog Wekey regorge de ressources sur le freelancing, le web3 ou l'intelligence artificielle !

S'inscrire à la newsletter