Tout ce qu’il faut savoir sur ChatGPT, le robot qui veut plaire aux humains | 24 heures
/panorama

Tout ce qu’il faut savoir sur ChatGPT, le robot qui veut plaire aux humains

Image principale de l'article ChatGPT, le robot qui veut plaire aux humains
Illustration Marilyne Houde

Rien ne semble impossible pour ChatGPT. Le robot conversationnel peut vous écrire un essai convaincant sur la justice autant qu’un sonnet à propos de votre amour de la lasagne, ou encore vous dire qui est le plus grand président américain de l’histoire ou la marche à suivre pour cuisiner un œuf mollet. Est-ce dire que ChatGPT sait tout? Pas exactement. Il serait surtout doué pour nous dire ce que l’on veut entendre. 

• À lire aussi: ChatGPT refuse d'écrire notre lettre de coming out

À sa base, ChatGPT est ce qu’on appelle un modèle de langage: une intelligence artificielle (IA) capable de prédire les prochains mots d’une phrase grâce aux probabilités. Entraîné avec un corpus gigantesque de livres numériques, de conversations sur des forums et d’autres médias, il est comme une version ultra-performante du logiciel de saisie prédictive de votre téléphone. 

Capture d'écran

C’est dans sa façon de répondre aux questions que le robot conversationnel diffère de son prédécesseur GPT-3. Lorsqu’on pose une question à un modèle de langage, il se peut que la réponse la plus probable ne soit pas celle que l’on recherche. Mais grâce à un modèle d’apprentissage particulier, ChatGPT n’a pas ce problème.  

Apprentissage par renforcement humain 

Même si le processus d’apprentissage de ChatGPT n’a pas été rendu public, on sait qu’il repose sur des principes ayant déjà été étudiés avec d’autres intelligences artificielles similaires. Enfin d’entraîner un modèle de langage à bien comprendre les demandes de ses utilisateurs, on utilise l’apprentissage par renforcement humain en trois étapes.  

En premier lieu, on choisit des demandes tests auxquelles de véritables humains répondent. Ces réponses servent de point de départ pour apprendre à l’IA ce qui est recherché. Après cette première étape, l’IA se trompe toutefois encore souvent dans ses réponses.  

Lors de la deuxième étape, on soumet certaines des mêmes demandes tests à l’IA, qui fournit par elle-même plusieurs réponses. Les testeurs humains classent alors ces réponses de la plus utile à la moins utile. L’IA intègre ces résultats pour comprendre ce qu’elle devrait répondre.  

À l’étape finale, l’IA utilise ce qu’elle a appris lors de la deuxième phase pour fournir une réponse à d’autres demandes tests, raffinant sa compréhension du style de réponse attendue. Puis, les deuxième et troisième étapes sont répétées en boucle jusqu’à ce que l’IA maîtrise les subtilités et les nuances des demandes que lui fournissent les humains. 

• À lire aussi: Voici 23 tendances qui marqueront 2023

Il ne faut pas croire tout ce qu’on lit sur Internet 

ChatGPT sait répondre à nos questions, mais ça ne veut pas dire que ses réponses sont toujours les bonnes. Il lui arrive de mal comprendre la demande ou de tout simplement répondre des faussetés.  

Le corpus de base à partir duquel ChatGPT a été entraîné ne contient en effet pas seulement des informations véridiques. On n’a qu’à penser aux forums de discussion, où les gens expriment leurs opinions ou des faits qui ne sont pas nécessairement vérifiés.  

Comme c’est le cas avec d’autres IA, ChatGPT risque également de recréer des stéréotypes. Par exemple, si on lui pose des questions sur un ou une PDG de compagnie, il va présumer qu’il s’agit d’un homme blanc

L’apprentissage par renforcement humain peut également introduire des biais dans le fonctionnement du robot conversationnel. Plutôt que de dire que ChatGPT a été entraîné pour répondre aux humains, il serait plus exact de dire qu’il a été entraîné pour plaire à ses testeurs. Sont-ils représentatifs d’une grande variété d’expériences humaines ou proviennent-ils tous de milieux similaires?  

Au contraire d’un moteur de recherche, ChatGPT ne met pas à jour automatiquement les informations auxquelles il a accès. Il est donc impossible pour lui de répondre à une question à propos d’un évènement qui a eu lieu après la fin de 2021. 

Outil ou compétiteur? 

ChatGPT n’est pas encore fonctionnel au point pour prendre la place d’un humain qui, par exemple, occupe un emploi qui nécessite d’écrire.    

Plutôt que de remplacer des employés, le robot pourrait devenir un allié et accomplir certaines tâches, comme écrire des courriels ou faire des publications sur les réseaux sociaux. L’IA est aussi déjà très efficace pour résumer des textes de manière claire et pour déceler les erreurs de codage informatique.  

Dans le monde du service à la clientèle, ChatGPT pourrait également permettre d’améliorer l’efficacité des assistants virtuels et les conversations automatiques.  

Microsoft a investi plus d’un milliard de dollars dans OpenAI, les développeurs de ChatGPT, dans l’espoir d’implémenter l’IA dans son moteur de recherche, Bing. Google, de son côté, travaille sur LaMDA, sa propre version du robot conversationnel. 

Si ChatGPT est toujours disponible gratuitement, il pourrait éventuellement devenir payant. Son opération engrange déjà des coûts «à en pleurer», a prévenu le PDG d’OpenAI sur Twitter. 

Sources: Search Engine Journal, AssemblyAI, OpenAI, Forbes