L'intelligence artificielle (IA) a fait d'énormes progrès ces dernières années, et l'un des développements les plus remarquables est l'émergence de ChatGPT. Ce modèle de langage alimenté par l'IA suscite beaucoup d'intérêt en raison de sa capacité à tenir des conversations fluides et naturelles avec les utilisateurs. 

Dans cet article, nous allons explorer, de manière accessible, le fonctionnement de ChatGPT, en abordant ses entraînements et son mode de fonctionnement.

Sommaire : 

  1. Quelle est la différence entre GPT et ChatGPT ?
    • Définition et fonctionnement de GPT et ChatGPT. 
  2. Comment fonctionne ChatGPT ?
    • Entraînement avec les sources internet, une supervision humaine, une supervision d’IA, le langage humain.
Apprentissage automatisé pour les algorithmes GPT

1. Quelle est la différence entre GPT et ChatGPT ?

Qu’est-ce que GPT ? 

Le modèle GPT a été initialement introduit par OpenAI en juin 2018 avec la publication du premier modèle, GPT-1, entraîné sur plus de 500 milliards de mots. Depuis, plusieurs itérations et améliorations ont été réalisées. GPT-2 a été dévoilé en février 2019 et GPT-3 en juin 2020. Ces modèles ont connu une évolution significative en termes de taille, de capacités et de performances.

“GPT-3 est non seulement capable d’écrire correctement dans plusieurs langues mais c’est aussi un modèle encyclopédique qui intègre un grand nombre de références au monde réel (personnes, événements, connaissances scientifiques) qu’il restitue plus ou moins bien. (...) GPT-3 n’a pas vraiment d’inhibition et peut générer n’importe quoi tant que le texte est superficiellement cohérent.”, “ChatGPT : comment ça marche ?”, Hypotheses, par Pierre-Carl Langlais, 07/02/2023. 

 

Depuis mars 2023, GPT-4 apporte des réponses plus précises et plus fiables que son prédécesseur.

GPT (“Generative Pre-trained Transformer” en anglais) est un grand modèle de langage (LLM “Large Language Model” en anglais). Ce dernier est en fait connu de tous. Dans nos applications de messages ou moteurs de recherche, nous utilisons le texte intuitif (aussi appelée écriture prédictive), basé sur un dictionnaire préexistant et des probabilités. 

GPT utilise l’écriture prédictive pour apporter des réponses a priori cohérentes en utilisant la suite de mots la plus probable.

 

Qu’est-ce que ChatGPT ? 

 

ChatGPT est l’agent conversationnel basé sur le modèle de langage GPT, conçue spécifiquement pour fournir des réponses et engager des conversations avec les utilisateurs.

Prédiction de Chat-GPT pour un langage naturel

2. Comment fonctionne ChatGPT ?

Lorsque vous donnez une instruction ou une phrase d'amorçage  (appelée “prompt”) à ChatGPT, le modèle analyse le contexte et génère une réponse en utilisant les connaissances acquises pendant son entraînement. Il essaie de produire une suite de mots qui semble appropriée dans le contexte donné.

Visualisation des entrainements GPT
La triche à l'ère de ChatGPT: constats et solutions
Analyse des données informatiques par GPT

Entraînement avec les sources internet

GPT est entraîné sur de vastes quantités de données textuelles provenant d'Internet, articles, journaux, livres, réseaux sociaux, forums… Il apprend à prédire la probabilité d’apparition d’un mot ou d’une phrase en fonction d’un texte donné. ChatGPT utilise une architecture de réseau de neurones appelée Transformer, qui est conçue pour capturer les relations entre les mots dans un texte. 

GPT est entraîné jusqu’à donner la réponse attendue par un humain.

Analyse GPT avec l'aide de développeurs

Entraînement avec une supervision humaine

GPT est entraîné à donner plusieurs réponses à une question. Des humains classent et évaluent la pertinence de ces réponses en donnant une “récompense” (“rewards”). Le but est de renforcer la cohérence des réponses, éviter les dérives et les erreurs. 

Une IA de récompense se développe. Elle comprend comment classer et évaluer les réponses. Ce processus s’appelle le “Reinforcement Learning”.

Requêtes analysées par l'Intelligence Artificielle

Entraînement avec une supervision d’Intelligence Artificielle

Dans cette dernière phase d’entraînement, GPT donne plusieurs réponses à une question sous le contrôle de l’IA de récompense. Cette IA évalue les réponses pour les faire évoluer. 

Des humains vérifient que les réponses données ne sont pas sensibles et correspondent aux schémas de pensées actuels. On appelle cette étape “fine tuning”. 

Langage prédictif grâce à son algorithme entrainé

Entrainement avec le langage humain

Après tous ces entraînements, on demande à la technologie de répondre aux questions avec un langage humain. ChatGPT est la version conversationnelle de GPT. C’est ce que l’on appelle un Chatbot.

ChatGPT fonctionne de manière interactive en échangeant des tours de parole avec un utilisateur. Il utilise les informations précédentes, y compris les messages de l'utilisateur et les réponses précédentes du modèle, pour générer des réponses.

Les IA dans l'enseignement : opportunités ou menaces ?

Pour conclure, ChatGPT est un outil conversationnel qui répond à vos questions grâce à des entraînements sur plusieurs milliards de sources.

Les contenus générés par ChatGPT restent détectable grâce à un détecteur Chat GPT ou détecteur de contenu IA.

Ce ChatBot est beaucoup utilisé par les étudiants et les enseignants. Peut-on dire que c’est une avancée prometteuse ou un pas en arrière pour l’enseignement ? Ce qui est sûr, c’est que l’IA continue de se développer.

Voici quelques-unes des principales prédictions de Gartner.com (informations pour les décisionnaires professionnels) concernant l'IA générative.

  • D'ici 2025, l'IA générative produira 10% de toutes les données (aujourd'hui, c'est moins de 1 %) avec 20 % de toutes les données de test pour les cas d'utilisation destinés aux consommateurs.
  • D'ici 2025, l'IA générative sera utilisée par 50% des initiatives de découverte et de développement de médicaments.
  • D'ici 2027, 30% des fabricants utiliseront l'IA générative pour améliorer l'efficacité de leur développement de produits.”
    Explication des modèles d'IA générative, Altexsoft, 13/10/2022.

 


Pour aller plus loin :  


Information : cet article informatif ne requérant pas de réflexion personnelle, a été rédigé en partie avec l'aide de ChatGPT. Nous avons retravaillé les contenus générés automatiquement (corrections des répétitions, corrections des tournures de phrases, ajout de précisions, ajout de citations, vérification de la véracité des informations...).