Depuis des mois, vous entendez parler de ChatGPT, des prouesses qu’il réalise tout autant que des inquiétudes qu’il soulève. Lors de l’événement Cultive ta Data, Samuel Rochette et Giuseppe Guarino, Senior Data Scientists chez Flint, ont eu l’occasion de présenter la conférence “Jusqu'où peut aller l'IA ?
Depuis des mois, vous entendez parler de ChatGPT, des prouesses qu’il réalise tout autant que des inquiétudes qu’il soulève.
Lors de l’événement Cultive ta Data, Samuel Rochette et Giuseppe Guarino, Senior Data Scientists chez Flint, ont eu l’occasion de présenter la conférence “Jusqu'où peut aller l'IA ? État des lieux et perspectives”afin de remettre du contexte, de présenter à la fois les mécanismes derrière les "grands modèles de langage" (LLM) de manière simple et didactique, pour ensuite les illustrer avec des applications concrètes pour vos entreprises.
Le replay de la conférence est disponible ci-après : (le son s’améliore après la troisième minute)
Durant cette conférence, nous parlerons d’IA générative. Cette branche de l’intelligence artificielle se concentre sur la création de modèles et d’algorithmes capables de générer des données, des images, des textes ou des sons de manière autonome.
LLM signifie Large Language model. Ce sont des réseaux neuronaux utilisant d'énormes volumes de données pour comprendre le langage humain (appelé aussi langage naturel).
Ainsi pour comprendre ce qu’est ChatGPT, il est important de comprendre le fonctionnement qui se cache derrière.
On va donc parler de 2 modèles :
Le modèle text to image est un modèle d’apprentissage supervisé qui prend en entrée, une description textuelle et produit une image correspondante à cette description.
Focus sur l'apprentissage supervisé
L'apprentissage supervisé est une technique d'apprentissage automatique (Machine Learning) utilisée en Data Science. Il s'agit d'un type d'algorithmes où le modèle est entraîné sur un ensemble de données étiquetées (par l’humain). L'objectif de l'apprentissage supervisé est de permettre au modèle d'apprendre à faire des prédictions précises sur de nouvelles données non étiquetées.
Un exemple très connu est lorsque vous dites à votre logiciel d’email qu’un email est un spam, vous “l’étiquetez” spam pour l’algorithme de reconnaissance de type d’email. Ainsi, il devient meilleur.
Ici, c’est de la classification de l’image mais cela pourrait être tout simplement le même fonctionnement pour tous les modèles dit paramétriques fonctionnels.
Avec cette même logique (que l’on appelle encoder / décoder), lorsque l’on travaille un set de data, avec un modèle, nous pourrons récupérer une image qui, de prime abord, ne ressemblera pas forcément à ce que l’on souhaite.
Il faudra entraîner le modèle afin de se rapprocher de ce que l’on attend (ici dans l’exemple de Samuel, un saxophone).
Un modèle GPT est un réseau neuronal artificiel utilisé pour le traitement du langage naturel qui utilise des concepts d'apprentissage profond pour générer des phrases de sortie précises.
Ce modèle est par exemple utilisé lorsque l’on souhaite prédire la fin d’une phrase.
Pour ce faire, on utilise de l'apprentissage auto supervisé, c’est-à-dire, un modèle qui apprend à partir de données partiellement étiquetées ou auto-étiquetées.
Les avantages :
Les limites :
Pour passer d’un modèle type GPT qui va générer du texte à un agent conversationnel de type ChatGPT, il suffit de créer un contexte au modèle, que l’on appelle un pré-prompt.
Mais attention, à l’importance du contexte donné, votre texte et sa formulation auront un impact sur la réponse que cela va générer.
Parmi les usages les plus classiques, nous avons :
Et depuis quelques mois, nous voyons apparaître de nouveaux usages :
Les cas d’usage principaux de l’IA sont l’optimisation des processus robotiques et les interfaces de conversation (chatbots). En effet, il est important de rappeler que la plupart des cas d’usage, ne nécessite pas l'usage des LLM ou des modèles SOTA. Les systèmes de Machine Learning classiques livrent une très bonne performance.
Lors de cette présentation, Giuseppe souhaite partager l’état de l’art en 09/2022.
Nombreuses des entreprises présentées ici, comme étant à l’état de l’art, ont été créées ces derniers mois. Il est donc normal pour toutes entreprises de se sentir perdus.
Les modèles sont bons pour l’interpolation entre différents points des données d’apprentissage. Cependant, il est compliqué pour eux d’extrapoler.
Ils vont donc générer des informations cohérentes mais non vraies. En effet, il est très difficile pour des modèles d’apprentissage de raisonner sur des sujets inconnus partant d’informations qu’ils ont à disposition.
Évidemment, l’une des grandes questions autour de l’IA est l’éthique. Un des exemple donné est une limitation émise sur Mid Journey, contre toute reproduction du président chinois.
Éthique ou non, la question reste ouverte.
Comme tout système informatique, ChatGPT a lui aussi ses failles et peut être contourné.
ChatGPT est programmé pour ne pas générer de réponses blessantes, ne pas prodiguer de conseils dangereux ou produire de contenu sexuel, violent ou polémique.
Cependant, il existe de plus en plus de règles connues pour contourner cette limitation, parfois pour manipuler ou désinformer.
Il en est de même pour ChatGPT Injection. Alors que nous ne lisons que le contenu texte et image, il est possible qu'une personne malveillante puisse intégrer des métadonnées, qui seront lu par l’IA, mettant le lecteur en erreur.
Giuseppe alerte et préconise de garder en tête qu’il peut toujours y avoir une personne mal intentionnée qui détourne l’IA. Il ne faut donc pas lui donner une confiance aveugle.
Auparavant, nous étions à la recherche du modèle le plus grand, donc le plus puissant.
Aujourd'hui, grâce à l’open source, les développeurs ont réussi à créer un modèle plus petit mais encore plus puissant. Même si ChatGPT est le plus connu, aujourd'hui les Data Scientists ont plein d’autres solutions à portée de main (telles que Llama by Meta).
L’open source s’adapte très vite, voire plus vite, puisqu’il s’appuie sur une communauté mondiale.
Pour conclure, voici les points clés à retenir :
Si vous souhaitez comprendre comment intégrer l’IA dans votre entreprise, nous vous conseillons de lire l’article “Comment intégrer l’Intelligence Artificielle dans sa stratégie d’entreprise ?” ou visionner le replay de cette table ronde animée par Pierre Vannier, CEO de Flint.