Apprentissage automatique : L’essor de l’IA générative dans les entreprises, la recherche et l’éducation

Perspectives
Cette publication fait partie de la série Perspectives
Principaux points à retenir
1
On a parfois l’impression que les grands modèles de langage sont apparus presque du jour au lendemain, alors qu’ils sont le résultat de décennies de recherche. Et des modèles toujours plus puissants sont en cours de développement.
2
La chaîne de valeur va probablement évoluer, permettant aux employés de se concentrer sur les domaines les plus créateurs de valeur ajoutée, abandonnant certaines tâches ordinaires à un ordinateur.
3
Les humains forment encore les machines, mais nous pensons que l’inverse pourrait être vrai d’ici dix ans. Les machines pourraient fournir un enseignement personnalisé et interactif complètement inédit.

Les possibilités de l’intelligence artificielle générative (IAG) suscitent un vif intérêt ces derniers temps. Nous sommes tous plus ou moins stupéfaits par l’aptitude des grands modèles de langage (LLM) comme ChatGPT à effectuer des tâches comme l’écriture d’un roman, la suggestion d’une recette ou le résumé d’un document de recherche complexe. Et ce n’est pas fini : ces modèles ne représentent que la partie émergée de l’iceberg et des outils beaucoup plus puissants sont en cours de développement. Mais les inquiétudes ne manquent pas : vont-ils entraîner un chômage de masse et les machines pourraient-elles finir par dominer le monde ?

Lou D’Ambrosio, responsable de l’équipe « Value Accelerator » de Goldman Sachs, s’est récemment entretenu avec Dave Ferrucci, un chercheur spécialiste de l’IA de renommée internationale. Entre 2007 et 2011, le Docteur Ferrucci a dirigé une équipe d’experts et d’universitaires d’IBM travaillant au développement du système informatique Watson, qui a battu les meilleurs concurrents historiques de l’émission télévisée Jeopardy ! En 2015, il a fondé Elemental Cognition, une société d’IA spécialisée dans la compréhension profonde du langage naturel.

D’où viennent les modèles de langage dont tout le monde parle soudainement ?

Ferrucci : Il s’agit d’un grand pas pour l’intelligence artificielle, c’est certain, mais je pense que tout le monde ne se rend pas compte qu’ils sont le fruit d’un travail de longue haleine - ces modèles ne sont pas apparus comme par enchantement. Cela fait des décennies que des experts travaillent sur l’IA, mais les derniers développements marquent un tournant. En effet, la capacité à maîtriser le langage est l’un des éléments étroitement associés à l’intelligence humaine, et c’est précisément ce que permettent ces grands modèles de langage. Des machines sont aujourd’hui capables de formuler un langage cohérent et fluide comme les meilleurs d’entre nous.

Comment ces modèles fonctionnent-ils ?

Ferrucci : Les grands modèles de langage sont l’une des applications de « deep learning ». En travaillant de manière prédictive, ils analysent l’agencement des mots dans de vastes corpus de données afin de calculer la probabilité que certains termes suivent une séquence particulière d’autres mots. S’ils y parviennent aussi bien, c’est grâce à la quantité gigantesque de données à partir desquelles ils sont entraînés. Cela permet d’obtenir une fluidité incroyable qui correspond non seulement à la langue des données d’entraînement, mais aussi à la requête spécifiée par l’utilisateur. Bien entendu, vous pouvez ensuite réagir à ce qu’ils produisent, ce qui permet d’instaurer un dialogue. Ils ne pensent pas comme les humains, mais leur impact est néanmoins spectaculaire et significatif. Il en résulte donc une vraie communication entre l’homme et la machine.

Quelles sont les conséquences pour les entreprises ?

Ferrucci : Le langage est essentiel à l’acquisition des connaissances. La communication d’idées entre personne se fait par le biais du langage. Par conséquent, les modèles de langage pourraient avoir une incidence sur les fonctions fondamentales de l’entreprise pour faire des résumés, des synthèses, donner des explications ou encore fournir des données et des informations clés. Le rôle de reporting de nombreux cadres moyens, qui jouent le rôle d’intermédiaires, pourrait en être affecté. La chaîne de valeur commence à se transformer car toute personne prenant une décision peut obtenir à un coût bien moins élevé la synthèse, le résumé, l’agrégation et la fourniture d’informations à partir d’une machine. Les clients des entreprises ont désormais accès à ces connaissances beaucoup plus facilement et avec moins d’expertise humaine.

Les modèles de langage pourraient avoir une incidence sur les fonctions fondamentales de l’entreprise pour faire des résumés, des synthèses, donner des explications ou encore fournir des données et des informations clés.

Une entreprise peut-elle développer son propre grand modèle de langage (LLM) pour exploiter toutes les expertises existantes, tout en conservant un certain contrôle sur les données d’apprentissage ?

Ferrucci : On s’attend globalement à l’émergence de modèles de langage spécialisés dans un domaine particulier et entraînés par une entreprise à partir de son propre contenu, par exemple grâce à ce que l’on appelle des « modèles de langage fondamentaux », afin de les former à la structure globale du langage. Mais il faut ensuite ajouter une couche supplémentaire pour les former aux données spécifiques de l’entreprise. Il est également possible de les former à des domaines spécifiques, en se focalisant uniquement sur des sujets précis.

Comment les entreprises doivent-elles exploiter le potentiel offert par les modèles de langage ?

Ferrucci : Je pense qu’elles ne peuvent pas se permettre d’ignorer ce qui se passe actuellement. La solution à adopter dépend de la nature de l’activité de l’entreprise et il faudra nécessairement passer par une phase d’expérimentation. L’une des principales questions est de savoir si le produit ou le service offert est directement réplicable par l’IA. Au-delà de cette question fondamentale, les entreprises peuvent être amenées à tenir compte de la séquence de leurs opérations et de leurs processus afin d’identifier des expérimentations à faible risque et les opportunités viables. Le principal risque serait qu’elles ignorent l’IA ou qu’elles n’envisagent pas toutes les incidences que l’IA peut avoir sur leurs processus opérationnels.

Quels types de rôles seront affectés ?

Ferrucci : Tout le monde a parlé de l’impact sur les fonctions créatives. Prenons l’exemple des rédacteurs dans les fonctions vente et marketing : une grande partie de ce qu’ils font peut être répétitif et avec des formules. Comme les modèles de langage peuvent assurer ces tâches à un coût extrêmement faible, les rédacteurs peuvent se concentrer sur le 1/5è de leur rôle qui consiste à trouver de nouvelles idées susceptibles de créer de la valeur ajoutée.

Les bases de données et les systèmes informatiques actuels utilisent déjà des techniques de calcul puissantes, efficaces et fiables, mais un intermédiaire reste nécessaire entre le décideur et l’utilisation de la technologie. De grands modèles de langage (LLM) aident désormais les décideurs à communiquer de manière fluide avec ces systèmes pour effectuer des analyses et parvenir à des conclusions. Prenons l’exemple de la logistique, où les sujets complexes liés aux déplacements, aux finances ou au design nécessitaient auparavant de multiples interactions humaines. Désormais, une machine peut résoudre ces problèmes et interagir de manière fluide avec une personne qui ne comprend pas nécessairement tous les processus. Les centres d’appel, par exemple, utilisent désormais des machines pour traiter 90 à 95 % des appels entrants, contre 40 à 50 % auparavant.

Comment l’IA affecte-t-elle des secteurs comme la recherche et la biopharmacie ?

Ferrucci : Les entreprises conjuguent de modèles de langage avec la recherche et l’analyse sémantique, ce qui réduit considérablement le besoin de recherche documentaire. Dans certains domaines, comme l’investissement ou la conception de médicaments, la production d’une recherche de grande qualité et bien étayée, qui prenait auparavant des mois, peut désormais être réalisée en quelques jours, quelques heures, voire quelques minutes.

Autre domaine intéressant, celui du repliement des protéines. La manière dont les protéines se plient suit une série de schémas prévisibles, un peu comme un langage. Les modèles de langage utilisent de puissantes techniques de « deep learning » pour apprendre l’enchaînement de ces schémas, ce qui nous permet de mieux comprendre les protéines et leur mode de repliement. Les modèles ont donc un rôle essentiel à jouer dans la découverte de nouveaux médicaments et dans la compréhension des maladies.

Le langage ne se résume pas aux mots. Le langage implique des séquences et des schémas qui créent du sens. La structure des protéines repose sur le langage et les modèles de langage peuvent nous aider à apprendre beaucoup plus efficacement les schémas classiques qui sous-tendent leur fonctionnement.

Quel est le rôle de l’IA dans l’éducation ?

Ferrucci : Il est désormais possible de s’instruire sur n’importe quel sujet, mais le problème c’est que cet apprentissage n’est pas personnalisé en fonction de l’étudiant. Mais imaginez que l’on puisse prendre tout le contenu existant, le rendre dynamique, interactif et le personnaliser pour chaque élève. Cela permettrait d’améliorer considérablement l’enseignement, tant dans les universités que dans les entreprises.

Vis-à-vis de quels sujets doit-on être vigilants ?

Ferrucci : Nous devons être prudents quant à l’utilisation potentiellement abusive de ces outils. La sécurité, la propriété intellectuelle et l’impact de ces outils sur l’économie suscitent par exemple des inquiétudes. Il nous faut encore réfléchir à toutes les répercussions possibles.

Je pense que les personnes qui connaissent le mieux ces modèles ont des préoccupations légitimes en matière de vie privée, de sécurité, de fiabilité et de confiance. La technologie est à la fois facile à utiliser et omniprésente, donc je ne sais pas s’il est judicieux d’interrompre les progrès et les développements en cours, comme certains le proposent.

Il est important de prendre acte de ces préoccupations, d’en être pleinement conscient et de prendre du recul pour y réfléchir. Je pense que beaucoup de ces craintes finiront par être dissipées. Mais il faut garder à l’esprit qu’il s’agit de systèmes génératifs, c’est-à-dire qu’ils produisent de nouvelles choses. Ils pourraient intégrer des données erronées et développer des choses à partir de ces fausses informations. Cela n’a rien à voir avec du travail de recherche.

Selon vous, où en serons-nous dans 10 ans ?

Ferrucci : Je suis globalement optimiste malgré toutes les réserves suscitées par le sujet de l’IA générative. Aujourd’hui, nous en sommes encore à la phase où les humains forment les machines. Mais ces modèles vont être tellement fluides et capables de synthétiser le langage que les machines pourraient un jour finir par former les humains. Elles pourraient nous enseigner de nouvelles compétences, nous éduquer sur tout un éventail de sujets. Elles pourraient nous fournir un accès personnalisé et interactif à des supports pédagogiques. Simultanément, des humains pourraient reprogrammer - simplement en leur parlant - des ordinateurs pour qu’ils effectuent une multitude de tâches.

En fait, je ne vois pas d’avenir pour l’humanité sans intelligence artificielle. Selon moi, il s’agit de l’outil le plus fondamental pour le développement de l’espèce humaine. Cela ne veut pas dire que nous ne rencontrerons pas de problèmes ou que nous n’aurons pas beaucoup à apprendre au fil des progrès technologiques. Les gens vont devoir expérimenter, nous devrons être prudents et la réglementation devra être rigoureuse. Mais la technologie est tellement puissante que je considère qu’il est de notre devoir de la déployer.

Les machines pourraient nous enseigner de nouvelles compétences, nous éduquer sur tout un éventail de sujets.

Quel le potentiel d’amélioration des grands modèles de langage ?

Ferrucci : Je pense que nous allons atteindre un niveau de performance décroissant et que la valeur créée viendra de l’efficacité avec laquelle nous adapterons les modèles pour résoudre des problèmes spécifiques. Nous pouvons entraîner les modèles sur une vaste quantité de langage humain, mais comment les utiliser efficacement dans le monde des entreprises ? Comment les intégrer à d’autres techniques et technologies pour contribuer à leur efficacité ? Ce sont probablement ces questions qui seront les plus passionnantes à l’avenir.