Exploiter la puissance de l'IA pour améliorer la prise de décision en matière d'investissement
L'objectif des stratégies d'investissement actives et fondées sur les données est d'obtenir un avantage informationnel, c'est-à-dire d'en savoir plus, d'y voir plus clair et d'agir plus rapidement que les autres acteurs du marché. Il s'agit d'identifier, d'interpréter et d'agir sur des informations clés avant qu'elles ne soient entièrement intégrées par le marché. Pour évaluer la qualité et la valorisation des entreprises, les investisseurs orientés « données » se sont toujours appuyés sur des informations quantitatives et structurées, telles que le ratio cours/bénéfice d'une entreprise, ainsi que sur des statistiques de marché telles que la performance des actions ou le volume des transactions. Cette liste s'est allongée ces dernières années avec la disponibilité d'ensembles de données structurées telles que les chiffres de livraisons, de trafic Internet ou de transactions par carte de crédit.
Si ces indicateurs restent importants, le processus de prise de décision en matière d'investissement a considérablement évolué ces dernières années, processus qui s'est accéléré avec l'essor de l'intelligence artificielle (IA). Les investisseurs orientés « données » ont désormais accès à des ensembles de données plus vastes, moins structurés et plus complexes que jamais. Les sources non traditionnelles telles que les articles de presse, les dépôts réglementaires et de brevets, ainsi que les transcriptions et les enregistrements audios des conférences téléphoniques sur les résultats nécessitent de nouvelles méthodes d'analyse de données et d'extraction d'informations exploitables. Les progrès de l'IA procurent aux investisseurs des outils de plus en plus puissants pour traiter ces ensembles de données plus nuancés et non conventionnels dans le but de construire des signaux d’alpha et d'améliorer la prise de décision.
Pour tirer parti efficacement l'IA, il ne suffit pas de disposer des technologies nécessaires, telles que du stockage extensible ou des clusters de processeurs centraux et graphiques (CPU et GPU). Un processus d'investissement piloté par l'IA nécessite une stratégie bien conçue pour acquérir les données capables de générer des indications utiles, les nettoyer et les incorporer dans un cadre intégré. En d'autres termes, nous pensons qu'une stratégie d'IA efficace et évolutive repose sur une solide stratégie de données s'inscrivant dans la culture et la philosophie de l'entreprise.
L'essor de l'IA n'a pas réduit l'importance des personnes qui utilisent cette technologie. C'est plutôt l’inverse qui se vérifie. Pour exploiter toute la puissance du big data et de l'IA, il faut des data scientists capables de formuler des hypothèses de qualité et d'impulser des idées novatrices. Ils doivent pouvoir identifier les méthodes et techniques qui permettront d'obtenir les éclairages les plus différenciants à partir des données disponibles, et savoir comment les utiliser pour accomplir des tâches spécifiques de manière efficace.
Ces deux éléments - une solide stratégie de données et des data scientists innovants - sont selon nous essentiels pour mettre en place une stratégie d'investissement active basée sur la donnée. Dans cet article, nous nous appuyons sur l'expérience de l'équipe Quantitative Investment Strategies (QIS) de Goldman Sachs Asset Management pour explorer ces deux éléments et les solutions qu'ils cherchent à faire émerger.
Stratégie et science
Lorsqu'elle est déployée efficacement, l'IA peut permettre aux investisseurs d'extraire des informations significatives d'ensembles de données complexes et non structurées qui étaient auparavant incroyablement difficiles à traiter. Les données constituent la base de ce processus.
Nous pensons que les investisseurs ont besoin d'une stratégie globale pour acquérir et traiter les ensembles de données les plus susceptibles de générer des informations utiles. Cette stratégie devrait couvrir des domaines tels que la qualité, l'infrastructure, la gouvernance, les tests, le déploiement et la supervision des données. L'autre élément essentiel réside dans une équipe talentueuse de data scientists.
Les data scientists qui ont l'habitude de travailler à la croisée des données et de l'IA sont mieux préparés pour sélectionner des modèles appropriés et pour identifier et atténuer les biais qui peuvent être inhérents à certains ensembles de données disponibles. Si ces biais ne sont pas détectés, ils peuvent être exagérés lors de l'apprentissage d'un modèle d'IA. Lorsqu'ils doivent choisir entre différents outils d'IA, les data scientists doivent évaluer les compromis possibles entre complexité, transparence et interprétabilité. En comprenant les forces et les limites des techniques d'IA, les data scientists expérimentés peuvent contribuer à garantir que les ensembles de données et les modèles retenus pour un projet spécifique seront conformes aux objectifs poursuivis.
Il ne suffit pas de demander à un modèle génératif d'IA de prédire les rendements des actions ou de recommander l'achat ou la vente de titres. Les techniques d'IA doivent selon nous être considérées comme des outils permettant de tester et de retenir des hypothèses lors de l'analyse des investissements. La véritable valeur réside dans la capacité des humains à formuler des hypothèses de grande qualité et des idées innovantes qui peuvent être appliquées à un ensemble dynamique de données et potentiellement procurer un avantage concurrentiel sur le long terme.
Analyse de l’audio
Parmi les hypothèses productives susceptibles de tirer parti de l'utilisation efficace des modèles d'IA, nous pouvons citer la conviction de notre équipe QIS selon laquelle les sentiments exprimés par les dirigeants d'entreprise lors des conférences téléphoniques sur les résultats peuvent donner une indication sur leur potentiel de performance future. Ces personnes ont généralement une bonne connaissance des perspectives de leur entreprise. Ainsi, leur comportement et leurs remarques peuvent laisser deviner des changements dans leur façon de penser.
Depuis plus d'une décennie, l'équipe QIS a validé et mis en œuvre cette hypothèse en tant que stratégie d'investissement au moyen de différentes techniques. En s'appuyant sur des outils de traitement du langage naturel tels que BERT (Bidirectional Encoder Representations from Transformers)1 pour traiter les retranscriptions de conférences téléphoniques sur les bénéfices, l'équipe QIS peut évaluer le sentiment textuel émanant du discours des dirigeants. Depuis 2023, nous avons complété ce processus en élargissant notre champ d'action à leur manière de s’exprimer.
Les données utilisées pour cette analyse peuvent être tirées des enregistrements audios des conférences téléphoniques sur les bénéfices. L'analyse audio nous permet de saisir les nuances émotionnelles dans la transmission d'un message, ainsi que les changements de ton et d'accentuation, qui seraient difficile à discerner à partir d'une simple retranscription. Nous constatons que les séquences « questions-réponses » des conférences téléphoniques sur les résultats contiennent un niveau élevé d’informations complémentaires en raison de la spontanéité des échanges et de leur nature non scénarisée. Les techniques de deep learning2 peuvent être appliquées aux enregistrements bruts d’annonces de résultats par les dirigeants d'entreprise afin d'extraire un large éventail d’attributs permettant d'analyser leurs déclarations en fonction d'indicateurs tels que l'ambiguïté, l'émotion tonale ou le caractère évasif. Même si les analystes humains peuvent réaliser une tâche similaire, l'utilisation de l'IA permet aux investisseurs de traiter efficacement l’enregistrement de milliers de conférences téléphoniques et de contrôler les possibles biais humains. Notre équipe QIS a par exemple accès à plus de 400 000 heures de données audios provenant de conférences téléphoniques sur les résultats.
Les enregistrements audios posent des problèmes dont l'analyse textuelle est dépourvue. Par exemple, ils contiennent souvent des silences, des bruits de fond ou de la musique. Certains intervenants se révèlent plus expressifs que d'autres. Ils peuvent avoir des accents différents ou s’exprimer dans une langue qui n'est pas leur langue maternelle. En raison de cette complexité, notre équipe QIS s'appuie sur des données brutes que nous nettoyons nous-mêmes afin de préserver des nuances potentiellement importantes. Nous analysons la prestation d'un intervenant par rapport à son propre profil vocal afin de fournir une base de comparaison cohérente. Les résultats des modèles de deep learning peuvent ensuite être utilisés pour aider à construire un signal d’alpha plus robuste.
Effets « avance/retard »
Parmi les autres exemples d'hypothèse productive, on peut citer les relations « avance/retard » entre actions qui peuvent apparaître indirectement par l'exposition à des thèmes communs. Si nous sommes capables d’identifier rapidement ces thèmes de marché à grande échelle, ainsi que l'exposition d'un titre donné à ces thèmes, nous pouvons être en mesure de tirer parti de tendances émergentes.
Les techniques de traitement du langage naturel, telles que les modèles dits « d’embeddings », nous permettent de détecter systématiquement ces thèmes dans divers ensembles de données textuelles, notamment les dépôts de brevets, les communiqués de presse des entreprises, les bulletins d’informations et les rapports d'analystes sell-side.3 Une fois ces thèmes identifiés, nous pouvons suivre les performances des entreprises afin d'évaluer et tirer parti de la dynamique de ces diverses tendances thématiques. L'équipe QIS exploite actuellement 290 000 rapports d'analystes, 2 millions d'articles de presse et 50 millions de brevets publiés chaque année dans le monde entier.
Prenons l'exemple des bulletins d'informations. Notre équipe QIS considère que les entreprises fréquemment mentionnées dans les mêmes articles de presse ont de fortes chances d'être liées d’un point de vue économique, et que la sous-réaction des investisseurs à ces relations peut créer des effets de décalage dans les rendements boursiers. Sur la base de cette hypothèse, les techniques d'IA peuvent être utilisées pour analyser le grand volume d’actualités que nous suivons quotidiennement. Cela nous permet de construire un réseau de liens entre des milliers d'actions et d'observer les effets d'entraînement résultant d’événements de marché qui, selon nous, peuvent avoir un impact sur les rendements des actions.
Alors que les méthodes d'analyse traditionnelles pourraient être dépassées par le flux incessant de nouvelles informations, une approche quantitative, basée sur les données et propulsée par des modèles d'intelligence artificielle, nous permet de comprendre comment un événement mondial peut déclencher des effets de premier et de second ordre. Une interruption de l'approvisionnement en gaz naturel pourrait par exemple faire grimper le prix des engrais, ce qui contribuerait à terme à une augmentation des prix des denrées alimentaires à l'échelle mondiale. Dans un cas comme celui-ci, nos modèles ont permis d'identifier les entreprises de ce réseau de liens qui seraient impactées.
Une vue complète
L'évolution rapide des techniques d'IA fournit aux investisseurs de nouveaux outils puissants pour évaluer les entreprises et gérer les risques. Outre les données traditionnelles telles que les états financiers, les investisseurs peuvent désormais s'appuyer sur des ensembles de données vastes, complexes et moins structurés qui peuvent fournir des éclairages sur d'autres facteurs influençant la valeur future d'une entreprise. Ce processus débute et se termine par la présence d'un être humain au poste de pilotage. Elle commence par une stratégie d'acquisition, de nettoyage et de traitement des données, et s'appuie sur les data scientists pour fournir des hypothèses innovantes qui maximisent l'efficacité des techniques d'IA, ainsi que pour surveiller en permanence, innover, et enfin interpréter et tirer des enseignements. En exploitant la puissance de l'IA, les investisseurs peuvent parvenir à une compréhension plus large des entreprises et améliorer leurs processus de prise de décision et de gestion des risques.
1 BERT est un modèle linguistique de deep learning qui peut être ajusté pour déterminer la probabilité qu'une entrée soit un énoncé positif, neutre ou négatif.
2 IBM. Le deep learning est un type d'apprentissage automatique qui utilise des réseaux de neurones artificiels multicouches pour simuler le processus de prise de décision du cerveau humain. Au 26 novembre 2024.
3 Les modèles d'embeddings sont utilisés pour convertir les données dans un format numérique en vue de leur traitement par des machines. Par exemple, ils peuvent sélectionner des mots et des phrases et les représenter sous forme de vecteurs, qui sont des listes de nombres. Ces vecteurs capturent la signification et les relations entre différents points de données. Les mots ayant des significations similaires auront des représentations vectorielles similaires.
