21-03-2023 · Vision

Quant Chart : comment le TLN peut anticiper les modifications apportées à la GICS

Les récents changements apportés à la classification GICS (global industry classification standard) mettent en lumière son côté lourd et rigide. Les techniques de traitement du langage naturel (TLN) peuvent quant à elles fournir de nouvelles informations dans un environnement de marché qui évolue rapidement.

    Auteurs

  • Matthias Hanauer - Researcher

    Matthias Hanauer

    Researcher

  • Rob Huisman - Researcher

    Rob Huisman

    Researcher

La norme GICS est la méthode standard de classification des entreprises de même nature dans des secteurs, des groupes d’industries, des industries et des sous-industries. Mais il s’agit d’un système rigide. Ses mises à jour sont rares et très lentes à mettre en application, car elles passent par de longues consultations avec les acteurs du marché. Résultat, d’autres méthodes de classification sont proposées. Celles-ci se basent sur les similitudes dans les données client-fournisseur, les présentations d’entreprise dans les rapports annuels des sociétés, les technologies citées dans les textes de brevets ou la couverture par les analystes.

L’un des principaux changements apportés lors de la récente révision de la GICS a été la création d’une nouvelle sous-industrie intitulée Services de traitement des transactions et des paiements, au sein du secteur Produits financiers. Cette nouvelle catégorie inclura les sociétés telles que Visa, Mastercard et PayPal, auparavant affectées à la sous-industrie Traitement des données et services externalisés, dans le secteur Technologies de l’information.

Cette évolution reflète le rôle grandissant joué par ces entreprises dans les paiements effectués sur diverses plateformes et marchés, et le fait que ces activités sont étroitement liées à celles couvertes par le groupe industriel Services financiers. Mais ce changement n’est entré en vigueur que le 17 mars 2023, soit deux ans après le début des consultations sur le sujet1.

La méthode de classification TBSC (text-based stock clustering) est une alternative intéressante à la GICS. Elle utilise les techniques de TLN pour analyser les données textuelles issues de diverses sources, notamment les rapports annuels des entreprises. La TBSC présente plusieurs avantages par rapport à la GICS :

  • Plus souple et plus flexible : elle peut actualiser les classifications plus fréquemment, en fonction de nouvelles informations.

  • Plus détaillée et plus précise : elle peut capter les similitudes et les différences entre les entreprises d’un même secteur ou de secteurs différents, sur la base de leurs produits et services spécifiques.

  • Plus instructive et plus utile : elle peut expliquer les classifications en se basant sur des preuves textuelles.

Next-Generation Quant

À mesure que la technologie progresse, les opportunités pour les investisseurs quantitatifs se multiplient. L’exploitation de volumes plus importants de données et de techniques de modélisation avancées nous permet d’approfondir nos analyses et d’améliorer la prise de décision.

Pour illustrer ces avantages, la figure 1 présente une projection en 2D de représentations vectorielles spécifiques aux entreprises, issues de rapports annuels en utilisant un modèle de TLN baptisé BERT (bidirectional encoder representations from transformers). Nous utilisons comme intrant les rapports annuels relatifs à l’exercice 2021, afin de tester si la technique de TLN peut déjà anticiper les révisions actuelles de la GICS.

Les résultats montrent que les prestataires de services de traitement des transactions et des paiements (tels que Visa, Mastercard et PayPal, en bleu clair) sont en effet plus proches de leur nouveau groupe d’industries Services financiers (vert) que de leur précédent groupe Logiciels et services (marron). Ce résultat suggère que la TBSC peut anticiper les évolutions de la GICS avant leur entrée en vigueur officielle. Cependant, nous observons également que le groupe industriel Services financiers est relativement hétérogène par rapport à d’autres groupes tels que les Banques, les Assurances, ou les Semi-conducteurs et équipements de semi-conducteurs.

Figure 1 | Projection en 2D des mots utilisés dans les rapports annuels de l’exercice 2021.

Figure 1  |  Projection en 2D des mots utilisés dans les rapports annuels de l’exercice 2021.

Source : SEC, Refinitiv, Robeco. Le graphique présente une projection en 2D de représentations numériques tirés du BERT, sur la base des déclarations annuelles pour l’exercice 2021. L’analyse se limite aux firmes de l’indice MSCI USA, auxquelles s’ajoutent d’importantes valeurs liquides des indices FTSE World Developed et S&P Broad Market. Les différentes couleurs représentent différents groupes d’industries GICS au sein du secteur Technologies de l’information (Logiciels et services, Matériel et équipement technologique, Semi-conducteurs et équipements de semi-conducteurs) et du secteur Produits financiers (Banques, Services financiers, Assurances). Les firmes de la nouvelle sous-industrie Services de traitement des transactions et des paiements au sein du groupe Services financiers apparaissent également. Auparavant, ces sociétés étaient affectées au groupe d’industries Logiciels et services.

Conclusion, la méthode TBSC pourrait être une solution plus opportune et plus efficace que les classements standards tels que la GICS. Grâce aux techniques de TLN qui permettent d’analyser les données textuelles issues de sources diverses, la TBSC peut générer des classifications plus adaptées, détaillées, précises, informatives et instructives en matière d’analyse des valeurs.

Note de bas de page

1 La consultation sur les potentiels changements a commencé en 2021. Ceux-ci ont été annoncés en mars 2022 mais ne sont entrés en vigueur qu’en mars 2023.