21-03-2023 · Einblick

Quant-Grafik: Wie durch NLP Änderungen an den GICS vorhergesehen werden können

Die jüngsten Änderungen an den Global Industry Classification Standards (GICS) machen deutlich, dass diese wenig flexibel und träge sind. In diesem Artikel wird dargelegt, dass Techniken der Verarbeitung natürlicher Sprache (Natural Language Processing – NLP) im heutigen, sich schnell verändernden Marktumfeld zusätzliche Erkenntnisse liefern können.

    Autoren/Autorinnen

  • Matthias Hanauer - Researcher

    Matthias Hanauer

    Researcher

  • Rob Huisman - Researcher

    Rob Huisman

    Researcher

Die GICS sind das klassische Rahmenkonzept für die Einteilung vergleichbarer Unternehmen in Sektoren, Branchengruppen, Branchen und Branchensegmente. Die GICS-Methodik ist allerdings wenig flexibel. Revisionen gibt es selten und ihre Umsetzung dauert Jahre, weil dafür umfangreiche Beratungen mit Marktteilnehmern erforderlich sind. Deshalb stehen Vorschläge für alternative Klassifizierungsmethoden im Raum, die auf Daten von Kunden und Lieferanten, textlichen Ähnlichkeiten in den 10-K-Geschäftsbeschreibungen von Unternehmen, vergleichbaren Technologien ausgehend von Patentdaten oder auf von Analysten veröffentlichten Studien beruhen.

Eine der wichtigsten Änderungen im Rahmen der jüngsten Überarbeitung der GICS ist die Einrichtung des neuen Branchensegments „Transaktions- und Zahlungsverarbeitungsdienste“ innerhalb des Finanzsektors. Zu diesem neuen Branchensegment gehören Unternehmen wie Visa, Mastercard und PayPal, die bisher im Branchensegment „Datenverarbeitung und ausgelagerte Dienstleistungen“ in der Branchengruppe „Software und Dienstleistungen“ innerhalb des Informationstechnologiesektors enthalten waren.

Diese Änderung trägt der zunehmenden Bedeutung dieser Unternehmen bei der Verbesserung des Zahlungsverkehrs über verschiedene Plattformen und Märkte hinweg wie auch dem Umstand Rechnung, dass diese Tätigkeiten in engem Zusammenhang mit den der Branchengruppe Finanzdienstleistungen zugeordneten Geschäftstätigkeiten stehen. Diese Änderung ist allerdings erst am 17. März 2023 in Kraft getreten, zwei Jahre nach Beginn der Beratungen zu diesem Thema. 1

Sogenanntes „textbasiertes Aktien-Clustering“ (Text-Based Stock Clustering – TBSC) ist eine interessante Alternative zu den GICS. Dieses Verfahren nutzt NLP-Techniken, um Textdaten aus verschiedenen Quellen wie z. B. die in den USA für börsennotierte Unternehmen vorgeschriebenen 10-K-Geschäftsberichte zu analysieren. TBSC bietet gegenüber den GICS mehrere Vorteile:

  • TBSC ist anpassungsfähiger und flexibler, weil die Klassifizierung auf der Grundlage neuer Informationen häufiger aktualisiert werden kann.

  • TBSC kann detaillierter und genauer sein, weil es Ähnlichkeiten und Unterschiede zwischen Unternehmen innerhalb eines Sektors oder sektorübergreifend ausgehend von den Produkten oder Dienstleistungen dieser Unternehmen erfassen kann.

  • TBSC kann informativer und aufschlussreicher sein, weil die Klassifizierung durch Textbelege erklärt wird.

Next-Generation Quant

Mit dem technologischen Fortschritt nehmen auch die Möglichkeiten für quantitative Investoren zu. Indem wir mehr Daten einbeziehen und fortgeschrittene Modellierungstechniken nutzen, können wir tiefere Einblicke gewinnen und bessere Entscheidungen treffen.

Diese Vorteile werden durch Grafik 1 veranschaulicht, die eine 2-D-Projektion unternehmensspezifischer Vektoreinbettungen enthält, die mit dem sogenannten „Modell der bidirektionalen Encoder-Darstellung von Transformatoren“ (BERT) aus 10-K-Unterlagen abgeleitet wurden. Wir verwenden 10-K-Unterlagen für das Geschäftsjahr 2021 als Input für das Modell, um zu prüfen, ob die NLP-Technik die aktuellen Revisionen der GICS bereits hätte vorhersehen können.

Die Ergebnisse zeigen, dass Transaktions- und Zahlungsverarbeitungsunternehmen wie Visa, Mastercard und PayPal (hellblau) tatsächlich näher an ihrer neuen Branchengruppe Finanzdienstleistungen (grün) liegen als an ihrer vorherigen Branchengruppe Software und Dienstleistungen (braun). Diese Erkenntnis deutet darauf hin, dass TBSC Änderungen an den GICS vor deren offizieller Umsetzung vorhersehen kann. Wir stellen aber auch fest, dass die Branchengruppe Finanzdienstleistungen im Vergleich zu anderen Branchengruppen wie Banken, Versicherungen oder Halbleiter und Halbleiterausrüstung recht heterogen ist.

Abbildung 1 | 2-D-Projektion von Worteinbettungen auf der Basis von 10-K-Unterlagen für das Geschäftsjahr 2021

Abbildung 1 | 2-D-Projektion von Worteinbettungen auf der Basis von 10-K-Unterlagen für das Geschäftsjahr 2021

Quelle: SEC, Refinitiv, Robeco. Die Grafik enthält eine 2-D-Projektion von auf der Basis von 10-K-Unterlagen von Unternehmen für das Geschäftsjahr 2021 aus dem BERT-Modell abgeleiteten numerischen Einbettungen. Die Analyse beschränkt sich auf die im MSCI USA-Index enthaltenen Unternehmen, ergänzt um große und liquide Unternehmen aus dem FTSE World Developed-Index und dem S&P Broad Market-Index. Die einzelnen GICS-Branchengruppen innerhalb des Informationstechnologiesektors (Software & Dienstleistungen, Technologie-Hardware und -Ausrüstung sowie Halbleiter und Halbleiterausrüstung) und des Finanzsektors (Banken, Finanzdienstleistungen und Versicherungen) sind farblich unterschiedlich gekennzeichnet. Außerdem sind die Aktien hervorgehoben, die zum neu geschaffenen Branchensegment Transaktions- und Zahlungsverarbeitungsdienste innerhalb der Branchengruppe Finanzdienstleistungen gehören. Zuvor waren diese Aktien in der Branchengruppe Software und Dienstleistungen enthalten.

Fazit: TBSC könnte eine bessere und zeitgemäßere Alternative zu standardmäßigen Sektor- und Branchenklassifizierungssystemen wie z. B. den GICS sein. Durch den Einsatz von NLP-Techniken zur Analyse von Textdaten aus verschiedenen Quellen kann TBSC eine anpassungsfähigere, detailliertere, genauere, informativere und aufschlussreichere Klassifizierung für die Analyse von Aktien liefern.

Fußnote

1 Die Beratungen über mögliche Änderungen begannen bspw. bereits im Jahr 2021. Angekündigt wurden die Änderungen im März 2022, in Kraft getreten sind sie aber erst im März 2023.