In den letzten Jahren wurden in der Finanzbranche die Thematiken Nachhaltigkeit und soziale Verträglichkeit zunehmend wichtiger. Der Begriff ESG (Environmental, Social, & Governance) fasst hierzu die Themen Umwelt, soziales Verhalten und gute Unternehmensführung zusammen. Ratingagenturen geben mittlerweile „ESG-Ratings“ aus, die das Verhalten von Unternehmen in diesen Kategorien bemessen sollen. Einige Finanzinstitute bieten hierzu spezielle ESG-Fonds an, die ausschließlich Firmen mit einem guten ESG Rating beinhalten. Produkte dieser Art erfreuen sich bei Anlegenden steigender Beliebtheit: 2021 flossen weltweit 649 Mrd. $ in ESG-fokussierte Fonds. (2020 waren es noch 542 Mrd. $) ESG-Fonds machen nun bereits 10% des weltweiten Fond-Vermögens aus. [1]
Eine Herausforderung für Finanzinstitute ist hierbei jedoch, wie die Bewertung von Unternehmen nach ESG-Kriterien vollzogen werden sollen. In diesem Blogpost stellen wir hierzu textbasierte KI-Methoden vor, auch bekannt als NLP (Natural Language Processing), um ESG-Analysen zu vereinfachen und zu ergänzen. Die Grundlage hierzu sind vor allem sogenannte Transformer-basierte Sprachmodelle wie „BERT“, denen über komplexe Neuronale Netze ein Grundverständnis für Sprache antrainiert wird. (Lesen Sie hierzu mehr unter folgendem Blog-Artikel)
KI zur Klassifizierung von ESG-Ratings
Eine große Schwierigkeit bei der textbasierten Bewertung des ESG-Ratings stellt die Tatsache dar, dass Unternehmen ihr potentiell negatives ESG-Verhalten nicht im Klartext kenntlich machen. In einer wissenschaftlichen Studie [2] konnte sogar gezeigt werden, dass Firmen mit einem schlechten ESG-Verhalten häufig dazu neigen, durch das verwendete Vokabular in ihren Berichten ein besonders ethisches Verhalten zu signalisieren. Diese Diskrepanz zwischen dem positiven Signal des verwendeten Wortschatzes und dem tatsächlich negativen ESG-Verhalten, das nur im Kontext deutlich wird, muss durch die verwendeten Sprachmodelle aufgelöst werden. Um diese Schwierigkeit zu überwinden, müssen die Modelle an die domänenspezifische Sprachführung von Firmenberichten angepasst werden [3,4].
Im Unterschied zu den meisten anderen NLP-Ansätzen zur Thematik ESG, wurde daher ein Sprachmodell basierend auf echten ESG-Ratings (der Ratingagentur S&P Global) trainiert welches damit das ESG-Verhalten anhand von standardisierten Unternehmensberichten klassifiziert. Bei der Klassifizierung dieser Texte lag die Genauigkeit dieses Transformer-basierten ESG-Modells bis zu 19 Prozentpunkte über traditionellen NLP-Methoden.
Abb.1: Beispiel Vorhersage unseres ESG-Modells und des State-of-the-Art Finanz-Modells (FinBERT)
Abbildung 1 zeigt ein entsprechendes Beispiel aus unserer ESG-Demo und Tabelle 1 vergleicht die Vorhersagen unseres ESG-Modells mit den Vorhersagen von FinBERT [4], dem State-of-the-Art Sprachmodell für Finanztexte, welches jedoch nicht speziell für die Thematik ESG trainiert wurde. Die Scores der Modelle liegen dabei jeweils zwischen 0 und 100. Bei unserem ESG-Modell bedeuten höhere Scores dabei, dass das Modell es für wahrscheinlich hält, dass der vorliegende Text von einer Firma mit hohem ESG-Rating stammt, während FinBERT die finanzspezifische Tonalität (positiv, neutral, negativ) der Texte misst. Unser ESG-Modell reagiert dabei in der Regel tatsächlich auf ESG-relevante Themen wie Abfallwirtschaft, erneuerbare Energie oder Vorteilspakete für Mitarbeiter, während FinBERT überwiegend auf rein wirtschaftlichen Kennzahlen wie den Aktienkurs reagiert.
Tabelle 1: Bewertung von Beispielsätzen von unserem ESG-Modell im Vergleich zu FinBERT, dem State-of-the-Art Sprachmodell für Finanztexte. Werte liegen zwischen 0 und 100. Bei unserem ESG-Modell bedeuten hohe Werte eine hohe Wahrscheinlichkeit eines guten ESG-Ratings. FinBERT misst die finanzspezifische Tonalität des Textes.
ESG-Themen erkennen
Neben einer Bewertung des ESG-Ratings erlauben es NLP-Tools auch zu identifizieren, welche ESG-relevanten Themen die Firmen jeweils in ihren Berichten diskutieren. Beispielweise lassen sich die Absätze aus ESG-Reports von Unternehmen in die drei ESG-Bereiche (Umwelt, Soziales und Unternehmensführung) sowie in jeweils vier Unterbereiche einteilen. Hierzu verwenden wir die NLP-Methode Zero-Shot Klassifikation (Lernen Sie mehr darüber in unserem Blog-Artikel zu Zero-Shot Klassifikation), die es erlaubt ohne gelabelte Daten und entsprechendes Training Texte zu klassifizieren. Abbildung 2 zeigt ein Beispiel anhand von ESG-Reports der U.S. Banken JP Morgan Chase [5] und Morgan Stanley [6].
Abb. 2: Klassifizierung von ESG-Themen basierend auf ESG-Reports
ESG „Frühwarnsystem“
Mithilfe der entwickelten ESG-spezifischen Sprachmodelle lassen sich außerdem Veränderungen über die Zeit untersuchen. Abbildung 3 zeigt das ESG-Sentiment für das Unternehmen Wells Fargo, welches anhand von Finanznews über vier Jahre ermittelt wurde. Das ESG-Sentiment misst hierbei, ob die Berichterstattung zu ESG-relevanten Themen einen positiven oder negativen Ton hat. Dadurch lassen sich mögliche negative Ausschläge frühzeitig erkennen und Domainexperten können gegebenenfalls überprüfen, ob Handlungsbedarf bzgl. des ESG-Ratings besteht. Im Falle von Wells Fargo wurde beispielsweise ein Skandal bezüglich fiktiver Kundenkonten, welcher im Sommer 2016 publik wurde, korrekterweise identifiziert.
Abb. 3: ESG-Sentiment in Finanznews zu Wells Fargo
Automatisierte Extraktion von Antworten
Schließlich beinhaltet unser NLP-Werkzeugkasten auch noch eine skalierbare semantische Suche, mit deren Hilfe sich Informationen aus Firmenberichten extrahieren lassen. Da die semantische Suche ebenfalls auf State-of-the-Art Transformer-Modellen basiert, lassen sich Inhalte aus Berichten extrahieren, auch wenn die Berichte die gesuchten Begriffe nicht eins zu eins enthalten (Lernen Sie mehr über die Technologie unserer semantischen Suche in diesem Blog-Artikel). Über die Funktion Question-Answering kann man sich außerdem für Fragen automatisiert Antworten ausgeben lassen. Abbildung 4 zeigt ein Beispiel, erneut aus dem ESG-Report von JP Morgan Chase, für automatisiertes Question-Answering. Das Tool gibt direkt die Antwort für die entsprechende Frage aus, zeigt aber auch die Textstelle an, aus welcher die Antwort extrahiert wurde. Dies erlaubt es Domainexperten die vorgeschlagene Antwort direkt anhand der Textstelle zu überprüfen.
Abb. 4: Automatisierte Antwortsuche
Fazit
Dieser Blogpost stellt eine Reihe an textbasierten KI-Methoden vor, die an den Anwendungsfall ESG angepasst sind und dadurch Analysen rund um die Thematik nachhaltiges Investieren vereinfachen und ergänzen können. Dabei geht es nicht zwingend darum, die Analyse von ESG-Verhalten komplett durch eine KI durchführen zu lassen, sondern mithilfe neuester KI-Methoden aus einer Masse von Textdaten relevantes Wissen automatisiert zu extrahieren und somit die Arbeit von Domainexperten zu komplementieren.
Das vorliegende Modell wurde anhand von englischen Texten und den ESG-Ratings einer Ratingagentur trainiert. Ähnliche Sprachmodelle ließen sich aber auch für deutsche Texte und individuell bevorzugten ESG-Ratings anwenden.
Referenzen
[1] https://www.reuters.com/markets/us/how-2021-became-year-esg-investing-2021-12-23/
[2] Loughran, T., McDonald, B., & Yun, H. (2009). A wolf in sheep’s clothing: The use of ethics-related terms in 10-K reports. Journal of Business Ethics, 89(1), 39-49.
[3] Beltagy, I., Lo, K., & Cohan, A. (2019). SciBERT: A pretrained language model for scientific text. arXiv preprint arXiv:1903.10676.
[4] Araci, D. (2019). Finbert: Financial sentiment analysis with pre-trained language models. arXiv preprint arXiv:1908.10063.
[5] https://impact.jpmorganchase.com/content/dam/jpmc/jpmorgan-chase-and-co/documents/jpmc-cr-esg-report-2019.pdf
[6] https://www.morganstanley.com/pub/content/dam/msdotcom/sustainability/Morgan-Stanley_2019-Sustainability-Report_Final.pdf