GASTBEITRAG: Was Sie über Computerlinguistik in den Finanzdienstleistungen wissen müssen
Haben Sie schon einmal von Natural Language Processing (NLP) oder Computerlinguistik gehört? Falls das nicht der Fall ist und Sie auch weiterhin Ihren Front Office-Job im Investmentbanking behalten wollen, dann sollten Sie sich rasch damit befassen.
1. NLP ist ein neuer Trend im Banking
Banken wissen natürlich, dass ihre Trader viel über die Märkte lesen. Um Fehlverhalten der Marktteilnehmer auszuschließen, müssen die Compliance-Teams die interne Kommunikation mitlesen. Auch die Vertriebsteams kommunizieren ständig über irgendwelche Chats mit ihren Kunden.
Wer in einer Bank erfolgreich sein will, muss also reichlich lesen. Das Problem dabei: Niemand hat genügend Zeit, um alles durchzugehen. Es bedarf viel Zeit, aus dem gewaltigen Medienrauschen die wichtigen Informationen herauszulesen, weshalb vieles übersehen wird. Wäre es nicht schön, wenn dieses Lesen automatisiert werden könnte? Und nicht nur das Lesen. Falls die Auswertung von den Analysten-Calls automatisiert werden könnte, ebenso wie das Verfassen von Artikeln nach gängigen Marktereignissen, wäre das nicht ebenfalls großartig?
NLP soll all das und mehr erledigen. Langsam wird auch den Banken das Potenzial bewusst. So erzählt beispielsweise Charles Elkan, die Bank nutze NLP, um alle ihre Verträge durchzulesen. Sowohl Goldman Sachs als auch JP Morgan suchen nach NLP-Spezialisten für ihre internen Suchmaschinen.
2. NLP besitzt eine eigene Sprache
Um NLP zu verstehen, muss man die Unterschiede zwischen Morphologie, Syntax, Semantik und Pragmatik verstehen. Morphologie untersucht, wie die Wörter selbst strukturiert sind. So gehen die Wörter „isst“, „aß“ und „essen“ auf den gleichen Verbstamm zurück. Die Syntax beschäftigt sich mit dem Zusammenspiel der Wörter in einem Satz auf grammatikalisch korrekte Weise. Die Sätze „Alex isst Burger“ und „Die Burger essen Alex“ bestehen zwar aus fast den gleichen Wörtern, aber ihre Anordnung verändern den Sinn.
Semantik behandelt, wie man Informationen strukturieren muss, so dass man Fragen zum Text stellen kann: Wer, wie und was? Dies ist beispielsweise eine Anzahl von Wörtern zu einer bestimmten Aktie, die eine Analyse des Textes erlaubt.
Bei der Pragmatik geht es wiederum um das umfassende Verständnis des Textes, wobei oft auf Quellen außerhalb des Textes zurückgegriffen wird.
3. Open Source-Bibliotheken in Python für NLP helfen beim Einstieg
So manchen IT-Experten scheint so etwas nur vom Hören Kopfschmerzen zu bereiten. Doch das muss nicht sein. Beispielsweise können Sie Textdatenbanken wie „newsire“ kaufen, in denen die Strukturierung und Säuberung der Texte bereits vorgenommen wurde. In Python gibt es sogar eine menge Open Source-Pakete, die solche Dinge für Sie erledigen. Am bekanntesten ist das „Natural Language Toolkit“ (NLTK), aber es gibt auch andere wie „spaCy“.
Diese Open Source-Lösungen erledigen viele NLP-Lösungen für Sie: von der Wortsegmentierung, über die Zuordnung der Wörter zu Satzteilen, bis hin zur Sentiment-Analyse. Weiter gibt es die Lösung „Beautiful Soup“, die den Text für Sie säubert. Viele Cloud-Anbieter offerieren ihre eigenen NLP-Lösungen, die ebenfalls bei der Strukturierung und Interpretation des Textes weiterhelfen.
Sich in NLP einzuarbeiten, kostet allerdings etwas Zeit. Doch es lohnt sich und wenn Sie jetzt damit beginnen, dann haben Sie die Nase vorn.
Saeed Amen ist ein systematischer Devisenhändler, der seit 2013 sein eigenes Handelsbuch in den zehn größten Devisen hat. Amen hat schon Handelssysteme für verschiedene Großbanken wie Lehman Brothers und Nomura entwickelt.