R ist besser als Python – versuch mal, das einer Bank zu vermitteln…

eFC logo
R ist besser als Python – versuch mal, das einer Bank zu vermitteln…

Die meisten ernstzunehmenden Data Scientists mögen R lieber als Python, doch wer in einer Investmentbank im Bereich Data Science oder Machine Learning arbeitet, muss die Präferenz für R hinter sich lassen. Bei Banken ist überwiegend Python im Einsatz.

„Es gibt mehrere Gründe, warum Banken lieber auf Python setzen als auf R“, so der Head of Data Science bei einer führenden Bank in New York. „In Python gibt es mehr Machine Learning Packages wie Sklearn. Python ist für allgemeine Programmieraufgaben besser geeignet, ist einfacher produktionierbar und eignet sich ausserdem besser für Datenbereinigung (wie früher Perl) und für Textanalyse.“

Aus diesem Grund, so sagt er, würden Banken ihre Datenanalyse fast vollständig in Python machen. Es gibt ein paar Ausnahmen: Einige Strats arbeiten mit R, aber generell herrscht Python vor.

Nichtsdestotrotz hat R immer noch Fans. Jeffrey Ryan, ehemaliger Star-Quant bei Citadel, ist ein grosser Verfechter von R und veranstaltet eine jährliche Konferenz zum Thema R in der Finanzbranche (die dieses Jahr wegen der Corona-Pandemie abgesagt wurde). „R wurde Daten-zentriert entwickelt und von Researchern gebaut“, sagt Ryan. „Python hat die Data Frames und Zeitreihen von R übernommen, und zwar über Pandas [die Open-Source-Software-Library zur Datenmanipulation in Python, entwickelt von Wes McKinney, ehemaligem Softwareentwickler bei Two Sigma].“

R werde im Bereich der statistischen Arbeit und Forschung immer noch verwendet, sagt Ryan. Im Vergleich dazu sei Python das Tool der „populären Datenanalyse“, ist leicht anzuwenden und setzt keine Statistikkenntnisse voraus. „Python hat genau zum richtigen Zeitpunkt in der Geschichte eine völlig neue Riege an Programmierern hinzugewonnen“, meint Ryan. „Wenn Programmierer (von denen es mehr gibt als Statistiker) mit Daten arbeiten wollen, besticht Python damit, die Sprache zu sein, die ‚alles kann‘ – auch wenn technisch gesehen nichts von alledem inhärent ist.“

Angesichts der Bedeutung, die Daten in der Finanzwelt haben, könnte man annehmen, dass Banken auf die Sprache setzen, die leistungsfähiger ist, auch wenn deren Beherrschung mehr Aufwand erfordert. Graham Giller, Chief Executive Officer bei Giller Investments und ehemaliger Head of Data Science Research bei J.P.Morgan und der Deutschen Bank, ist allerdings der Meinung, dass sich Banken für Python – und nicht für R – entschieden haben, weil ihre IT-Abteilungen überwiegend von Informatikern geführt werden, und nicht von Leuten, die sich viel mit Daten beschäftigen.

„Ich persönlich mag R sehr gern“, sagt Giller. „R ist ein Tool für professionelle Statistiker, für Leute, die sich für Inferenzstatistik interessieren – aber weniger eines für Informatiker, die sich für Code interessieren.“ Je mehr Informatiker in den Banken an Einfluss gewonnen hätten, so Giller, desto mehr seien „Quants ersetzt worden durch IT-Fachleute, oder auch durch Quants, die im Grunde ihres Herzens IT-Fachleute sein wollen“, und diese haben Python mitgebracht.

Für reine Finanzmathematiker ist das etwas frustrierend. Pandas ist auf der Grundlage von R entstanden, hat aber ein Eigenleben entwickelt. „Pandas ist ursprünglich entwickelt worden, um eine R-ähnliche Umgebung für Python zu schaffen“, sagt Giller und merkt an, dass Pandas im Vergleich dazu „furchtbar langsam und ineffizient“ sein könne.

Den meisten Leuten ist das allerdings egal: Je mehr Python und Pandas verwendet werden, desto mehr Anwendungsfälle gibt es. „R hat zurzeit eine kleinere User-Basis als Python“, so Ryan. „Das wiederum bedeutet, dass immer mehr Tools rund um Python und Daten entwickelt werden und der Erfolg weiter ausgebaut wird.“

Have a confidential story, tip, or comment you’d like to share? Contact: sbutcher@efinancialcareers.com in the first instance. Whatsapp/Signal/Telegram also available.

Bear with us if you leave a comment at the bottom of this article: all our comments are moderated by human beings. Sometimes these humans might be asleep, or away from their desks, so it may take a while for your comment to appear. Eventually it will – unless it’s offensive or libelous (in which case it won’t.)

Ähnliche Artikel

Close
Loading...