getML – Neues Tool zur Beschleunigung von Data Science-Projekten

getML_Team
Im November ist die innovative Software zur Beschleunigung von Data Science-Projekten von getML an den Start gegangen. (v.l.n.r.: Dr. Patrick Urbanke, Ulrike Wolf, Dr. Johannes King, Alexander Uhlig und Dr. Philipp Müller, Quelle: getML)

Das Leipziger Tech-Startup getML hat im November eine innovative Software zur Automatisierung von Feature Engineering veröffentlicht. Feature Engineering ist ein zentraler Bestandteil von Machine Learning-Projekten und stellt für Data Scientists in Unternehmen ein große Herausforderung dar. Die Software von getML soll diesen in Zukunft die Arbeit erleichtern.

Feature Engineering – was ist das eigentlich?

Feature Engineering ist ein zentraler Bestandteil von Machine Learning-Projekten und stellt für Data Scientists in Unternehmen eine große Herausforderung dar. Dr. Patrick Urbanke und Alexander Uhlig, die Gründer von getML, haben aus diesem Grund eine Software entwickelt, die die Arbeit von Data Scientists erleichtert. Damit Maschinen die Daten, mit denen sie gefüttert werden nutzen können, müssen diese erst in Merkmale zerkleinert werden. Das Extrahieren von Merkmalen aus einem Rohdatenbestand nennt man Feature Engineering.

Das innovative Konzept von getML beinhaltet einen Algorithmus, der Feature Engineering für relationale Daten und Zeitreihen automatisiert. Feature Engineering gilt als der aufwendigste und zugleich fehleranfälligste Schritt bei der Automatisierung von maschinellem Lernen (AutoML). Dabei kann die Erzeugung von aussagekräftigen Features über Erfolg oder Misserfolg eines Projektes entscheiden. Genau deshalb sind Innovationen in diesem Bereich auch so wichtig. Die Software-Lösung des Leipziger Tech-Startups trägt damit maßgeblich zur aktuellen Entwicklung in Sachen performanter AutoML-Lösungen bei.

Vorteil durch Fokus – Was getML anders macht.

Übliche Software im Bereich AutoML beruht auf sogenannten „Brute-Force-Methoden“. Bei diesem Vorgehen werden solange verschiedene Möglichkeiten durchgegangen, bis eine Lösung gefunden wurde. Dieser Prozess ist zeit- und energieaufwändig.

“Stattdessen haben wir einen Algorithmus entwickelt, der inkrementelle Updates benutzt, um die Korrelation eines Features mit der Zielvariable zu maximieren. Um eine Vielzahl von Features zu trainieren setzen wir auf bewährte Methoden aus dem Bereich Ensemble Learning.”, sagt Dr. Patrick Urbanke, CTO von getML.

Mit getML können Data Science-Projekte in wenigen Tagen anstelle von mehreren Monaten abgeschlossen werden. Dabei lag die Güte der getroffenen Vorhersagen in bisherigen Projekten deutlich oberhalb derer, die mit manuell erstellten Features erreicht wurde. In einem Projekt mit einem führenden deutschen Automobilhersteller übertraf getML das hauseigene Vorhersagemodell innerhalb einer Trainingszeit von nur 15 Minuten. Dabei verbesserten sie die Genauigkeit von Kundenabwanderungs-Prognosen um 4%. In einer E-Commerce Studie konnte getML die Prognose von Warenretoursendungen um 17% verbessern und so eine potentielle Profitsteigerung von 2.5 Millionen Euro erreichen.

Tech-Innovation aus Mitteldeutschland beim Web Summit in Lissabon

getML_websummit2019_tag2_part1_29_1
Auf dem Web Summit in Lissabon haben CEO Alexander Uhlig (l.) und Data Scientist Johannes King (r.) ihre Software der Staatsministerin für Digitales, Dorothee Bär präsentiert. (Quelle: de:Hub, Foto: Johannes Schmidt)

Im Rahmen des Launches hat das Startup seine Software auf dem diesjährigen Web Summit in Lissabon präsentiert. Der Web Summit zählt zu den größten Tech-Konferenzen der Welt und bringt jedes Jahr die einflussreichsten Menschen aus der Branche zusammen. Dort nutze das Team die Möglichkeit sich mit wichtigen NetzwerkpartnerInnen auszutauschen.

“Der Web Summit war eine einzigartige Möglichkeit, uns mit der internationalen Tech-Szene zu vernetzen. Die positiven Rückmeldungen der anwesenden CTOs und Entwickler auf den Ansatz von getML, haben uns darin bestärkt, dass wir ein zentrales Problem auf dem Weg zur vollständigen Automatisierung von Machine Learning lösen.”, erzählt Dr. Johannes King, Data Scientist bei getML.

Organische Skalierung dank starker Partner

Gegründet haben Alexander Uhlig und Dr. Patrick Urbanke getML 2017, damals noch unter dem Namen The SQLNet Company. Die Gründer haben sich bei ihrem ehemaligen Arbeitgeber in München kennen gelernt. Die Idee kam Dr. Urbanke schon zu Studienzeiten. Für Leipzig haben sich die Gründer ganz bewusst entschieden, da Uhlig Mitteldeutschland bereits während seines Studiums in Leipzig als äußerst gründerfreundlich wahrgenommen hatte. Zuletzt hat das Startup das Gründerprogramm des SpinLabs in Leipzig durchlaufen, welches ihnen bei der Skalierung die nötige Unterstützung lieferte. Noch eine Besonderheit: Bis hierher hat es das Startup ganz ohne Investoren geschafft. CEO Alexander Uhlig betont an dieser Stelle:

“Bisher haben wir es geschafft, den Unternehmensaufbau aus unserem Projektgeschäft zu finanzieren. Dieser Weg des organischen Wachstums ist sicherlich der schwierigere, birgt jedoch den großen Vorteil, dass wir in den Projekten unsere Zielgruppe besser kennenlernen konnten. Um unser Wachstum weiter zu beschleunigen, halten wir uns aber die Option eines strategischen Investments nach wie vor offen.”

Projekte mit etablierten Unternehmen wie Volkswagen, Carl Zeiss sowie Finanzdienstleistern und Versicherungen ermöglichten genau das. Mittlerweile ist getML auf ein Team von sieben MitarbeiterInnen gewachsen. Das Lizenzmodell von getML umfasst eine freie Basis-Version, mit der sich jeder mit der Software vertraut machen kann. Danach können größere Datensätze mit einem 30-Tage Enterprise Trial getestet werden.

Hinterlasse jetzt einen Kommentar

Kommentar hinterlassen

E-Mail Adresse wird nicht veröffentlicht.


*