Ausgabe 09 | 2021

Aus komplexen Daten umsetzbare Erkenntnisse schaffen

Cloudera

Europa und insbesondere die Schweiz sind in der Forschung zu Künstlicher Intelligenz (KI) und Maschinellem Lernen (ML) sehr gut aufgestellt. Diese Meinung vertritt auch Philippe Cudré-Mauroux, Direktor des eXascale Infolabs und Professor für Informatik an der Universität Fribourg.

Philippe Cudré-Mauroux forscht an NextGen-Infrastrukturen für Big Data und KI: «Geht es aber um den Einsatz moder-ner KI- und ML-Modellen, sind Europa und die Schweiz weitgehend im Rückstand.
Die USA sind dabei der klare Gewinner und China ein starker Konkurrent. Diese Themen sind so komplex und strategisch wichtig, dass sie eine ‹The winner takes it all›-Situation geschaffen haben. 95 Prozent der Unternehmen werden versuchen müssen, mit Technikgiganten gleichzuziehen, um wettbewerbsfähig zu bleiben.»
Warum stockt der Prozess, ML-Funktionen aus der Forschung für die Produktion zu adaptieren und zu skalieren? Oder anders gefragt: Wo bauen sich Hürden im ML-Lebenszyklus auf? In der Regel gerät ein Unter-nehmen schnell in die Bredouille, soll es die Lücke zwischen dem Experimentieren mit ML und dem Einsetzen der Technologie in Produktionsumgebungen schliessen. Dennoch kann eine Firma ML, das eine Teildisziplin der KI bildet, zügig und erfolgreich realisieren.
Sogar eine nachhaltige Entwicklung ist möglich, bei der Algorithmen, die sich durch wiederholte Interaktionen verbessern, aus Daten mehr Umsatz erzeugen und Kosten senken. Denn die grössten Unternehmen der Welt machen uns vor, wo die Hindernisse für eine erfolgreiche ML-Implementierung liegen. Aus diesen Erkenntnissen heraus leiten sich reale Anforderungen ab, die sich in praktische Workflows, Produkte und Best Practices übersetzen lassen.
In komprimierter Form ergibt sich so eine To-do-Liste, mit der Unternehmen dem Ziel in zehn Schritten zumindest sehr nahekommen: Mit ML schnell in die Produktion gehen und KI-Anwendungsfälle im Unternehmen skalieren.

1. Einen ganzheitlichen ML-Ansatz verfolgen
ML kann zu einem Katalysator für die Veränderungen werden, wenn ein Unternehmen die Technologie als integralen Bestandteil seiner Datenstrategie etabliert. Die ML-Integration in die IT-Umgebung, Prozesse, Anwendungen und Arbeitsabläufe ebnet den Weg zum nachhaltigen Ansatz, der bessere Geschäftsergebnisse erzielt.

2. Bereit zum Experimentieren – auch zum Scheitern
ML automatisiert Geschäftsprozesse und löst Geschäftsprobleme. Dahinter steckt Wissenschaft, die Experimente und Beobachtung erfordert. Gefragt ist zudem die Bereitschaft, auch Misserfolge zu akzeptieren. Wer feststellt, dass sich mit ML ein bestimmtes Geschäftsproblem nicht lösen lässt, konzentriert sich auf andere Bereiche.

3. Ein multidisziplinäres Team aufbauen und einbinden
Perfekte Kollaboration fusst auf Freiheitsgraden. Datenwissenschaftler in der Firma benötigen zum einen eine Plattform und Tools, die ihnen praktischen Zugang zu Daten, Rechenressourcen und Bibliotheken bieten. Anderseits funktioniert Operational ML am besten, wenn es von einem Team entwickelt und gewartet wird, das ein breites Spektrum an Fähigkeiten aufweist – von Dateningenieuren und Datenwissenschaftlern bis hin zu Stakeholdern.

4. Schnell wiederholen, später optimieren
Ein ML-Modell zu entwickeln, das von Anfang an fehlerfrei ist, führt in die Irre. Teams haben Erfolg, wenn sie schnell experimentieren, früh und oft scheitern, kontinuierlich lernen und neue Dinge ausprobieren.

5. Mit der richtige Technologie den gesamten ML-Lebenszyklus optimieren
ML in der Produktion lässt sich in zwei Phasen unterteilen

  • die ganzheitliche ML-Entwicklung und den Aufbau von ML-Modellen.
  • Übergang in die Produktion, Skalierung und laufender Betrieb.

Mit der richtigen Plattform und den richtigen Tools können Data-Engineering- und Data-Science-Teams in beiden Phasen nahtlos arbeiten.

6. Die Unternehmensorganisation für eine ML-Akzeptanz entwickeln
Zwischen dem Experimentieren und der gross angelegten Produktion existiert oft eine Mauer, weil Unternehmen das Wissen und die Fähigkeiten fehlen, um ML-Entwicklung, -Produktion und -Wartung in ihre bestehenden Prozesse, Workflows, Architektur und Kultur zu integrieren. Aus diesem Grund erfordert die Einführung von ML Flexibilität in der Firmenstruktur.

7. Integrität der Modelle bewahren
Wer erfolgreich einige ML-Modelle im grossen Massstab einsetzt, darf sich freuen, aber nicht ausruhen.
Warum? Weil sich die zugrunde liegenden Daten im Laufe der Zeit verändern. Sobald ein effektives Modell implementiert ist, muss es stets feinabgestimmt und überwacht werden, was anstrengend ist.

8. Die Qualifikationslücke schliessen
Eine Firma sollte versuchen, ein Team mit Erfahrungen, Talenten und Fähigkeiten aus einem breiten Spektrum aufzubauen – von Data Engineering und Data Science bis hin zu DevOps und Produktentwicklung. Je viel-fältiger dieses Team ist, desto mehr lernen die Mitglieder voneinander.

9. Modelle in der Produktion sind lebendige Software
In gewissem Sinne sind Modelle sehr lebendig, da sie ständig gefüttert, aufrechterhalten und kontrolliert werden müssen. Ausserdem benötigen sie Schutz.
Aus diesem Grund ist es wichtig, die Modellabfolge zu kennen und zu überwachen, wer auf Modelle zugreifen und diese ändern kann.

10. Ethische Verpflichtungen erkennen und befolgen
Es gibt zahlreiche ethische Überlegungen zu ML. Wichtig ist, sicherzustellen, dass Unternehmen die Zustimmung von Kunden und anderen Stakeholdern haben, bevor sie die notwendigen Daten in einem ML-Modell anwenden. Auf lange Sicht zahlt sich aus, frühzeitig strenge ethische ML-Standards festzulegen und einzuhalten.

ML für sich arbeiten lassen

«Keine Veränderung ohne Bewegung, keine Bewegung ohne den ersten Schritt» – das ist eine der vielen überlieferten Weisheiten, die Lao-Tse zugeschrieben werden.
Der chinesische Philosoph und Begründer des Taoismus drückte es auch so aus: «Auch eine Reise von tausend Meilen beginnt mit dem ersten Schritt.» Ist dieser richtig wie die nächsten neun Schritte, die folgen müssen, ist der Weg eines Unternehmens zur erfolgreichen KI-Anwendung und deren Skalierung vorgezeichnet.
Schliesslich geht es darum, die ML in der Produktion arbeiten zu lassen – und zwar kontrolliert und im grossen Stil. Einen Überblick und zahlreiche Details zu den zehn nötigen Schritten, die zur KI-Einsatzfähigkeit führen, gibt das E-Book «Production Machine Learning For Dummies» in einer Special Edition von Cloudera.

INFOS | KONTAKT
Cloudera
Arnulfstrasse 122
D-80636 München
T +49 (0)221 6507 8699
www.cloudera.de

Termine

Oktober

EMO, Mailand

Weltleitmesse der Metallbearbeitung und internationaler Branchentreff
4. bis 9. Oktober
www.emo-milano.com

parts2clean, Stuttgart

Internationale Leitmesse für industrielle Teile- und Oberflächenreinigung
5. bis 7. Oktober
www.parts2clean.de

MOTEK, Stuttgart

Internationale Fachmesse für Montage- und Handhabungstechnik
5. bis 8. Oktober
www.motek-messe.de

Bondexpo, Stuttgart

Fachmesse für industrielle Klebetechnologie
5. bis 8. Oktober
www.bondexpo-messe.de

Fakuma, Friedrichshafen

Internationale Fachmesse für Kunststoffverarbeitung
12. bis 16. Oktober
www.fakuma-messe.de