Layout des geschilderten Projektbeispiels.

Ausgabe 01 | 2021

Was bisher schwer denkbar war ...

Stettbacher Signal Processing AG

Die Rechenleistung von Mikroprozessoren und industriellen PCs wächst beständig. Dadurch werden industrielle Lösungen nicht nur schöner und schneller, sondern es eröffnen sich zunehmend auch ganz neue Möglichkeiten und Strategien. In aller Munde ist heute das Maschinelle Lernen. Der folgende Selbstversuch zeigt Möglichkeiten auf.

Zeitungen und Zeitschriften sind voll mit Gerede über die sogenannte Künstliche Intelligenz (KI), oder englisch Artificial Intelligence (AI). Eine wunderbare goldene Zukunft wird uns prophezeit oder apokalyptische Abgründe. Zur ersten Kategorie zählen die immer wieder gepriesenen intelligenten Kühlschränke, die dereinst aufgebrauchte (oder abgelaufene) Joghurts und Salate automatisch nachbestellen werden; zur zweiten Kategorie rechnen wir Siri, Alexa & Co., die ­heute schon im Auftrag der krankhaften Torwächter des Internets – Google, Amazon, Apple, Microsoft – unsere intimsten Geheimnisse aushorchen. Nebst diesen fragwürdigen und teilweise beängstigenden Entwicklungen übersieht man leicht, dass die sogenannte Künstliche Intelligenz, oder besser, das Machine Learning, längst auch in der Industrie angekommen ist. Hier eröffnen sich interessante, neuartige Möglichkeiten für das Smart Manufacturing, die Qualitätskontrolle, prädiktive Verfahren, Mustererkennung, usw., die mit konventionellen Methoden – wenn überhaupt – nur schwer realisierbar wären.

Das Maschinelle Lernen wird für komplexe Aufgaben eingesetzt, häufig für die optische Erkennung, Klassifikation und die Bestimmung von Lage und Orientierung von Objekten jeder Art. Nebst technischen Komponenten zählen dazu auch Personen, Gesichter, Gesten, Handschriften, usw. In autonomen Fahrzeugen beispielsweise werden damit Hindernisse, andere Fahrzeuge, Passagen, Markierungen, usw. erkannt und lokalisiert.

Versuchsaufbau
Für die Lösung von derartigen Aufgaben braucht es heute weder ein Wissenschafter-Team noch ein leistungsstarkes Rechenzentrum. Anhand eines einfachen Beispiels soll das illustriert werden. Das automatische Erkennen von Farbstiften, Schrauben oder Zahnrädern in einem Kamerabild wäre aber zu einfach. Darum haben wir uns eine etwas kniffligere Aufgabenstellung gegeben: Eine beliebige Person sitzt an einem Schreibtisch mit PC. Dabei geht sie einer von vier möglichen ­Tätigkeiten nach, nämlich (1) Schreiben auf Papier, (2) Tippen auf der Tastatur, (3) mit Werkzeug hantieren und (4) eingenickt sein. Ein künstliches Neuronales Netzwerk soll anhand eines digitalen Fotos die jeweilige Tätigkeit aus den vier erkennen. Erschwerend kommt dazu, dass jede Person individuell gemusterte Kleidung trägt und dass im Hintergrund der betreffenden Bilder sich weitere Personen befinden können.
In der jüngeren Vergangenheit wurden derartige Klassifizierungs-Aufgaben mithilfe von Deep Learning erfolgreich gelöst. Dabei wird ein grosses Neuronales Netz eingesetzt. Da dieses Netzwerk in der Regel viele hundert Millionen Parameter enthält, sind für sein Training tausende oder gar Millionen von Trainingsbildern notwendig. Zu jedem von diesen Bildern muss angegeben werden, welche Kategorie (in unserem Beispiel: welche der vier Tätigkeiten) darauf abgebildet ist. In den meisten praktischen Fällen, ist die Beschaffung und Klassifizierung einer solchen Menge von Bildern schlicht zu aufwändig und zu teuer.
Um dies zu umgehen, haben wir für unsere Aufgabe ein vortrainiertes Netz verwendet. Ein derartiges Netzwerk ist bereits da­rauf trainiert, zum Beispiel 1000 verschiedene Features von Bildern zu separieren. Man nutzt das Neuronale Netz also nur als sogenannten Feature Extractor. Anstelle des vollständigen Bildes werden in der Folge für die Klassifikation nur diese 1000 Werte benutzt. Die Komplexität der Problemstellung reduziert sich damit auf einen überschaubaren Bruchteil.
Die Verarbeitung des Feature Vektor übernimmt zum Beispiel eine Support Vector Machine, ein Random Forest Klassifizierer oder ein zweites, kleineres Neuronales Netzwerk. Für das Training dieser zweiten Stufe, reichen einige hundert bis einige tausend Trainingsbilder.
Für unsere Aufgabe haben wir ein Kamera-Setup aufgebaut, und ein kleines Hilfsprogramm vorbereitet, um jedem Bild, neben der Klasse der Tätigkeit, noch einige weitere Informationen zuzuordnen, zum Beispiel den Namen der Person im Bild. Mit diesem Aufbau wurden innerhalb von einem Tag knapp 900 Bilder mit neun verschiedenen Personen bei den vier Tätigkeiten aufgenommen, im Durchschnitt also 25 Bilder pro Person und Tätigkeit. Damit wurde der Klassifizierer trainiert.

Resultate
Bei der Verifikation des Systems dürfen diese Bilder selbstverständlich nicht nochmals verwendet werden. Stattdessen wurden neue Bilder aufgenommen. Enthalten diese Testbilder Personen, die nicht im Trainingsset dabei waren, so erreicht das System eine Trefferrate von 80 Prozent. Wird dagegen mit einer Person getestet, die in den Trainings bildern bereits vorkam, so erreicht der Klassifizierer eine Zuverlässigkeit von rund 95 Prozent. Damit folgt: Trotz dem bescheidenen Umfang des Trainingsmaterials erreicht der Klassifizierer bereits recht gute Trefferraten.
Durch eine Erweiterung des Trainingssets auf zirka 4000 Bilder, entweder durch Augmentation – das heisst, durch Verändern der vorhandenen Bilder – oder mit zusätzlichen Aufnahmen der gleichen Personen und/oder mit weiteren Personen, kann die Trefferrate leicht bis gegen 100 Prozent gesteigert werden. Zu beachten ist aber, dass selbst die sogenannte Human Performance in der Regel keine 100 Prozent erreicht, denn es gibt immer Bilder, die sich nicht eindeutig zuordnen lassen.

INFOS | KONTAKT
Stettbacher Signal Processing AG
Neugutstrasse 54
CH-8600 Dübendorf

T +41 (0)43 299 57 23
www.stettbacher.ch
dsp@stettbacher.ch

Termine

Juli

emv, Köln

Internationale Fachmesse und Kongresse für Elektromagnetische Verträglichkeit
12. bis 14. Juli
www.mesago.de

August

all about automation, Zürich

Fachmesse für Industrieautomation
31. August und 1. September
www.aaa-zürich.ch

September

all about automation, Zürich

Fachmesse für Industrieautomation
31. August und 1. September
www.aaa-zürich.ch

drinktec, München

Weltleitmesse für die Getränke- und Liquid-Food-Industrie
12. bis 16. September
www.drinktec.com

AMB, Stuttgart

Internationale Messe für Metallbearbeitung
13. bis 17. September
www.messe-stuttgart.de/amb