Neuigkeiten

Robustheit für selbstlernende Systeme

Dateneffizientes Lernen vs Robustes Systemverhalten

Heutige Lernverfahren für selbstlernende Systeme bilden einen Trade-Off zwischen dateneffizientem Lernen und der Robustheit der gelernten Bewegungsstrategie. Die Robustheit bezeichnet hierbei das Systemverhalten bei unerwarteten Störungen. Um diesen Trade-Off zu schließen, wurde im Rahmen von InPulS ein dateneffizientes Reinforcement Learning Verfahren so erweitert, dass eine hohe Robustheit erreicht wird. Damit stellt dieser Schritt einen Beitrag zu zuverlässigen Anwendung von selbstlernenden Systemen dar. ![](robustheit.png)

In Anlehnung an das menschliche Vorbild: Motorreflexe

Der Mensch generiert mit seinem Gehirn Bewegungskommandos, welche zunächst an das Rückenmark weiterleitert werden. Dort findet die lokale Regelung der Bewegung statt - es werden also Muskelzustände ausgelesen und in Muskelaktionen überführt, es findet quasi ein motorischer Reflex statt. In Analogie dazu, wurde im Projekt InPulS eine Repräsentation für Bewertungsstrategien entwickelt, bei der für einen Systemzustand zunächst ein motorischer Reflex parametriert wird, welcher dann erst im Anschluss in eine Aktion überführt. Diese Vorgehen führt dazu, dass Bewegungsmuster (die Motorreflexe) einfachste Aufgaben abbilden (bspw. Neigen, Schwenken, Drehen, ...), welche im gesamtem Zustandsbereich seine Gültigkeit behalten.

Aktueller Stand

Arbeitspakete

Das Vorgehen zur Erreichung der Zielsetzung gliedert sich im Folgenden in die fünf Arbeitsschritte Analyse (AP1), Konzeption (AP2), Realisierung (AP3), Validierung (AP4) und Dokumentation (AP5). Innerhalb der Analyse und Konzeption werden Produktionsprozesse betrachtet und individuelle Modelle entwickelt. Als Funktionsmuster wird im Rahmen von InPuls ein Forschungsdemonstrator aufgebaut, der anhand eines konkreten Anwendungsfalls die Applikation der entwickelten Modelle aufzeigt sowie ein webbasierter Leitfaden zur Integration intelligenter, lernfähiger Systeme in bestehende Produktionsumgebungen erarbeitet. Die Firmen aus dem projektbegleitenden Ausschuss (PA) umfassen produzierende Unternehmen, Endanwender und Systemintegratoren, die in den einzelnen Arbeitsphasen integriert werden. Im Vordergrund stehen KMU, die anhand des Leitfadens eine dezidierte Vorgehensweise für die Integration intelligenter Prozesse erlangen. Parallel zum Forschungsdemonstrator zeigt eine Evaluation innerhalb von industriellen Anwendungsfällen bei Unternehmen des projektbegleitenden Ausschusses die Anwendbarkeit in bestehenden Produktionssystemen auf.

Analyse
100%
Lernverfahren
70%
Demonstrator
70%
Validierung
40%
Dokumentation
20%