Next: Regelung des Pendelsystems Up: No Title Previous: Der Backpropagation Algorithmus

Identifikation des Pendelsystems durch das Neuronale Netz

In diesem Kapitel wird erläutert, wie man ein Neuronales Netz zur Identifikation des doppeltinversen Pendels einsetzen kann. Weiterhin wird gezeigt, wofür man das so trainierte Neuronale Netz benutzen kann.

Wie bereits in Kapitel erläutert, schaltet man parallel zu dem zu identifizierenden System, also dem doppeltinversen Pendel, das Neuronale Netz, siehe Abbildung . Die Eingabe an das Netz ist der aktuelle Zustand des Pendelsystems beschrieben durch Winkel, Geschwindigkeiten, etc., sowie die durch den Regler ermittelte Kraft. Das Pendelsystem bekommt als Eingabe nur die Kraft, die Eingabe des Zustandes ist nur fiktiv. Aus dem Unterschied der Ausgaben des Pendelsystems und des Neuronalen Netzes ist ein Fehlermaß ermittelbar und hiermit das Neuronale Netz trainierbar.

Abbildung: Identifikation des Pendelsystems.

Zur Identifikation muß man Online, also am laufenden doppeltinversen Pendel, lernen können. Außerdem benötigt man einen Regler, der das Pendel nicht umfallen läßt. Das Echtzeitlernen war am Hardwaremodell nicht möglich. Deswegen wurde ein mathematisches Modell erstellt, siehe Heul96, mit dem das Pendelsystem simuliert wurde. Durch das Verwenden eines Simulationsmodells ist es jedoch notwendig, zu überprüfen, ob das Modell mit dem Hardwaremodell annähernd übereinstimmt. Um das Pendelsystem identifizieren zu können, muß man dessen Reaktion auf einen Regler kennen. Deshalb benötigt man zuerst einen Regler, der das Pendelsystem so regelt, daß es nicht umfällt. Erst dann kann man es identifizieren. Hat man keinen Regler zur Verfügung, kann man dies mit dem Simulationsmodell umgehen. Ersetzt man das Pendel durch das Simulationsmodell, so kann man am Simulationsmodell das doppeltinverse Pendel identifizieren. Der Vorteil dieser Methode ist, daß kein gelernter Regler benötigt wird, der dafür sorgt, daß das Pendel beziehungsweise das Simulationsmodell stehen bleibt. Statt dessen kann man einen ,,Zufallsregler`` benutzen, der zufällig eine Stellgröße ermittelt. Für die Identifikation ist nur die Reaktion des doppeltinversen Pendels auf diese Stellgröße hin notwendig. Am Hardwaremodell ist das nicht möglich, da dieses bei einem Zufallsregler sehr schnell umfällt und jedesmal per Hand aufgerichtet werden muß.

Hat man erst einmal ein Neuronales Netz das System des doppeltinversen Pendels identifizieren lassen, so kann man dies zur Emulation des Pendelsystems, siehe Abbildung , benutzen. Dies ist vor allen Dingen dann notwendig, wenn man das Neuronale Netz zur Regelung des Systems nicht Online lernen kann. In dem Fall des doppeltinversen Pendels ist diese Notwendigkeit durch zwei Punkte gegeben. Zum einen ist für das Lernen des Neuronalen Reglers ein erheblicher Rechenaufwand, je nach Netzart und -größe, nötig, zum anderen müßte man das Pendel nach jedem Fehlschlag per Hand wieder aufrichten.

Abbildung: Emulator Netz: Das Netz bekommt als Eingabe den aktuellen Zustand x(t) und die Kraft u(t) und liefert als Ausgabe den nächsten Zustand x(t+1). Es ersetzt das doppeltinverse Pendel.

Der Vorteil des Emulatornetzes konnte beim doppeltinversen Pendel nicht genutzt werden. Das Emulatornetz konnte aus oben erwähnten Gründen nur am Simulationsmodell gelernt werden. Auch der Rechenaufwand des Simulationsmodells war geringer als der des Emulatornetzes, so daß nur das Simulationsmodell verwendet wurde.

Next: Regelung des Pendelsystems Up: No Title Previous: Der Backpropagation Algorithmus

Marius Heuler
Tue Jan 7 12:05:27 MET 1997