next up previous
Next: Bildanalyse Up: LME Previous: LME

Einführung

Unter dem Arbeitsgebiet ``Mustererkennung'' des Lehrstuhls wird ganz allgemein die automatische Transformation einer von einem geeigneten Sensor gelieferten Folge von Abtastwerten eines Signals in eine den Anforderungen der Anwendung entsprechende symbolische Beschreibung verstanden. Hierfür werden in der Bildverarbeitung in diesem Zusammenhang Sensoren eingesetzt, die unter Umständen gekoppelt mit speziell gesteuerter Beleuchtung sind und Informationen in einem oder mehreren Kanälen, gegebenenfalls auch als Stereokameras, liefern. Zum Einsatz kommen Fernseh- und Spezialkameras, teilweise mit Ansteuerung durch den Rechner. Bei der Verarbeitung von zusammenhängend gesprochener Sprache werden Mikrofone als Sensoren verwendet. Eine symbolische Beschreibung kann zum Beispiel eine diagnostische Bewertung einer Bildfolge aus dem medizinischen Bereich enthalten, die Ermittlung, Benennung und Lokalisation eines erforderlichen Montageteils für einen Handhabungsautomaten umfassen oder die Repräsentation der Bedeutung eines gesprochenen Satzes enthalten. Die Lösung dieser Aufgaben erfordert sowohl Verfahren aus der (numerischen) Signalverarbeitung als auch aus der (symbolischen) Wissensverarbeitung. Die Ermittlung einer symbolischen Beschreibung wird auch als Analyse des Musters bezeichnet.

Der Lehrstuhl bearbeitet hauptsächlich zwei Themenkomplexe, nämlich wissensbasierte Analyse von Bildern und Bildströmen sowie Verstehen gesprochener Sprache und Generierung einer Antwort. In der wissensbasierten Bildanalyse werden sowohl grundsätzliche Arbeiten zur Bildverarbeitung und zur Repräsentation und Nutzung problemspezifischen Wissens als auch spezielle Arbeiten zur Entwicklung eines vollständigen, rückgegkoppelten Systems für die schritthaltende Analyse dreidimensionaler Szenen durchgeführt. In der Spracherkennung konzentrierten sich die Arbeiten auf die Entwicklung eines Systems, das über einen begrenzten Aufgabenbereich (Auskünfte über Intercity-Züge) einen Dialog mit einem Benutzer führen kann, wobei gesprochene Sprache für die Ein- und Ausgabe verwendet wird. Im Rahmen des 1995 gestarteten Copernicus-Projektes SQEL (Spoken Queries in European Languages) wird an einer Erweiterung des Auskunftssystems in Richtung Multilingualität (Deutsch, Tschechisch, Slowakisch und Slowenisch) und Multifunktionalität (Zug- und Flugauskunft) gearbeitet. Als weitere Anwendung werden in der Spracherkennung Teilprobleme im Rahmen des VERBMOBIL-Vorhabens untersucht. Ziel des Gesamtvorhabens ist die Entwicklung eines portablen Übersetzungsgerätes.

Ein beiden Themenkomplexen gemeinsames Problem ist die Akquisition, Repräsentation und Nutzung des Wissens, das zur Analyse von Bildern und Sprache bzw. zum Verstehen der Bedeutung erforderlich ist. In diesem Zusammenhang spielen statistische Modelle eine zunehmend wichtigere Rolle. Es ist unter Umständen erforderlich, daß zusätzlich zum Verstehen der Bedeutung auch noch eine sinnvolle Systemreaktion geliefert wird, zum Beispiel auf die Anfrage eines Benutzers eine richtige Auskunft des Systems, oder eine Bewegung des Montageroboters oder der Kameramotoren aufgrund der Ergebnisse der Bildanalyse.


Dieser Text ist auch im world wide web (www) verfügbar. Besuchen Sie hierzu http://www5.informatik.uni-erlangen.de.


next up previous
Next: Bildanalyse Up: LME Previous: LME

Joachim Denzler
Thu Mar 7 16:55:30 MET 1996