Der kommunikative Agent Lokutor Jan-Torsten Milde Fakultät für Linguistik und Literaturwissenschaft, Universität Bielefeld, email: milde@coli.uni-bielefeld.de 1. Lokutor Lokutor ist ein natürlichsprachlich steuerbarer anthropomorpher Agenten-Prototyp, der innerhalb einer simulierten 3D-Umgebung agiert ([1] und [2]). Seine aktuelle Aufgabe ist die Präsentation eines Autos. Der Agent ist in der Lage, die Funktionalität des Autos zu beschreiben (z.B. wie öffne ich den Tankdeckel, welchen Typ Benzin muß man einfüllen, wie groß ist das Volumen des Kofferraums etc.). Der Benutzer interagiert mit Lokutor durch natürlichsprachliche Kommunikation. Lokutor interpretiert die gegebenen Anweisungen unter Einbeziehung situativer Information und führt die entsprechendent Teilhandlungen aus. Informationen über das Auto werden natürlichsprachlich wiedergegeben. Hier kommt ein Synthesemodul zum Einsatz. Der Inhalt der Beschreibung ist Teil der Verhaltensspezifikation von Lokutor. Diese wird in einem XML-annotierten ([3]) Format angegeben . Die Wissensbasis des Agenten besteht dabei aus strukturiert annotiertem Domänenwissen (in der Testanwendung sind dies aufbereitete Ausschnitte aus dem Benutzerhandbuch des Wagens) und in der Beschreibung möglicher Verhaltensmuster. Ein Verhaltensmuster kombiniert dabei eine Situationsbeschreibung mit einer Folge möglicher Handlungen. Unter Handlung wird hier sowohl eine physikalische Handlung als auch eine Sprachhandlung verstanden. Das spezifizierte Verhaltensmuster wird umgesetzt in ein Behaviormodul des reaktiven Basissystems. 2. Das multimodale Beschreibungsformat Das Steuerungssystem von Lokutor nutzt eine externe deklarative Verhaltensbeschreibung. Hierzu wurde eine XML-Dokumenttypdefinition (DTD) entwickelt. Folgend eine vereinfachte Form der XML-DTD: Die Beschreibung des Agenten (agent) besteht aus der Agentengeometrie (geom, Verweis auf das externe H-ANIM 1.1 Modell), dem geometrischen Szenenmodell (scene, ebenfalls ein Verweis auf eine externe Datei) und der Wissensbasis (knowb). Die Wissensbasis besteht aus Einträgen, welche eine Situationsbeschreibung (sit, eine Folge von Bedingungen) mit einer Aktionsfolge (act) in Beziehung setzt. Ausführbare Aktionen bestehen aus physikalischen Handlungen (move) und aus möglichen Äußerungen (say). Ein anhand der Strukturbeschreibung annotiertes Dokument kann nun durch einen XML-Parser (IBM xml4j2.0.11, ein in Java geschriebener freier XML-Parser, s.a http://www.alphaworks.ibm.com/) eingelesen und strukturell validiert werden. Alle XML-Dokumente sind Baumstrukturen. Der verwendete XML-Parser gibt diese Struktur als DOM-Tree zurück (s.a. http://www.w3.org/TR/WD-DOM/) und erlaubt so die Traversierung und damit die inhaltsgesteuerte Auswertung der Verhaltensbeschreibung. Sprachliches und außersprachliches Verhalten werden innerhalb dieses Beschreibungsformat gleich behandelt. Das vereinfachte Beschreibungsformat führt zu einer Reihe von Problemen: 1) Die sprachliche Beschreibungsebene ist reduziert auf einzelne Utterances, ohne diesen eine interne Struktur zu geben. 2) Dialogstrukturen können nicht ausgezeichnet werden. 3) Entsprechend reagiert der Agent mit stereotypischer Wiederholung der Äußerung innerhalb einer Situation. 4) Es fehlt ein Zeitmodell. 5) Es fehlt ein Referenzmodell. 3. Präsentation/Erwartungen Ich würde gerne den aktuellen Stand der Entwicklung von Lokutor kurz darstellen (evtl durch eine kleine Videosequenz). Besonders wichtig ist mir die Diskussion des zugrundeliegenden XML-basierten multimodalen Beschreibungsformats, welches sprachliche und außersprachliche Information miteinander verbindet/verbinden soll. Meine Erwartungen an den Workshop gehen in die Richtung: Information über den aktuellen Stand linguistischer Verfahren zur Dialogbeschreibung, Partnermodellierung etc. und deren möglich Integration in das multmodale Beschreibungsformat. Literatur 1) J.-T. Milde and Tobias Ahlers. Lokutor: An Articulated Presentation Agent. In Proceeding of the First Workshop on Intelligent Virtual Environments, KI-99, Bonn, 1999. 2) J.-T. Milde and Tobias Ahlers. The Communicative Agent Lokutor Proceedings der 4. Fachtagung der Gesellschaft für Kognitionswissenschaft KogWis 1999, Bielefeld. infix Verlag, Sankt Augustin, 1999. 3) Steven Holzner. XML complete. McGraw-Hill, New York, 1998.