Proyecto de Investigación

"Análisis y Aplicación de Tecnologías Basadas en XML para la Implementación de Sistemas de Diálogo"

(Dial-XML)

Dpto. Lenguajes y Sistemas Informáticos, ETS Ingeniería Informática, Univ. de Granada, España (Spain)

bullet Introducción
bullet Equipo investigador
bullet Tareas
bullet Publicaciones

Introducción

Los denominados sistemas de diálogo son programas informáticos que tienen como finalidad interactuar con los usuarios oralmente (o utilizando otras modalidades de interacción) para proporcionarles determinados servicios, como por ejemplo, información o reserva de viajes en avión o tren, información meteorológica, venta de productos, etc. Un creciente número de empresas e instituciones públicas utilizan estos sistemas para proporcionar información a clientes y público en general, lo que les proporciona un valor añadido y un importante ahorro económico en cuanto a costes de personal.

La finalidad del proyecto Dial-XML es estudiar, analizar y usar diversas tecnologías basadas en XML (concretamente VoiceXML, CCXML y XHTML+Voice) para implementar sistemas de diálogo unimodal (oral), multilingüe y multimodal para dominios de aplicación concretos, en los que las frases de los usuarios estén claramente limitadas por el contexto de cada aplicación. El proyecto permitirá comparar las ventajas/desventajas de estas nuevas tecnologías con las de la metodología “tradicional” de implementación de sistemas de diálogo, basada en el uso de lenguajes de programación de propósito general (por ejemplo C). En particular, pretendemos que el proyecto nos permita determinar en qué medida dichas tecnologías son suficientemente potentes y flexibles como para poder ser consideradas una alternativa preferible a la metodología de implementación tradicional.

Por otra parte, este proyecto pretende establecer las bases de una infraestructura básica para llevar a cabo proyectos de mayor envergadura, en los que podamos desarrollar sistemas que puedan procesar frases de mayor complejidad léxica, sintáctica y semántica, en los cuales, además de soportar varios dispositivos de interacción (ordenadores PC, PDAs, etc.) se soporten diversas modalidades de interacción de entrada/salida (p. e. reconocimiento de expresiones faciales y gestos, agentes animados, etc.). En dichos proyectos podremos aplicar los conocimientos y experiencia adquiridos, así como la tecnología desarrollada gracias al presente proyecto.

El proyecto está financiado por el Plan de Investigación de la Univ. de Granada, 2004.

Equipo investigador

El equipo investigador está constituido por cinco investigadores del Dpto. de Lenguajes y Sistemas Informáticos de la Univ. de Ganada (cuatro profesores a tiempo completo y una becaria de investigación):

bullet Prof. Dr. Ramón López-Cózar Delgado (Investigador principal)
bullet Prof. Zoraida Callejas Carrión
bullet Prof. Dr. Miguel Gea Megías
bullet Prof. Dr. Nuria Medina Medina
bullet Prof. Dr. Domingo Martín Perandrés

Tareas

Las principales tareas que tenemos previsto realizar en el proyecto son las siguientes:

bullet Análisis inicial de las tecnologías XML de interés.
bullet Instalación y configuración de software y hardware (para reconocimiento y síntesis de habla) en un ordenador que actúe como servidor.
bullet Adquisición de corpora de diálogos de diversos dominios de aplicación, con objeto de utilizarlos como guía para la implementación de sistemas de diálogo.
bullet Evaluación objetiva y subjetiva de los sistemas desarrollados.
bullet Difusión de los resultados obtenidos en el proyecto.

Respecto a la primera tarea, ya hemos realizado diversos estudios y análisis acerca de las tres tecnologías XML en que estamos interesados (VoiceXML, CCXML y XHTML+Voice), habiendo realizado diversas publicaciones de las conclusiones obtenidas (López-Cózar et al. 2005).

Respecto a la segunda tarea, hemos adquirido un nuevo servidor en el que hemos instalado y configurado una tarjeta de interfaz telefónica Intel Dialogic D/41JCT-LS, así como un software para reconocimiento y síntesis de habla adecuado para la misma.

Respecto a la tercera tarea, estamos en proceso de obtener permisos para poder usar corpora de diálogos creados en proyectos previos. Asimismo, tenemos previsto poder usar algunos corpus adicionales de proyectos en desarrollo.

Respecto a la cuarta tarea, ya hemos comenzado a usar la tecnología VoiceXML para implementar un sistema que proporcione información de Departamentos de la Univ. de Granada (Callejas y López-Cózar 2005). Por otra parte, también hemos comenzado a usar la tecnología XHTML+Voice para implementar un sistema multimodal que proporcione información acera de transporte de viajeros en autobús (horarios de salida y llegada, precios, etc.).

Publicaciones

bullet Zoraida Callejas, Ramón López-Cózar. 2005. Nueva Técnica para Generación Automática de Gramáticas para Sistemas de Diálogo. Procesamiento del Lenguaje Natural, nº 35, pág. 205-212, ISSN: 1135-5948, Dep. Legal: B-3941-91
bullet López-Cózar, R., Callejas, Z., Gea, M., Medina, N., Gea, M. 2005. Implementación de Sistemas de Diálogo en Dial-XML. Procesamiento del Lenguaje Natural, nº 35, pág. 445-446, ISSN: 1135-5948, Dep. Legal: B-3941-91
bulletZoraida Callejas, Ramón López-Cózar. 2005. Implementing Modular Dialogue Systems: A Case of Study. Aceptado en ISCA Tutorial and Research Workshop on Applied Language Interaction in Distributed Environments (ASIDE2005), Aalborg, Dinamarca, 10-11 Noviembre 2005