De guías turísticos a agentes de la autoridad: llegan los avatares 3D dotados con ChatGPT
El proyecto de la UMA y Visitas Virtuales, reconocido con uno de los 'Premios IA y Tecnologías Avanzadas' de Madrid
Categoría: Investigación, portada, Premios Investigación
La unión de los tradicionales avatares 3D y la novedosa inteligencia artificial de ChatGPT ha dado lugar a una nueva generación de chatbots que permiten interactuar a través de la voz con 'metahumanos' convertidos en guías turísticos, agentes de la autoridad o asesores en materia medioambiental.
El profesor del Departamento de Lenguajes y Ciencias de la Computación de la Escuela de Informática de la Universidad de Málaga David Bueno ha creado, junto con José Manuel López, de la empresa Visitas Virtuales, un avatar entrenado con conocimientos de reciclaje al que se le pueden dar instrucciones de voz.
Se trata de Almudena, un avatar realista, que es capaz de reconocer la voz del usuario y de proporcionarle información sobre cómo reciclar en Madrid, explicando desde qué objetos deben ir en cada contenedor a qué puntos limpios se pueden encontrar en cada barrio, o brindar consejos para reducir el impacto ambiental.
Vestida con tejanos y jersey, Almudena responde diligentemente a cualquier pregunta sobre reciclado de residuos desde una plaza hecha digitalmente con fotogrametría, técnica que consiste en obtener modelos 3D de la realidad.
El profesor de la UMA y Visitas Virtuales se presentaron con este proyecto a los premios Inteligencia Artificial y Tecnologías Avanzadas 2023 del Ayuntamiento de Madrid y ganaron en la categoría de diseño de un modelo de información ciudadana mediante bots conversacionales, dotada con 40.000 euros.
Interacción con voz
Esta empresa está digitalizando el centro histórico de Málaga, lo que ha dado pie al profesor de la UMA, que durante una década fue el gerente del Centro Municipal de Informática en el Ayuntamiento de Málaga, a crear otro avatar, en este caso llamada Victoria, que hace de guía virtual en la plaza de la Merced de la capital malagueña.
Según detalla este investigador, lo que se puede ver en la plaza tiene un aspecto muy real porque es el resultado de este complejo sistema de fotogrametría que ha combinado, además, varias tecnologías, como escáner láser y fotografías de 360 grados, incluyendo el uso de drones para la toma de imágenes de los tejados.
Victoria, de aspecto muy similar a Almudena, se ha aprendido los puntos más relevantes de la plaza para poder contarlos a los turistas, como el obelisco erigido en honor a José María de Torrijos o la Casa Natal de Pablo Picasso.
"Aquí la gracia es que hablas con el avatar con tu propia voz, no por escrito, y él te entiende y es capaz de hacer acciones, desde contestar a las preguntas que le hagas a llevarte a sitios de la plaza", explica Bueno.
Ello es posible gracias a la "conexión" de la inteligencia de ChatGPT, entrenado para mantener conversaciones sobre temas específicos, con la tecnología de los avatares 3D. El resultado: personajes digitales que imitan el comportamiento humano y son capaces de interactuar con los usuarios en entornos virtuales.
Usos infinitos
Parar demostrar los infinitos usos de estos 'metahumanos', el profesor David Bueno ha diseñado también uno que representa a una agente de la Guardia Civil. Se identifica como una mujer de 35 años que trabaja en este cuerpo desde hace una década y que se ofrece a ayudar al interlocutor con "cualquier consulta" que tenga.
A modo de prueba, el humano le pregunta qué tiene que hacer tras ser multado por conducir a 200 kilómetros por hora y la respuesta de la agente virtual no tiene desperdicio: "Lamentablemente, conducir a 200 kilómetros por hora es una infracción grave y peligrosa. Te recomendaría que aceptes la multa y pagues la sanción correspondiente. Además, es importante que reflexiones sobre la importancia de respetar los límites de velocidad para garantizar la seguridad vial".
Los chatbots tradicionales, comenta David Bueno, lo que detectan son intenciones, es decir, utilizan técnicas como el PLN (Procesado de Lenguaje Natural) para interpretar los mensajes del usuario e identificar su propósito.
En esta nueva generación de bots de charla, se pasa de las intenciones a los sistemas generativos abiertos, que permiten al avatar "aprender" y tomar decisiones, haciéndolo cada vez un poquito más humano.