Hace unos meses, durante el evento I/O para desarrolladores, Google presentó el sistema “Google Duplex”, la inteligencia artificial capaz de interactuar con personas para agendar reuniones o reservas. Este sistema ya funciona desde los teléfonos Pixel.
Uno de los puntos fuertes de Google este año ha sido el desarrollo de un asistente virtual capaz de conversar en tiempo real con una persona y agendar reuniones o reservar lugar en un restaurante. Esta demo fue parte del Google I/O 2018, en donde se mostró la enrome capacidad de la Inteligencia Artificial para lidiar con información en tiempo real.
Este video fue una demo preparada para el evento. Sin embargo, y de acuerdo con VentureBeat, este servicio “Duplex” ya está disponible a través de los nuevos teléfonos Pixel, y el funcionamiento no dista mucho de esa maravillosa demo presentada en Mountain View. Este video muestra cómo funciona en realidad el sistema, y la cantidad de información que solicita al usuario para la decisión correcta.
Luego de este proceso, el asistente de Google llama al negocio a preguntar acerca de la disponibilidad en esas horas. En algunos casos, según cuenta la nota, el asistente no pudo establecer una reserva debido a las limitaciones del local. Aparece en la pantalla del usuario este mensaje, en donde Google especifica las acciones tomadas para ejecutar el pedido del dueño del teléfono.
Sin embargo, el reto mayor es saber cómo suena la llamada al otro lado. Este otro video muestra cómo el asistente de Google se desenvuelve para concretar la reserva con el restaurante:
Una vez que se realiza la reserva, el asistente confirma en un mensaje emergente la hora y el lugar acordados. Sin embargo, extiende el servicio a otros aspectos, como la cancelación de la reserva, el cambio de hora y temas adicionales de agenda.
¿Qué hay detrás de Duplex?
Parte del “truco” de Google para lograr esta naturalidad es el uso de WaveNet, un sistema que permite identificar patrones vocales y modos de conversación mediante la inteligencia artificial, además de la incorporación de los “em”, “ah” y otras muletillas. La pragmática del lenguaje se aplica de manera eficiente en la ejecución del pedido, pues los turnos y las onomatopeyas van dentro del contexto de la conversación.
El vicepresidente de ingeniería para el asistente de Google Scott Huffman reveló en entrevistas recientes que las disfluencias – la leve tartamudez propia de la conversación natural - resultaron ser la clave para avanzar en las conversaciones en las pruebas de “Dúplex”. Sin ellas, “era más probable que las personas colgaran cuando el intercambio comienza a sentirse demasiado artificial”. Tienen otro propósito más práctico: ganar tiempo. Cuando Duplex se enfrenta a una respuesta incierta de un compañero de conversación después de, por ejemplo, solicitar una mesa para tres, reiterará con una falta de fluidez: "ah, para tres". Así, esa pausa le permite a Duplex concretar con tiempo la respuesta.
Comparte esta noticia