Ha nacido “Q”, un proyecto para implementar la primera voz de asistente virtual sin género, que podría llegar a Google Assistant, Siri, Alexa y otros sistemas implementados.
Vivimos en una época en donde la asistencia virtual se va ganando un espacio en nuestras rutinas. Cuando das una vuelta a la derecha, recibes las noticias o consultas el clima de tu ciudad, una voz te resume la información de manera sencilla. Sin embargo, siempre debemos optar por una voz de hombre o de mujer, de diversos matices, pero dos géneros definidos. Ahora, una tercera opción aparece para eliminar esa frontera.
Se llama “Q”, un nuevo proyecto de asistencia por voz diseñado por un grupo de lingüistas, tecnólogos y diseñadores de sonido, liderados por el equipo de investigación de Copenhagen Pride, la organización EqualAI y la agencia creativa Virtue. Esta nueva voz busca llamar la atención de las grandes desarrolladoras de asistencia virtual, como Google o Apple, para implementar una opción neutral en estos procesos. Y así es como suena:
El proyecto se enfrenta a un nuevo universo digital lleno de problemas. No es casual que Siri, Cortana y Alexa tengan voces femeninas; varias investigaciones muestran que los usuarios reaccionan más positivamente ante ellos que lo que lo harían con una voz masculina. Pero a medida que los diseñadores toman esa decisión, corren el riesgo de reforzar los estereotipos de género, de que las ayudantes femeninas de IA deben ser útiles, gentiles y cuidadosas, mientras que las máquinas como los robots de seguridad deben tener una voz masculina para representar autoridad. Si bien este no es el primer intento de crear una voz neutra en cuanto al género, con Q no solo podemos hacer que la tecnología sea más inclusiva, sino que también podemos utilizar esa tecnología para iniciar conversaciones sobre temas sociales.
¿Cómo comenzó el proceso de depuración? El equipo comenzó grabando las voces de 24 personas que se identificaron como hombres, mujeres, transexuales o no binarios, mientras leían una lista predeterminada de oraciones. "En ese momento, no sabíamos si íbamos a poner las voces en capas, por lo que necesitábamos la misma oración con el mismo ritmo que pudiéramos obtener", comenta Nis Nørgaard, ingeniero de sonido involucrado en proyectos como “Westworld” de HBO.
En lugar de mezclar las voces para lograr un timbre único, Nørgaard se centró en la voz de una persona, que se registró en algún lugar entre lo que podríamos considerar masculino o femenino. Eso se reduce en gran medida a la frecuencia o al tono: los hombres tienden a tener un tracto vocal más grande, lo que produce un timbre de menor sonido. Pero hay un punto dulce entre 145 y 175 hercios, un rango que la investigación muestra que percibimos como más neutral en cuanto al género. Si va más alto, se percibirá la voz como típicamente femenina; puede ir más abajo y se volverá más masculina. Nørgaard lo define como un proceso difícil, porque el sweet spot puede perderse muy fácilmente: "Fue realmente difícil, porque tu cerebro puede saber si la voz se ha subido y bajado", dice. "Fue difícil trabajar con estas voces sin destruirlas".
Luego de este proceso, se crearon 4 variantes, compartidas a 4.500 personas en Europa para un eficiente focus group. Una voz sobresalió entre los participantes de la encuesta. "La gente decía: 'Esta es una voz neutral. No puedo decir el género de esta voz", dice Nørgaard. “Al principio creía que iba a ser difícil. Pero cuando recibimos retroalimentación de estas 4,500 personas, realmente lo hemos definido”. Esa voz se convirtió en la base de Q.
De acuerdo con proyecciones, para el 2023 la industria de la asistencia por voz crecerá un 35%, en gran parte por el despliegue del Internet de las Cosas y la gestión de estos dispositivos a través de la voz. "Se convertirá en una forma cada vez más común para que nos comuniquemos con la tecnología", dice Julie Carpenter, colaboradora del Proyecto Q, investigadora del Grupo de Ética y Ciencias Emergentes, que explora los problemas sociales en torno a la tecnología. "Nombrar a una asistente doméstica Alexa, que suena femenina, puede ser problemática para algunas personas, porque refuerza este estereotipo de que las mujeres asisten y apoyan a las personas en las tareas".
Sin duda, es una misión difícil el cambiar estereotipos enraizados culturalmente. A pesar de lo dura de la tarea, el solo hecho que Q genere estas reacciones podría ser favorable para ampliar nuestros conceptos de inclusión. Recordemos que las empresas que desarrollan esta tecnología implementan timbres de voz distintos, y así el usuario tenga opciones. A pesar de un catálogo más amplio, la voz de mujer viene por defecto en estos sistemas. Estas opciones “no-binarias” podrían ser una nueva hoja de ruta.
Comparte esta noticia