Usando ChatGPT, este programador peruano presenta un bot que transcribe y resume audios de WhatsApp en pocos segundos y sin salir de la app.
WhatsApp se ha convertido en un repositorio importante de nuestra actividad diaria, y son muchas las maneras en que la experiencia de uso se puede optimizar, aunque sin llegar a los monstruosos niveles de Telegram, su competencia directa a nivel global y que lleva años convirtiéndose en una completa navaja suiza para la mensajería y la interacción social. Sin embargo, la popularidad de la submarca de Meta provoca una enorme oportunidad para desarrolladores que añadan experiencias sin fricciones. Un peruano decidió hacerlo, y vaya que lo hizo bien.
En RPP hemos venido probando EVA, un bot de WhatsApp que, haciendo uso de GPT-4, permite transcribir y resumir un audio en cuestión de segundos y sin necesidad de usar una plataforma de terceros. Esta función pone a prueba las condiciones que empresas como OpenAI imponen en el creciente mundo de las IA generales.
Christian Pasquel, director de tecnología en “Curador”, señaló en RPP que esta herramienta surgió como una “broma de ocio” con la que se podía resumir los audios de WhatsApp sin escucharlos. “Santiago (Tapia, CEO de Curador) me enviaba audios con sus ideas a través de WhatsApp, así que diseñé un bot que me resumiera el mensaje de voz para no tener que escuchar audios de dos o tres minutos. Vimos que, más allá de una broma, era un producto que podríamos desarrollar a gran escala”.
El desarrollador menciona que el nivel de interacción que se logra con esta nueva tecnología generativa basada en Inteligencia Artificial es bastante alto: “hasta antes de este tipo de tecnologías como GPT era difícil pensar que no era un humano. Ahora sí, a veces, puedes pensar que suena un poco humano, aunque no lo es”.
¿Cómo funciona EVA?
Hablamos de un programa escrito en NodeJS que utiliza una serie de recursos para “entender”, en el menor tiempo posible, lo que un usuario dice en un audio enviado a través de WhatsApp. En combinación con sistemas de proceso amplio como Wolfram Language, el bot procesa en un servidor de Linux la información recibida, usando dos herramientas de OpenAI para lograrlo: Whisper-1 y GPT-4.
El uso del bot es realmente simple. Debes agregar a EVA como un contacto y enviarle un mensaje para que pueda desplegar su mensaje de bienvenida. Una vez que el bot entra en actividad, puedes reenviarle un audio no mayor a 5 minutos para que pueda procesarlo.
Una vez que EVA procesa el audio, despliega un submenú para resumir o transcribir mensajes. Hay una tercera opción en BETA que permite conversar con GPT-4, aunque aún está en fase de pruebas.
En pocos segundos, EVA entrega un resumen en texto del mensaje, resaltando partes importantes del mensaje sin distorsionar su sentido. En el caso de que el usuario quiera transcribir de manera textual el audio, también puede hacerlo.
Para usar el bot, debes ingresar a este enlace e iniciar una conversación con EVA.
Te recomendamos
Comparte esta noticia