La compañía OpenAI reveló este lunes sus planes de dotar a ChatGPT con capacidades de voz e imagen, expandiendo así las posibilidades de esta plataforma que hasta ahora se limitaba a recibir instrucciones escritas.
En una publicación en el blog de la empresa, señalaron algunas de las posibilidades que esta función brindará a los usuarios, como la capacidad de pedir un cuento antes de dormir para la familia o resolver debates en la mesa de manera dinámica y conversacional.
En una demostración que acompañó el anuncio, un usuario le pidió a ChatGPT que contara una historia sobre "el genial erizo llamado Larry", y el resultado sorprendió a los usuarios, ya que el chatbot narró la historia con una voz que sonaba humana y pudo responder preguntas específicas sobre el personaje y su entorno.
La voz de ChatGPT se basa en un nuevo modelo de conversión de texto a voz que puede generar audio de alta calidad a partir de texto y solo unos segundos de muestra de voz. OpenAI incluso colaboró con actores de doblaje profesionales para crear cinco voces distintas que dan vida a este chatbot.
Además, anunció una función adicional que permitirá a ChatGPT responder a solicitudes que incluyan imágenes. Por ejemplo, los usuarios podrán tomar una foto de los ingredientes en su refrigerador y pedirle al chatbot que les ayude a planificar las comidas en función de lo que tengan disponible.
Estas funciones de voz e imagen estarán disponibles para los suscriptores de los servicios Plus y Enterprise de ChatGPT en las próximas dos semanas. El servicio Plus tiene un costo de $20 al mes, mientras que el servicio Enterprise está dirigido a clientes comerciales.