Mas

    El chatbot con inteligencia artificial de OpenAI, ChatGPT, ahora puede «ver, oír y hablar»

    OpenAI, la empresa creadora del chatbot con inteligencia artificial (IA) generativa ChatGPT, anunció este lunes una nueva versión de su popular herramienta que es capaz de «ver, oír y hablar» en voz alta con los usuarios.

    Hasta ahora solo se podía interactuar con las distintas versiones de ChatGPT por escrito, pero los usuarios de pago en «dos semanas» podrán tener una conversación en voz alta y escuchar las respuestas de la máquina, así como mandar fotos, imágenes, capturas de pantalla y documentos al chat para obtener respuestas específicas.

    Por su parte, los que usan la versión gratuita de esta herramienta podrán sacarle partido a estas nuevas actualizaciones «poco después», según OpenAI.

    «La voz y la imagen te brindan más formas de usar ChatGPT en tu vida. Cuando estés en casa, saca fotografías de tu refrigerador y despensa para saber qué hay para cenar (y haz preguntas para obtener una receta paso a paso)», anota la empresa en un comunicado.

    Mientras que para ejemplificar cómo se puede usar la herramienta de voz, la empresa dice que se puede utilizar para «contar un cuento o resolver un debate».

    Por ahora, este asistente de voz -que es similar a Alexa, de Amazon, y a Siri, de Apple,- estará disponible para iOS y Android, pero no en PC.

    Se podrán elegir entre cinco voces distintas, aunque la voz que viene por defecto y la que salía en los ejemplos de hoy es una voz que imita a la de una mujer joven y aparentemente blanca, como suele ser habitual en este tipo de herramientas.

    Mediante Whisper -herramienta de OpenAI que usa la IA para trascribir audio- se convierte la voz del usuario a texto, y la compañía luego usa su nuevo modelo de conversión de texto a voz para la respuesta de la máquina.

    «Nuestra nueva tecnología de voz es capaz de crear voces sintéticas realistas a partir de tan solo unos segundos de voz real. Esto abre las puertas a muchas aplicaciones creativas y da herramientas de accesibilidad. Sin embargo, estas capacidades también presentan nuevos riesgos, como la posibilidad de que actores maliciosos se hagan pasar por figuras públicas o cometan fraude», advierte la empresa.

    OpenAI, además, anunció hoy que la plataforma de música Spotify está utilizando el «poder de esta tecnología para traducir algunos de sus pódcast a «idiomas adicionales, pero manteniendo las propias voces de los presentadores e invitados».

    ¿QUIERES SABER MAS?

    Javier Ramos, el niño que jugaba con robots y ha revolucionado la impresión 3D

    Con 26 años cofundó Inkbit, una empresa pionera en crear máquinas con ‘ojos’ y ‘cerebro’ capaces de imprimir objetos con materiales elásticos; con 32 ha ideado réplicas de manos. Javier Ramos, puertorriqueño de padre madrileño, pasó de jugar con robots en su instituto de San Juan a revolucionar la impresión 3D

    Spotify anuncia a sus usuarios que abandona Uruguay

    La plataforma Spotify anunció este viernes a través de un correo electrónico a sus clientes uruguayos que comenzará a retirar gradualmente su servicio del país suramericano desde el próximo 1 de enero y que cesará completamente sus servicios en febrero.

    Arranca en Tokio iREX2023, la feria de robots más grande del mundo

    Tokio acoge desde hoy y hasta el próximo 2 de diciembre la vigesimoquinta edición de la feria de robots más grande del mundo, la Exposición Internacional de Robots 2023 (iREX2023), en su centro internacional de exhibiciones, el Tokyo Big Sight.

    ¿Por qué Omegle cerró después de 14 años?

    Omegle, la plataforma de chat aleatorio que conectaba a usuarios de todo el mundo a través de videollamadas gratuitas, ha cerrado sus puertas tras 14 años de actividad.

    ¿Cuándo se lanza ‘Spotify Wrapped’ 2023?

    Spotify lanzará su función anual 'Wrapped' una vez más este año, donde los fanáticos de la música pueden recordar sus lanzamientos favoritos de 2023.