Mas

    Meta lanza modelo de IA para traducir voz entre varios de idiomas

    La empresa matriz de Facebook, Meta Platforms, lanzó el martes un modelo de inteligencia artificial capaz de traducir y transcribir el habla en docenas de idiomas, un componente potencial para las herramientas que permiten la comunicación en tiempo real entre idiomas.

    La compañía dijo en una publicación de blog que su modelo SeamlessM4T podría admitir traducciones entre texto y voz en casi 100 idiomas, así como traducción completa de voz a voz para 35 idiomas, combinando tecnología que anteriormente solo estaba disponible en modelos separados.

    El director ejecutivo Mark Zuckerberg ha dicho que prevé que dichas herramientas faciliten las interacciones entre usuarios de todo el mundo en el metaverso, el conjunto de mundos virtuales interconectados en los que apuesta el futuro de la empresa.

    Meta está poniendo el modelo a disposición del público para uso no comercial, dice la publicación del blog.

    La compañía de redes sociales más grande del mundo ha lanzado una serie de modelos de IA en su mayoría gratuitos este año, incluido un modelo de lenguaje grande llamado Llama que plantea un serio desafío para los modelos patentados vendidos por OpenAI respaldado por Microsoft (MSFT.O) y Alphabet (GOOGL.O) Google.

    Zuckerberg dice que un ecosistema abierto de IA funciona en beneficio de Meta, ya que la empresa tiene más que ganar si colabora de manera efectiva en la creación de herramientas orientadas al consumidor para sus plataformas sociales que cobrando por el acceso a los modelos.

    No obstante, Meta enfrenta cuestiones legales similares a las del resto de la industria en torno a los datos de capacitación ingeridos para crear sus modelos.

    En julio, la comediante Sarah Silverman y otros dos autores presentaron demandas por infracción de derechos de autor contra Meta y OpenAI, acusando a las empresas de usar sus libros como datos de capacitación sin permiso.

    Para el modelo SeamlessM4T, los investigadores de Meta dijeron en un trabajo de investigación que recopilaron datos de entrenamiento de audio de 4 millones de horas de «audio sin procesar que se originó en un repositorio disponible públicamente de datos web rastreados», sin especificar qué repositorio.

    Un portavoz de Meta no respondió a las preguntas sobre la procedencia de los datos de audio.

    Los datos de texto provienen de conjuntos de datos creados el año pasado que extrajeron contenido de Wikipedia y sitios web asociados, según el documento de investigación.

    ¿QUIERES SABER MAS?

    El Supremo de Estados Unidos decidirá si los estados pueden regular lo que publican las redes sociales

    El Tribunal Supremo de Estados Unidos decidirá si los estados del país pueden regular los contenidos que publican las redes sociales en sus territorios, al haber aceptado este viernes estudiar si las leyes aprobadas en Texas y Florida con este fin son constitucionales.

    Truecaller presenta una nueva identidad de marca y funciones de IA para la prevención del fraude

    El logotipo actualizado de Truecaller significa un enfoque renovado y fuerte en la privacidad del consumidor y una mayor seguridad en las comunicaciones.

    La nueva IA de Meta usará la cara de diversos famosos, pero no sus personalidades o vidas

    El director ejecutivo de Meta anunció que "pronto" los usuarios de sus aplicaciones Messenger, Instagram y WhatsApp podrán tener conversaciones con chatbots que usan la cara y las expresiones físicas de diversas personalidades.

    El chatbot con inteligencia artificial de OpenAI, ChatGPT, ahora puede «ver, oír y hablar»

    OpenAI, la empresa creadora del chatbot con inteligencia artificial (IA) generativa ChatGPT, anunció este lunes una nueva versión de su popular herramienta que es capaz de "ver, oír y hablar" en voz alta con los usuarios.

    Spotify usará inteligencia artificial para doblar pódcast al español

    La plataforma musical sueca Spotify anunció este lunes que empezará a poner a prueba un programa que usa inteligencia artificial para traducir pódcast del inglés a otros idiomas, entre ellos el español, todos con la voz original.