
OpenAI, fabricante de ChatGPT, anunció el martes 30 de julio que empezará a ofrecer a sus clientes su nuevo modo de voz, un mes después de retrasar el lanzamiento para realizar más pruebas de seguridad de la herramienta.
OpenAI presentó en mayo el modo de voz conversacional, capaz de detectar distintos tonos de voz y responder a las interrupciones como si fuera un humano. Pero algunos investigadores no tardaron en criticar a la empresa por mostrar un producto de inteligencia artificial que respondía a estereotipos sexistas sobre asistentes femeninas coquetas y complacientes.
La actriz Scarlett Johansson alegó que la empresa había copiado su voz de la película “Her”, en la que un robot de inteligencia artificial entabla una relación romántica con un hombre.

Los registros de OpenAI muestran que trabajó con una actriz completamente distinta y retiró la voz, llamada Sky, de su producto. En junio, dijo que retrasaría el lanzamiento del modo de voz para realizar más pruebas de seguridad. El nuevo modo de voz lanzado el martes no incluye la voz de Sky, según confirmó un portavoz de OpenAI.
Las empresas tecnológicas llevan años trabajando para crear chatbots conversacionales con IA. Alexa, de Amazon, y Siri, de Apple, son omnipresentes y millones de personas los utilizan para programar horarios y consultar el tiempo, pero no son lo bastante capaces para realizar tareas complejas.
Ahora, OpenAI, Google, Microsoft, Apple y una serie de otras empresas tecnológicas están tratando de utilizar los avances en IA generativa para construir finalmente el tipo de asistente que ha sido un elemento fijo de la ciencia ficción durante décadas.
Los fans y clientes de OpenAI han reclamado el modo de voz, y algunos se quejaron en Internet cuando la empresa retrasó el lanzamiento en junio. La nueva función estará disponible para un pequeño número de usuarios al principio, y la empresa la abrirá gradualmente a todos los clientes de pago de OpenAI en otoño.

Las versiones anteriores de ChatGPT tenían la capacidad de escuchar preguntas habladas y responder con audio transcribiendo las preguntas a texto, pasándolas por su algoritmo de IA y leyendo después su respuesta de texto en voz alta. Pero las nuevas funciones de voz se basan en el último modelo de IA de OpenAI, que procesa directamente el audio sin necesidad de convertirlo primero en texto.
Esto permite al robot escuchar varias voces a la vez y determinar el tono de voz de una persona, respondiendo de forma diferente en función de lo que piensa que son las emociones de la persona.
Esto abre un nuevo abanico de preguntas, como por ejemplo cómo entran en juego las diferencias culturales o si las personas podrían entablar relaciones con bots entrenados para responder a sus emociones de formas específicas.
OpenAI afirma que ha trabajado con personas que representan 45 idiomas y 29 “geografías” para mejorar las capacidades del modelo de IA. Sólo se podrán utilizar cuatro voces únicas, y la herramienta bloqueará los intentos de que el bot genere voces de personas reales, afirma la empresa.
(c) 2024, The Washington Post
Últimas Noticias
Harvard rechaza exigencias del gobierno de EEUU pese al riesgo de perder fondos federales
La prestigiosa universidad se negó a implementar cambios estructurales en su gobernanza, admisiones y políticas de contratación

Estudio cita 17 factores vinculados a accidente cerebrovascular, demencia y depresión en la vejez
Un estudio identificó factores modificables vinculados a enfermedades cerebrales en adultos mayores, destacando la hipertensión y la inactividad como riesgos clave

Siria intenta cortar las últimas redes de contrabando de armas y dinero en efectivo vinculadas al régimen de Irán
Tras derrocar a Al Assad, los nuevos gobernantes sirios han acabado con el “puente terrestre” que Teherán utilizaba para proyectar su poder regional armando a los terroristas de Hezbollah y otros aliados

Un millón de deportados en 2025: el objetivo de Trump en su plan contra los migrantes ilegales
Funcionarios de inmigración y analistas son cada vez más escépticos de que el gobierno pueda deportar a tantas personas en un año

Las pocas libertades de las que gozaban los norcoreanos han desaparecido
La ciudad de Hyesan, justo al otro lado del río con China, ofrecía antaño un atisbo de una Corea del Norte más abierta. Ahora ejemplifica el creciente autoritarismo de Kim Jong Un
