OpenAI desarrolla una nueva herramienta capaz de generar música a partir de texto y audio

Los usuarios podrían emplear la plataforma para ambientar videos, crear acompañamientos personalizados y ajustar las composiciones en tiempo real a escenas generadas por IA

Guardar
La herramienta no solo aceptaría
La herramienta no solo aceptaría prompts de texto. REUTERS/Dado Ruvic

La inteligencia artificial da un paso más allá en el plano creativo con el desarrollo, por parte de OpenAI, de una innovadora herramienta generativa que permite componer piezas musicales originales a partir de instrucciones escritas o fragmentos de audio. De acuerdo con un informe publicado por The Information, esta nueva solución apunta a revolucionar la creación sonora automatizada, facilitando la obtención de melodías, arreglos y acompañamientos instrumentales a partir de simples indicaciones del usuario.

Nueva herramienta de OpenAI generaría música

La apuesta actual de OpenAI por la música surge después de varios años focalizados en modelos de procesamiento de lenguaje y síntesis de voz. En esta nueva etapa, la compañía habría reactivado iniciativas previas de generación musical, pero lo hace integrando los avances recientes logrados en inteligencia artificial para el análisis y recreación sonora.

Según las fuentes citadas por The Information, la herramienta no solo aceptaría prompts de texto, como descripciones detalladas sobre el carácter o el estilo musical deseado, sino que también permitiría usar muestras de audio como referencia.

La apuesta actual de OpenAI
La apuesta actual de OpenAI por la música surge después de varios años focalizados en modelos de procesamiento de lenguaje y síntesis de voz. (Imagen Ilustrativa Infobae)

Así, será posible solicitar acompañamientos para grabaciones vocales, bases rítmicas o melodías que complementen una pieza previamente existente o en desarrollo, orientando el resultado de la IA a afinidades musicales y sonidos específicos.

Esta propuesta apunta tanto al público general como a creadores de contenido y profesionales de la industria audiovisual, quienes podrían emplear la herramienta para musicalizar videos, producir acompañamientos personalizados y adaptar la música en tiempo real a escenas generadas por inteligencia artificial.

Colaboración con Juilliard y el enfoque artístico en la formación de la IA

Uno de los aspectos más novedosos del proyecto es la alianza estratégica entre OpenAI y estudiantes de la Juilliard School, reconocida escuela de arte y música. Los estudiantes colaboran en la elaboración de anotaciones de partituras que servirán como material de entrenamiento para el sistema.

Un elemento innovador del proyecto
Un elemento innovador del proyecto es la colaboración estratégica entre OpenAI y estudiantes de la Juilliard School. REUTERS/Dado Ruvic

Este enfoque busca que la IA internalice no solo la estructura formal de la música, sino también variables expresivas y complejidades como dinámica, intención y progresión armónica.

El trabajo conjunto con expertos musicales sugiere una diferencia respecto a otras plataformas de generación automática, priorizando la musicalidad y el sentido artístico más allá de una simple concatenación de notas o patrones repetitivos.

Cuándo se lanzará la herramienta generativa de música de OpenAI

Por el momento, OpenAI no ha confirmado una fecha exacta para el lanzamiento de la herramienta generativa de música ni ha definido si aparecerá como solución independiente o integrada en productos ya existentes, como ChatGPT o la nueva aplicación de video Sora.

Con la nueva herramienta de
Con la nueva herramienta de OpenAI será posible solicitar acompañamientos para grabaciones vocales, bases rítmicas o melodías. VisualesIA

Cualquiera de estas opciones ampliaría considerablemente su base de usuarios: desde aquellos que buscan musicalizar escenas con IA de manera automatizada, hasta quienes exploran nuevas fórmulas de creatividad digital en tiempo real.

Analistas sostienen que una integración con ChatGPT facilitaría su uso por parte del público general, mientras que sumar las posibilidades musicales a un entorno visual como Sora supondría un cambio de paradigma para la creación audiovisual automatizada, dinamizando la producción en áreas como la edición de video, la publicidad y los videojuegos.

Cómo funciona ChatGPT para procesar y responder audios

ChatGPT permite interactuar con audios en ciertas plataformas y aplicaciones compatibles. Los usuarios pueden grabar su voz o cargar archivos de audio, y el sistema procesa estos mensajes mediante reconocimiento automático del habla. Esta función convierte el contenido hablado en texto para facilitar la comprensión y la respuesta de la inteligencia artificial.

Tras realizar la transcripción, ChatGPT analiza la información y responde con textos escritos o, en algunos casos, mensajes de voz generados digitalmente. Esta capacidad amplía las posibilidades de comunicación y vuelve la interacción más accesible, especialmente para quienes prefieren el uso de mensajes de audio en lugar de texto.