Meta ha lanzado una herramienta de código abierto que utiliza sus modelos de lenguaje grande (LLM, por sus siglas inglés) Llama para transformar anotaciones en un audio tipo de pódcast al estilo de NotebookLM de Google.
NotebookLlama es "una versión de código abierto de NotebookLM", como describen directamente los ingenieros de Meta, que han compartido este modelo de lenguaje en GitHub, donde detallan su funcionamiento.
Esta herramienta parte de un documento escrito en pdf que procesa para analizar, limpiar y resumir con la ayuda de Llama 3.2 (1B-Instruct), y posteriormente lo transcribe con el apoyo de Llama 3.1 (70B-Instruct), un LLM que "proporcionó transcripciones de pódcast un poco más creativas" para los ejemplos probados por Meta.
También se puede utilizar el modelo Llama 3.1 (8B-Instruct) para hacer que esa transcripción sea "más dramática". Finalmente, se utiliza tecnología de texto a voz para "generar un pódcast conversacional" a partir de la transcripción.
Esta herramienta recuerda a la función 'Audio Overviews' de NotebookLM, que genera un programa de audio o pódcast a partir de las notas guardadas por el usuario. En el caso de la herramienta de Meta, la compañía matiza que las voces todavía no suenan muy naturales y los agentes de voz tampoco respetan el turno de palabra, dificultando el formato debate.
Últimas Noticias
El Ibex 35 cierra la semana apuntando a los 15.300 puntos tras cerrar en los 15.277 enteros, un 0,47% más

El Supremo de Brasil fija para el 2 de septiembre el juicio contra Bolsonaro por el intento de golpe de Estado

Trump asegura que los demócratas pagan a manifestantes para protestar contra su despliegue en Washington D.C.

VÍDEO: Trump confirma que tratará con Putin la situación territorial de Ucrania pero deja un acuerdo en manos de Kiev

Un acto civil despedirá al expresidente de Aragón, Javier Lambán, este sábado en Ejea
