
Google ha presentado una función impulsada por inteligencia artificial (IA) que permite crear contenido en formato podcast sin necesidad de grabaciones humanas. Se trata de los ‘Resúmenes de audio’, una herramienta integrada a la plataforma Gemini, que genera discusiones en audio a partir de documentos o archivos cargados por el usuario.
Esta tecnología se basa en la generación automática de voces y guiones por medio de sistemas conversacionales. En este caso, Gemini produce una conversación entre dos presentadores de IA que simulan una discusión sobre el contenido proporcionado por el usuario, sin intervención humana en la locución ni en el diseño del diálogo.
Según explicó la empresa, “los ‘Resúmenes de audio’ transforman tus documentos, diapositivas e incluso informes de ‘Deep Research’ en discusiones de audio estilo podcast”. La herramienta fue concebida para facilitar el procesamiento de información compleja mediante resúmenes auditivos generados en lenguaje natural.

De acuerdo con la compañía, para realizar el producto, “Gemini creará una discusión estilo podcast entre dos presentadores de IA que se lanzarán a una conversación profunda y animada basada en los archivos cargados. Los locutores resumirán el material, establecerán conexiones entre temas, participarán en un intercambio dinámico y proporcionarán perspectivas únicas”.
La herramienta está disponible, en esta primera fase, para suscriptores de los planes Gemini y Gemini Advanced en idioma inglés. Sin embargo, Google informó que próximamente se habilitará en más idiomas, aunque no especificó fechas concretas.
Los usos previstos para esta función abarcan desde la revisión de apuntes académicos hasta el resumen de informes corporativos o análisis de tendencias sectoriales.

La empresa destacó su utilidad para personas que requieren procesar información mientras realizan otras actividades. “Puedes escuchar estas discusiones generadas por IA para obtener nuevos conocimientos y mantenerte informado, incluso mientras realizas múltiples tareas”, aseguran desde Google.
A diferencia de otros sistemas automatizados que generan únicamente transcripciones o extractos textuales, los ‘Resúmenes de audio’ de Gemini integran elementos de síntesis, organización narrativa y locución artificial, reproduciendo el ritmo y tono de una conversación entre humanos.
La herramienta se basa en NotebookLM, un asistente de lectura y análisis de textos lanzado por Google en 2023, que permite a los usuarios subir documentos y hacer preguntas sobre su contenido. Los ‘Resúmenes de audio’ representan una extensión de esa tecnología hacia formatos multimedia.

Con esta función, Google avanza en su estrategia de integrar capacidades generativas de voz dentro de sus plataformas de productividad, en un contexto donde la creación automatizada de contenido ha adquirido protagonismo en múltiples industrias.
El desarrollo de sistemas que generan locución artificial a partir de texto no es nuevo, pero la integración de esas capacidades en herramientas de consumo masivo representa un cambio en la forma en que se produce y distribuye información.
Hasta ahora, el proceso tradicional de creación de podcasts requería una serie de pasos manuales —desde la escritura del guion hasta la edición final—. Con funciones como los ‘Resúmenes de audio’, este flujo de trabajo puede realizarse de forma completamente automatizada.

Aunque la herramienta aún se encuentra limitada por idioma y acceso, su disponibilidad marca un hito en la automatización del formato podcast, en línea con una tendencia más amplia de producción de contenido sin intervención humana directa. Google promueve esta capacidad como una forma de “dar vida a tus ideas”, utilizando únicamente insumos textuales como punto de partida.
Por ahora, la función está disponible en la web y la aplicación móvil de Gemini. El contenido generado puede ser compartido o descargado para escucharse en distintos momentos. La plataforma no requiere conocimientos técnicos avanzados ni experiencia previa en producción de audio, lo que sugiere un posible impacto en el modelo actual de creación de contenidos sonoros.
Últimas Noticias
WhatsApp trae la mejor función para compartir stickers al mismo tiempo con todos tus amigos
La aplicación de Meta está probando una nueva herramienta en algunos teléfonos Android y iOS y se espera que esté disponible en próximas actualizaciones

Google Cloud Next ‘25: conoce todas las innovaciones en IA que ahorran horas de tiempo
Los modelos Gemini de Google optimizan interacciones con clientes y eficiencia de costos, todo con desarrollos basados en inteligencia artificial

La estafa ‘silenciosa’: se esconde en pestañas inactivas de Chrome, Edge y más buscadores
Esta modalidad de ataque se llama tabnabbing y busca los datos de acceso de las cuentas de los usuarios

MrBeast critica los aranceles de Trump: un golpe a sus empresas y a los emprendedores
El youtuber asegura que esta decisión del presidente de Estados Unidos es un “el clavo en el ataúd” para las pequeñas empresas

Encuentran nueva estafa que pone en peligro la privacidad: todo empieza con una voz falsa hecha con IA
Los ciberdelincuentes hacen creer a sus víctimas que se están comunicando con una persona real que los ayudará a configurar los ajustes de privacidad de su correo electrónico
