
Ya no es necesario escribir guiones ni grabar voces para producir un podcast. Google amplió las capacidades de su herramienta de inteligencia artificial (IA) que genera resúmenes de audio, permitiendo ahora su uso en más de 50 idiomas, incluidos español, portugués, francés, turco, coreano y chino.
La función, disponible a través de la plataforma Gemini y la aplicación NotebookLM, convierte documentos, presentaciones y archivos en conversaciones de audio simuladas entre dos presentadores de IA.
Hasta hace poco, esta tecnología solo operaba en inglés, pero ahora es posible configurar el idioma de salida desde la sección de ajustes en NotebookLM, tanto en su versión web como en dispositivos móviles.

Para cambiar de idioma, los usuarios deben dirigirse a NotebookLM, seleccionar la configuración ubicada en la esquina superior derecha de la pantalla y elegir “Idioma de salida”.
Desde allí, se puede seleccionar el idioma preferido para recibir respuestas, escuchar los resúmenes en formato de audio y ajustar otros parámetros de salida de la conversación generada.
Cómo funcionan los ‘Resúmenes de audio’ de Google
Los ‘Resúmenes de audio’ transforman documentos, diapositivas e incluso informes de investigación extensos en discusiones estilo podcast.

La tecnología genera de forma automática las voces y los guiones a través de sistemas conversacionales que permiten simular una discusión profunda basada en el contenido proporcionado. La locución y el diseño del diálogo no requieren intervención humana en ningún momento del proceso.
Desde su lanzamiento inicial en 2023, Audio Overviews —nombre que recibe esta función en inglés— ha sido incorporado en diversas plataformas de Google. Además de NotebookLM, la herramienta está disponible en el chatbot Gemini y en Google Docs, extendiendo su capacidad para convertir distintos tipos de contenido escrito en material sonoro apto para la escucha en distintos contextos.
Aunque la expansión reciente permite su uso en múltiples idiomas, el acceso completo a la función sigue estando limitado a suscriptores de los planes Gemini y Gemini Advanced.

La herramienta se basa en NotebookLM, el asistente de lectura y análisis de textos de Google. Desde allí, los usuarios pueden cargar documentos, informes académicos, análisis sectoriales o presentaciones corporativas, y generar automáticamente versiones sonoras de su contenido para su posterior consumo auditivo.
Esto permite procesar información de manera auditiva mientras se realizan otras actividades cotidianas, según explicó la empresa: “Puedes escuchar estas discusiones generadas por IA para obtener nuevos conocimientos y mantenerte informado, incluso mientras realizas múltiples tareas”.
Actualmente, los resúmenes generados en idiomas distintos del inglés están disponibles en fase experimental, y Google no ha especificado fechas concretas para una implementación global definitiva.

A diferencia de sistemas que se limitan a ofrecer transcripciones o resúmenes textuales, los ‘Resúmenes de audio’ integran elementos de síntesis, organización narrativa y locución artificial, imitando el ritmo, las pausas y la estructura de una conversación entre personas.
Entre los usos previstos se encuentran la revisión de apuntes académicos, el resumen de informes corporativos, la actualización de tendencias sectoriales o la preparación de presentaciones.
El contenido generado puede ser compartido o descargado para escucharlo en distintos momentos y dispositivos, sin necesidad de conocimientos técnicos avanzados ni experiencia previa en producción de audio.

La creación de voces artificiales a partir de texto no es una innovación reciente, pero su incorporación en herramientas de consumo masivo como Gemini podría enmarcar un cambio significativo en la forma de producir, consumir y distribuir información de manera automatizada.
Funciones como los ‘Resúmenes de audio’ automatizan procesos que, hasta ahora, requerían escritura, grabación y edición manual, tradicionalmente realizados por equipos humanos.
La disponibilidad en más de 50 idiomas marca un paso relevante en la estrategia de Google por integrar capacidades generativas de voz en sus servicios de productividad y comunicación, en un contexto donde la automatización de contenidos continúa expandiéndose en múltiples industrias tecnológicas, educativas y empresariales.
Últimas Noticias
Netflix: cuántos dispositivos pueden usarse con el plan básico
La respuesta varía según el país: en algunos casos se permite usar uno o dos dispositivos a la vez, pero nunca más de esa cantidad

El universo de Star Wars invade Fortnite con un skin gratis de Stormtrooper: cómo tenerlo
Los jugadores también podrán ver de forma anticipada los dos primeros episodios de la nueva serie ‘Star Wars: Historias del Inframundo’

Cada cuántos años se debe cambiar de celular y por qué
La batería es uno de los elementos que determinan la vida útil de un teléfono móvil, ya que su capacidad se degrada con el tiempo debido a los ciclos de carga y descarga

Qué pasa si se va la luz estando dentro de un ascensor
Cuando se interrumpe el suministro, el sistema deja de operar de forma inmediata y automática en el punto exacto en el que se encontraba

Qué es la inteligencia artificial explicable y por qué cambiará la forma de ver la tecnología
La creciente integración tecnológica en la sociedad demanda transparencia en sus procesos. The Economist alertó que se trata de un proceso clave para asegurar el futuro de los sistemas
