Así funcionan las videollamadas traducidas en tiempo real en Google Meet gracias a la IA

Español e inglés son los primeros idiomas disponibles en la aplicación, que usa tecnología de Gemini

Guardar
Demostraciones de la IA y capacidad de traducir videollamadas.

Con la llegada de la inteligencia artificial a Google Meet se eliminó una de las grandes barreras de comunicación: el idioma. Una nueva función permite el doblaje en tiempo real para que cada interlocutor se comunique y escuche en su idioma.

Esto es gracias a Gemini, que puede traducir voces durante reuniones virtuales de hasta 100 participantes con un alto nivel de naturalidad, ya que se preservan el tono, el ritmo y la expresión de la voz original, acercando a personas de distintos idiomas y culturas sin perder autenticidad en el diálogo.

Cómo es el funcionamiento del doblaje en Google Meet

Google Meet ya integraba subtítulos automáticos en varios idiomas y capacidades para tomar notas mediante IA. El reciente lanzamiento de la función de traducción y doblaje en tiempo real representa un salto cualitativo.

Según explicó Javier Martínez, director del equipo de preventa de Google Cloud, a la Cadena SER, “hasta ahora el sistema aprendía la voz y a partir de ahí podía sintetizarla y hablar con una voz parecida a la tuya. Este modelo traduce tu sonido y te lo devuelve directamente. La gran revolución de este nuevo sistema es que traducimos audio a audio”.

Gemini, la IA de Google,
Gemini, la IA de Google, traduce audio a audio y conserva el tono y la expresividad original de los participantes. (Google)

La mecánica de uso resulta sencilla para el usuario. Desde la misma interfaz habitual de videollamada, la persona puede activar la traducción simultánea, similar a la opción de subtítulos. Una vez habilitada, se establece una comunicación bidireccional: si un participante habla en inglés, la herramienta ofrece la traducción hablada en español, y viceversa, siempre con un leve retraso de apenas unos segundos.

El sonido original permanece en segundo plano, mientras que el doblaje pasa a primer plano, permitiendo seguir la conversación mediante la voz traducida, sin perder el timbre, el ritmo ni la expresividad característica del hablante.

El acceso a la herramienta está disponible para suscriptores de los planes Google AI Pro y Ultra en versión beta. Por ahora, solo están habilitados los idiomas español e inglés, pero la compañía ha confirmado que en las próximas semanas sumará más opciones lingüísticas.

Esta función elimina la necesidad de descargar componentes adicionales o realizar configuraciones complejas: solo es necesario habilitarla dentro de la plataforma.

El sistema de Google Meet
El sistema de Google Meet facilita la comunicación bidireccional en inglés y español, con más idiomas en camino. (Imagen Ilustrativa Infobae)

El sistema, al diferenciarse de los traductores convencionales, emula las particularidades vocales y emocionales de quienes hablan. Así, se garantiza que la traducción conserve el registro natural y auténtico, ofreciendo una experiencia cercana a la comunicación presencial.

Las traducciones no alteran la interacción entre las dos personas y no interrumpen la fluidez de la conversación. De acuerdo a las pruebas internas de Google, incluso en situaciones de conversación espontánea o negociaciones, la IA logra mantener intacto el estilo personal de cada interlocutor.

Cuál es la tecnología de IA detrás de las traducciones en Google Meet

El secreto del funcionamiento radica en la combinación de modelos de IA especializados en comprensión y síntesis del lenguaje. Gemini, la solución desarrollada por Google, forma parte crucial de este proceso.

Mientras que los modelos de traducción tradicionales realizan primero una transcripción y luego la traducen, Gemini opera traduciendo directamente señales de audio a audio. En pocos segundos, el participante escucha lo que su interlocutor dice en su propio idioma, conservando la voz y las emociones originales.

La tecnología de Gemini supera
La tecnología de Gemini supera a los traductores convencionales al emular las particularidades vocales y emocionales.(REUTERS/Dado Ruvic/Illustration/File Photo)

Durante una demostración en el Anfiteatro Shoreline de la sede de Google en California, la compañía presentó un video pregrabado donde una estadounidense y una latina conversaban sobre el alquiler de una casa, cada cual en su lengua nativa.

Los usuarios que acceden actualmente a la función beta a través de los planes premium de Google Meet pueden comunicarse de manera inmediata en inglés o español, mientras observan cómo la IA adapta sus voces y emociones a la lengua del interlocutor. Google ha anunciado que la herramienta pronto estará disponible para empresas y que planea ampliar el catálogo de idiomas.