Habla con tus correos y archivos de manera muy sencilla con la IA de Google Gemini

La nueva función combinará voz y video para conectar aplicaciones como Gmail y Drive

Guardar
Gemini permitirá interactuar con correos
Gemini permitirá interactuar con correos y documentos de Google usando comandos hablados y visuales. (REUTERS/Dado Ruvic/Illustration)

Gemini sigue creciendo y ahora está trabajando en una función que le permitirá a los usuarios tener una conversación más directa con sus correos, documentos y archivos en general que estén en las aplicaciones de Google.

Esta nueva funcionalidad aún no ha sido lanzada de manera oficial, pero ya se ha detectado en la versión beta de la app de Gemini, pero ya se conocen detalles de cómo operará y lo que se podrá hacer con ella, más allá del chat que ya está disponible en algunas versiones pagas de Google.

<b>Cómo será posible hablar con las aplicaciones de Google</b>

Gemini, el chatbot desarrollado por Google, ya cuenta desde hace un tiempo con la capacidad de interactuar con herramientas como Gmail, Drive, Calendar, Google Home y servicios externos como Spotify. Esta interacción no se limita a respuestas automáticas, sino que incluye acciones ejecutables: puede leer y resumir documentos almacenados en Drive, gestionar citas a partir del calendario del usuario o encender dispositivos inteligentes del hogar.

Todo esto ocurre dentro de la interfaz de texto del chatbot, pero el nuevo paso implica trasladar estas capacidades a Gemini Live, la variante de interacción por voz y video.

Usuarios podrán activar bombillas inteligentes
Usuarios podrán activar bombillas inteligentes y reproducir música con comandos en Gemini Live. (GOOGLE)

Según reportes de Android Police y Android Authority, Gemini Live se prepara para adoptar las “Apps” o extensiones de Gemini, una función que permitirá extender su uso más allá de la simple conversación, habilitando una sinergia operativa más fluida con el entorno digital cotidiano del usuario.

Hasta ahora, Gemini Live ofrecía la posibilidad de mantener conversaciones ininterrumpidas y naturales con el modelo de lenguaje, e incluso analizar contenidos mostrados a través de la cámara o la pantalla compartida del teléfono. Con la próxima incorporación de las extensiones, esta experiencia se volverá aún más poderosa.

La clave de esta evolución radica en la posibilidad de ejecutar acciones complejas dentro de una conversación hablada o visual con Gemini Live. Por ejemplo, bastará con que el usuario apunte la cámara de su teléfono a una bombilla inteligente para que el asistente comprenda la intención de encenderla y realice la acción a través de Google Home.

La integración de Gemini en
La integración de Gemini en Google Home permitirá gestionarlo visualizando objetos con la cámara. (REUTERS/Gonzalo Fuentes)

Lo mismo ocurrirá si el usuario señala su parlante inteligente y le solicita reproducir una canción específica desde Spotify.

Según el análisis del APK de la app beta de Google (versión 16.17.38.sa.arm64 beta), ya existen referencias directas a esta implementación en desarrollo. Aunque no hay una fecha oficial de lanzamiento, se presume que Google podría anunciarla en su evento Google I/O 2025, manteniéndola como una carta fuerte para presentar avances en IA aplicada al entorno cotidiano.

Por el momento, se sabe que la incorporación de estas funciones se realizará en fases, repitiendo la estrategia que utilizó la compañía para desplegar Gemini en sus distintas versiones. Esta progresión por etapas apunta a asegurar la estabilidad del sistema y afinar la compatibilidad con los múltiples servicios asociados.

Para qué servirá hablar con los archivos y correos

Gemini Live será capaz de ejecutar comandos simples y podrá procesar la información visual captada a través de la cámara o pantalla compartida y conectar esa interpretación con servicios como Gmail, Calendar o Drive.

Gemini Live facilitará resúmenes de
Gemini Live facilitará resúmenes de documentos y consultas de calendario en tiempo real. (GOOGLE)

Esto permitirá que, en medio de una conversación fluida, el usuario pueda recibir respuestas contextuales vinculadas a sus datos personales, documentos o eventos sin necesidad de interrumpir el intercambio ni abandonar la aplicación.

Por ejemplo, al estar dialogando con Gemini Live, un usuario podría solicitar un resumen de un documento específico de Drive o consultar la disponibilidad para una reunión sin necesidad de teclear nada. La IA extraería la información correspondiente y respondería en tiempo real, completando así un ciclo de interacción continuo, sin fricción.

Además de los dispositivos móviles, esta funcionalidad se proyecta como un componente central de la estrategia de Google para sus futuros productos de realidad extendida.

En colaboración con Samsung, la compañía desarrolla unas gafas inteligentes potenciadas por Android XR, que incluirán Gemini Live como asistente virtual integrado. La posibilidad de mirar un objeto o entorno y hablar directamente con el asistente para ejecutar una acción marca un punto de inflexión en la interacción hombre-máquina.