
Cada vez es más común hablar con asistentes virtuales para resolver tareas diarias. Ahora, esa conversación ya no se limita a texto o voz: también puede incluir lo que el usuario está viendo.
Google ha empezado a ampliar una herramienta llamada Gemini Live, que permite interactuar con inteligencia artificial a partir de lo que se muestra en la cámara del celular o en la pantalla, en tiempo real.
Esto significa que una persona puede apuntar con la cámara a un objeto, compartir su pantalla mientras navega por internet o mostrar el contenido de una app, y recibir respuestas habladas o escritas según lo que la inteligencia artificial detecte.

La función está disponible para quienes usan el plan de pago Gemini Advanced, y ya puede utilizarse en dispositivos como los teléfonos Google Pixel 9 y Samsung Galaxy S25.
Gemini Live está disponible en más de 45 idiomas y sigue una línea similar a la presentada por OpenAI en diciembre de 2024, cuando incorporó la capacidad de visión en tiempo real en ChatGPT. Ambas tecnologías buscan integrar la inteligencia artificial en actividades diarias sin depender del uso del teclado.
Organización de espacios físicos
Una de las formas más destacadas de uso es la reorganización del entorno doméstico. Al activar el modo de cámara y enfocar, por ejemplo, un estante o un cajón desordenado, Gemini puede proponer estrategias para clasificar los objetos, optimizar el uso del espacio o decidir qué elementos pueden ser descartados.

Durante la tarea, la IA permanece disponible para responder a preguntas específicas o realizar recomendaciones contextuales a medida que avanza el proceso.
Apoyo en procesos creativos
Gemini Live también se ha utilizado como herramienta de apoyo para personas involucradas en procesos creativos. A través del modo de pantalla, el usuario puede compartir imágenes que considere inspiradoras, como texturas o paletas de color, y solicitar sugerencias para proyectos gráficos, literarios o manualidades.
El modelo responde con ideas estructuradas o asociaciones visuales que pueden estimular el desarrollo del proyecto en curso.

Asistencia en reparaciones domésticas
El modo de cámara permite enfocar objetos o dispositivos que presentan fallas y recibir orientación sobre posibles soluciones.
Por ejemplo, al mostrar una silla desajustada o un aparato electrónico que no funciona correctamente, Gemini puede identificar el objeto y ofrecer indicaciones paso a paso para resolver el problema.
Esta interacción se realiza por voz y en tiempo real, sin necesidad de realizar búsquedas manuales.

Comparación de productos durante compras
Durante procesos de compra en línea, el modo de pantalla convierte a Gemini en un asistente capaz de analizar productos, comparar características o sugerir combinaciones.
En paralelo, el usuario puede utilizar la cámara para mostrar prendas del armario y solicitar ideas sobre cómo combinarlas. La herramienta ofrece información adicional sobre los artículos consultados, sin necesidad de salir del sitio web en el que se realiza la compra.
Revisión de contenidos digitales
También es posible compartir la pantalla con Gemini para recibir observaciones sobre contenidos digitales personales, como blogs, publicaciones en redes sociales o presentaciones visuales.

La IA puede señalar aspectos a mejorar en la composición, el estilo del texto o el uso de imágenes, y formular recomendaciones para optimizar el impacto del contenido. Este tipo de retroalimentación se adapta al formato y al contexto específico del material compartido.
Gemini Live representa una nueva etapa en la integración de la inteligencia artificial en dispositivos móviles, al incorporar la percepción visual como una fuente directa de datos para el modelo. Aunque su uso sigue limitado a ciertos dispositivos y requiere una suscripción avanzada, la expansión de esta funcionalidad indica una tendencia hacia asistentes capaces de operar en entornos físicos y digitales de manera simultánea.
Últimas Noticias
Cuál debería ser la capital de México si no fuese Ciudad de México, según la inteligencia artificial
La selección de esta ciudad se basa en datos sobre ubicación, población, infraestructura, conectividad y presencia de instituciones

Si el iPhone tiene poca carga y no hay cargador, activa esta función para ahorrar batería de inmediato
Los teléfonos de Apple cuentan en su configuración con una opción que adapta su funcionamiento para evitar que se apague en el menor tiempo posible

Día Q, la amenaza invisible que podría romper internet sin previo aviso
Un avance cuántico aún sin fecha podría desactivar los sistemas que protegen tus datos bancarios, mensajes privados y hasta las redes del gobierno sin que nadie lo vea venir

Por qué la película ‘Los dos papas’ es tendencia y qué plataforma es segura para verla, tras la muerte del papá Francisco
A propósito de la muerte del papa Francisco, muchos creyentes y el público en general se ha interesado en la vida del argentino desde su infancia hasta su elección como sumo pontífice

Nueva campaña de phishing pone en peligro las cuentas de Gmail: cómo protegerlas
Un ataque sofisticado a través de un correo aparentemente legítimo pone en riesgo cuentas de Gmail; descubre cómo reconocerlo y proteger tus datos con herramientas como la verificación en dos pasos
