Google revela cuál es la mejor inteligencia artificial para desarrollar apps de Android

Guardar

Google reveló qué inteligencia artificial es la mejor para desarrollar aplicativos para Android.

El desarrollo de aplicaciones móviles con ayuda de inteligencia artificial está avanzando rápidamente, y ahora Google ha publicado un nuevo sistema de evaluación para medir qué modelos son realmente útiles para programar en su ecosistema móvil.

El gigante tecnológico presentó Android Bench, un benchmark diseñado específicamente para evaluar la capacidad de las IA en tareas reales de desarrollo de apps para Android.

Según los resultados publicados por la compañía, el modelo mejor calificado es Gemini 3.1 Pro, que alcanzó una puntuación del 72,4 % en las pruebas. Este resultado lo posiciona como la inteligencia artificial más eficaz para desarrollar aplicaciones dentro del ecosistema Android, superando a modelos de otros competidores del sector.

Gemini 3.1 Pro es la mejor app para programar aplicaciones para Android.

Detrás del sistema de Google aparecen Claude Opus 4.6, desarrollado por Anthropic, con un 66,6 %, y GPT-5.2 Codex, de OpenAI, con 62,5 %. Estas herramientas completan los primeros lugares del ranking que busca determinar qué modelos de IA tienen mejor desempeño en programación móvil.

Google explicó que uno de los motivos para crear Android Bench es que muchos benchmarks actuales no reflejan las necesidades reales de los desarrolladores móviles.

Según la empresa, escribir código genérico en lenguajes como Python no representa la complejidad de construir aplicaciones completas para Android. El desarrollo móvil implica tareas más específicas, como gestionar el ciclo de vida de una actividad, trabajar con arquitecturas de software modernas o implementar sistemas de almacenamiento y sincronización de datos.

Google presentó Android Bench, un sistema capaz de evaluar a las IA que programan para Android. (Imagen Ilustrativa Infobae)

Por ese motivo, Android Bench fue diseñado para medir habilidades concretas relacionadas con la creación de aplicaciones dentro del sistema operativo móvil.

El benchmark está compuesto por 100 tareas de programación seleccionadas a partir de un conjunto inicial de casi 39.000 solicitudes de cambios (pull requests) publicadas en GitHub.

Para garantizar la relevancia de las pruebas, Google filtró repositorios con más de 500 estrellas y con actividad reciente en los últimos tres años. De esta forma, los modelos de IA se enfrentan a problemas de programación actuales y no a código antiguo o desactualizado.

Las pruebas evalúan la capacidad de los sistemas en cuatro áreas clave del desarrollo Android:

Diseño de interfaces de usuario
Manejo de procesos asíncronos
Persistencia de datos
Inyección de dependencias

Estas competencias representan gran parte del trabajo cotidiano de los desarrolladores profesionales.

Google evalúa constantemente a las IA, incluyendo a la suya, en el desarrollo de aplicaciones.

Además, el benchmark incluye tareas de diferentes niveles de complejidad. Algunas consisten en correcciones de menos de 30 líneas de código, mientras que otras requieren modificar más de 400 líneas, lo que permite evaluar tanto problemas simples como tareas propias de un desarrollador experimentado.

Otro detalle importante es que la mayoría de las tareas del benchmark se basan en Kotlin, el lenguaje principal para el desarrollo de aplicaciones Android en la actualidad.

En total, el 71 % de las pruebas utilizan Kotlin, mientras que el 25 % se basa en Java. El resto incluye otras configuraciones menores.

También se evaluaron distintos tipos de proyectos. Aunque muchas de las pruebas corresponden a aplicaciones completas, alrededor del 58 % de las tareas se orientan al desarrollo de librerías, una parte fundamental del ecosistema de software móvil.

Las pruebas que se realizaron se hicieron a través de Kotlin, donde se suele programar la mayor parte de las aplicaciones para Android.

Uno de los retos al evaluar modelos de inteligencia artificial es evitar que aprueben simplemente porque memorizaron fragmentos de código durante su entrenamiento.

Para evitar este problema, Google incluyó varias salvaguardas en el benchmark. Entre ellas se encuentra una verificación manual del proceso que sigue cada modelo al generar su solución.

Este sistema permite comprobar que los resultados obtenidos se deben realmente a la capacidad de razonamiento de la IA y no a la repetición de ejemplos aprendidos previamente.

Según Google, este enfoque busca ofrecer una medición más precisa del rendimiento de las herramientas de programación basadas en inteligencia artificial.

De acuerdo con la clasificación publicada en Android Bench, estos son los modelos con mejor desempeño en el desarrollo de aplicaciones móviles:

Gemini 3.1 Pro Preview – 72,4 %
Claude Opus 4.6 – 66,6 %
GPT-5.2 Codex – 62,5 %
Claude Opus 4.5 – 61,9 %
Gemini 3 Pro Preview – 60,4 %
Claude Sonnet 4.6 – 58,4 %
Claude Sonnet 4.5 – 54,2 %
Gemini 3 Flash Preview – 42 %
Gemini 2.5 Flash – 16,1 %

Google publicó su ranking de IA para desarrollar aplicaciones para Android. (Imagen ilustrativa Infobae)

Con este nuevo benchmark, Google busca ofrecer una referencia más clara para los desarrolladores que utilizan inteligencia artificial como herramienta de apoyo.

A medida que estas tecnologías evolucionan, evaluaciones especializadas como Android Bench podrían convertirse en un estándar para medir qué tan capaces son los modelos de IA de resolver problemas reales en el desarrollo de software móvil.

Últimas Noticias

Youtube en España: la lista de los 10 videos más reproducidos de este sábado

Google compró YouTube en el 2006 por un valor de 1650 millones de dólares; en ese entonces se visualizaban 100 millones de videos al día

Apple Music revelará si una canción fue hecha o no con inteligencia artificial

El nuevo sistema exigirá a discográficas y distribuidoras informar si una canción, su arte o su video ha sido creado con esta tecnología

¿Temes que te graben con gafas inteligentes? Una app te avisa si estos dispositivos están cerca de ti

La nueva herramienta analiza señales Bluetooth en tiempo real para ayudar a los usuarios a vigilar su privacidad

Qué significan los errores de Netflix R40, R12 o R25-1 en la pantalla de tu dispositivo

La plataforma de streaming ha implementado cambios en sus requisitos técnicos, provocando errores como R40 y R12 en algunos televisores, móviles y tabletas

Google revela cuál es la mejor inteligencia artificial para desarrollar apps de Android

Google presentó Android Bench, un benchmark diseñado para medir qué modelos de IA son más eficaces para desarrollar apps para Android

Un benchmark enfocado en desarrollo real

Cómo se realizó la evaluación

Predominio de Kotlin en las pruebas

Un sistema para medir habilidades reales

El ranking de las mejores IA para Android

Últimas Noticias

Youtube en España: la lista de los 10 videos más reproducidos de este sábado

Google compró YouTube en el 2006 por un valor de 1650 millones de dólares; en ese entonces se visualizaban 100 millones de videos al día

Apple Music revelará si una canción fue hecha o no con inteligencia artificial

El nuevo sistema exigirá a discográficas y distribuidoras informar si una canción, su arte o su video ha sido creado con esta tecnología

¿Temes que te graben con gafas inteligentes? Una app te avisa si estos dispositivos están cerca de ti

La nueva herramienta analiza señales Bluetooth en tiempo real para ayudar a los usuarios a vigilar su privacidad

Qué significan los errores de Netflix R40, R12 o R25-1 en la pantalla de tu dispositivo

La plataforma de streaming ha implementado cambios en sus requisitos técnicos, provocando errores como R40 y R12 en algunos televisores, móviles y tabletas

Así es Pomelli, la IA de Google para creadores de contenido y pequeñas empresas

Esta herramienta gratuita analiza el sitio web y la identidad visual de cada negocio para crear imágenes y anuncios profesionales

Franco Colapinto largará 16° el Gran Premio de Australia de Fórmula 1: Nico Varrone corre en la F2

Con goles de Lionel Messi y Rodrigo De Paul, Inter Miami le ganó 2-1 al DC United por la MLS

La foto de Cristiano Ronaldo desde Madrid en medio de las alarmas por su lesión: “Recuperándome y listo”

Francisco Cerúndolo sufrió en el debut, pero venció a Benjamin Bonzi y avanzó en Indian Wells

Pique al vacío y definición de categoría: el golazo de Lionel Messi para el Inter Miami en el triunfo frente al DC United

Mirtha Legrand sorprendió con su look: el detalle inesperado que marca un cambio en su estilo

Emily Lucius y Rodrigo Valladares Macri celebran su amor en boda llena de famosos, glamour y emociones

La periodista Valeria Schapira se accidentó al caer de una pasarela en Torres del Paine arrastrada por una ráfaga de casi 80 km/h

Las vacaciones de Sofía Gonet y Cami Mayan en Miami: de su encuentro con Bad Gyal a lujosas cenas

El divertido blooper de Sol Pérez y Guido Mazzoni durante su entrenamiento: “Re tranqui el sábado”

INFOBAE AMÉRICA

¿Se puede cultivar vida en Marte? Así sobreviven microorganismos en tierras que imitan al planeta rojo

Del Grammy Latino al Goya: Silvia Pérez Cruz brilla en duetos con Rosalía, Alba Flores y Residente

Al menos 12 muertos y un edificio residencial destruido tras nuevos bombardeos rusos en Kharkiv

No basta solo con cuidar los bosques: la huella de biodiversidad está en cada decisión diaria

Guy Ritchie revoluciona el mito de Sherlock Holmes en una versión para la Generación Z

Un benchmark enfocado en desarrollo real

Cómo se realizó la evaluación

Predominio de Kotlin en las pruebas

Un sistema para medir habilidades reales

El ranking de las mejores IA para Android

Temas Relacionados

Últimas Noticias

Youtube en España: la lista de los 10 videos más reproducidos de este sábado

Google compró YouTube en el 2006 por un valor de 1650 millones de dólares; en ese entonces se visualizaban 100 millones de videos al día

Apple Music revelará si una canción fue hecha o no con inteligencia artificial

El nuevo sistema exigirá a discográficas y distribuidoras informar si una canción, su arte o su video ha sido creado con esta tecnología

¿Temes que te graben con gafas inteligentes? Una app te avisa si estos dispositivos están cerca de ti

La nueva herramienta analiza señales Bluetooth en tiempo real para ayudar a los usuarios a vigilar su privacidad

Qué significan los errores de Netflix R40, R12 o R25-1 en la pantalla de tu dispositivo

La plataforma de streaming ha implementado cambios en sus requisitos técnicos, provocando errores como R40 y R12 en algunos televisores, móviles y tabletas

Así es Pomelli, la IA de Google para creadores de contenido y pequeñas empresas

Esta herramienta gratuita analiza el sitio web y la identidad visual de cada negocio para crear imágenes y anuncios profesionales

Franco Colapinto largará 16° el Gran Premio de Australia de Fórmula 1: Nico Varrone corre en la F2

Con goles de Lionel Messi y Rodrigo De Paul, Inter Miami le ganó 2-1 al DC United por la MLS

La foto de Cristiano Ronaldo desde Madrid en medio de las alarmas por su lesión: “Recuperándome y listo”

Francisco Cerúndolo sufrió en el debut, pero venció a Benjamin Bonzi y avanzó en Indian Wells

Pique al vacío y definición de categoría: el golazo de Lionel Messi para el Inter Miami en el triunfo frente al DC United

Mirtha Legrand sorprendió con su look: el detalle inesperado que marca un cambio en su estilo

Emily Lucius y Rodrigo Valladares Macri celebran su amor en boda llena de famosos, glamour y emociones

La periodista Valeria Schapira se accidentó al caer de una pasarela en Torres del Paine arrastrada por una ráfaga de casi 80 km/h

Las vacaciones de Sofía Gonet y Cami Mayan en Miami: de su encuentro con Bad Gyal a lujosas cenas

El divertido blooper de Sol Pérez y Guido Mazzoni durante su entrenamiento: “Re tranqui el sábado”

INFOBAE AMÉRICA

¿Se puede cultivar vida en Marte? Así sobreviven microorganismos en tierras que imitan al planeta rojo

Del Grammy Latino al Goya: Silvia Pérez Cruz brilla en duetos con Rosalía, Alba Flores y Residente

Al menos 12 muertos y un edificio residencial destruido tras nuevos bombardeos rusos en Kharkiv

No basta solo con cuidar los bosques: la huella de biodiversidad está en cada decisión diaria

Guy Ritchie revoluciona el mito de Sherlock Holmes en una versión para la Generación Z