
La creación de la base de datos Pico-Banana-400K se apoyó en el uso de la herramienta Nano Banana (Gemini 2.5 Flash Image), una tecnología que permitió a Apple conformar un conjunto diverso a partir de fotografías provenientes de OpenImages, generando múltiples pares de edición para cada imagen. De acuerdo con información publicada por el medio, el conjunto, compuesto por 400.000 imágenes de alta calidad, se encuentra disponible para la comunidad investigadora en la plataforma GitHub con una licencia de uso restringida al ámbito no comercial. La noticia principal radica en que Apple ha desarrollado y puesto a disposición pública una colección masiva y diversa de imágenes destinadas a entrenar modelos de inteligencia artificial enfocados en la generación de imágenes.
Según detalló el medio, este repositorio ha sido confeccionado poniendo especial atención tanto en la calidad visual de las fotografías como en su diversidad, criterios fundamentales para el desarrollo de modelos de inteligencia artificial que requieren grandes volúmenes de datos realistas y variados. El acceso a Pico-Banana-400K, explicaron los responsables del proyecto en GitHub, está orientado a facilitar y potenciar la investigación académica, contribuyendo con recursos que hasta ahora escaseaban debido a la falta de conjuntos de imágenes a gran escala, abiertos y generados a partir de material real.
El medio precisó que las imágenes incluidas en el conjunto cubren 35 tipos diferentes de edición organizados en ocho categorías semánticas. Estas categorías están diseñadas para representar un espectro amplio de transformaciones, desde simples ajustes en el color o la luminosidad hasta ediciones complejas que afectan a objetos de alto nivel, escenas completas y atributos estilísticos. Tal como se expone en el repositorio de GitHub, estas transformaciones pretenden simular intervenciones diversas que suelen aplicarse en los procesos de edición y generación de imágenes utilizadas en la inteligencia artificial moderna.
Pico-Banana-400K tiene como objetivo principal servir de herramienta para el entrenamiento de modelos de generación de imágenes guiados por texto, lo que implica la posibilidad de crear imágenes originales a partir de descripciones verbales. La base de datos responde a limitaciones identificadas por la investigación adjunta, publicada en ArXiv, referidas a la escasez de datos a gran escala que sean tanto de alta calidad como accesibles para la comunidad de investigación. La propuesta de Apple busca solventar la carencia de recursos que posibiliten la mejora de modelos entrenados en la comprensión y generación de imágenes complejas partiendo de instrucciones textuales.
El repositorio publicado en GitHub, según reportó el medio, resalta que el acceso a estos datos está sujeto a una licencia que prohíbe su uso comercial, enfocado exclusivamente a la investigación. El desarrollo de Pico-Banana-400K, especificó la plataforma, incluyó la selección cuidadosa de imágenes reales y la aplicación de ediciones controladas, todo documentado detalladamente en la publicación académica disponible en ArXiv, que explica las metodologías y los objetivos perseguidos en el proyecto.
La iniciativa responde a la tendencia creciente en la industria tecnológica de ofrecer conjuntos de datos abiertos para acelerar el avance de la inteligencia artificial, en particular la generación de imágenes, un campo que depende de grandes volúmenes de referencias visuales diversas y bien clasificadas. El medio subrayó que Pico-Banana-400K pretende beneficiar tanto el desarrollo de modelos novedosos como la evaluación objetiva de algoritmos existentes, proporcionando un estándar de referencia de acceso libre para la comunidad científica.
Además, el conjunto incorpora diferentes grados de edición, desde modificaciones sutiles en el color hasta transformaciones que alteran significativamente el contenido de la imagen, lo que lo hace útil para investigaciones que requieren analizar la capacidad de los modelos de IA para entender la coherencia visual y los matices estilísticos. La diversidad de ediciones y categorías semánticas incluidas ha sido determinada para contemplar distintos usos potenciales en la investigación, como la generación condicionada, la transferencia de estilo visual y la manipulación controlada de escenas.
En conclusión, según informó el medio, la publicación de Pico-Banana-400K refuerza el interés de Apple en aportar herramientas de utilidad pública enfocadas en la investigación en inteligencia artificial. Facilitar el acceso abierto a grandes colecciones de datos de alta calidad se presenta como un factor esencial para contribuir al desarrollo y mejora de modelos de generación de imágenes cada vez más precisos, flexibles y capaces de responder a las demandas de la investigación científica internacional.
Últimas Noticias
James Dyson Award 2025 premia un sensor de calidad del agua con IA y un teclado inteligente para enfermos de Parkinson

Zelenski anuncia la llegada de sistemas de misiles Patriot a Ucrania pero subraya que "se necesitan más"

Robin Le Normand sufre una hiperextensión en la rodilla izquierda

'Cholo' Simeone: "Fuimos de menos a más, parecido al partido con el Sevilla"

Un terremoto de magnitud 6,3 sacude el norte de Afganistán
