Wikimedia da acceso a las aplicaciones de IA a una base de datos verificables, gratuitos y abiertos

Guardar

Wikimedia ha puesto en marcha Wikidata Embedding, un proyecto que busca facilitar a los desarrolladores de aplicaciones de inteligencia artificial (IA) generativa el acceso a datos verificables, gratuitos y abiertos.

El nuevo proyecto de integración presentado por Wikimedia Alemania ofrece una base de datos con cerca de 120 millones de entradas de Wikidata revisadas por profesionales para que puedan utilizarla en aplicaciones de IA generativa.

Se trata de datos estructurados, diseñados para lenguaje natural, y para que los modelos de IA puedan comprenderlos, ofrecen el contenido como datos vectoriales. Con el Protocolo de Contexto de Modelo (MCP), aseguran que la IA pueda comunicarse con la base de datos y con la técnica de Generación Aumentada de Recuperación (RAG), que pueda recuperar datos actualizados, lo que contribuye a reducir las respuestas incorrectas o inventadas.

Con ello, buscan resolver un problema que ya se ve en aplicaciones como ChatGPT o la búsqueda con IA de Google: que "a menudo no ofrecen respuestas fiables" y "las referencias precisas a las fuentes son escasas, ya que la mayoría de los sistemas de IA se basan en conjuntos de datos opacos", indican en un comunicado compartido en su blog oficial.

Este proyecto cuenta con el apoyo de DataStax, empresa de IBM y proveedor líder de soluciones de IA y datos, y Jina AI, empresa berlinesa especializada en búsquedas basadas en IA, y se dirige a desarrolladores que no cuentan con tantos recursos y del movimiento del 'software' libre.