Wikimedia ha puesto en marcha Wikidata Embedding, un proyecto que busca facilitar a los desarrolladores de aplicaciones de inteligencia artificial (IA) generativa el acceso a datos verificables, gratuitos y abiertos.
El nuevo proyecto de integración presentado por Wikimedia Alemania ofrece una base de datos con cerca de 120 millones de entradas de Wikidata revisadas por profesionales para que puedan utilizarla en aplicaciones de IA generativa.
Se trata de datos estructurados, diseñados para lenguaje natural, y para que los modelos de IA puedan comprenderlos, ofrecen el contenido como datos vectoriales. Con el Protocolo de Contexto de Modelo (MCP), aseguran que la IA pueda comunicarse con la base de datos y con la técnica de Generación Aumentada de Recuperación (RAG), que pueda recuperar datos actualizados, lo que contribuye a reducir las respuestas incorrectas o inventadas.
Con ello, buscan resolver un problema que ya se ve en aplicaciones como ChatGPT o la búsqueda con IA de Google: que "a menudo no ofrecen respuestas fiables" y "las referencias precisas a las fuentes son escasas, ya que la mayoría de los sistemas de IA se basan en conjuntos de datos opacos", indican en un comunicado compartido en su blog oficial.
Este proyecto cuenta con el apoyo de DataStax, empresa de IBM y proveedor líder de soluciones de IA y datos, y Jina AI, empresa berlinesa especializada en búsquedas basadas en IA, y se dirige a desarrolladores que no cuentan con tantos recursos y del movimiento del 'software' libre.
Últimas Noticias
El Salvador prohíbe el uso del "lenguaje inclusivo" en las escuelas públicas

El Senado argentino rechaza los vetos de Milei a la financiación universitaria y la emergencia pediátrica

Petro acusa a EEUU de hacer del Caribe zona de "agresión y colonización" tras su despliegue de aviones

China protesta por la invitación de opositores a eventos del Consulado de EEUU en Hong Kong

EEUU tacha la Global Sumud Flotilla de "provocación deliberada e innecesaria"
