Microsoft dice que su inteligencia artificial supera a médicos en diagnósticos complejos

Una investigación basada en 304 casos del New England Journal of Medicine mostró que la inteligencia artificial de Microsoft resolvió más del 80% de diagnósticos difíciles, frente al 20% logrado por médicos humanos sin recursos externos

Guardar
Microsoft impulsa la inteligencia artificial
Microsoft impulsa la inteligencia artificial hacia la “superinteligencia médica” con un sistema que supera a los médicos en diagnósticos complejos (Imagen Ilustrativa Infobae)

El desarrollo de inteligencia artificial médica por parte de Microsoft ha marcado un nuevo hito: su sistema, denominado MAI Diagnostic Orchestrator (MAI-DxO), ha demostrado una capacidad de diagnóstico superior a la de médicos humanos en casos clínicos complejos, según investigaciones recientes reportadas por The Guardian, Wired y Yahoo!. La compañía, bajo la dirección de Mustafa Suleyman, sostiene que este avance abre una “ruta hacia la superinteligencia médica”, aunque recalca que la IA no reemplazará el papel clínico de los profesionales de la salud.

El núcleo de la investigación de Microsoft reside en la simulación de un panel de médicos expertos que abordan casos “diagnósticamente complejos y exigentes desde el punto de vista intelectual”. Para evaluar la eficacia de su sistema, el equipo utilizó 304 estudios de caso extraídos del New England Journal of Medicine (NEJM), transformándolos en desafíos interactivos que replican el proceso real de diagnóstico: analizar síntomas, solicitar pruebas y llegar a una conclusión clínica.

El sistema MAI-DxO, diseñado para coordinar varios modelos de IA líderes —incluidos los desarrollados por OpenAI, Google, Meta, Anthropic y xAI—, actúa como un “orquestador diagnóstico”. Este mecanismo consulta a los modelos en una dinámica que imita el debate entre expertos, permitiendo que la IA proponga qué pruebas solicitar y cuál podría ser el diagnóstico final. Cuando se combinó con el modelo avanzado o3 de OpenAI, el sistema logró resolver correctamente más del 80% de los casos del NEJM, mientras que los médicos humanos, trabajando sin acceso a recursos externos, alcanzaron una tasa de acierto del 20%. En palabras de Suleyman, “este mecanismo de orquestación —múltiples agentes que colaboran en una cadena de debate— es lo que nos acerca a la superinteligencia médica”.

La IA médica de Microsoft
La IA médica de Microsoft reduce costos en un 20% sin sacrificar precisión diagnóstica (Imagen Ilustrativa Infobae)

El impacto económico también resulta notable. Según los datos presentados, el sistema de Microsoft redujo los costos en un 20% al seleccionar pruebas y procedimientos menos costosos, manteniendo o mejorando la precisión diagnóstica. Dominic King, vicepresidente de Microsoft involucrado en el proyecto, afirmó: “Nuestro modelo rinde de forma sobresaliente, tanto al llegar al diagnóstico como al hacerlo de manera muy eficiente en costos”.

A pesar de estos resultados, la compañía insiste en que la IA no sustituirá a los médicos. En un comunicado, Microsoft subrayó: “Las funciones clínicas de los médicos van mucho más allá de emitir un diagnóstico. Deben gestionar la ambigüedad y generar confianza con los pacientes y sus familias, algo para lo que la IA no está diseñada”. Suleyman, en declaraciones a Yahoo!, reforzó esta idea: “El médico estará ahí para tomar la decisión adecuada en el momento oportuno, planificar el tratamiento tras el diagnóstico y supervisar y responsabilizarse de la IA”.

El proyecto de Microsoft se diferencia de investigaciones previas porque reproduce con mayor fidelidad el proceso de razonamiento clínico humano, en lugar de limitarse a responder preguntas de opción múltiple. La empresa cuestionó la validez de pruebas como el United States Medical Licensing Examination para evaluar la competencia real de la IA, argumentando que estos exámenes favorecen la memorización sobre la comprensión profunda.

El desarrollo de MAI-DxO ha contado con la incorporación de destacados investigadores de Google, reflejando la creciente competencia por el talento en inteligencia artificial. Suleyman, quien anteriormente cofundó DeepMind (adquirida por Google en 2014) y lideró proyectos de IA en Google antes de unirse a Microsoft en marzo de 2024, ahora supervisa todos los productos de IA de consumo de la empresa, incluyendo Copilot, Bing, MSN y Edge.

El estudio utilizó 304 casos
El estudio utilizó 304 casos del New England Journal of Medicine para evaluar la IA (Imagen Ilustrativa Infobae)

El uso de IA en el sector sanitario estadounidense ya es habitual en áreas como la interpretación de imágenes médicas, pero la llegada de modelos multimodales capaces de abordar diagnósticos generales plantea nuevos retos, especialmente en relación con posibles sesgos derivados de los datos de entrenamiento. David Sontag, científico del MIT y cofundador de Layer Health, valoró la rigurosidad metodológica del estudio, aunque advirtió que los médicos participantes no pudieron utilizar herramientas adicionales, lo que podría no reflejar la práctica clínica real. Eric Topol, del Scripps Research Institute, destacó que el informe aborda casos de alta complejidad y que demostrar la reducción de costes es un avance novedoso.

Microsoft reconoce que su sistema aún no está listo para su uso clínico generalizado. La empresa señala la necesidad de realizar más pruebas, especialmente en síntomas más comunes, y de validar la herramienta en ensayos clínicos comparativos con médicos en situaciones reales. Suleyman anticipó que en los próximos años se intensificarán los esfuerzos para demostrar la eficacia de estos sistemas en el mundo real.

La colaboración entre Microsoft y OpenAI, que ha supuesto una inversión de casi USD 14.000 millones y ha elevado la valoración de OpenAI a USD 325.000 millones, sigue siendo estratégica para ambos, a pesar de recientes tensiones sobre el control y la dirección futura de la alianza. El acuerdo, vigente hasta 2030, podría finalizar antes si OpenAI declara haber alcanzado la inteligencia artificial general (AGI). Suleyman minimizó cualquier conflicto, describiendo la relación como “en buena forma” y anticipando su continuidad durante al menos cinco años más.