La inteligencia artificial, a pesar de sus avances, enfrenta dificultades en los diagnósticos médicos sin supervisión humana. Un estudio reciente revela que, si bien los chatbots como Gemini, Grok, DeepSeek o Chat GPT aciertan con información completa, fallan en la etapa inicial del diagnóstico y al discernir entre diversas enfermedades, donde el razonamiento clínico es crucial.
Investigadores de la incubadora de innovación MESH de Boston han evaluado 21 modelos avanzados de inteligencia artificial en escenarios clínicos. Descubrieron que, si bien estos modelos aciertan en más del 90% de los casos con información completa, presentan deficiencias al inicio del proceso diagnóstico, dependiendo en gran medida del razonamiento humano.
Limitaciones y potencial de la IA en medicina
Los modelos de IA son buenos en la emisión de diagnósticos finales precisos, pero carecen al proponer diagnósticos diferenciales, un aspecto fundamental del razonamiento clínico. Según Marc Succi, director de la Incubadora MESH, la IA aún no está lista para la toma de decisiones médicas autónomas.
La capacidad de la IA para ofrecer diagnósticos acertados se ve potenciada cuando se emplea como apoyo al profesional de la salud, siempre que se disponga de todos los datos relevantes. No obstante, replicar el razonamiento clínico humano sigue siendo un desafío insuperable para la inteligencia artificial en la actualidad.
Evaluación de modelos de IA en medicina
Para evaluar la competencia de los modelos de IA en diagnósticos potenciales, el equipo desarrolló el índice PrIME-LLM. Este indicador destaca las fortalezas y debilidades de los modelos en cada etapa del proceso diagnóstico, evidenciando su eficacia en ciertas áreas y sus fallos en otras.
El estudio comparativo de los modelos, incluyendo ChatGPT, DeepSeek, Claude, Gemini y Grok, revela mejoras constantes en los modelos más recientes. Las puntuaciones de los modelos oscilaron entre el 64% y el 78%, demostrando avances significativos en la precisión cuando se incorporan datos no textuales.
Recomendaciones y reflexiones finales
El uso de la IA en medicina plantea desafíos y oportunidades. Si bien los modelos de lenguaje han demostrado ser eficaces en diagnósticos finales, es esencial reconocer sus limitaciones en el razonamiento clínico inicial. La supervisión humana sigue siendo imprescindible para garantizar la precisión y la ética en el proceso diagnóstico.
En resumen, la inteligencia artificial en medicina representa un avance significativo, pero aún se encuentra en evolución. Combinar la tecnología con la experiencia humana sigue siendo la clave para un diagnóstico preciso y efectivo en la atención médica del futuro.
Source: www.eldiario.es
