La inteligencia colectiva es un enfoque prometedor para la mejora del diagnóstico médico, según un estudio que utiliza datos del Proyecto de Diagnóstico Humano (Human Dx) para evaluar la precisión diagnóstica en grupos de médicos y de estudiantes de medicina, comparándola con la de médicos individuales. Los resultados publicados en Jama Network Open muestran la superioridad de los diagnósticos agrupados y sugieren que la investigación se traslade a entornos clínicos.
Madrid, 16 de mayo de 2019. El diagnóstico es fundamental para la práctica de la medicina; sin embargo, los estudios sugieren que el error tiene una alta tasa de prevalencia incluso para afecciones comunes, con una importante morbilidad y mortalidad asociada. Durante siglos, el modelo predominante ha sido un profesional individual que evalúa al paciente y llega a un diagnóstico. Hoy todo apunta a que la inteligencia colectiva mejora el diagnóstico individual y así ha sido defendido por la Academia Nacional de Medicina para reducir los errores médicos. Prueba de ello son ya las rondas de equipos de médicos en las salas hospitalarias, las discusiones de casos y los comités de tumores.
Diagnosticar en grupo sería más efectivo incluso cuando solo intervienen dos médicos, observándose un aumento exponencial de la precisión en los grupos de nueve participantes. La mejora se percibe incluso en grupos de no especialistas frente a especialistas que evaluaban individualmente al paciente. Los datos se desprenden de un estudio de los departamentos de Medicina y Salud Pública de las universidades de Harvard y Washington, junto al Servicio de Medicina Interna y Atención Primaria del Hospital Brigham Women’s de Boston, en Estados Unidos. El investigador principal es Michael Barnett, médico de atención primaria y profesor del Departamento de Política y Gestión de la Salud en Harvard.
El proyecto se nutre de la plataforma online Human Dx, que se diseñó para apoyar la docencia de médicos, fellows (en Estados Unidos, los médicos que después de la residencia siguen en formación clínica y/o investigadora), residentes y estudiantes de medicina. En concreto, Barnett seleccionó todos los casos creados por usuarios entre el 7 de mayo de 2014 y el 5 de octubre de 2016, con 10 o más respuestas, lo que sumó un total de 1572 casos en los que habían participado 2.069 usuarios de 47 países. El 70.2 por ciento de los usuarios tenían formación en medicina interna; el 59.4 eran residentes o fellows; el 20.8, médicos en ejercicio y el 19.8, estudiantes de Medicina. Solo un 10 por ciento provenía de cirugía y otras especialidades.
El resultado incidió sobre la calidad diagnóstica, entendida como un diagnóstico correcto dentro del top tres de diagnósticos posibles. Para los grupos, los tres diagnósticos principales fueron un diferencial colectivo generado mediante una combinación ponderada de diagnósticos. Para tener en cuenta la agrupación de los participantes repetidos se usó una versión del test de McNemar. La conclusión: “un enfoque de inteligencia colectiva se asoció con mayor precisión diagnóstica en comparación con individuos, incluidos especialistas individuales cuya experiencia coincidió con el diagnóstico de casos, en una amplia gama de casos médicos”.
A mayor tamaño, mayor precisión
Este estudio transversal reveló que, en una amplia selección de casos clínicos en liínea y síntomas comunes, los diagnósticos diferenciales independientes realizados por varios médicos combinados en una lista ponderada superaron, de manera significativa, a los diagnósticos de médicos individuales, incluso con grupos tan pequeños como de 2, y la precisión aumentó en grupos más grandes de hasta 9 médicos. La media fue de 85.6 por ciento de precisión para el grupo versus 62.5 por ciento a título particular.
Los grupos de no especialistas también superaron significativamente a los especialistas individuales en la resolución de casos que coincidían con la especialidad del especialista individual. Entre otros análisis parciales, se comparó la precisión diagnóstica de los grupos con la de un especialista individual en casos prácticos de su propia especialidad médica, demostrándose la superioridad del diagnóstico grupal: 85.5 por ciento de precisión para un grupo de dos versus un 77.7 por ciento en especialistas individuales.
El rango de mejora varió según las especificaciones utilizadas para combinar los diagnósticos, pero los grupos superaron sistemáticamente a los individuos. La mejora absoluta en la precisión de los individuos con respecto a los grupos de 9 varió al presentar los síntomas de un aumento del 17.3% (IC 95%, 6.4% -28.2%; P = .002) para el dolor abdominal al 29.8% (IC 95%, 3.7% - 55.8%; P = .02) para la fiebre. Los grupos de 2 usuarios (77,7% de precisión; 95% CI, 70,1% -84,6%) a 9 usuarios (85,5% de precisión; 95% IC, 75,1% -95,9%) superaron a los especialistas individuales en su subespecialidad (66,3% de precisión; 95% IC, 59,1% -73,5%; p <0,001 frente a grupos de 2 y 9).
“La inteligencia colectiva aplicada a grupos de médicos en ejercicio y en periodos de formación se asocia con una mejora de la precisión diagnóstica si se compara con usuarios individuales en múltiples disciplinas clínicas”, destacan los autores, recordando que estamos ante un concepto relativamente nuevo, aunque la profesión médica confía desde hace tiempo en procesos grupales de toma de decisiones como la técnica Delphi o los comités de tumores.
Lápiz y papel
Hasta ahora esta es la mayor investigación sobre inteligencia colectiva para diagnóstico clínico en general, tanto por el número de médicos participantes como por la cantidad de casos clínicos utilizados. El estudio sugiere además la importancia de establecer un rango diagnóstico para construir un enfoque de inteligencia colectiva, gracias a las reglas de ponderación utilizadas para construir el diferencial colectivo y, por larga que sea la lista de diagnósticos combinados, lograr mínimos cambios de precisión en los dos primeros diagnósticos que la encabezan.
Los autores quieren trasladar futuras investigaciones a entornos clínicos, ayudándose o no de tecnologías de alto coste para implementar estrategias de inteligencia colectiva. Reconocen que, aunque disponer de smartphones e Internet podría agilizar la recogida e integración de las decisiones grupales, “la inteligencia colectiva no necesita software y es posible mejorar la precisión diagnóstica incluso usando lápiz y papel”, arguye el equipo de Barnett para defender la viabilidad de esta perspectiva diagnóstica con pocos recursos.
Los expertos advierten que el beneficio añadido del enfoque de inteligencia colectiva necesitaría ponderarse “según el tiempo y la carga de trabajo necesaria para ponerlo en práctica”, un aspecto más que refuerza la necesidad de evaluar este enfoque diagnóstico en la complejidad del mundo real. En opinión de estos expertos en Salud Pública “el enfoque de inteligencia colectiva ofrecería asistencia diagnóstica valiosa en las áreas de atención primaria con tasas más altas de error diagnóstico”.
Por otra parte, los investigadores reconocen limitaciones que devienen de los propios datos. Y es que, quienes aportan inputs al Human Dx podrían no ser una muestra representativa de la comunidad médica (el análisis incluye solo 431 médicos en ejercicio) y, además, esa plataforma no se diseñó específicamente para evaluar la inteligencia colectiva. En cualquier caso, Barnett insiste en que “agrupar los diagnósticos de múltiples médicos en una lista clasificada podría ser un enfoque eficaz para mejorar la precisión diagnóstica, pero se necesita más estudio en un entorno clínico”.
Referencia
Barnett M, Boddupalli D, Nundy S. et al. Comparative Accuracy of Diagnosis by Collective Intelligence of Multiple Physicians vs Individual Physicians. Jama Network Open. 2019;2 (3):e190096. doi:10.1001/jamanetworkopen.2019.0096
Ponemos a su disposición un servicio de atención personalizado, a través del cual obtener soporte técnico y ayuda, tanto para la navegación dentro del sitio como para el uso del programa.