A Systematic Review of Cross-Population Shifts in Medical Imaging Analysis with Deep Learning
Resumen: Deep learning has achieved expert-level performance in medical imaging analysis. However, models often fail to generalize across patient populations due to cross-population domain shifts, distributional differences arising from demographic variability, variations in imaging protocols, scanner hardware, and differences in disease prevalence. This challenge limits the real-world deployment and can increase health inequities. This review systematically examines the nature, causes, and impact of cross-population domain shift in deep learning-based medical imaging analysis. We analyzed 50 peer-reviewed studies from 2020 to 2025, evaluating the proposed methodologies for handling population shifts, the datasets employed, and the metrics used to assess performance. Our findings demonstrate that performance degradation ranged from 10–25% when models were tested on unseen populations, emphasizing the substantial impact of domain shifts on model generalizability. The literature reveals that mitigation strategies broadly fall into two categories: data-centric approaches, such as augmentation and harmonization, and model-centric approaches, including domain adaptation, transfer learning, adversarial learning, multi-task learning, and continual learning. While domain adaptation and transfer learning are the most widely used, their performance gains across populations remain modest, ranging from 5–15%, and are not supported by external validation. Our synthesis reveals a significant reliance on large, publicly available datasets from limited regions, with an underrepresentation of data from low- and middle-income countries. Evaluation practices are inconsistent, with few studies employing standardized external test sets. This review provides a structured taxonomy of mitigation techniques, a refined analysis of domain shift characteristics, and an in-depth critique of methodological challenges. We highlight the urgent need for more geographically and demographically inclusive datasets, adaptable modeling techniques, and standardized evaluation protocols to enable accurate and equitable AI-driven diagnostics across diverse populations. Finally, we outline future research directions to guide the development of robust, generalizable, and fair models for medical imaging analysis.

El aprendizaje profundo ha alcanzado un rendimiento de nivel experto en el análisis de imágenes médicas. Sin embargo, los modelos a menudo no logran generalizar entre poblaciones de pacientes debido a cambios de dominio entre poblaciones, diferencias de distribución derivadas de la variabilidad demográfica, variaciones en los protocolos de imagen, el hardware del escáner y diferencias en la prevalencia de enfermedades. Este desafío limita la implementación en el mundo real y puede aumentar las inequidades en salud. Esta revisión examina sistemáticamente la naturaleza, las causas y el impacto de los cambios de dominio entre poblaciones en el análisis de imágenes médicas basado en aprendizaje profundo. Analizamos 50 estudios revisados ​​por pares de 2020 a 2025, evaluando las metodologías propuestas para manejar los cambios de población, los conjuntos de datos empleados y las métricas utilizadas para evaluar el rendimiento. Nuestros hallazgos demuestran que la degradación del rendimiento osciló entre el 10 % y el 25 % cuando los modelos se probaron en poblaciones no vistas, lo que enfatiza el impacto sustancial de los cambios de dominio en la generalización del modelo. La literatura revela que las estrategias de mitigación se dividen en dos categorías principales: enfoques centrados en datos, como la ampliación y la armonización, y enfoques centrados en modelos, que incluyen la adaptación de dominio, el aprendizaje por transferencia, el aprendizaje adversario, el aprendizaje multitarea y el aprendizaje continuo. Si bien la adaptación de dominio y el aprendizaje por transferencia son los más utilizados, sus mejoras de rendimiento en diferentes poblaciones siguen siendo modestas, oscilando entre el 5 % y el 15 %, y carecen de validación externa. Nuestra síntesis revela una dependencia significativa de grandes conjuntos de datos públicos procedentes de regiones limitadas, con una escasa representación de datos de países de ingresos bajos y medios. Las prácticas de evaluación son inconsistentes, y pocos estudios emplean conjuntos de prueba externos estandarizados. Esta revisión proporciona una taxonomía estructurada de las técnicas de mitigación, un análisis refinado de las características del cambio de dominio y una crítica exhaustiva de los desafíos metodológicos. Destacamos la necesidad urgente de contar con conjuntos de datos más inclusivos desde el punto de vista geográfico y demográfico, técnicas de modelado adaptables y protocolos de evaluación estandarizados para permitir diagnósticos precisos y equitativos basados ​​en IA en diversas poblaciones. Por último, describimos las futuras líneas de investigación para guiar el desarrollo de modelos robustos, generalizables y justos para el análisis de imágenes médicas.

Idioma: Inglés
DOI: 10.3390/bdcc10030076
Año: 2026
Publicado en: Big Data and Cognitive Computing 10, 3 (2026), 34
ISSN: 2504-2289

Financiación: info:eu-repo/grantAgreement/ES/DGA/B50-24
Financiación: info:eu-repo/grantAgreement/ES/DGA/COS2MOS research group
Financiación: info:eu-repo/grantAgreement/ES/DGA/T64-23R
Financiación: info:eu-repo/grantAgreement/ES/ISCIII/RD24-0007-0022
Financiación: info:eu-repo/grantAgreement/ES/MICINN/PID2022-138703OB-I00
Tipo y forma: Artículo (Versión definitiva)
Área (Departamento): Área Lenguajes y Sistemas Inf. (Dpto. Informát.Ingenie.Sistms.)

Creative Commons Debe reconocer adecuadamente la autoría, proporcionar un enlace a la licencia e indicar si se han realizado cambios. Puede hacerlo de cualquier manera razonable, pero no de una manera que sugiera que tiene el apoyo del licenciador o lo recibe por el uso que hace.


Exportado de SIDERAL (2026-04-18-10:48:29)


Visitas y descargas

Este artículo se encuentra en las siguientes colecciones:
Artículos > Artículos por área > Lenguajes y Sistemas Informáticos



 Registro creado el 2026-04-18, última modificación el 2026-04-20


Versión publicada:
 PDF
Valore este documento:

Rate this document:
1
2
3
 
(Sin ninguna reseña)