MODELOS DE APRENDIZAJE AUTOMÁTICO EXPLICABLES PARA PREDICCIÓN DE INFECCIÓN DEL SITIO QUIRÚRGICO TRAS FUSIÓN LUMBAR POSTERIOR BASADOS EN SHAPLEY ADDITIVE EXPLANATIONS
Resumen
Diseño del estudio: Estudio retrospectivo, de un solo centro.
Objetivos: Este estudio tiene como objetivo desarrollar modelos de aprendizaje automático (ML) combinados con un método explicable para la predicción de infección del sitio quirúrgico (SSI) tras cirugía de fusión lumbar posterior.
Métodos: En este estudio retrospectivo, de un solo centro, se incluyeron en total 1.016 pacientes consecutivos que fueron sometidos a cirugía de fusión lumbar posterior. Se estableció un conjunto de datos comprensivo, que abarcó variables demográficas, comorbilidades, evaluación preoperatoria, detalles relacionados con la enfermedad lumbar diagnosticada, pruebas de laboratorio preoperatorias, especificaciones quirúrgicas y factores postoperatorios. Utilizando este conjunto de datos, se desarrollaron seis modelos de ML para predecir la ocurrencia de SSI. La evaluación del rendimiento de los modelos en el conjunto de prueba involucró varias métricas, incluyendo la curva ROC, el área bajo la curva ROC, precisión, recall, puntaje F1 y precisión. El método Shapley Additive Explanations (SHAP) se empleó para generar predicciones interpretables, permitiendo una evaluación comprensiva del riesgo de SSI y proporcionando interpretaciones individualizadas de los resultados del modelo.
Resultados: Entre los 1.016 casos retrospectivos incluidos en el estudio, 36 (3,54 %) experimentaron SSI. De los seis modelos examinados, el modelo Extreme Gradient Boost (XGBoost) demostró el rendimiento discriminativo más alto en el conjunto de prueba, alcanzando las siguientes métricas: precisión 0,9000, recall 0,8182, exactitud 0,9902, puntaje F1 0,8571, y área bajo la curva (AUC) 0,9447. Al emplear el método SHAP, se identificaron varios predictores importantes de SSI, entre ellos: duración del catéter venoso central, niveles de nitrógeno ureico (BUN), niveles de proteína total, fiebre sostenida, niveles de creatinina, niveles de triglicéridos, recuento de monocitos, diabetes mellitus, tiempo de drenaje, recuento de glóbulos blancos, historia de infarto cerebral, pérdida estimada de sangre, niveles de prealbúmina, índice nutricional pronóstico, dolor lumbar, puntuación de fusión posterior (posterior fusion score) y osteoporosis.
Conclusión: Las herramientas de predicción basadas en ML pueden evaluar con precisión el riesgo de infección del sitio quirúrgico tras cirugía de fusión lumbar posterior. Además, combinar ML con SHAP podría proporcionar una interpretación clara de la predicción individual del riesgo y ofrecer a los médicos una comprensión intuitiva de los efectos de las características más esenciales del modelo.
Resultado
El estudio demuestra que, con una muestra de 1.016 pacientes sometidos a fusión lumbar posterior, los modelos ML son capaces de predecir infecciones del sitio quirúrgico con alta precisión cuando se entrenan con un conjunto completo de variables clínicas, quirúrgicas y de laboratorio. El modelo que mejor rindió fue el Extreme Gradient Boost. Entre los predictores identificados por SHAP destacan tanto factores preoperatorios (por ejemplo, nutrición, niveles de proteína total, diabetes, función renal) como variables operativas (duración del catéter, tiempo de drenaje, estimación de sangrado), lo cual sugiere que múltiples dominios deben considerarse para evaluar el riesgo.
Relevancia Clínica
Este modelo puede servir para identificar pacientes con riesgo alto de infección del sitio quirúrgico antes de la operación, lo que permitiría adoptar medidas de prevención personalizadas como optimización nutricional, control de glucosa, minimizar tiempos de drenaje o cateterismo innecesario. Además, la interpretación mediante SHAP aporta transparencia al modelo, lo que facilita que los cirujanos comprendan qué factores contribuyen más al riesgo en cada paciente, mejorando la toma de decisiones individuales.
Comentario
Se ve como en los últimos años aumentan las publicaciones científicas sobre la aplicación de la inteligencia artificial en ciencias de la salud, dada su gran capacidad predictiva de eventos adversos serios como es la infección del sitio quirúrgico.
Este trabajo representa un avance importante en la aplicación de inteligencia artificial explicable en cirugía de columna, porque no solo logra una excelente capacidad predictiva, sino que lo hace de una forma que los clínicos pueden entender (mediante SHAP). Antes, los modelos de predicción de complicaciones quirúrgicas frecuentemente eran “cajas negras” difíciles de interpretar. Aquí, los autores combinan potencia predictiva con interpretabilidad, algo clave para la aceptación clínica.

