Agrupamiento y descubrimiento de subgrupos para fenotipado de pacientes
- López Martínez-Carrasco, Antonio
- Manuel Campos Martínez Director/a
- José Manuel Juarez Herrero Director/a
Universidad de defensa: Universidad de Murcia
Fecha de defensa: 30 de enero de 2024
- Daniel Ruiz Fernández Presidente
- Raquel Martínez España Secretario/a
- Gregor Stiglic Vocal
Tipo: Tesis
Resumen
Según las principales organizaciones sanitarias, la resistencia antimicrobiana (antimicrobial resistance o AMR, por sus siglas en inglés) es una de las mayores amenazas mundiales para la salud humana y constituye un problema crítico en el ámbito médico. La AMR se produce cuando los microorganismos se vuelven resistentes a los tratamientos antimicrobianos, haciendo que estos últimos no puedan combatir eficazmente las infecciones. Algunas de las principales causas de la AMR son el uso inadecuado de antimicrobianos y la transferencia de microorganismos resistentes entre humanos, animales o el medio ambiente. Esto significa que, a pesar del uso de fármacos antimicrobianos para tratar a pacientes infectados con microorganismos resistentes, su uso excesivo y una regulación inadecuada favorecen la propagación de estos microorganismos resistentes. Por un lado, desde el punto de vista sanitario y hospitalario, es imprescindible disponer de recursos, herramientas y procedimientos con los que monitorizar, detectar y controlar los posibles casos de AMR, además de erradicar todas las amenazas potenciales tanto para los pacientes como para el resto de la sociedad. Por otro lado, en el ámbito de la investigación clínica se han realizado muchos esfuerzos para abordar el problema de la AMR y mitigar los efectos y problemas que causa. En este contexto, la búsqueda de conjuntos de pacientes con características interesantes se ha convertido en una cuestión fundamental. Esta tarea se denomina fenotipado de pacientes y estas características de los pacientes se denominan fenotipos. El aprendizaje computacional (machine learning o ML, por sus siglas en inglés) es un área prometedora en el campo de la informática, ya que proporciona un mecanismo con el que investigar y desarrollar nuevas soluciones a la hora de enfrentarse a determinados problemas como el descrito en este trabajo. Más concretamente, el ML puede utilizarse para la generación automática de fenotipos de pacientes. La hipótesis de esta tesis doctoral es que las técnicas de agrupamiento (clustering) y descubrimiento de subgrupos (subgroup discovery o SD, por sus siglas en inglés), que son dos técnicas de ML, son eficaces para apoyar al proceso de fenotipado de pacientes en el contexto clínico de la resistencia a los antibióticos. Nuestra hipótesis es que las versiones refinadas y adaptadas de dichas técnicas pueden generar fenotipos útiles y legibles para los clínicos. Para probar esta hipótesis, establecemos los siguientes objetivos: (1) utilización de las técnicas de clustering o SD como base para proponer técnicas de ML para el fenotipado cuyos resultados sean útiles y fácilmente legibles por los expertos clínicos, (2) generación de fenotipos de pacientes mediante el diseño de una nueva técnica de ML no supervisada basada en clustering, (3) identificación de fenotipos de pacientes mediante la propuesta de una nueva metodología que permita involucrar a los expertos clínicos en el proceso, (4) extracción de fenotipos mediante la creación de un nuevo y eficiente algoritmo de SD, (5) definición de fenotipos de pacientes con la propuesta del nuevo problema de minado de las top-k listas de subgrupos diversas, (6) facilitación del uso de todos los algoritmos de SD desarrollados en esta investigación, junto con otros ya existentes en la literatura, mediante el desarrollo de una librería Python pública, accesible y de código abierto y (7) garantía de la reproducibilidad de la investigación mediante la extracción y el uso de datos clínicos relacionados con el problema de la resistencia a los antibióticos a partir de un repositorio público. Finalmente, las principales conclusiones de esta tesis doctoral en relación con los objetivos propuestos son que: (1) las nuevas técnicas de ML creadas en este trabajo pueden aplicarse con éxito al problema de la resistencia a los antibióticos y sus resultados son fáciles de interpretar para los clínicos, (2) la técnica de clustering basado en trazas genera fenotipos de pacientes, (3) la nueva metodología de 5 pasos proporciona una guía sencilla con la que identificar y hacer un ranking de los fenotipos de pacientes y permite involucrar a los expertos clínicos en el proceso de descubrimiento, (4) el algoritmo VLSD puede utilizarse tanto para extraer directamente fenotipos de pacientes como formando parte de otras técnicas de fenotipado, (5) el nuevo problema de minado de las top-k listas de subgrupos diversas proporciona un nuevo enfoque para el fenotipado de pacientes, (6) la librería ‘subgroups’ es de fácil acceso, ya que está disponible en GitHub y PyPI y puede ser utilizada por científicos de datos, investigadores de ML y usuarios finales para tareas como el fenotipado y (7) la base de datos MIMIC-III es una excelente fuente de datos que proporciona abundante información relativa al problema de la resistencia a los antibióticos, ayuda a los investigadores en este campo y garantiza la reproducibilidad de la investigación