Un método para validar sistemas de puntos basados en modelos de regresión logística para predecir eventos binarios con la metodología bootstrap y a través de una app para smartphone
- Vicente Gil Guillén Directeur
- Antonio Palazón Bru Co-directeur/trice
Université de défendre: Universidad Miguel Hernández de Elche
Fecha de defensa: 28 juin 2021
- Antonio Cabrera de León President
- Teresa Seoane Pillado Secrétaire
- Vicente Pallarés Carratalá Rapporteur
Type: Thèses
Résumé
Para emplear un sistema de puntos basado en un modelo de regresión logística para predecir un evento binario en una determinada población, es necesaria su validación. Para ello, debemos tener un tamaño muestral suficiente y aplicar las técnicas matemáticas recomendadas por los consensos internacionales. En lo referente al primer punto, se ha recomendado tener un tamaño muestral con al menos 100 eventos y 100 no eventos, independientemente del modelo que estemos validando. Sin embargo, estudios científicos han demostrado que ciertos factores influyen sobre este tamaño, por lo que parece que no tiene mucho sentido tener un valor fijo para este propósito. En consecuencia, en esta tesis doctoral se ha desarrollado un algoritmo para calcular el tamaño muestral en sistemas de puntos obtenidos a través de modelos de regresión logística. Este algoritmo se basa en métodos utilizados ampliamente en la literatura científica, como son la curva ROC o el bootstrapping. Con respecto al segundo y último punto, la forma más correcta de ello es calcular a través de bootstrapping la discrimación y la calibración. La discriminación se puede abordar a través del área bajo la curva ROC y la calibración mediante la representación del gráfico de calibración suavizado (método más recomendado). Esto no es una tarea sencilla, por lo que se plantea la elaboración de una metodología para construir una aplicación para teléfono móvil en Android que la realice. Ambos métodos se han aplicado sobre un conjunto de datos simulados perteneciente a un modelo para predecir mortalidad en las Unidades de Cuidados Intensivos. De esta forma se puede comprender cada una de las etapas, con el fin de poder aplicarse para otros sistemas de puntos para predecir eventos binarios.