Un método para validar sistemas de puntos basados en modelos de regresión logística para predecir eventos binarios con la metodología bootstrap y a través de una app para smartphone

  1. Folgado de la Rosa, David Manuel
Supervised by:
  1. Vicente Gil Guillén Director
  2. Antonio Palazón Bru Co-director

Defence university: Universidad Miguel Hernández de Elche

Fecha de defensa: 28 June 2021

Committee:
  1. Antonio Cabrera de León Chair
  2. Teresa Seoane Pillado Secretary
  3. Vicente Pallarés Carratalá Committee member

Type: Thesis

Teseo: 671568 DIALNET

Abstract

Para emplear un sistema de puntos basado en un modelo de regresión logística para predecir un evento binario en una determinada población, es necesaria su validación. Para ello, debemos tener un tamaño muestral suficiente y aplicar las técnicas matemáticas recomendadas por los consensos internacionales. En lo referente al primer punto, se ha recomendado tener un tamaño muestral con al menos 100 eventos y 100 no eventos, independientemente del modelo que estemos validando. Sin embargo, estudios científicos han demostrado que ciertos factores influyen sobre este tamaño, por lo que parece que no tiene mucho sentido tener un valor fijo para este propósito. En consecuencia, en esta tesis doctoral se ha desarrollado un algoritmo para calcular el tamaño muestral en sistemas de puntos obtenidos a través de modelos de regresión logística. Este algoritmo se basa en métodos utilizados ampliamente en la literatura científica, como son la curva ROC o el bootstrapping. Con respecto al segundo y último punto, la forma más correcta de ello es calcular a través de bootstrapping la discrimación y la calibración. La discriminación se puede abordar a través del área bajo la curva ROC y la calibración mediante la representación del gráfico de calibración suavizado (método más recomendado). Esto no es una tarea sencilla, por lo que se plantea la elaboración de una metodología para construir una aplicación para teléfono móvil en Android que la realice. Ambos métodos se han aplicado sobre un conjunto de datos simulados perteneciente a un modelo para predecir mortalidad en las Unidades de Cuidados Intensivos. De esta forma se puede comprender cada una de las etapas, con el fin de poder aplicarse para otros sistemas de puntos para predecir eventos binarios.