Machine Learning Meets Asset Management

  1. Mirete, Pedro
Supervised by:
  1. María Asunción Prats Albentosa Director
  2. Juan Samuel Baixauli Soler Director

Defence university: Universidad de Murcia

Fecha de defensa: 13 December 2023

Committee:
  1. Susana Álvarez Díez Chair
  2. Luis Moreno Izquierdo Secretary
  3. José García Rodríguez Committee member

Type: Thesis

Abstract

El propósito de esta tesis es proporcionar una revisión exhaustiva, desde una perspectiva tanto teórica como práctica, de la utilidad que el Machine Learning (ML) aporta a la disciplina financiera de la Gestión de Activos. En años recientes, el mundo de la Gestión de Activos ha presenciado una transformación notable con la integración de tecnologías de vanguardia. Entre estos avances, la aplicación del ML destaca como una herramienta que ha transformado la toma de decisiones de inversión, capacitando a los gestores de activos para tomar decisiones de inversión más informadas basadas en datos. La tesis realiza contribuciones en dos áreas principales. En primer lugar, proporciona una revisión global exhaustiva del estado del arte en cuanto a la contribución del ML a la Gestión de Activos. Buscando un equilibrio entre Finanzas, Estadística y Computación, la revisión intenta mejorar el análisis de la literatura reciente, a fin de que investigadores y profesionales puedan explorar sin fisuras sus áreas de interés. En segundo lugar, la tesis se centra en la aplicación práctica de herramientas de ML en la gestión de activos, buscando evidencia empírica de su utilidad para mejorar los resultados obtenidos por enfoques tradicionales como la econometría. La primera sección empírica aborda el problema más general dentro de la disciplina de Gestión de Activos, la predicción de precios. A pesar de las limitaciones que la hipótesis de Eficiencia impone en cuanto a la predicción de precios de activos financieros, aplicamos los algoritmos de ML más innovadores, específicamente las Gated Recurrent Units (GRUs), a los últimos 33 años de precios diarios del índice S&P 500, previamente procesados con un innovador algoritmo de descomposición de señales para series no estacionarias (EMD). Los resultados son prometedores, ya que nuestro modelo EMD-GRU, de acuerdo a los estándares estadísticos, muestra un nivel notable de precisión en la predicción de movimientos direccionales de precios de acciones. La Directional Accuracy (DA) asciende al 75,15% en el caso del mejor modelo cuando se prueba en escenarios reales de trading. En el segundo ejercicio empírico, la tesis aborda otra estrategia de predicción de precios muy conocida entre los gestores de activos, llamada estrategia de pares o arbitraje estadístico. El experimento examina la viabilidad de utilizar técnicas de aprendizaje no supervisado de ML para encontrar posibles pares de acciones que incorporar a una cartera long-short. Además de usar autoencoders para la reducción de dimensionalidad, proponemos aplicar un enfoque específico de clustering para datos de series temporales, llamado k-means clustering con DTW. Utilizando datos mensuales desde 2010 para los componentes individuales del índice S&P500, el modelo propuesto logra un rendimiento total del 89% en 8 años, con una DA del 63% y un ratio de Sharpe (SR) de 2,658. En comparación con los dos benchmarks seleccionados, el índice y una estrategia short-term reversal, nuestro modelo es el mejor en términos de rendimiento total y otras medidas de rendimiento. Finalmente, el tercer ejercicio se centra en los modelos de tres y cinco factores de Fama y French, quizás los modelos de valoración de activos más seguidos por la comunidad científica en los últimos años. En este caso, la propuesta es más metodológica que empírica, ya que sugerimos una estimación alternativa de estos modelos a través del uso de algoritmos de ML. Para ser más específicos, se aplica una combinación de Support Vector Regression (SVR) y Grid Search (GS) con Validación Cruzada (CV) de 10 capas para pronosticar rendimientos mensuales en cinco industrias del índice S&P500, utilizando los modelos de tres y cinco factores de Fama y French. El modelo propuesto GS-CV-SVR arroja coeficientes de correlación fuera de muestra entre 92-97% para los diferentes sectores. Estos hallazgos muestran que la ganancia de precisión en la predicción es notable en comparación con el método de optimización OLS convencional utilizado en el trabajo original de Fama-French y en trabajos posteriores.