Definición de un conjunto de métricas para asegurar la calidad de los almacenes de datos
- Serrano Martín, Manuel A.
- Coral Calero Muñoz Director/a
- Mario G. Piattini Velthuis Director/a
Universidad de defensa: Universidad de Castilla-La Mancha
Fecha de defensa: 03 de noviembre de 2004
- Manuel Palomar Sanz Presidente
- Francisco Ruiz González Secretario/a
- José María Cavero Barca Vocal
- Juan Trujillo Mondéjar Vocal
- Matilde Celma Giménez Vocal
Tipo: Tesis
Resumen
Actualmente se pueden almacenar grandes cantidades de datos, pero estos datos no proporcionan información, Para resolver este problema, las organizaciones están adoptando la tecnología de almacenes de datos, de forma, que éstos se han convertido en una de las tendencias más importantes de la informática empresarial. El desarrollo de un almacén de datos, definido como una colección de datos orientados a temas, integrados y no volátiles, que soportan la gestión de la toma de decisiones, es una tarea difícil y llena de riesgos, a pesar de contar con diferentes propuestas de ciclos de vida y técnicas para su desarrollo. Es esencial poder asegurar la calidad de la información que contiene el almacén de datos ya que éste se ha convertido en la principal herramienta para la toma de decisiones estratégicas. Como es lógico, la calidad del esquema del almacén de datos tiene una gran influencia en la calidad de la información y este trabajo se centra en la calidad del esquema de datos multidimensional a nivel conceptual y lógico. Una forma de asegurar la calidad de los diseños de almacenes de datos es mediante la utilización de métricas específicas para este propósito. En esta tesis se presentan las métricas que hemos diseñado para asegurar la calidad de los esquemas lógicos y conceptuales de almacenes de datos. Todo el proceso de diseño de las métricas ha incluido las siguientes tareas:- Definición de un marco para la obtención de métricas validas. - Definición de métricas - Validación teórica de las métricas propuestas siguiendo las principales tendencias existentes para tal fin, como son los marcos formales basados en propiedades y los basados en la teoría de la medida. - Validación empírica de las métricas definidas utilizando tanto los tests estadísticos clásicos, como diferentes técnicas basadas en el aprendizaje automático (machine learning). - Diseño de una herramienta par