Modelo de integración de conocimiento huérfano descubierto mediante minería de datos

  1. Wilford Rivera, Ingrid
Dirigida per:
  1. Daniel Ruiz Fernández Director

Universitat de defensa: Universitat d'Alacant / Universidad de Alicante

Fecha de defensa: 10 de de desembre de 2010

Tribunal:
  1. Juan Manuel García Chamizo President
  2. Antonio Soriano Payá Secretari
  3. Francisco Javier García Casado Vocal
  4. María Asunción Pastor Climent Vocal
  5. Diego Andina de la Fuente Vocal
Departament:
  1. TECNOLOGIA INFORMÀTICA I COMPUTACIÓ

Tipus: Tesi

Teseo: 301254 DIALNET lock_openRUA editor

Resum

El trabajo de investigación presentado en esta memoria de tesis se centra en el descubrimiento de conocimiento en bases de datos, en concreto, en la extracción de conocimiento global, oculto en bases de datos distribuidas, mediante la aplicación de técnicas de minería de datos. De forma más específica el objetivo de esta investigación consiste en el desarrollo de un modelo que permita la integración de conocimiento expresado como conjuntos de patrones procedentes de múltiples bases de datos a las que, por cualquier motivo, no es posible acceder. Esta propuesta resulta especialmente útil en aquellas situaciones en las que se requiere obtener conocimiento global representativo de un conjunto de organizaciones o entidades, cuyas bases de datos han sido exploradas localmente y que comparten sus modelos locales de minería de datos pero no sus datos originales. Un ámbito de aplicación de este modelo son las bases de datos que incorporan información sensible protegida por la ley y que, por tanto, presentan un acceso directo limitado a los datos. El trabajo aborda los siguientes aspectos fundamentales: - Una revisión del estado del arte sobre los aspectos relacionados con el descubrimiento de conocimiento global procedente de múltiples bases de datos, mediante técnicas de minería de datos. - Formalización de un modelo general de integración de conocimiento distribuido y huérfano, es decir, procedente de bases de datos desconocidas o a las que no es posible acceder. Junto a la formalización del modelo conceptual se presenta también una propuesta de implementación funcional basada en el paradigma de agentes. - Para validar el modelo de integración propuesto, se han diseñado e implementado un conjunto de experimentos con dos bases de datos. Para cada base de datos se han generado conjuntos de patrones de conocimiento y se ha validado su integración siguiendo el modelo conceptual propuesto. Este trabajo ha permitido identificar un conjunto de problemas abiertos y líneas de investigación que perfilan el camino hacia el desarrollo de posibles trabajos científicos, de interés en el ámbito del descubrimiento de conocimiento en bases de datos y la minería de datos. Entre estos problemas podemos destacar la adaptación dinámica del modelo, el desarrollo de nuevas estrategias paralelas y distribuidas de minería de datos o el estudio de nuevos métodos de estimación de medidas de calidad de los patrones integrados.