Theoretical Models and Computational Techniques for the Analysis of Microbial Communities

  1. Riera Roca, Gabriel
Dirigida por:
  1. Maria de la Mercè Llabrés Segura Director/a
  2. Francesc Andreu Rosselló Llompart Director/a

Universidad de defensa: Universitat de les Illes Balears

Fecha de defensa: 15 de septiembre de 2023

Tribunal:
  1. José María Sempere Luna Presidente/a
  2. Arnau Mir Torres Secretario/a
  3. Josefa Antón Botella Vocal

Tipo: Tesis

Resumen

Las comunidades microbianas son ecosistemas complejos formados por diversos microorganismos que interactúan en un espacio vital compartido. Entender su diversidad y las relaciones entre las composiciones de las poblaciones es crucial para comprender su dinámica y su importancia ecológica. En esta tesis, nos centramos en dos aspectos clave: (1) la evaluación de la biodiversidad en comunidades microbianas y (2) el análisis de las relaciones virus-hospedador en muestras metagenómicas y metavirómicas mediante técnicas computacionales. Para evaluar la biodiversidad microbiana se han propuesto diversas medidas basadas en información filogenética. La más popular es la diversidad filogenética (PD) de Faith, que cuantifica la diversidad de caracteres fenotípicos en un conjunto de especies utilizando un árbol filogenético. Sin embargo, en la evolución microbiana, acontecimientos reticulares como las recombinaciones genéticas y las transferencias laterales de genes desempeñan papeles significativos, lo que hace necesario el uso de redes filogenéticas. En esta tesis desarrollamos una propiedad de intercambio para la extensión de la PD de Faith de árboles a redes filogenéticas (rPSD). Esto permite la caracterización, en tiempo polinómico, de subconjuntos de especies con puntuaciones rPSD máximas en redes filogenéticas del tipo semi-binarias nivel-2 o semi-ternarias nivel-1 mediante un algoritmo greedy. Además, en el mismo contexto, investigamos la aplicación de los índices de interacción de la teoría de juegos a las redes filogenéticas. Estos índices evalúan las contribuciones de las coaliciones de especies a la diversidad filogenética global. Así pues, derivamos expresiones simplificadas del índice de interacción de Shapley y el índice de interacción de Banzhaf, introducidos para varios juegos cooperativos, a índices con significado filogenético definidos sobre redes filogenéticas, incluyendo la diversidad de subredes filogenéticas enraizadas y no enraizadas en redes filogenéticas enraizadas, y también la diversidad de subredes filogenéticas en las redes split, una clase muy popular de redes filogenéticas no enraizadas. Estas expresiones profundizan nuestra comprensión del valor y la distribución de poder entre especies y grupos de especies. En la segunda parte de esta tesis, nos adentramos en el análisis de las relaciones virushospedador en el marco de las comunidades microbianas. El estudio de las relaciones virus-hospedador en muestras metagenómicas es crucial para comprender la dinámica y el impacto de los virus en las comunidades microbianas. Comenzamos abordando el reto de la clasificación de los virus en muestras metagenómicas. A pesar de que los virus son las formas de vida más abundantes en la Tierra, hay pocas herramientas informáticas para la clasificación taxonómica de los datos metavirómicos. En este trabajo proponemos una nueva herramienta, VPF-Class, basada en familias de proteínas virales (VPF), que proporciona tanto una clasificación taxonómica como una predicción del hospedador de una muestra metavirómica. A continuación presentamos METEOR, una herramienta que integra VPF-Class y herramientas de asignación metagenómica como MegaBLAST y TANGO. Las predicciones de hospedadores de secuencias virales generadas por VPF-Class se validan de forma cruzada y se enriquecen con evidencias sobre hospedadores putativos presentes en una muestra metagenómica obtenida de la misma comunidad microbiana, lo que da lugar a predicciones de hospedadores más precisas y restringidas a los hospedadores presentes en la muestra metagenómica. Por último, abordamos el reto de alinear las redes de interacciones proteína-proteína (PPIN) virus-huésped. Presentamos una formulación compacta mediante programación lineal entera del problema de alineación de PPIN, que puede resolverse utilizando programas estándar de modelización matemática y programación lineal entera. También mostramos resultados empíricos que prueban que las redes biológicas pequeñas, como las PPIN virushuésped de la base de datos STRING Viruses, pueden alinearse en un tiempo razonable en un ordenador personal, produciendo alineaciones estructuralmente coherentes y biológicamente significativas.