Theoretical Models and Computational Techniques for the Analysis of Microbial Communities

  1. Riera Roca, Gabriel
Dirigida per:
  1. Maria de la Mercè Llabrés Segura Director/a
  2. Francesc Andreu Rosselló Llompart Director/a

Universitat de defensa: Universitat de les Illes Balears

Fecha de defensa: 15 de de setembre de 2023

Tribunal:
  1. José María Sempere Luna President/a
  2. Arnau Mir Torres Secretari/ària
  3. Josefa Antón Botella Vocal

Tipus: Tesi

Resum

Les comunitats microbianes són ecosistemes complexos formats per diversos microorganismes que interactuen en un espai vital compartit. Entendre la seva diversitat i les relacions entre les composicions de les poblacions és crucial per a comprendre la seva dinàmica i la seva importància ecològica. En aquesta tesi, ens centrem en dos aspectes clau: (1) l’avaluació de la biodiversitat en comunitats microbianes i (2) l’anàlisi de les relacions virus-hoste en mostres metagenòmiques i metaviròmiques mitjançant tècniques computacionals. Per a avaluar la biodiversitat microbiana s’han proposat diverses mesures basades en informació filogenètica. La més popular és la diversitat filogenètica (PD) de Faith, que quantifica la diversitat de caràcters fenotípics en un conjunt d’espècies utilitzant un arbre filogenètic. No obstant això, en l’evolució microbiana, esdeveniments reticulars com les recombinacions genètiques i les transferències laterals de gens exerceixen papers significatius, la qual cosa fa necessari l’ús de xarxes filogenètiques. En aquesta tesi, introduïm una propietat d’intercanvi per a l’extensió de la PD de Faith d’arbres a xarxes filogenètiques (rPSD). Això ens permet caracteritzar, en temps polinòmic, subconjunts d’espècies amb puntuacions rPSD màximes a xarxes filogenètiques semi-binàries de nivell 2 o semiternàries de nivell 1, mitjançant un algorisme greedy. A més, en el mateix context, investiguem l’aplicació dels índexs d’interacció de la teoria de jocs a les xarxes filogenètiques. Aquests índexs avaluen les contribucions de les coalicions d’espècies a la diversitat filogenètica global. Així doncs, derivem expressions simplificades de l’índex d’interacció de Shapley i l’índex d’interacció de Banzhaf, introduïts per a diversos jocs cooperatius, a índexs amb significat filogenètic definits en xarxes filogenètiques, incloent-hi la diversitat de subxarxes filogenètiques arrelades i no arrelades en xarxes filogenètiques arrelades i també la diversitat de subxarxes filogenètiques a les xarxes split, una classe molt popular de xarxes filogenètiques no arrelades. Aquestes expressions aprofundeixen la nostra comprensió del valor i la distribució de poder entre espècies i grups d’espècies. En la segona part d’aquesta tesi, ens endinsem en l’anàlisi de les relacions virus-hoste en el marc de les comunitats microbianes. L’estudi de les relacions virus-hoste en mostres metagenòmiques és crucial per a comprendre la dinàmica i l’impacte dels virus en les comunitats microbianes. Comencem abordant el repte de la classificació dels virus en mostres metagenòmiques. Malgrat que els virus són les formes de vida més abundants en la Terra, hi ha poques eines informàtiques per a la classificació taxonòmica de les dades metaviròmiques. Proposem doncs una nova eina, VPF-Class, basada en famílies de proteïnes virals (VPF), que proporciona tant una classificació taxonòmica com una predicció de l’hoste. A continuació presentem METEOR, una eina que integra VPF-Class i eines d’assignació metagenòmica com MegaBLAST i TANGO. Les prediccions d’hostes de seqüències virals generades per VPF-Class es validen de forma creuada i s’enriqueixen amb evidències sobre hostes putatius presents en una mostra metagenòmica obtinguda de la mateixa comunitat microbiana, la qual cosa resulta en prediccions d’hostes més precises i restringides als hostes presents en la mostra metagenòmica. Finalment, abordem el repte d’alinear les xarxes d’interaccions proteïna-proteïna (PPIN) virus-hoste. Presentem una formulació compacta mitjançant programació lineal entera del problema d’alineació de PPIN, que pot resoldre’s utilitzant programes estàndard de modelització matemàtica i programació lineal entera. També proporcionem resultats emiv pírics que demostren que les xarxes petites, com les PPIN virus-hoste de la base de dades STRING Viruses, poden alinear-se en un temps raonable en un ordinador personal, produint alineacions estructuralment coherents i biològicament significatives.