Evaluación de la diversidad y funcionalidad del sistema CRISPR-Cas I-E de Escherichia coli

  1. Díez Villaseñor, César
Dirixida por:
  1. Jesús García-Martínez Co-director
  2. Francisco J. M. Mojica Co-director

Universidade de defensa: Universitat d'Alacant / Universidad de Alicante

Fecha de defensa: 07 de xullo de 2015

Tribunal:
  1. Francisco Rodríguez Valera Presidente
  2. Cristina Madrid Xufré Secretario/a
  3. Matxalen Llosa Blas Vogal
Departamento:
  1. FISIOLOGIA, GENETICA Y MICROBIOLOGIA

Tipo: Tese

Teseo: 389103 DIALNET lock_openRUA editor

Resumo

Al inicio de esta tesis, poco se conocía de unas secuencias denominadas SRSR (Mojica y col. 2000), unas pequeñas secuencias repetidas regularmente espaciadas presentes en la mayoría de grupos de procariotas. El hecho de que estas repeticiones estuvieran tan ampliamente distribuidas hacía pensar que desempeñaban una importante función, ya que los genomas procariotas tienden a eliminar secuencias innecesarias, pero esta función resultaba un enigma. El propósito inicial de la tesis era analizar la presencia de SRSR en las secuencias genómicas de procariotas que se fueran publicando, especialmente en las de Escherichia coli y en una colección de 72 cepas de dicha especie (la colección ECOR, que representa la diversidad de E. coli; Ochman y Selander, 1984), para estimar su diversidad, evaluar su potencial para el tipado de cepas, e intentar averiguar su función. Estas repeticiones fueron renombradas como CRISPR ("clustered regularly interspaced short palindromic repeats"), observándose que estaban relacionadas con genes codificantes de proteínas cas ("CRISPR associated"; Jansen y col., 2002). Estudios de esta tesis predijeron que las CRISPR podrían funcionar como sistema inmunitario capaz de reconocer secuencias invasoras por hibridación con la de los espaciadores en un RNA transcrito de las repeticiones (Mojica y col., 2005). Esta capacidad fue demostrada experimentalmente por primera vez en Barrangou y col. (2007). En este proceso se distinguen tres etapas: adaptación/adquisición (las secuencias espaciadoras se incorporan a la agrupación CRISPR), expresión (transcripción de las agrupaciones y producción de las proteínas Cas) e interferencia (se destruye el ácido nucleico diana). La expresión de las repeticiones se suele producir desde una secuencia llamada líder, adyacente a la agrupación que se puede conservar entre agrupaciones distintas . Tras diversos estudios de los genes cas y secuencias CRISPR se estableció que existen tres tipos de sistemas CRISPR (tipos I, II y III), incluyendo varios subtipos (Haft y col., 2003; Kunin y col., 2007; Makarova y col., 2011). El sistema estudiado en esta tesis es del tipo I y subtipo E (I-E), aunque se observó que en determinadas cepas de E. coli existe un sistema I-F (Díez-Villaseñor y col., 2010). Se observó inmunidad por primera vez para el sistema I-E de E. coli en Brouns y col. (2008) al sobreexpresarse sus componentes clonados en plásmidos. El sistema está reprimido en K-12 silvestre por H-NS (Pul y col., 2010), represión que puede aliviarse expresando la proteína LeuO (Westra y col., 2010). Para realizar interferencia se utiliza el RNA transcrito de las repeticiones (pre-crRNA; pre-CRISPR RNA), procesado en fragmentos (crRNA) que incluyen un espaciador y fragmentos de las CRISPR adyacentes ("handles"). Cada uno de estos fragmentos se unen a un complejo de proteínas Cas (Cascada, de "Cas complex for antiviral defence"), guiándolo para unirse al DNA diana. Tras la unión al DNA diana la proteína Cas3 (no incluída en el complejo Cascada) lo corta. Para el éxito de este proceso de interferencia (Semenova y col., 2011) las secuencias del espaciador y la diana (protoespaciador) han de ser idénticas en siete posiciones de nucleótidos denominados secuencia "seed", además 3 nucleótidos adyacentes al protoespaciador han de tener una secuencia determinada conocida como PAM (Mojica y col., 2009). Las dos proteínas Cas que no están implicadas en el proceso de interferencia, Cas1 y Cas2, participan en el proceso de adquisición (Yosef y col., 2012). Con el objetivo de analizar la diversidad CRISPR en genomas se desarrolló un programa informático capaz de detectarlas. Con él por ejemplo se realizó el estudio publicado en Mojica y col. (2005), donde análisis de 4500 espaciadores en los genomas procariotas disponibles revelaron que al menos 88 eran similares a secuencias de elementos principalmente extracromosómicos (fagos y plásmidos) relacionados con la especie en la que se encontraba el protoespaciador. Ello revelaba el origen de las secuencias espaciadoras y en conjunto con otras observaciones previamente publicadas sugería que las secuencias CRISPR podían actuar como un sistema inmunitario de procariotas capaz de reconocer secuencias específicas, previsiblemente mediante hibridación con el transcrito de RNA de los espaciadore. Este descubrimiento abría la posibilidad de que los sistemas CRISPR-Cas tuvieran numerosas utilidades biotecnológicas al igual que otros sistemas relacionados con inmunidad, como el RNAi, los enzimas de restricción y los anticuerpos. Además de las secuencias repetidas de E. coli de genomas publicados se desarrollaron protocolos de PCR para amplificar y posteriormente secuenciar las agrupaciones CRISPR de los sistemas I-E. En cepas silvestres de E. coli se investigó también la predicha función inmunitaria del sistema I-E, pero no se consiguió observar inmunidad en ninguna de las condiciones en las que se probaron. Sólo se consiguió observar este tipo de interferencia utilizando cepas artificialmente modificadas comprobando la reproducibilidad de experimentos realizados por otros investigadores (ver introducción): (i) en cepas sin H-NS, (ii) con sobreexpresión de LeuO o (iii) expresando las proteínas Cas y las CRISPR desde plásmidos. Además se ideó un sistema para estudiar la adquisición CRISPR (Díez-Villaseñor y col., 2013). Este sistema se basa en que al producirse una adquisición en un plásmido con un gen testigo se restablece la pauta de lectura correcta de un gen testigo, lo que permite su selección. Utilizando este sistema se observaron preferencias por cierto tipo de elementos e inserciones anómalas que dan información sobre el mecanismo de adquisición. En la mayoría de cepas de E. coli existe el sistema CRISPR-Cas I-E completo, si bien la existencia de cepas sin este sistema demuestra que no es esencial. En la diversidad de la longitud de las agrupaciones y de espaciadores se observa que este sistema ha tenido cierto nivel de actividad, pero los recambios de espaciadores se producen muy esporádicamente. El bajo recambio de los espaciadores hace que su contenido en una cepa determinada sea estable, e incluso idéntico o parecido a cepas cercanas. El análisis de los espaciadores presentes en varias cepas llevó a la determinación de ciertas familias de agrupaciones denominadas SGs (spacer groups; Almendros y col., 2014), que se corresponden grosso modo con la filogenia de las cepas. El contenido de espaciadores de las agrupaciones pertenecientes a un mismo SG se puede explicar si descienden de una agrupación ancestral con todos los espaciadores y en las descendientes se han ido perdiendo algunos de ellos. Los espaciadores provienen de otras secuencias preexistentes generalmente extracromosómicas de elementos genéticos (plásmidos y virus) relacionados con la especie que contiene el espaciador; esto apuntaba a una función de las CRISPR como sistema inmune de procariotas. La búsqueda de homologías para los espaciadores I-E de las agrupaciones de E. coli revelan que la mayor parte de los protoespaciadores se encuentran en virus, detectándose el consenso PAM "cwt". En E. coli la interferencia causada por el sistema I-E no está activa constitutivamente ni se induce mediante la entrada de DNA foráneo. Para que se realice la interferencia han de conservarse la PAM "cwt" y la secuencia "seed". La PAM además determina la orientación con la que se introducen los espaciadores en la agrupación. Los plásmidos testigo de inserción son útiles para estudiar el proceso de adaptación. El mecanismo de adquisición parece tomar los espaciadores preferentemente de ciertos replicones concretos. El 70% de espaciadores introducidos en los plásmidos testigo contienen una PAM consenso CTT, por lo que la PAM CAT observada para agrupaciones secuenciadas y de genomas parece deberse a una variante distinta de los genes cas. Durante la inserción del espaciador en la agrupación CRISPR se realiza un primer corte entre la CRISPR y la secuencia líder y un segundo corte a una distancia fija en la cadena complementaria que no se reconoce por su secuencia.