Información

Eliminación de codones al comienzo de una secuencia en preparación para expresión heterogénea. ¿Por qué?

Eliminación de codones al comienzo de una secuencia en preparación para expresión heterogénea. ¿Por qué?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Estoy leyendo una patente en la que aíslan un gen de ADNc construido a partir de ARN extraído de materia vegetal.

El siguiente paso (en preparación para la expresión heterogénea en E. Coli) me desconcierta:

Puedo entender la optimización de codones, pero esta parte me confunde "... eliminar los primeros 23 codones de la secuencia de ADN y reemplazar [¿el inicio?] Por la secuencia ATGGCT".

¿Por qué se eliminaría un conjunto de codones al comienzo de una secuencia? ¿Cómo decidieron cuántos eliminar? ¿Existe una razón obvia por la que no estoy? También lo que tiene de especial la secuencia ATGGCT.

¿Alguna idea de por qué harían esto?

El inicio de la nueva secuencia (1650 pb) se ve así:

atggctaccg ataatgacag ctctgaaaac cgtcgtatgg gtaattacaa gccgtccatc 60 tggaactacg acttcctgca gtccctggct acccgccaca atatcatgga agagcgccac 120

mientras que la secuencia original (1710 pb) era la siguiente:

atggattctt ccaccgccac cgccatgaga gctccattca ttgatcatac tgatcatgtg 60 aatctcagaa ctgataacga ttcctcagag aatcgaagga tggggaatta taaacccagt 120

Otro punto sobre el que estoy confundido es que 1710 - 23 x 3 + 6 es 1647. Pero la nueva seq. es de 1650 pb. ¿Lo que da?


La respuesta más sencilla sería preguntar a los autores de la patente. Se excluyeron varias otras posibilidades (ver comentarios), tales como:

  • sitios de restricción que interfieren con la clonación
  • péptido señal
  • escisión proteolítica

Aunque es solo una teoría, eliminar parte del extremo N podría mejorar la estabilidad de la proteína y el tiempo de vida media porque los primeros 30-40 aminoácidos carecen de una estructura ordenada (a juzgar por enviar la estructura a Phyre). Se sabe que esas estructuras se agregan e influyen en la estabilidad de las proteínas.

Referencias:

El uso de deleciones N- y C-terminales sistemáticas para promover la producción y estudios estructurales de proteínas recombinantes.

La composición de la secuencia de las regiones desordenadas afina la vida media de las proteínas

Producción de proteínas propensas a agregarse


Las roturas de doble cadena inducidas por CRISPR desencadenan la recombinación entre brazos de cromosomas homólogos

La edición del genoma basada en CRISPR-Cas9 ha transformado las ciencias de la vida, permitiendo una manipulación genética virtualmente ilimitada de los genomas: la endonucleasa Cas9 guiada por ARN corta el ADN en una secuencia objetivo específica y las rupturas de doble cadena resultantes son reparadas por una de las reparaciones celulares intrínsecas. caminos. La reparación imprecisa de doble hebra introducirá mutaciones aleatorias como indeles o mutaciones puntuales, mientras que la edición precisa restaurará o editará específicamente el locus según lo requiera una plantilla proporcionada de forma endógena o exógena. Estudios recientes indican que los cortes de ADN inducidos por CRISPR también pueden resultar en el intercambio de información genética entre brazos de cromosomas homólogos. Sin embargo, faltan datos concluyentes de tales eventos de recombinación en eucariotas superiores. Aquí, mostramos que en Drosophila, los eventos de edición mediados por Cas9 detectados con frecuencia dieron como resultado un intercambio de brazos cromosómicos transmitido por la línea germinal, a menudo sin indeles. Estos hallazgos demuestran la viabilidad de usar el sistema para generar recombinantes y también destacan un riesgo imprevisto de usar CRISPR-Cas9 para intervenciones terapéuticas.


Patobiología del eritrocito humano y sus hemoglobinas

Martin H. Steinberg,. Benjamin L. Ebert, en Hematología (séptima edición), 2018

Mecanismos postranscripcionales, traslacionales y postraduccionales

El ARNm de globina procesado se exporta desde el núcleo al citoplasma mediante un mecanismo que no está claramente definido. La traducción del ARNm se produce en el citoplasma (v. fig. 33.7). Los tripletes de codones o ARNm son reconocidos por los anticodones de ARNt específicos que llevan residuos de aminoácidos activados a las cadenas polipeptídicas nacientes. El proceso de traducción, en el que una plantilla de ARNm dirige la síntesis de proteína, se divide típicamente en tres fases: inicio, alargamiento y terminación (véanse los capítulos 1 y 4). Cada fase está regulada por una variedad de factores proteicos.

La molécula de ARNm de globina se asocia con cuatro a seis ribosomas, formando el polirribosoma. Al menos 11 factores de iniciación de la traducción eucariotas interactúan con el polirribosoma. Ellos median la estabilización de un complejo de preiniciación, la unión del tRNA de metionina iniciadora a las subunidades ribosómicas, la unión de mRNA al complejo de preiniciación, la estabilización de la unión de mRNA, el reconocimiento del sitio cap en el extremo 5 'del mRNA y la liberación de factores de iniciación de el complejo de preiniciación. También se han definido varios factores de alargamiento y terminación. La iniciación o un paso temprano en el proceso de elongación es el factor limitante de la velocidad.

El primer paso postraduccional en la formación de tetrámeros es la combinación de cadenas de α-globina y no α-globina para formar dímeros, un evento que parece depender de la carga relativa de cada subunidad de globina. Los dímeros forman luego Hb tetramérica. Debido a las diferencias de carga entre las cadenas que no son de α-globina, existe una jerarquía o afinidad de estas cadenas por las de α-globina. La combinación de cadenas de globina α y β es la más favorecida seguida de una combinación de cadenas de globina α, γ y δ. Ciertos Hbs mutantes que han ganado o perdido una carga pueden alterar esta disposición jerárquica. Esto puede influir en la proporción de Hb variante presente, especialmente cuando el paciente también hereda un síndrome de α-talasemia, en el que se reduce la síntesis de cadenas de α-globina. El suministro de cadenas de α-globina disponibles es entonces limitado y las cadenas que no son de α-globina compiten entre sí para formar tetrámeros con la reserva de cadenas de α-globina limitante.

La biosíntesis de la cadena de globina y la síntesis de hemo son mutuamente importantes. El hemo juega un papel en la regulación del complejo de iniciación. Una deficiencia de hemo (p. Ej., Deficiencia de hierro) se asocia con la acumulación de un represor de factores de iniciación de la traducción. La traducción del ARNm de β-globina parece iniciarse de manera más eficaz que el ARNm de α-globina, lo que confiere a la anemia asociada algunas de las características de la α-talasemia leve. Este fenómeno se produce porque la deficiencia de hemo deprime la disponibilidad de factores iniciadores por los que el α-mRNA menos eficaz debe competir con el β-mRNA más eficaz.

La identificación de mutaciones genéticas que causan formas congénitas y adquiridas de anemia proporciona más información sobre las vías necesarias para la producción coordinada de globina y hemo. Más de la mitad de los pacientes con anemia de Diamond-Blackfan, un trastorno caracterizado por una anemia macrocítica grave y escasez de células progenitoras eritroides, tienen mutaciones en la línea germinal heterocigóticas en el RPS19 gen u otros genes que codifican proteínas ribosómicas. De manera similar, la anemia macrocítica en pacientes con síndrome mielodisplásico y una deleción del cromosoma 5q está causada por la deleción heterocigótica de otro gen de la proteína ribosómica. RPS14. La haploinsuficiencia de estos genes de proteínas ribosomales activa la vía p53, lo que conduce a la detención del ciclo celular y la apoptosis de forma selectiva en las células progenitoras eritroides.

La anemia refractaria con sideroblastos en anillo (RARS) es un subtipo de síndrome mielodisplásico caracterizado por mitocondrias cargadas de hierro evidentes en la tinción con azul de Prusia. En la mayoría de los casos de RARS, las mutaciones somáticas están presentes en el SF3B1 gen, que codifica un miembro central de la maquinaria de empalme de ARN. No se han identificado los objetivos precisos de SF3B1.


Resultados

Para construir este genoma modificado, utilizamos ingeniería de genoma automatizable multiplex de coselección (CoS-MAGE) (32, 33) para crear un mi. coli cepa (C123) con todos los 123 codones AGR eliminados de sus genes esenciales (ver Fig.1A y Dataset S1 para obtener una lista completa de codones AGR en genes esenciales). CoS-MAGE aprovecha la recombinación mediada por Lambda Red (34, 35) y explota el vínculo entre una mutación en un alelo seleccionable (p. Ej., tolC) a ediciones cercanas de interés (por ejemplo, conversiones AGR), enriqueciendo así las celdas con esas ediciones (Fig. S1). Para agilizar la construcción de C123, elegimos comenzar con mi. coli cepa EcM2.1, que se optimizó previamente para la ingeniería del genoma mediada por Lambda Red (33, 36). El uso de CoS-MAGE en EcM2.1 mejora la frecuencia de reemplazo de alelos en 10 veces más que MAGE en cepas no optimizadas, pero funciona de manera óptima cuando todas las ediciones están en el mismo replicoro y dentro de 500 kb del alelo seleccionable (33). Para satisfacer este requisito, dividimos el genoma en 12 segmentos que contienen todos los 123 codones AGR en genes esenciales. A tolC El casete se movió alrededor del genoma para habilitar CoS-MAGE en cada segmento, lo que nos permitió crear un prototipo de cada conjunto de mutaciones de AGR → CGU rápidamente en grandes poblaciones de células in vivo. (Por favor mira Estrategia de reemplazo general y Estrategia de resolución de problemas en Materiales y métodos para una discusión más detallada). De los 123 codones AGR en genes esenciales, 110 podrían cambiarse a CGU mediante este proceso (Fig. 1), lo que revela una considerable flexibilidad en el uso de codones para la mayoría de los genes esenciales. La frecuencia de reemplazo de alelos (en este caso, sustitución de codones AGR → CGU) varió ampliamente entre estos 110 codones permisivos, sin una correlación clara entre la frecuencia de reemplazo de alelos y la posición normalizada del codón AGR en un gen (Fig.2A).

Construcción de la cepa C123. (Interno) Flujo de trabajo utilizado para crear y analizar la cepa C123. La fase de DISEÑO implicó la identificación de 123 codones AGR en los genes esenciales de mi. coli. Los oligos MAGE se diseñaron para reemplazar todas las instancias de estos codones AGR con el codón CGU sinónimo. La fase de CONSTRUCCIÓN utilizó CoS-MAGE para convertir 110 codones AGR en CGU e identificar 13 codones AGR que requerían resolución de problemas adicional. La fase de RESOLUCIÓN DE PROBLEMAS in vivo resolvió los 13 codones que no se podían convertir fácilmente en CGU e identificó mecanismos que podrían explicar por qué AGR → CGU no tuvo éxito. En la fase de ESTUDIO, se realizaron la secuenciación, la evolución y el fenotipado de próxima generación en la cepa C123. (Exterior) Esquema del genoma de C123 (el nucleótido 0 está orientado hacia arriba y la numeración es según la cepa MG1655). Las etiquetas exteriores indican el conjunto de agrupaciones de codones AGR. Las conversiones exitosas de AGR → CGU (110 instancias) se indican mediante líneas radiales verdes, y los codones AGR recalcitrantes (13 instancias) se indican mediante líneas radiales rojas.

Análisis de intentos de sustitución de AGR → CGU. (A) Frecuencia de recombinación AGR (mascPCR, norte = 96 clones por población celular) frente a la posición ORF normalizada (número de residuo del codón AGR dividido por la longitud total del ORF). Las conversiones AGR → CGU fallidas se indican mediante líneas rojas verticales debajo de la X eje. (B) El tiempo de duplicación de las cepas en el linaje C123 en medio LB L a 34 ° C se determinó por triplicado en un lector de placas de 96 pocillos. Las barras coloreadas indican el conjunto de codones en construcción cuando se determinó un tiempo de duplicación (coloración basada en la Fig. 1). Cada punto de datos representa una etapa diferente de construcción de deformaciones. Se identificaron codones alternativos para 13 codones AGR recalcitrantes en nuestro proceso de resolución de problemas, las secuencias de reemplazo optimizadas se incorporaron en la cepa final (sección gris a la derecha, etiquetada con un asterisco) y se midieron los tiempos de duplicación resultantes. Las barras de error representan SEM en el tiempo de duplicación de al menos tres réplicas de cada cepa.

Estrategia para reemplazar cada conjunto de codones AGR en todos los genes esenciales de mi. coli (EcM2.1). Los codones AGR están marcados con triángulos abiertos (varios colores). Para empezar, un doble seleccionable tolC El casete (doble línea verde) se recombina en el genoma usando Lambda Red en una recombinación multiplexada junto con varios oligos que se dirigen a loci AGR aguas abajo cercanos (& lt500 kb) (varias líneas coloreadas). Tras la selección para tolC clones de inserción, los codones AGR elegidos correctamente (triángulos rellenos) también se observan a una frecuencia más alta debido al fuerte vínculo entre los eventos de recombinación en tolC y otros loci AGR aguas abajo cercanos (& lt500 kb). A continuación, se lleva a cabo una segunda recombinación utilizando el mismo grupo de oligonucleótidos de conversión de AGR pero ahora se empareja con otro oligo para interrumpir el tolC ORF con una parada prematura entonces el tolC Se aplica la contraselección, enriqueciendo nuevamente a la población para las conversiones AGR. Una tercera recombinación multiplexada luego fija la tolC ORF, de nuevo dirigido a los loci AGR. Después de la tolC Se aplica la selección, los clones se analizan mediante mascPCR. Si se han realizado la mayoría de las conversiones en un conjunto dado, el marcador seleccionable se elimina utilizando un oligo de reparación en una recombinación simple o multiplexada (según la necesidad). los tolC A continuación, se aprovecha la contraselección tanto para dejar un cromosoma sin cicatrices como para liberar el casete de tolC para su uso en otras partes del genoma.

Las 13 mutaciones restantes de AGR → CGU no se observaron, lo que sugiere una frecuencia de sustitución de codones por debajo de nuestro límite de detección del 1% de la población bacteriana (Materiales y métodos y conjunto de datos S2). Se asumió que estos "codones recalcitrantes" eran deletéreos o no recombinogénicos y se clasificaron en una tubería de resolución de problemas para su posterior análisis (Fig. 1). Curiosamente, todos excepto 1 de los 13 codones recalcitrantes se colocalizaron cerca de los extremos de sus respectivos genes, lo que sugiere la importancia de la elección del codón en estas posiciones: siete estaban como máximo 30 nt cadena abajo del codón de inicio y cinco como máximo 30 nt cadena arriba del codón de parada (Fig.2A, Más bajo y conjunto de datos S3). Debido a nuestra estrategia de diseño imparcial, anticipamos que varias mutaciones AGR → CGU presentarían defectos de diseño obvios, como la introducción de mutaciones no sinónimas (dos instancias) o interrupciones de RBS (cuatro instancias) en genes superpuestos. Por ejemplo, ftsI_AGA1759 se superpone al segundo y tercer codones de amurallar, un gen esencial, que introduce una mutación sin sentido (amurallar D3V) que pueden afectar la aptitud. Reemplazo ftsI_AGA con CGA reemplazó con éxito el codón AGA prohibido mientras conservaba la secuencia de aminoácidos primaria de MurE con un impacto mínimo en la aptitud (Fig.3A y conjunto de datos S2). Similar, holB_AGA4 se superpone al gen esencial aguas arriba tmk, y reemplazar AGA con CGU convierte la tmk codón de parada a Cys, añadiendo 14 aminoácidos al terminal C de tmk. Aunque algunas extensiones C-terminal son bien toleradas en mi. coli (37), ampliando tmk parece ser perjudicial. Reemplazamos exitosamente holB_AGA con CGC insertando tres nucleótidos que comprenden un codón de parada antes de la holB codón de inicio. Esta inserción redujo el tmk/holB se superponen y conservan las secuencias codificantes de ambos genes (Fig. S2A).

Ejemplos de mecanismos de falla para cuatro reemplazos de AGR recalcitrantes. Los codones de AGR de tipo salvaje se indican con letras negras en negrita, los defectos de diseño se indican con letras rojas y los genotipos de reemplazo optimizados se indican con letras verdes. (A) Los genes ftsI y amurallar se superponen entre sí. Una mutación AGA → CGU en ftsI introduciría una mutación Asp3Val no conservadora en amurallar. La secuencia de aminoácidos de amurallar se conservó mediante el uso de una mutación AGA → CGA. (B) Gen ver se superpone con el RBS para el gen esencial descendente nusG. Se predice que una mutación AGG → CGU disminuirá la fuerza del RBS en un 97% (53). La fuerza de RBS se conserva mediante el uso de una mutación no sinónima AGG → GAG. (C) Gen ssb tiene un motivo interno similar a RBS poco después de su codón de inicio. Una mutación AGG → CGU disminuiría la fuerza de RBS en un 94%. La fuerza de RBS se conserva mediante el uso de una mutación AGA → CGA combinada con mutaciones de oscilación adicionales indicadas por letras verdes. (D) Gen rnpA tiene una estructura de ARNm definida que cambiaría por una mutación AGG → CGU. La estructura del ARN original se conserva mediante el uso de una mutación AGG → CGG. El RBS (verde), el codón de inicio (azul) y el codón AGR (rojo) están anotados con recuadros de colores similares en las estructuras secundarias de ARN predichas.

Esquema de tres casos diferentes de falla en mutaciones AGR → CGU recalcitrantes. En cada caso, la fila superior es la secuencia inicial, la fila del medio es la mutación AGR → CGU y la tercera fila de la secuencia de ADN primaria es la solución optimizada en la que convergen en la resolución de problemas. Los recuadros verdes debajo de la secuencia de ADN indican la secuencia de aminoácidos en el mismo orden (el recuadro superior es la secuencia inicial, el recuadro del medio muestra los resultados de AGR → CGU y el recuadro inferior muestra los resultados de la solución de resolución de problemas). (A) Casos de superposición C-terminal de AGR en los extremos de genes esenciales con ORF descendentes. (I) Los genes ftsI y amurallar se superponen entre sí. Una mutación AGA → CGU en ftsI introduciría una mutación Asp3Val no conservadora en amurallar. La secuencia de aminoácidos de amurallar se conservó mediante el uso de una mutación AGA → CGA. (ii) Los genes holB y tmk se superponen entre sí. Una mutación AGA → CGU en holB introduciría una mutación Stop214Cys no conservadora en tmk. La secuencia de aminoácidos de tmk se conservó mediante el uso de una mutación AGA → CGC y la adición de tres nucleótidos. (B) Casos de superposición C-terminal de AGR en los extremos de genes esenciales con el RBS de un gen aguas abajo. (I) Gen ver se superpone con el RBS para el gen esencial descendente nusG. Una mutación AGG → CGU disminuiría la fuerza de RBS en un 97% (53). La fuerza de RBS se conserva mediante el uso de una mutación AGG → GAG. (ii) Gen adn se superpone con el RBS para el gen esencial descendente dnaC. Una mutación AGG → CGU disminuiría la fuerza de RBS en un 77% (53). La fuerza de RBS se conserva mediante el uso de una mutación AGG → CGA. (ii) Gen folC se superpone con el RBS para el gen descendente dedD, demostrado ser esencial en nuestra variedad. Una mutación AGGAGA → CGUCGU disminuiría la fuerza de RBS en un 99% (53). La fuerza de RBS se conserva mediante el uso de una mutación AGG → CGGCGA. (C) Motivos similares a RBS N-terminales que causan conversiones AGR recalcitrantes al comienzo de genes esenciales. (I) Gen adn tiene un motivo interno similar a RBS. Una mutación AGG → CGU aumentaría la fuerza de RBS 26 veces (53). La fuerza de RBS se conserva mejor mediante el uso de una mutación AGA → CGU combinada con mutaciones de oscilación adicionales. (ii) Gen prfB tiene un motivo interno similar a RBS. Este motivo similar a RBS está involucrado en un cambio de marco planificado aguas abajo en prfB (39). La mutación AGG → CGU solo fue posible eliminando el cambio de marco (dejando un sitio deficiente similar a RBS).Para mantener el desplazamiento del marco de lectura, se requirió la mutación AGG → CGG y una oscilación adicional. En ese caso, se mantuvo la fuerza de RBS local (cuarta fila). (iii) Gen ssb tiene un motivo interno similar a RBS. Una mutación AGG → CGU disminuiría la fuerza de RBS en un 94%. La fuerza de RBS se conserva mediante el uso de una mutación AGA → CGA combinada con mutaciones de oscilación adicionales.

Además, los cuatro fallos C-terminales restantes incluyeron mutaciones AGR → CGU que alteran los motivos RBS que pertenecen a genes posteriores (ver_AGG376 para nusG, adn_AGA532 para dnaC, y folC_AGAAGG1249,1252 para dedD, constituyendo el último dos codones). Ambos nusG y dnaC son esenciales, lo que sugiere que reemplazar AGR con CGU en ver y adn interrumpe letalmente el inicio de la traducción y, por lo tanto, la expresión de la superposición nusG y dnaC (Fig. 3B y Fig. S2B). A pesar de que dedD está anotado como no esencial (31), planteamos la hipótesis de que reemplazar el AGR con CGU en folC interrumpió una parte de dedD que es esencial para la supervivencia de EcM2.1 (mi. coli K-12). En apoyo de esta hipótesis, no pudimos eliminar los 29 nucleótidos de dedD que no fueron eliminados por Baba et al. (31) y no se superpone con folC, lo que sugiere que esta secuencia es esencial en nuestra variedad. La falla inesperada de esta conversión resalta el desafío de predecir fallas de diseño incluso en organismos bien anotados. De acuerdo con nuestra observación de que la interrupción de estos motivos RBS subyace en las conversiones fallidas de AGR → CGU, superamos los cuatro defectos de diseño seleccionando codones que conservaban la fuerza de RBS, incluida una conversión no sinónima (Arg → Gly) para ver.

Estas lecciones, junto con las observaciones previas de que los ribosomas se detienen durante la traducción cuando encuentran motivos RBS en secuencias de ADN codificantes (20), proporcionaron información clave sobre las fallas de AGR → CGU N-terminal. Tres de las fallas del terminal N (ssb_AGA10, dnaT_AGA10 y prfB_AGG64) tenía motivos similares a RBS que fueron interrumpidos o creados por el reemplazo de CGU. A pesar de que prfB_AGG64 es parte del motivo RBS que desencadena una mutación de cambio de marco esencial en prfB (21, 38, 39), deteniendo la regulación mediada por motivos de ssb y adn no se ha informado de expresión. Sin embargo, los datos de pausa ribosómica (20) mostraron que los picos de ocupación ribosómica están presentes directamente aguas abajo de los codones AGR para ssb y están ausentes por adn (Fig. S3) mientras tanto, se predijo que las mutaciones fallidas de la CGU debilitarían el motivo similar a RBS para prfB y ssb y para fortalecer el motivo similar a RBS para adn (Fig. 3C y Fig. S2C), lo que sugiere una relación funcional entre la ocupación de RBS y la aptitud celular. De acuerdo con esta hipótesis, los reemplazos de codones exitosos de la tubería de resolución de problemas conservan la fuerza de RBS predicha en comparación con la gran desviación predicha causada por mutaciones fallidas de AGR → CGU (Fig.4, eje y y comparación de asteriscos naranjas y puntos verdes). Curiosamente, los intentos de reemplazar adn_AGA10 con CGN o NNN falló solo manipulando la posición de oscilación de los codones circundantes y conservando el aminoácido Arg podría adn_AGA10 ser reemplazado (Fig. S2C). Estas variantes de oscilación parecen compensar el aumento de la fuerza de RBS causada por la mutación AGA → CGU: la fuerza del motivo de RBS con variantes de oscilación se desvió ocho veces de la secuencia no modificada, mientras que la fuerza del motivo de RBS para AGA → CGU solo se desvió 27 veces.

La fuerza del RBS y la estructura del ARNm predicen el éxito de la mutación sinónima. Gráfico de dispersión que muestra la fuerza de RBS prevista [y eje, calculado con la calculadora Salis RBS (53)] frente a las desviaciones en el plegamiento del ARNm [X eje, calculado a 37 ° C con la calculadora UNAFold (40)]. Los pequeños puntos grises representan genes no esenciales en mi. coli MG1655 que tienen un codón AGR dentro de los primeros 10 o últimos 10 codones. Los puntos grises grandes representan conversiones AGR → CGU exitosas en los primeros 10 o últimos 10 codones de genes esenciales. Los asteriscos naranjas representan mutaciones fallidas de AGR → CGU (codones recalcitrantes) en genes esenciales. Los puntos verdes representan soluciones optimizadas para estos codones recalcitrantes. La SRZ (región sombreada en azul) es un rango definido empíricamente de desviaciones de fuerza de RBS y plegamiento de ARNm, basado en las mutaciones de reemplazo AGR → CGU exitosas observadas en este estudio. La mayoría de las mutaciones AGR → CGU fallidas (asteriscos naranjas) causan grandes desviaciones en la fuerza o estructura del ARNm de RBS que están fuera de la SRZ. Los genes holB y ftsI son dos excepciones notables porque sus mutaciones iniciales en CGU causaron cambios de aminoácidos en genes esenciales superpuestos. Gene folC corresponde a dos AGR. Flechas para cuatro ejemplos de codones de reemplazo optimizados (ftsA, folC, rnpA, y rpsJ) muestran que se reducen las desviaciones en la fuerza del RBS y / o la estructura del ARNm. Las flechas se omiten para los ocho codones de reemplazo optimizados restantes para aumentar la legibilidad.

Datos de pausa ribosómica extraídos de trabajos anteriores (20) para genes ssb, adn, y prfB. La línea verde representa los datos de perfiles de ribosomas para cada gen. La línea naranja es el promedio de todos los genes con un codón AGR dentro de los primeros 30 nt del codón de inicio anotado. La región entre las dos líneas rojas verticales indica zonas de interés (centradas 12 pb después del codón AGR). Curiosamente, prfB y ssb muestran un pico después del codón AGR, pero no se observa ningún pico en esa ubicación para adn. Según las predicciones de la calculadora de Salis (53), se cree que la sustitución de AGR por CGU en esos tres casos altera la pausa ribosómica (prfB y ssb) o para introducir una pausa ribosómica (adn).

Para comprender mejor los varios casos restantes de falla N-terminal que no exhibieron desviaciones considerables en la fuerza de RBS (rnpA_AGG22, ftsA_AGA19, frr_AGA16, y rpsJ_AGA298), examinamos otros posibles determinantes de ácidos nucleicos de la expresión de proteínas. Basándonos en la observación de que la estructura secundaria del ARNm cerca del extremo 5 'de los ORF impacta fuertemente en la expresión de la proteína (12), encontramos que estas cuatro mutaciones AGR → CGU restantes cambiaron la energía de plegamiento predicha y la estructura del ARNm cerca del codón de inicio de la diana. genes (Fig.3D y Fig. S4). Los reemplazos de codones exitosos obtenidos a partir de oligos MAGE degenerados redujeron la alteración de la estructura secundaria del ARNm en comparación con la CGU (Fig. 4, puntos verdes). Por ejemplo, rnpA tiene un bucle de ARNm predicho cerca de su RBS y el codón de inicio que se basa en el emparejamiento de bases entre ambas guaninas del codón AGG y las citosinas cercanas (Fig.3D y Fig. S5A). Es importante destacar que solo se observó AGG22CGG de todos los intentos rnpA AGG22CGN, y el hecho de que solo CGG conserve esta estructura de ARNm sugiere que es fisiológicamente importante (Fig.3D y Fig. S5 B y C). En apoyo de esta noción, introdujimos con éxito un rnpA Mutación AGG22CUG (Arg → Leu) solo cuando cambiamos los nucleótidos complementarios en el tallo de CC (pares de bases con AGG) a CA (pares de bases con CUG), preservando así la estructura natural del ARN (Fig. S5D) mientras cambia tanto la fuerza del motivo RBS como la identidad de aminoácidos. Nuestro análisis de las cuatro secuencias de genes optimizadas mostró una desviación reducida en la energía de plegamiento del ARNm computacional [calculada con UNAFold (40)] en comparación con las mutaciones fallidas de la CGU (Fig. 4, X eje, asteriscos naranjas y puntos verdes). De manera similar, la estructura de ARNm predicha [calculada con diferentes programas de plegamiento de ARNm, NUPACK (41)] para estos genes se modificó fuertemente por mutaciones de CGU y se corrigió en nuestras soluciones empíricamente optimizadas (Fig. S4).

Predicciones de plegamiento de ARNm para las cuatro mutaciones recalcitrantes AGR → CGU explicadas por variaciones de plegamiento de ARNm. Predicción de plegamiento de ARNm de 100 nt cadena arriba y 30 nt cadena abajo del codón de inicio usando UNAfold (40). Tanto la forma del pliegue del ARNm como el valor de la energía de pliegue deben tenerse en cuenta para comprender el fallo de la conversión de AGR → CGU. AGR representa el ARNm de tipo salvaje predicho, CGU es la predicción de plegamiento de ARNm con una mutación AGR → CGU (generalmente no observada) y "Optimizado" corresponde a la predicción de plegamiento de ARNm de la solución de reemplazo de AGR encontrada después de la resolución de problemas in vivo. La energía libre de plegamiento prevista de la estructura visualizada expresada en kilocalorías por mol se enumera debajo de cada estructura.

Predicciones de plegamiento de ARNm para el gen. rnpA. Para las predicciones de plegamiento, utilizamos 30 nt aguas arriba y 100 nt aguas abajo del sitio de inicio rnpA usando UNAfold (40). (A) El tipo salvaje rnpA secuencia, con AGG en el cuadro azul. (B) El tipo salvaje rnpA secuencia con AGG → CGU en el cuadro azul (no observado). (C) El tipo salvaje rnpA secuencia con AGG → CGG en el cuadro azul (observado sin defecto de tasa de crecimiento). (D) El tipo salvaje rnpA secuencia con AGG → CTG en caja azul y una mutación complementaria CCC → CCA para mantener el bucle de ARNm (en la caja azul) (también observado sin defecto de tasa de crecimiento).

La resolución de problemas de estos 13 codones recalcitrantes reveló que las mutaciones que causan grandes desviaciones de la energía de plegamiento del ARNm natural o la fuerza del RBS están asociadas con sustituciones de codones fallidas. Al calcular estas dos métricas para todos los intentos de mutaciones AGR → CGU, definimos empíricamente una zona de reemplazo segura (SRZ) dentro de la cual se toleraron la mayoría de las mutaciones CGU (Fig. 4, área sombreada). El SRZ se define como el espacio multidimensional más grande que no contiene ninguno de los fallos AGR → CGU asociados con la energía de plegamiento del ARNm o la fuerza del RBS (Fig. 4, asteriscos rojos). Comprende desviaciones en la energía de plegamiento de ARNm de menos del 10% con respecto al codón natural y desviaciones en las puntuaciones de motivos similares a RBS de menos de medio logaritmo con respecto al codón natural, lo que proporciona una guía cuantitativa para la sustitución del codón. En particular, la solución optimizada utilizada para reemplazar los 13 codones recalcitrantes siempre exhibió una desviación reducida para al menos uno de estos dos parámetros en comparación con la desviación observada con una mutación CGU. Además, las soluciones de los 13 codones recalcitrantes se solaparon casi por completo con la SRZ definida empíricamente. Estos resultados sugieren que las predicciones computacionales de la energía de plegamiento del ARNm y la fuerza del RBS pueden usarse como una primera aproximación para predecir si es probable que una mutación diseñada sea viable. Desarrollando en silico La heurística para predecir alelos problemáticos agiliza el uso de métodos de ingeniería del genoma in vivo, como MAGE, para identificar empíricamente codones de reemplazo viables. Por lo tanto, estas heurísticas reducen el espacio de búsqueda necesario para rediseñar genomas viables, lo que aumenta la posibilidad de crear genomas radicalmente alterados que exhiban funciones biológicas expandidas.

Una vez que identificamos las secuencias de reemplazo viables para los 13 codones recalcitrantes, combinamos las 110 conversiones de CGU exitosas con las 13 sustituciones de codones optimizadas para producir la cepa C123, en la que los 123 codones AGR se han eliminado de todos sus genes esenciales anotados. A continuación, se secuenció C123 para confirmar la eliminación de AGR y se analizó utilizando Millstone, una tubería de análisis de resecuenciación del genoma disponible públicamente (https://github.com/churchlab/millstone). Se observaron dos mutaciones espontáneas de AAG (Lys) a AGG (Arg) en los genes esenciales pssA y cca. Aunque los intentos de revertir estas mutaciones a AAG no tuvieron éxito, tal vez sugiriendo una compensación funcional, pudimos reemplazarlos con CCG (Pro) en pssA y CAG (Gln) en cca utilizando oligos MAGE degenerados. La cepa resultante, C123a, es la primera cepa completamente desprovista de codones AGR en sus genes esenciales anotados (https://github.com/churchlab/agr_recoding) (Dataset S4). Aunque algunos codones AGR en genes no esenciales podrían resultar inesperadamente difíciles de cambiar, nuestro éxito en el reemplazo de las 123 instancias de codones AGR en genes esenciales proporciona una fuerte evidencia de que los restantes 4,105 codones AGR pueden eliminarse completamente del mi. coli genoma, lo que permite la reasignación inequívoca de la función de traducción AGR (23).

El análisis de crecimiento cinético mostró que el tiempo de duplicación aumentó de 52,4 (± 2,6) min en EcM2.1 (ningún codón AGR cambió) a 67 (± 1,5) min en C123a (123 codones AGR cambiaron en genes esenciales) en caldo de lisogenia (LB) a 34 ° C en un lector de placas de 96 pocillos (Materiales y métodos). En particular, la aptitud varió significativamente durante la construcción de la cepa C123 (Fig.2B). Esta variación puede atribuirse a la desoptimización de codones (AGR → CGU) y mutaciones espontáneas compensatorias para aliviar los defectos de aptitud en una reparación de desajuste deficiente (mutS-) antecedentes. En general, la reducción de la aptitud de C123a puede deberse a mutaciones en el objetivo (AGR → CGU) o fuera del objetivo (espontáneas) que se produjeron durante la construcción de la cepa. De este modo, mutS la inactivación es al mismo tiempo una herramienta evolutiva útil y un pasivo. El análisis final de la secuencia del genoma reveló que, junto con las 123 conversiones de AGR deseadas, C123a tenía 419 mutaciones espontáneas no sinónimas que no se encontraron en la cepa parental EcM2.1 (Fig. S6). De particular interés fue la mutación argU_G15A, ubicado en el brazo D de tRNA Arg (argU), que surgió durante CoS-MAGE con AGR conjunto 4. Presumimos que argU_G15A compensa el aumento de la demanda de CGU y la disminución de la demanda de AGR, pero no observamos ningún costo directo de aptitud asociado con la reversión de esta mutación en C123, y argU_G15A no afecta a la eficiencia de la aminoacilación in vitro ni a las agrupaciones de aminoacil-tRNA in vivo (Fig. S7 y Conjunto de datos S5). De acuerdo con los hallazgos de Mukai et al. (25) y Baba et al. (31), argW (ARNt Arg CCU decodifica solo AGG) era prescindible en C123a porque puede complementarse con argU (tRNA Arg UCU decodifica tanto AGG como AGA). Sin embargo, argU es el único mi. coli ARNt que puede decodificar AGA y sigue siendo esencial en C123a, probablemente porque se requiere para traducir los codones AGR para el resto del proteoma (23).

Gráfico representativo del genoma totalmente recodificado en relación con MG1655. El anillo exterior contiene la agrupación de conjuntos en la que se encuentra cada codón AGR (línea vertical). Cada línea contiene información sobre la resolución de problemas (rojo si se requirió resolución de problemas, verde si no fue así). La frecuencia de recombinación relativa está representada por la posición del punto. Cada anillo interno representa las mutaciones que se acumularon durante la construcción de la cepa. Se resalta el conjunto objetivo de codones AGR para cada anillo. Los anillos internos con líneas radiales negras representan las mutaciones que se acumularon mientras que los 13 codones recalcitrantes mutaron a sus reemplazos de codones optimizados.

G15A ArgU no afecta los niveles de expresión y aminoacilación en los tipos salvaje y recodificados mi. coli son. Northern blot acid-urea PAGE se realizó en tRNA de tipo salvaje y G15A argU en tipo salvaje mi. coli (WT-WT y WT-G15A) y en las cepas finales C123a yb (501 y 503) en varias condiciones de crecimiento. Los niveles de aminoacilación son comparables a los del tipo salvaje para todas las condiciones y combinaciones, lo que sugiere que no hay efecto sobre los niveles de carga a pesar de que la mutación se extiende a la población (conjunto de datos S5).

Para evaluar la estabilidad genética de C123a después de la eliminación de todos los codones AGR de todos los genes esenciales conocidos, pasamos C123a durante 78 d (640 generaciones) para probar si los codones AGR reaparecerían y / o si las mutaciones espontáneas mejorarían la aptitud. Después de 78 d, no se detectaron codones AGR adicionales en una población secuenciada (los datos de secuenciación están disponibles en https://github.com/churchlab/agr_recoding), y el tiempo de duplicación de los clones aislados osciló entre un 22% más rápido y un 22% más lento que C123a (norte = 60).

Para obtener más información sobre cómo la fuerza del RBS local y el plegado del ARNm impactan en la elección del codón, realizamos un experimento de evolución para examinar la aptitud competitiva de las 64 posibles sustituciones de codones en cada uno de los codones AGR (conjunto de datos S6). Aunque MAGE es un método poderoso para explorar modificaciones genómicas viables in vivo, estábamos interesados ​​en mapear el costo de aptitud asociado con elecciones de codones menos óptimas, lo que requiere una aleatorización de codones agotada del genotipo parental, que hipotetizamos que está en o cerca de la aptitud global máximo. Para ello, desarrollamos un método llamado “CRAM” (MAGE asistido por Crispr). En primer lugar, diseñamos oligos que cambiaron no solo el codón objetivo AGR a NNN, sino que también realizaron varios cambios sinónimos al menos 50 nt aguas abajo que interrumpirían un locus objetivo CRISPR de 20 pb. Se usó MAGE para reemplazar cada AGR con NNN en paralelo, y se usó CRISPR / cas9 para reducir la población de células con el genotipo parental. Este enfoque permitió una exploración exhaustiva del espacio de codones, incluido el codón original, pero sin la preponderancia del genotipo parental. Después de CRAM, la población se pasó 1: 100 cada 24 h durante 6 d y se muestreó antes de cada pase utilizando la secuenciación de Illumina (Fig. 5 y conjunto de datos S6).

Preferencia de codón de 14 codones AGR N-terminales. Se usó CRAM para explorar la preferencia de codones por varios codones AGR ubicados dentro de los primeros 10 codones de su CDS. Brevemente, se usó MAGE para diversificar una población aleatorizando el AGR de interés y luego se usó CRISPR / Cas9 para agotar la población parental (no modificada), permitiendo la exploración exhaustiva de los 64 codones en una posición de interés. A partir de entonces, se controló la abundancia de codones a lo largo del tiempo pasando en serie la población de células y secuenciando usando un Illumina MiSeq. La izquierda y El eje (frecuencia de codones) indica la abundancia relativa de un codón particular (gráfico de áreas apiladas). La derecha y El eje indica las desviaciones combinadas en la estructura de plegamiento del ARNm (línea roja) y la fuerza interna de RBS (línea azul) en unidades arbitrarias (AU) normalizadas a 0,5 en el punto de tiempo inicial. Cero indica que no hay desviación del tipo salvaje. El eje horizontal indica el punto de tiempo experimental (en horas) en el que se obtuvo una lectura particular de la diversidad de la población. Los genes bcsB y chpS no son esenciales en nuestras cepas y, por lo tanto, sirven como controles para los codones AGR que no están bajo la presión génica esencial.

La secuenciación 24 h después de CRAM mostró que todos los codones estaban presentes, incluidos los codones de parada (Fig. S8), validando el método como una técnica para generar diversidad masiva en una población. Todas las secuencias para análisis adicionales se amplificaron mediante PCR con cebadores específicos de alelo que contenían la secuencia cadena abajo modificada. El paso posterior de estas poblaciones reveló muchas tendencias específicas de genes (Fig. 5 y Figs. S8 y S9). En particular, todos los codones que requirieron solución de problemas (dnaT_AGA10, ftsA_AGA19, frr_AGA16, y rnpA_AGG22) convergió a su codón AGR de tipo salvaje, lo que sugiere que el codón original se optimizó globalmente. Para todos los casos en los que un codón alternativo reemplazó al AGR original, calculamos la desviación predicha en la energía de plegamiento del ARNm y la fuerza del RBS local (como un proxy para la pausa del ribosoma) para estos codones alternativos y comparamos estas métricas con la evolución de la distribución del codón en este posición a lo largo del tiempo. También calculamos la fracción de secuencias que caen dentro de la SRZ inferida de la Fig.4 (Materiales y métodos). CRAM introdujo inicialmente una gran diversidad de energías de plegamiento de ARNm y fuerzas de RBS, pero estos genotipos convergieron rápidamente hacia parámetros que son similares a los valores de AGR parentales en muchos casos (superposiciones en la Fig. 5). Los codones que interrumpieron fuertemente el plegamiento del ARNm predicho y la fuerza interna del RBS cerca del comienzo de los genes se desfavorecieron después de varios días de crecimiento, lo que sugiere que estas métricas pueden usarse para predecir las sustituciones óptimas de codones. en silico. Por el contrario, los genes de control no esenciales bcsB y chpS no convergió hacia codones que conservaban la estructura del ARN o la fuerza del RBS, lo que respalda la conclusión de que la conservación observada en la estructura secundaria del ARN y la fuerza del RBS es biológicamente relevante para los genes esenciales. Curiosamente, tilS_AGA19 fue menos sensible a este efecto, lo que sugiere que la elección del codón en esa posición particular no está bajo selección. Además, la fuerza interna promedio de RBS para el ispG las poblaciones convergieron hacia los valores de AGR parentales, pero los promedios de energía de plegamiento del ARNm no lo hicieron, lo que sugiere que esta posición en el gen puede ser más sensible a la alteración del RBS que al plegamiento del ARNm. Gene lptF siguió la tendencia opuesta.

El número de lecturas para cada codón y para cada gen en el experimento CRAM en el momento de 24 h. Se usó CRAM para explorar la preferencia de codones por varios codones AGR N-terminales. La izquierda y eje (número de lecturas) indica la abundancia de un codón particular. los X El eje indica los 64 codones posibles clasificados de AAA a TTT en orden alfabético. Se presenta el punto de tiempo experimental 24 h. La diversidad se evaluó mediante secuenciación de Illumina. Los genes bcsB y chpS no son esenciales y, por lo tanto, sirven como controles para los codones AGR que no están bajo la presión génica esencial.

El número de lecturas para cada codón y para cada gen en el experimento CRAM en el momento de 144 h. Se usó CRAM para explorar la preferencia de codones por varios codones AGR N-terminales. La izquierda y eje (el número de lecturas) indica la abundancia de un codón particular. los X El eje indica los 64 codones posibles clasificados de AAA a TTT en orden alfabético. Se presenta el punto de tiempo experimental 144 h. La diversidad se evaluó mediante secuenciación de Illumina. Los genes bcsB y chpS no son esenciales y, por lo tanto, sirven como controles para los codones AGR que no están bajo la presión génica esencial.

Curiosamente, varios genes (lptF, ispG, tilS, gyrA, y llanta) codones preferidos que cambiaron la identidad de aminoácidos de Arg a Pro, Lys o Glu, lo que sugiere que las funciones no codificantes triunfan sobre la identidad de aminoácidos en estas posiciones. Es importante destacar que todas las sustituciones de codones exitosas en genes esenciales cayeron dentro de la SRZ (Fig. 6), validando nuestra heurística basada en una prueba imparcial de los 64 codones. Mientras tanto, gen de control no esencial chpS exhibió menos dependencia de la SRZ.

La fuerza de RBS y la estructura del ARNm predicen la preferencia de codones de 14 sustituciones de codones N-terminales. Los gráficos de dispersión muestran los resultados del experimento CRAM (Fig. 5). Cada panel representa un gen diferente. los y El eje representa la desviación de la fuerza de RBS [calculada con la calculadora Salis RBS (53)], y el X El eje muestra las desviaciones en la energía de plegado del ARNm [calculado a 37 ° C por la calculadora UNAFold (40)]. La abundancia de codones en el punto de tiempo intermedio (t = 72 h, elegido para mostrar la máxima diversidad después de la selección) está representada por el tamaño del punto. Los puntos verdes representan el codón de tipo salvaje. Los puntos azules representan codones AGR sinónimos. Los puntos naranjas representan los 58 codones no sinónimos restantes, que pueden introducir sustituciones de aminoácidos no viables. Los cuadrados negros representan conversiones AGR → CGU fallidas observadas en el esfuerzo de recodificación de todo el genoma (Fig. 1 y Tabla 1). La SRZ (región sombreada en azul) es el rango definido empíricamente de desviaciones de fuerza de RBS y plegamiento de ARNm, basado en las mutaciones de reemplazo AGR → CGU exitosas observadas en este estudio (Fig. 3). Los genes bcsB y chpS no son esenciales en nuestras cepas y, por lo tanto, sirven como controles para los codones AGR que no están bajo la presión génica esencial.


Resultados

Alfavirus

Primero, aplicamos cRegions y synplot2 en las 24 poliproteínas no estructurales de alfavirus (ver también el ejemplo de "conjunto de datos de alfavirus" en la página de inicio de cRegions). Detectamos un total de seis señales significativas con cRegions (Fig. 1A) y tres señales significativas con el synplot2 (Figs. S4A y S5A). La primera señal del extremo 5 'fue reconocida por ambos programas (Fig. 1A) y se extendió desde las posiciones 138 a 174 en la alineación de codones (Tabla 1). Es un elemento de secuencia conservada (CSE) llamado "CSE de 51 nt", que actúa como un potenciador de la síntesis de ARN, afectando la replicación viral. Este CSE forma dos bucles de tallo y está ubicado en las posiciones 155-205 en el genoma del virus Sindbis (SINV) (Niesters & amp Strauss, 1990). Por tanto, la señal detectada se encuentra exactamente en la región (Tabla 1).

Figura 1: Análisis de regiones de poliproteínas no estructurales de alfavirus utilizando la prueba de bondad de ajuste de Chi-cuadrado.

Señal Descripción Conjunto de datos Posición en la alineación del codón SFV * SINV *
Poliproteína no estructural 1 51 nt CSE Todos (Fig. 1A) 138–174 184–220 161–197
2 Señal adyacente a la región de unión de la cápside Todos (Fig. 1A) 1,149 N / A 1,148
Nuevo mundo (Fig. 1B) 1.086 y 1.092 N / A 1.142 y 1.148
3 Señal de empaquetado de alfavirus del complejo SFV Todos (Fig. 1A) 2,835 2,812 2,804
Complejo SFV (figura 1C) 2,730 2,812 2,804
4 Señal dentro de la región b Todos (Fig. 1A) 2,967 2,944 2,936
5 Señal adyacente al codón de parada con fugas Todos (Fig. 1A) 6,834 5,536 5,768
Nuevo mundo (Fig. 1B) 6,159 N / A 5,888
6 Promotor subgenómico de alfavirus Todos (Fig. 1A) 8.658 y 8.664 7.354 y 7.360 7.583 y 7.589
Poliproteína estructural 1 Motivo UUUUUUA Todos (Fig.2) 2,673–2,679 9,825–9,831 10,022–10,028

El segundo impacto significativo, un solo nucleótido en la posición 1.149, fue detectado solo por el algoritmo cRegions. Sin embargo, dos posiciones adyacentes 1.143 y 1.146 estaban justo por debajo del umbral. En el conjunto de datos de alfavirus del Nuevo Mundo, además de la posición 1.149, 1.143 también fue significativa. La señal es adyacente a la señal de empaquetamiento de SINV y alfavirus del Nuevo Mundo (ver también el ejemplo de "Conjunto de datos de alfavirus del Nuevo Mundo" en la página de inicio de cRegions). Se ha demostrado que un fragmento de 570 nt posiciona 684-1,253 del SINV se une a la proteína de la cápside viral y es necesario para el empaquetamiento de SINV. La señal detectada se encuentra en esta región (Weiss et al., 1989). Sin embargo, cuando analizamos los VEEV por separado, pudimos detectar las posiciones de los vástagos previstos filogenéticamente conservados (Fig. S7). Los resultados son similares al trabajo realizado por Kim et al. (2011).

La tercera y la cuarta señal también son nucleótidos únicos en las posiciones 2.835 y 2.967, respectivamente (Fig. 1A). Ambas señales están ubicadas dentro de la región conservada de nsp2 llamada región b. Esta región de 266 nucleótidos se encuentra entre 2726 y 2991 en el genoma de SFV (White, Thomson & amp Dimmock, 1998). El análisis previo de mutación por deleción ha demostrado que se requieren nucleótidos de 2.767 a 2.824 en la región b para el empaquetamiento eficiente del genoma del SFV. (White, Thomson y Dimmock, 1998). La primera señal se encuentra en esa región. Además, el análisis de los virus "SFV Complex" por separado condujo a una mayor importancia de la primera señal (Fig. 1C) y la misma señal se hizo visible con synplot2 (Figs. S4B y S5B). Como era de esperar, ambas señales desaparecieron en el conjunto de datos del Nuevo Mundo, ya que la señal de empaquetamiento se encuentra en una ubicación diferente en estos virus (Fig. 1B). Por lo tanto, dividir los conjuntos de datos en diferentes subconjuntos puede ayudar a detectar señales que solo son características de subgrupos más pequeños.

El quinto impacto significativo es un solo nucleótido en la posición 6.834. Es aguas abajo del codón de parada "con fugas" (el codón de parada está en 6,814-6,816 en la alineación del codón y en el genoma SINV en nt 5,748-5,750). Synplot2 pudo detectar una región mucho más grande en comparación con las cRegions en la misma área (Figs. S4A y S5A). La señal detectada es una estructura secundaria de ARN de tallo-bucle 3 'inmediatamente adyacente al codón de terminación (+13 nt aguas abajo del codón de terminación en SINV). Para muchos alfavirus, incluidos VEEV y SINV, se ha informado que influye en la lectura. En el genoma SINV, se predice que la parte de doble hélice (el tallo) del tallo-bucle se forma entre las dos regiones: 5.763–5.772 y 5.928–5.939 (Firth et al., 2011). Por lo tanto, la señal detectada en la posición 6.834 (5.768 en SINV) está dentro de la primera región. Sin embargo, cuando analizamos los VEEV por separado, pudimos detectar múltiples señales significativas dentro de esta región de tallo-bucle (Fig. S7).

La sexta señal consta de dos posiciones 8658 y 8664 en la alineación de codones (figura 1A, figuras S4A y S5A). La señal se encuentra dentro del promotor subgenómico de alfavirus (Raju & amp Huang, 1991 Rupp et al., 2015).

Las cRegions y synplot2 también se aplicaron a las poliproteínas estructurales de los alfavirus (ver también el ejemplo de "conjunto de datos estructurales de alfavirus" en la página de inicio de cRegions). Se utilizó una ventana corrediza de tamaño 2 con cRegions. Se detectó una señal fuerte en las posiciones 2.643-2.649 en la alineación del codón, que corresponde a un motivo UUUUUUA (Fig. 2). El motivo es responsable de un cambio de marco en una proteína estructural (Firth et al., 2008 Chung, Firth & amp Atkins, 2010). Se detectó la misma señal con el synplot2 (Fig. S6).

Figura 2: Análisis de regiones de poliproteínas estructurales de alfavirus.

Requisitos sobre secuencias

El método utilizado en cRegions tiene algunas limitaciones y requisitos previos (Puustusmaa & amp Abroi, 2016). Primero, las secuencias en estudio deben haber divergido. En segundo lugar, el elemento funcional incorporado debe haber estado bajo selección. Para ayudar a los usuarios a evaluar sus secuencias en estos aspectos, agregamos una versión interactiva de la Fig. 3 a la herramienta web. La trama visualiza las secuencias en estudio en comparación con las secuencias mutadas aleatoriamente y las secuencias analizadas minuciosamente en el estudio anterior o actual con respecto a la divergencia y la selección. Para evaluar la divergencia y la selección usamos la relación entre la identidad de nucleótidos por pares promedio y la identidad de aminoácidos por pares promedio (Fig. 3). Como se muestra en la Fig. 3, las secuencias simuladas mutadas aleatoriamente forman un conjunto claro y estrecho en el gráfico. Se utilizaron secuencias mutadas aleatoriamente con una extensión definida (N mutaciones por pb) para modelar la evolución neutra y / o secuencias no divergentes (más detalles en "Materiales y métodos"). Las secuencias de origen natural utilizadas en el estudio anterior y en el actual se ubican claramente lejos de las secuencias simuladas.

Figura 3: La identidad media por pares de las secuencias de nucleótidos de la alineación de codones representada frente a la identidad media por pares de las secuencias de proteínas en los respectivos MSA.

Secuencias que tienen baja divergencia y / o que tienen una evolución cercana a la neutral

Como cRegions fue diseñado para trabajar en secuencias divergentes, el método puede dar posibles señales falsas positivas en secuencias de baja divergencia o en secuencias ubicadas cerca de secuencias de evolución neutra (Fig. 4 Fig. S8). Para evitar esto, recomendamos habilitar la corrección de umbral en la herramienta web. Al habilitar esta opción, los valores esperados se corrigen con los valores observados y se calcula el umbral ajustado (consulte "Materiales y métodos"). Esto elimina la mayor parte de la señal falsa positiva de las secuencias que están cerca de las secuencias que mutan aleatoriamente (Fig. 4 Fig. S8). Nos gustaría señalar que la corrección es necesaria sólo en el caso de secuencias que están cerca de las secuencias de evolución neutra / aleatoria (Fig. 3). Otra opción es utilizar synplot2 que utiliza la evolución neutra como hipótesis nula (Firth, 2014)

Figura 4: el número de señales en secuencias mutadas aleatoriamente.


RESULTADOS

Secuencias de ADNc y proteínas de humanos, ratones y Drosophila MMS19 ortólogos

Las bases de datos públicas se examinaron con la secuencia de aminoácidos publicada de la yMMS19 gene. Dos tecnologías ecológicamente racionales derivadas del cerebro humano adulto (<"type": "entrez-nucleotide", "attrs": <"text": "R89623", "term_id": "954450" >> R89623) y del timo de ratón (<" type ":" entrez-nucleotide "," attrs ": <" text ":" AA939567 "," term_id ":" 3100344 ">> AA939567) se identificaron con una homología significativa con el extremo C-terminal de la yMMS19 ORF. Para obtener de larga duración MMS19 ADNc Se seleccionaron bibliotecas de ADNc humano y de ratón con sondas RT & # x02013PCR. El clon más grande obtenido de una biblioteca de ADNc de células HeLa humana tenía una longitud de 3772 pb. Este cDNA contiene un ORF de 2616 pb que puede codificar una proteína de 872 aminoácidos con una masa molecular prevista de 96 kDa. La alineación con la proteína de levadura Mms19 indicó homología de secuencia de aminoácidos que se extiende al menos 100 aminoácidos cadena arriba del codón de inicio de metionina en esta transcripción humana (datos no mostrados), lo que sugiere que este ADNc corresponde a una forma empalmada alternativamente de la transcripción primaria. Por lo tanto, realizamos 5 & # x02032-RACE a partir de ARN total de testículo humano usando cebadores que mapean inmediatamente 5 & # x02032 al primer codón de metionina en el cDNA. Esto confirmó la presencia de formas empalmadas alternativamente del MMS19 gen (ver más abajo) y proporcionó una transcripción completa. Para verificar estos resultados amplificamos el ORF de longitud completa de la hMMS19 gen de ARN total de testículo humano. Se obtuvo un ADNc idéntico a las secuencias contiguas previamente alineadas. El cDNA completo identificado para la hMMS19 gen (número de acceso de GenBank <"tipo": "entrez-nucleotide", "attrs": <"text": "AF319947", "term_id": "14029385" >> AF319947) contiene un ORF de 3090 nt que puede codificar una proteína de 1030 aminoácidos (Fig. & # x200B (Fig. 1) 1) con una masa molecular predicha de 113 kDa.

Alineación de aminoácidos del Homo sapiens, Mus musculus, D.melanogaster, A.thaliana, C.elegans, S.pombe y S. cerevisiae Proteínas Mms19. La alineación se generó utilizando el programa CLUSTAL-X. La región altamente conservada de los aminoácidos & # x0223c120 en el extremo N está encuadrada. El exón 8 (que puede empalmarse alternativamente) corresponde a los primeros 43 aminoácidos de esta región. Las cuatro repeticiones de HEAT también están encuadradas y etiquetadas como I & # x02013IV. Sólo repita IV de C.elegans se incluye en esta caja. Se indica el codón de inicio de metionina usado con el corte y empalme alternativo del exón 2b o 3 (& # x0002a). Los 39 aminoácidos que difieren de la proteína humana MMS19 publicada anteriormente (9) están subrayados. En concreto son los siguientes: SCCRQLQVHLPVTLSPAMYCLYCWNSSTSTVAASGG. La secuencia KRX & # x0005bLV & # x0005d conservada en HEAT repeat IV está subrayada.

Una biblioteca de ADNc de testículo de ratón produjo un solo clon de 977 pb en el Mms19 región de codificación. Se obtuvo un ADNc de longitud completa mediante múltiples rondas de 5 & # x02032-RACE de ARN total de testículo de ratón. El raton mas largo Mms19 ADNc identificado (designado mMms19) tiene una longitud de 3491 pb (número de acceso de GenBank <"tipo": "entrez-nucleotide", "attrs": <"text": "AF319949", "term_id": "14029389" >> AF319949) y predice un polipéptido de 1031 aminoácidos (Fig. & # x200B (Fig. 1) 1) con una masa molecular de 113 kDa. El dMMS19 El gen se clonó a partir de ARN total de mosca completa mediante RT & # x02013PCR. El gen comprende 2880 pb (número de acceso de GenBank <"type": "entrez-nucleotide", "attrs": <"text": "AF319948", "term_id": "14029387" >> AF319948) y puede codificar una proteína de 958 aminoácidos (Fig. & # x200B (Fig. 1) 1) con una masa molecular calculada de 107 kDa.

yMMS19 homólogos de otros eucariotas, incluidos S.pombe (<"type": "entrez-protein", "attrs": <"text": "CAB59878", "term_id": "6179659" >> CAB59878), Caenorhabitis elegans (<"type": "entrez-nucleotide", "attrs": <"text": "AF067936", "term_id": "351050523" >> AF067936) y A.thaliana (<"tipo": "entrez-nucleotide", "attrs": <"text": "AB023039", "term_id": "4220638" >> AB023039) se tradujeron a partir de clones de ADNc genómico y parcial obtenidos de bases de datos públicas. Alineaciones de proteínas que incluyen todas las identificadas MMS19 los ortólogos confirmaron la conservación extensa de las secuencias de aminoácidos (Fig. & # x200B (Fig.1). 1). Las secuencias de aminoácidos predichas de las proteínas Mms19 humana y de ratón son 90 & # x00025 idénticas y comparten 93 & # x00025 similitud. Tanto los polipéptidos humanos como los de ratón tienen esencialmente el mismo tamaño que el codificado por el gen de la levadura (1030, 1031 y 1032 aminoácidos, respectivamente). También comparten una frecuencia similar de aminoácidos ácidos (10,3 & # x00025 para humanos y ratones y 12,2 & # x00025 para levadura) y básicos (11,5 & # x00025 para humanos y ratones y 12,1 & # x00025 para levaduras) y una estimación similar. pI de 5,92 (5,72 para la proteína Mms19 de levadura). En general, los polipéptidos humanos y de ratón comparten una identidad de aminoácidos de 25 & # x00025 y una similitud de 50 & # x00025 con la proteína Mms19 de levadura ortóloga. La secuencia de aminoácidos predicha para la proteína humana difiere de la informada previamente (9) en un tramo de 39 aminoácidos ubicado entre los residuos de aminoácidos 373 y 412 (Fig. & # X200B (Fig. 11).

Se predice con seguridad que las proteínas Mms19 poseen predominantemente una estructura helicoidal & # x003b1 (16), con un pequeño dominio & # x003b1 & # x0002f & # x003b2 potencialmente presente en la parte media de la proteína. El análisis de secuencia usando el programa SEG (15) sugiere que las secuencias de Mms19 pueden dividirse en dos regiones globulares predichas. La región globular N-terminal más larga abarca las posiciones de aminoácidos 1 & # x02013770, que incluye una región altamente conservada de & # x0223c120 aminoácidos localizados entre los residuos 167 y 285 de la proteína Mms19 de levadura. Esta región comparte una identidad de secuencia de aminoácidos de 42 & # x00025 y una similitud de 62 & # x00025 con las proteínas humanas y de ratón (Fig. & # X200B (Fig. 1). 1). Una región globular C-terminal más corta abarca las posiciones de aminoácidos & # x0223c880 & # x020131032, mientras que se predice que la región intermedia no es globular. Cuando la secuencia de la región globular C-terminal se comparó de forma independiente con la base de datos de secuencias de proteínas utilizando el programa iterativo PSI-BLAST (12), se detectó una similitud moderada pero estadísticamente significativa con una variedad de proteínas que contienen las llamadas repeticiones HEAT (19, 20). Utilizando un valor esperado de 0,05 como punto de corte para incluir secuencias en el perfil de búsqueda, se recuperaron las secuencias de proteínas de repetición HEAT & # x0223c500 de la base de datos en 10 iteraciones de búsqueda sin ningún falso positivo obvio.Un análisis más detallado realizado buscando las secuencias Mms19 con un perfil de repetición HEAT genérico (Fig. & # X200B (Fig.2) 2) mostró la presencia de cuatro repeticiones (Figs & # x200B (Figs1 1 y & # x200B y2). 2). Estos comprenden un grupo muy espaciado, una disposición característica de las proteínas repetidas HEAT (20). Las cuatro repeticiones se conservan en todas las secuencias disponibles de ortólogos eucariotas Mms19, con la excepción de la C.elegans secuencia en la que la región de repetición HEAT está muy divergente y sólo la repetición distal se conserva claramente (Figs. & # x200B (Figs. 1 1 y & # x200B y 2). 2). De particular interés es el motivo KRx & # x0005bIV & # x0005dR (aminoácidos alternativos entre paréntesis), que se conserva en la repetición más distal de los ortólogos Mms19 (Fig. & # X200B (Fig.1). 1). Este motivo puede funcionar como un determinante de unión específico.

Múltiples alineaciones de las repeticiones HEAT en los ortólogos Mms19 Tor1p y & # x003b2-importin. La alineación se construyó analizando los resultados de PSI-BLAST, con los límites de repetición derivados de la estructura cristalina de & # x003b2-importina (código PDB 1QGKA). La estructura secundaria debajo de la alineación es de la estructura 1QGKA: h indica & # x003b1-helix. Los números muestran las posiciones del primer y último residuo alineado en las correspondientes secuencias de proteínas. El consenso 80 & # x00025 muestra las siguientes clases de residuos de aminoácidos: h, hidrofóbico (ILVMFYWAC) 1, alifático (ILV) p, polar (STDENQKRH) s, pequeño (GASTVNAC) & # x0002b, cargado positivamente (KRH). Las posiciones con el mayor contenido de información en la alineación general de repetición de HEAT se resaltan en sombreado inverso.

Empalme alternativo de la hMMS19 gene

Durante la clonación de los ADNc de humanos y de ratón, identificamos diferentes clones, presumiblemente reflejando múltiples transcripciones. Para determinar si estos corresponden a productos empalmados alternativamente, establecimos los límites del exón & # x0002fintron del hMMS19 gen (Figura & # x200B (Figura 3A). 3 A). El gen comprende al menos 32 exones que abarcan & # x0003e40 kb. Los dos dominios altamente conservados descritos anteriormente están codificados por los exones 8 & # x0201311 y los exones 27 & # x0201332, respectivamente. La más abundante hMMS19 El ADNc (3530 pb) corresponde a & # x0223c75 & # x00025 de todas las transcripciones identificadas e incluye todos los exones codificantes (2b-32) más el exón 1 en el 5 & # x02032-UTR (Fig. & # x200B (Fig. 3B, 3 B, transcripción A). Este ADNc puede codificar potencialmente un polipéptido de 1030 aminoácidos y utiliza la primera señal de poliadenilación en el 3 & # x02032-UTR. El transcrito B difiere solo en el 5 & # x02032-UTR por la presencia del exón 2a en lugar del exón 1 (Fig. & # X200B (Fig. 3B). 3 B). Los ADNc restantes identificados pueden codificar polipéptidos que son 43, 158 o 201 aminoácidos más cortos que los codificados por las transcripciones A o B (1030 aminoácidos) (Fig. & # X200B (Fig. 3B). 3 B). # x200B (Fig.3). 3). Se espera que el empalme alternativo del exón 8 (Fig. & # x200B (Fig. 3B, 3 B, transcripciones E y F) elimine parte de la región conservada N-terminal en el ser humano Proteína Mms19. Al menos una de estas transcripciones (transcripción D, Fig. & # X200B Fig. 3B) 3 B) utiliza el segundo sitio de poliadenilación (pA2, Fig. & # X200B Fig. 3A). 3 A). Se están realizando estudios para evaluar la importancia biológica de estas transcripciones alternativas. Todas las transcripciones detectadas incluyen la región que codifica las repeticiones HEAT del C-terminal.

(A) Representación esquemática de la hMMS19 estructura genómica. Las líneas horizontales representan intrones. Los rectángulos y las líneas verticales corresponden a los exones. A modo de orientación, se muestran algunos números de exón. Se indican las posiciones de los supuestos codones de inicio ATG, así como el codón de terminación TGA. Las secuencias de codificación se representan como cajas llenas. Las regiones sin traducir se representan como cuadros abiertos. La primera señal de poliadenilación (pA1), en la posición del nucleótido 3514, es la más utilizada. En algunas transcripciones se utiliza una señal de poliadenilación aguas abajo (pA2). No se pudo determinar la longitud completa del exón 32 debido a la presencia de Alu secuencias. (B) Representación esquemática de partes de la hMMS19 transcripciones identificadas en tejidos normales. Los exones 10 & # x0201332 se encontraron en todas las transcripciones y no están representados para simplificar. Las cajas negras corresponden a las regiones de codificación. Los recuadros abiertos representan exones no traducidos. El exón 1 o 2a (no codificante) se utiliza exclusivamente en el 5 & # x02032-UTR del MMS19 gene. Las transcripciones A y B se muestran como ejemplos. Las transcripciones D y E también se identificaron con el exón 2a en lugar del exón 1. El corte y empalme alternativo del exón 8 aparentemente puede ocurrir solo, como se muestra en la transcripción C, o en combinación con el corte y empalme alternativo del exón 2b o 3 (transcripciones G y E). Ambas situaciones eliminan 43 aminoácidos en uno de los dos dominios altamente conservados de la proteína Mms19 (ver Fig. 1). Los exones 2b y 3 también pueden empalmarse alternativamente, dando como resultado polipéptidos potencialmente incluso más cortos (transcripciones D & # x02013G).

Humano y ratón MMS19 patrones de expresión genética

El análisis de transferencia Northern de tejidos adultos y fetales humanos y de ratón reveló la presencia de niveles moderados a altos en estado estacionario de MMS19 ARNm en todos los tejidos analizados (Fig. & # x200B (Fig. 4A 4 A y B y datos no mostrados). La transcripción más abundante tiene un tamaño estimado de 3,9 kb en tejidos humanos (Fig. & # x200B (Fig. 4A)) 4 A) y 3,8 kb en tejidos de ratón (Fig. & # X200B (Fig. 4B). 4 B). Estos probablemente corresponden a los ADNc más abundantes descritos anteriormente (3530 y 3491 pb para humanos y ratones, respectivamente). Las transcripciones humanas y de ratón tienen señales de poliadenilación AAUAAA de consenso en las posiciones 3514 y 3441, respectivamente, seguidas inmediatamente por una cola de poli (A). Se detectaron bandas adicionales con tamaños estimados de 4,8 y 5,8 kb en tejidos humanos y de ratón, respectivamente, mediante transferencia Northern. en la mayoría de los tejidos examinados (Fig. & # x200B (Fig.4). 4). Se observaron diferencias significativas en la proporción de las dos transcripciones en diferentes tejidos. Por ejemplo, la transcripción de 4.8 kb es relativamente abundante en el páncreas humano, pero es casi indetectable en el músculo esquelético (Fig. & # x200B (Fig. 4A). 4 A). La banda de 4,8 kb presumab ly refleja transcripciones con un 3 & # x02032-UTR que se extiende más allá de la primera señal de poliadenilación, como se representa en la Figura & # x200B Figura 3A. 3 A. Esta región del gen es muy rica en Alu repetir secuencias, por lo que no fue posible diseñar una sonda para confirmar esta presunción mediante análisis de transferencia Northern.

Northern blot de ARNm de varios humanos adultos (A) y el mouse (B) tejidos. Clonado y secuenciado verificado 3 & # x02032-UTR humano y ratón MMS19 Los productos se utilizaron como sondas (arriba). & # x003b2-La actina se muestra como un control interno (abajo). La pista de marcadores se muestra a la izquierda.

En un esfuerzo por correlacionar las transcripciones detectadas por análisis de transferencia Northern con los productos de empalme alternativos putativos en los exones 3 y 8, hibridamos las transferencias Northern humanas con sondas derivadas de ambos exones. En todos los casos, los resultados fueron indistinguibles de los obtenidos con una sonda de extremo 3 & # x02032 (datos no mostrados). Por lo tanto, llegamos a la conclusión de que ambas bandas detectadas por transferencia Northern comprenden una colección heterogénea de formas empalmadas alternativamente.

Mapeo cromosómico de la hMMS19 gene

FISH con un clon BAC que contiene la totalidad de hMMS19 ORF produjo un único sitio de hibridación en la banda cromosómica 10q24. Esta localización es consistente con los resultados de mapeo híbrido para dos STS (A002G19 y Cda19h12) en la base de datos pública NCBI, que se alinea con el 3 & # x02032-UTR del clonado hMMS19 gene.

Complementación de la levadura mms19& # x00394 mutante por hMMS19 ydMMS19 ADNc

En vista de la conservación de aminoácidos entre la proteína de levadura Mms19 y la de eucariotas superiores, especialmente en las regiones C- y N-terminales, preguntamos si el MMS19 genes de organismos superiores pueden complementar funcionalmente fenotipos mutantes de la levadura mms19& # x00394 cepa, eliminada de toda la MMS19 gene. Sobreexpresamos tanto hMMS19 ydMMS19 ADNc bajo control de la levadura GAL1 promotor en la levadura mms19 mutante de deleción. Como se muestra en la Figura & # x200B Figura 5, 5, ambos ADNc corrigieron la termosensibilidad para el crecimiento de la mms19 mutante de deleción. Además, mientras que el tiempo de duplicación del mutante de levadura es & # x0223c19 h en cultivo líquido, a 37 & # x000b0C este tiempo de duplicación se redujo a & # x0223c3.5 h cuando la cepa mutante se transformó con el humano, Drosophila o levadura de tipo salvaje MMS19 genes. La h de longitud completaMMS19 ydMMS19 genes también complementaron la sensibilidad a la radiación ultravioleta del mms19 mutante (Fig. & # x200B (Fig. 6). 6). Sin embargo, estos genes no pudieron complementar la auxotrofia de metionina de la levadura. mms19 mutante (datos no mostrados). Como era de esperar, la yMMS19 gen complementa completamente el último fenotipo (datos no mostrados).

Rescate del crecimiento termosensible del mms19 mutante de deleción. Las cepas son las siguientes: mms19& # x00394 (0), mms19& # x00394 & # x0002bpESC-TRP (1), mms19& # x00394 & # x0002byMMS19 (2 y 3), mms19& # x00394 & # x0002bdMMS19 (4 y 5), mms19& # x00394 & # x0002bhMMS19 (6 y 7). Como controles positivos, las cepas también se cultivaron a 30 ° C. En ausencia de pESC-TRP el mms19& # x00394 (0) la cepa no puede crecer.

Complementación funcional de la sensibilidad a la radiación UV del mms19& # x00394 cepa por sobreexpresión de humano (mms19& # x00394 & # x0002bhMMS19) o Drosophila (mms19& # x00394 & # x0002bdMMS19) MMS19 ADNc. A modo de comparación, se muestran las curvas de supervivencia para mms19& # x00394 transformado con pESC-TRP (vector de expresión vacío) y con la yMMS19 ORF (vector de expresión con el tipo salvaje yMMS19 gene). W303-1B es la cepa isogénica de tipo salvaje.


Clonación de genes y expresión y secreción deListeria monocytogenes Enzimas bacteriófago-líticas enLactococcus lactis

Figura 1 . Ilustración esquemática de los vectores utilizados para la construcción (A y B), producción intracelular (C) y secreción (D) de enzimas endolisina. Solo se muestran las coordenadas relevantes y algunas propiedades importantes. Los detalles se describen en el texto. Abreviaturas: Amp r y Er r, genes que especifican la resistencia a ampicilina y eritromicina, respectivamente P32, promotor lactocócicoSPslpA, secuencia de señales de L. brevisProteína A de la capa S ply511 y ply118, genes de endolisina de Listeria bacteriófagos A511 y A118, respectivamente (22).

Producción de enzimas Ply118 y Ply511 en L. lactis.

Figura 2 . Disminución de la DO de una suspensión de L. monocytogenes Células WSLC 1001 tras la adición de extractos celulares de L. lactis MG1363 que lleva pLC-PL118-P32, pLC-PL511 o el vector de control pTRKH2 (ver Materiales y métodos). Fig. 3 . Detección de Ply118 recombinante (30,8 kDa) y Ply511 (36,5 kDa), respectivamente, en las fracciones citoplásmicas de cultivos de una noche de recombinante L. lactis MG1363 (indicado por flechas). Las proteínas de los extractos celulares se separaron mediante SDS-PAGE y se detectaron mediante transferencia Western con anticuerpos anti-Ply. Carril 1, MG1363 (pLC-PL118-P32) carril 2, control negativo MG1363 (pTRKH2) carril 3, MG1363 (pLC-PL511). Las posiciones de los marcadores de masa molecular (en kilodaltons) se indican a la izquierda.

Nucleasa estafilocócica como informadora deSPSecreción mediada por SlpA.

SPSlpA permite la translocación de membrana de Ply511 activo.

Figura 4. Representación esquemática de la fusión genética delSPslpA secuencia de señales y ply511. La secuencia de nucleótidos y la secuencia de aminoácidos correspondientes de la región que une ambos fragmentos en SPslpA – ply511se muestra ampliada. La flecha indica el sitio de escisión del péptido señal propuesto de SlpA (43). los capa La región genética se muestra en negrita y el sitio de restricción utilizado para la fusión genética (AatII) también se indica. Figura 5. Colonias de recombinantes L. lactis cultivado en medio de agar GM17 que contiene suspensión L. monocytogenescélulas. La cepa de control MG1363 (pLC-PL511) no muestra efecto lítico (A), mientras que la cepa L. lactis MG1363 (pSL-PL511ΔC) que secreta la enzima Ply511 truncada terminalmente C muestra zonas claras de lisis alrededor de las colonias individuales (B). Figura 6. Detección de Ply en extractos celulares y sobrenadantes de recombinantes. L. lactis cultivado durante 12 h mediante inmunotransferencia con anticuerpos específicos de Ply. Carriles 1 y 2, extracto celular y fracción sobrenadante (respectivamente) de L. lactisMG1363 (pLC-PL511) carriles 3 y 4, extracto celular y fracción sobrenadante (respectivamente) de MG1363 (pSL-PL511) carril 5, sobrenadante de MG1363 (pSL-PL511ΔC). Las posiciones de los marcadores de masa molecular (en kilodaltons) se indican a la izquierda.

Preguntas frecuentes sobre síntesis genética y clonación / mutagénesis

¿Cuáles son las diferencias entre las opciones de servicio de síntesis de genes GENEWIZ y rsquos?

Servicio Oferta de servicios Tiempo de respuesta estimado Precio
FragmentoGENE Síntesis de fragmentos de ADN bicatenario 2-4 días laborales $
PriorityGENE Síntesis de genes estándar con clonación en un plásmido 8-10 días laborales $
TurboGENE 5 Síntesis de genes acelerada con clonación en un plásmido y nuestro tiempo de respuesta más rápido disponible 5 días laborales $$
TurboGENE 7 Síntesis de genes acelerada con clonación en un plásmido 7 días laborales $$
Síntesis de ADN de anticuerpos Síntesis de secuencias de cadenas pesadas y ligeras con clonación en un plásmido 6-8 días laborales $
Síntesis de plásmidos de AAV Síntesis de secuencias de AAV y clonación en un plásmido con verificación de secuencia de AAV-ITR utilizando tecnologías patentadas 11-15 días laborales $$
Síntesis de constructo CRISPR Síntesis de gRNA y clonación en un plásmido personalizado 8-10 días laborales $
Síntesis de ssDNA Síntesis de fragmentos de ADN monocatenarios 10-15 días laborales $

¿Dónde puedo obtener precios generales antes de enviar una solicitud de cotización?

¿Cómo solicito un presupuesto para un servicio de síntesis genética?

Los servicios PriorityGENE, TurboGENE, ValueGENE, síntesis de ADN de anticuerpos y síntesis de plásmidos AAV requieren que solicite una cotización antes de realizar el pedido. Los servicios de síntesis de construcción FragmentGENE, CRISPR y ssDNA están disponibles para pedidos directos, por lo que no es necesario solicitar una cotización para estos servicios.


Inicie sesión en su cuenta GENEWIZ en línea y seleccione & ldquoGene Synthesis & rdquo, luego haga clic en el nombre del servicio específico que le interesa. Se lo dirigirá a un formulario de solicitud de cotización para ese servicio seleccionado. Una vez que complete el formulario, seleccione el botón & ldquoReview Inquiry & rdquo en la parte inferior de la pantalla. Después de revisar los detalles ingresados, seleccione el botón & ldquoSubmit Quote Request & rdquo para solicitar su cotización. Tras la presentación de la consulta, puede esperar recibir una cotización dentro de un día hábil. Puede ver una copia en PDF de la información del pedido, incluido el precio, y descargarla mediante el botón & ldquoPrint Price & rdquo.

¿En qué vector se clona GENEWIZ?

El gen de longitud completa ensamblado se clona en el vector pUC-GW-Kan / Amp a través del sitio EcoRV. La construcción final se verifica con secuenciación de ADN Sanger (en al menos una hebra) y digestión de restricción. Las secuencias de pUC-GW-Kan / Amp se pueden encontrar aquí.

¿Cómo envío el material de partida necesario para la clonación?

Envíe todo el material de partida necesario a GENEWIZ. Para proyectos del Reino Unido (40-), las muestras deben enviarse a nuestra subsidiaria del Reino Unido, y para proyectos de Europa continental (50- / 90-), las muestras deben enviarse a nuestra subsidiaria alemana (direcciones a continuación) tan pronto como sea posible después de iniciar su pedido (si requerido). En la sección III "Cómo iniciar su pedido" de su presupuesto de síntesis de genes se incluye una lista detallada del material de partida requerido.

Por favor envíe una alícuota de 5 & microg (concentración mínima de 20ng / & microL) del plásmido circular purificado y sin digerir. Asegúrese de que el nombre del plásmido en el tubo coincida con el nombre enviado para el pedido. Incluya la primera página del recibo del pedido o la cotización con la muestra de plásmido enviada para asegurarse de que se identifiquen con precisión.

Todos los vectores enviados a nuestras instalaciones se mantendrán en almacenamiento durante dos años y estarán disponibles dentro de este tiempo para uso futuro en proyectos.

Envío directo (FedEx, UPS y DHL):
Si un punto de recolección GENEWIZ no está disponible, o si su material de partida requiere hielo seco, utilice un servicio de entrega al día siguiente como FedEx, UPS o DHL.

GENEWIZ
A la atención de: Gestión de proyectos
Hope End, Takeley
Essex CM22 6TA
Reino Unido
Tel: +44 01279 873837

GENEWIZ
A la atención de: Gestión de proyectos
Bahnhofstrasse 86
04158 Leipzig,
Alemania
Teléfono: + 49-341520122-41


Revisión de la terminología y la variación de la secuencia de ADN

El ADN es un polímero bicatenario largo compuesto por 4 nucleótidos que forman pares de bases complementarios (pb) entre sí: adenina (A) con timina (T) y guanina (G) con citosina (C). Conectados del extremo 5 ′ al extremo 3 ′ (refiriéndose al quinto y tercer carbonos del azúcar), estos 4 nucleótidos son los componentes básicos del ADN.

El ADN está organizado en moléculas enormes, lineales y altamente estructuradas que forman los cromosomas. La cromatina, la organización física del ADN y las proteínas asociadas, participa en la regulación de la función del ADN. Los genes son las regiones del ADN que codifican proteínas. Las regiones codificantes de proteínas se definen por la presencia de exones, leídos de 5 'a 3', que están formados por codones, tripletes de nucleótidos que especifican aminoácidos o señal de parada de la traducción. Los tramos de ADN que no codifica proteínas entre exones son intrones. Los sitios de empalme marcan los límites exón-intrón y dirigen la escisión de intrones del mensaje de ARN.

Control de la expresión génica

Existen numerosos elementos de ADN no codificantes funcionales que participan en la expresión génica. Los promotores, ubicados inmediatamente aguas arriba de los genes, son necesarios para la transcripción de genes. Los elementos reguladores del ADN que potencian o reprimen la expresión génica se encuentran a menudo cerca (o dentro de los intrones de) genes estructurales, pero también pueden encontrarse a gran distancia. Algunos elementos pueden controlar grandes regiones genómicas que contienen muchos genes, como la región de control del locus de globina. 4 Además, existen numerosas regiones de ADN que transcriben ARN funcionales no codificantes, por ejemplo, ARN de transferencia, ARN ribosómico y microARN. Los nucleótidos de ADN también pueden modificarse químicamente de forma reversible, como por metilación, para afectar a los elementos que influyen en la expresión génica específica del tejido o del desarrollo, como ocurre durante la impresión o la diferenciación del linaje celular. 5,6

Variación de la secuencia de ADN

El ADN es una molécula viva en el sentido de que cambia constantemente. El ADN se replica durante cada mitosis y se recombina y segrega con cada meiosis. Aunque los procesos de replicación del ADN operan con una fidelidad extremadamente alta, no son (ni pueden ser) perfectos. 7 Por lo tanto, la variación del ADN rara vez, pero inevitablemente, se introduce durante la copia de la plantilla de ADN o la ligadura de los extremos libres.Los errores de ADN también surgen de la reparación incorrecta del ADN dañado como resultado de la exposición rutinaria a fuentes celulares y ambientales o por exceso de radiación ionizante, rayos ultravioleta o agresiones químicas. Los procesos de reparación del daño del ADN generalmente exhiben menor fidelidad que la replicación del ADN. Se cree que esta tolerancia al error es necesaria para facilitar la restauración de un genoma funcional a partir de una plantilla de ADN corrupta sin detener la reparación del ADN por completo, y puede dar como resultado patrones específicos de daño de la variación del ADN adquirido. 8,9

El ADN acumula variación a medida que avanza el tiempo longitudinalmente a lo largo de generaciones (variación de la línea germinal) y dentro de un solo individuo a lo largo de muchas divisiones celulares (variación somática). La gran mayoría de las variantes de ADN no causan ningún fenotipo observable. Sin embargo, una pequeña fracción de variantes son funcionales y pueden alterar fenotipos.

Cualquier diferencia en la secuencia de ADN en comparación con una secuencia de referencia común se considera una variante de ADN (Figura 1). El tipo más simple de variante de ADN es un cambio en una base de un solo nucleótido, conocido como variante de un solo nucleótido (SNV). Un SNV que es común en poblaciones humanas (& gt1%) también se puede conocer como polimorfismo de un solo nucleótido (SNP). Otro tipo de variación del ADN resulta de la inserción o deleción (conocida como indel) de un tramo de nucleótidos. Las variantes estructurales (que suelen afectar a & gt1000 pb) son variantes de ADN que incluyen grandes indeles, así como reordenamientos de secuencias de ADN más complejos, como inversiones (un bloque de ADN que se ha invertido "hacia atrás") y translocaciones (unión de regiones genómicas distantes). Las variantes del número de copias (CNV) son un tipo de variación estructural resultante de la ganancia o pérdida de una copia de una región de ADN completa por deleción o duplicación.

Tipos de variación de la secuencia de ADN. (A) Los SNV resultan de la sustitución de 1 base, mientras que la inserción o deleción (indel) afecta a una cadena de nucleótidos. (B) Las variantes estructurales (que suelen afectar a & gt1000 pb) incluyen indels grandes, inversiones, duplicaciones y CNV.

Tipos de variación de la secuencia de ADN. (A) Los SNV resultan de la sustitución de 1 base, mientras que la inserción o deleción (indel) afecta a una cadena de nucleótidos. (B) Las variantes estructurales (que suelen afectar a & gt1000 pb) incluyen indels grandes, inversiones, duplicaciones y CNV.

Todos los tipos de variación del ADN tienen el potencial de alterar la expresión o función de los genes. Los SNV pueden funcionar directamente al escribir mal la traducción de aminoácidos de un codón (sentido erróneo), crear un codón STOP (sin sentido) o alterar los sitios de empalme. Los SNV pueden afectar la función de los genes al variar la secuencia de promotores, elementos reguladores o ARN no codificantes. Los indels también pueden crear variantes de desplazamiento de marco que cambian los registros de codones para crear nuevas secuencias de aminoácidos en sentido descendente. Los indeles grandes pueden alterar genes de manera similar, así como afectar regiones genómicas enteras o alterar la estructura de la cromatina. Las inversiones y translocaciones no solo alteran sus sitios genómicos de origen, sino que también pueden reunir nuevas combinaciones de genes y / o elementos reguladores. Además, las CNV que dan como resultado la ganancia o pérdida de copias completas de ADN funcional pueden afectar el fenotipo a través de un efecto de dosis diferencial de genes. Por tanto, cualquier tipo de variante de ADN puede afectar la función, y todas las categorías de variación de ADN se han visto implicadas en la enfermedad.


ELife digest

Los eucariotas como los animales, las plantas y los hongos almacenan su ADN dentro del núcleo de cada una de sus células. Los genes dentro de este ADN contienen las instrucciones necesarias para producir moléculas de ARN, algunas de las cuales pueden salir del núcleo y decodificarse para construir proteínas. Sin embargo, no todo el ADN que se copia en ARN en realidad codifica proteínas. En cambio, algunas moléculas de ARN son partes importantes de la maquinaria de producción de proteínas de la célula por derecho propio, y otras ayudan a regular la expresión de genes como ARN o proteínas.

Sin embargo, muchos ARN no codificantes no tienen roles tan claros. A menudo, estos ARN, que se denominan "transcripciones omnipresentes", se destruyen rápidamente dentro del núcleo, pero es probable que algunas moléculas escapen de este mecanismo de control de calidad. Si la maquinaria de producción de proteínas de la célula decodifica estos ARN, podría conducir a la producción de proteínas defectuosas o dañinas. Investigaciones recientes sugirieron que otro mecanismo de control de calidad, que normalmente erradica los ARN que codifican proteínas procesados ​​incorrectamente, también podría destruir transcripciones omnipresentes innecesarias o dañinas. Pero no estaba claro qué tan común era que este proceso, llamado "descomposición mediada por tonterías", se usara para este propósito.

Ahora Malabat, Feuerbach et al. han diseñado células de levadura que carecían de los genes necesarios para llevar a cabo la descomposición mediada por el sentido o la capacidad de destruir moléculas de ARN en el núcleo. Los experimentos con estas células de levadura revelaron que aproximadamente la mitad de todas las transcripciones dominantes pueden destruirse a través de la descomposición mediada por tonterías, lo que sugiere que este mecanismo sirve como un mecanismo a prueba de fallas para prevenir la acumulación de estas moléculas potencialmente dañinas.

Malabat, Feuerbach et al. También reveló que el complejo enzimático que copia las secuencias de genes para producir moléculas de ARN a menudo también copiará alguna secuencia de ADN adicional antes del inicio del gen. Por otro lado, también es común que este complejo enzimático pierda el inicio del gen y produzca una molécula de ARN que carece de algunas de las instrucciones necesarias para construir la proteína correcta. Experimentos adicionales demostraron que en la levadura estos dos tipos de ARN codificadores de proteínas fabricados incorrectamente también podrían identificarse y destruirse por desintegración mediada por sin sentido. El próximo desafío será ver hasta qué punto estos fenómenos se conservan en otros eucariotas.


Resultados

Identificación de mutaciones puntuales del exón 18 y del exón 21 de EGFR mediante SMAP. Antes de analizar muestras clínicas con nuestros conjuntos de cebadores mutantes y el ensayo SMAP, se realizaron pruebas controladas en plantillas genómicas conocidas. La reacción SMAP se realizó en presencia de un colorante intercalante (SYBR Green I) y se controló con el sistema Mx3000P. El ADN genómico aislado de la línea celular NC1-H1975 que se sabe que porta la mutación de sustitución L858R (exón 21) se utilizó como molde para probar la fiabilidad del ensayo de detección de la mutación SMAP. Se demostró que los conjuntos de cebadores de amplificación SMAP con un FP específico para detectar la mutación puntual L858R (2573T & gt G) como se describe en la Fig.2 amplificaban rápidamente (en 20 min) el ADN de la línea celular NC1-H1975, mientras que el mismo conjunto de cebadores era incapaz de amplificar el ADN de control genómico de tipo salvaje incluso después de 60 min (Fig. 4A). Una reacción de control "sin molde" también fue negativa después de 60 min. Los gráficos de la Fig. 4A son gráficos compuestos, cada línea representa un ensayo SMAP diferente utilizando un conjunto de cebadores de tipo salvaje (izquierda) y un conjunto de cebadores mutantes (Derecha) y una plantilla genómica diferente. Cada ensayo se realizó por duplicado. Tenga en cuenta que NCl-H1975 muestra amplificación con ambos conjuntos de cebadores, lo que confirma que la línea celular es heterocigótica para la mutación L858R.

Análisis de la reacción SMAP específica de alelo para la mutación de EGFR. A, curvas de amplificación de la detección de la mutación L858R. A la izquierda, amplificación del cebador específico de tipo salvaje en •, 20 ng de ADN de la línea celular NCI-H1975 como plantilla. ×, sin plantilla. Derecha, amplificación del cebador específico del mutante L858R en •, 20 ng de ADN de la línea celular NCI-H1975 ▴, 20 ng de ADN genómico humano de tipo salvaje como control y ×, sin molde. B, ADN de NCl-H1975 amplificado por SMAP cortado por endonucleasa de restricción MscI. MscI es capaz de digerir ADN amplificado de tipo salvaje en un solo sitio. El ADN mutante L858R amplificado no se corta. Los productos de reacción SMAP se procesaron en un 3% de gel de agarosa NuSieve GTG y se tiñeron con bromuro de etidio. Carril M, escalera de 20 pb utilizada como marcador de tamaño (TAKARA). Carril 1, ADN sin cortar de NCl-H1975 amplificado por cebadores específicos de tipo salvaje SMAP. Carril 2, MscI digestión del ADN usado en el carril 1. Carril 3, ADN sin cortar de NCl-H1975 amplificado por cebadores específicos de mutantes SMAP L858R. Carril (4): MscI digestión del ADN utilizado en el carril 3. Una sola banda en el carril 2 es el único producto de digestión visible, que consta de longitudes unitarias del amplicón EGFR cortado una vez por MscI. C, verificación de la especificidad del cebador de deleción en dianas de deleción clonadas. Ambos gráficos son perfiles de amplificación compuestos cuando se utilizan todos los conjuntos de cebadores de deleción para amplificar 20 ng de ADN genómico humano de tipo salvaje (izquierda) y 3000 copias del plásmido DE-A (Derecha). Los ensayos se realizaron por duplicado con un juego de cebadores para el tipo salvaje (•), un juego de cebadores para DE-A (▪), un juego de cebadores para DE-B (▴), un juego de cebadores para DE-C (⧫), un juego de cebadores para DE -D (*), juego de imprimaciones para DE-E (○), juego de imprimaciones para DE-F (□), juego de imprimaciones para DE-G (▾). Sólo el conjunto de cebadores que coincidía con el ADN molde mostró amplificación en & lt60 min. D, sensibilidad de SMAP. A la izquierda, reacción SMAP utilizando un conjunto de cebadores específicos de mutación puntual L858R con diluciones seriadas de ADN genómico de la línea celular H1975. Derecha, reacción SMAP usando un conjunto de cebadores específicos de mutación de deleción DE-A con diluciones seriadas de ADN genómico de la línea celular H1650. MI, especificidad de la detección de ADN mutante en presencia de ADN de tipo salvaje. A la izquierda, gráfico compuesto de reacciones SMAP utilizando un conjunto de cebadores L858R con una mezcla de ADN genómico de tipo salvaje y 10%, 5%, 1%, 0,5% y 0% de ADN de la línea celular H1975 objetivo (por duplicado). Derecha, gráfico compuesto de reacciones SMAP utilizando un juego de cebadores DE-A con una mezcla de ADN genómico de tipo salvaje y 10%, 1%, 0,1% y 0% de ADN de la línea celular H1650 (por duplicado).

El análisis electroforético del ADN amplificado mostró patrones en escalera esperados y típicos de la amplificación SMAP (Fig. 4B). Es probable que las bandas de ADN de aproximadamente 50 pb de tamaño (indicadas con un asterisco) correspondan al producto de amplificación autocebado monomérico unido por los extremos 5 'de los cebadores FP y TP. Las bandas de mayor tamaño son formas alternativas (derivadas de formas intermedias, IM1 e IM2), especies autohíbridas y amplicones de longitud de unidades múltiples de cada especie. Para confirmar la precisión de los productos específicos de genotipo mediante SMAP, se realizó un análisis de restricción seguido de electroforesis. los MscLa secuencia de reconocimiento de la enzima I existe en la secuencia de tipo salvaje del exón 21 de EGFR, pero no en el mutante L858R. Como era de esperar, los productos de amplificación derivados de la línea celular H1975 fueron digeridos por MscI. En experimentos similares sobre plantillas de ADN genómico, también pudimos detectar la mutación G719S por SMAP en 30 minutos (datos no mostrados). El ensayo de mutación G719S también mostró una alta especificidad similar, lo que permite una discriminación confiable de mutantes de muestras de tipo salvaje.

Identificación de deleciones del exón 19 de EGFR por SMAP. Nuevamente, antes de probar muestras clínicas con nuestros conjuntos de cebadores mutantes y el ensayo SMAP, se realizaron pruebas controladas en plantillas conocidas. Para la detección de deleciones, se utilizaron moldes de plásmidos diseñados por ingeniería porque no había líneas celulares disponibles que tuvieran estas mutaciones específicas de EGFR. La reacción SMAP se realizó en presencia de un colorante intercalante (SYBR Green I) y se controló con el instrumento de PCR en tiempo real Mx3000P. Se desarrollaron siete conjuntos de cebadores específicos de alelos diferentes para la detección de deleciones y se examinaron para determinar su especificidad en el ensayo SMAP. Los conjuntos de cebadores descritos previamente e ilustrados en la Fig. 3 se usaron cada uno en ensayos SMAP con moldes de plásmido de coincidencia exacta y contra todos los demás mutantes de deleción. En todos los casos, solo el molde completamente idéntico con cada conjunto de cebadores específicos de alelo se amplificó en 30 minutos. No se observó amplificación a partir de cualquier combinación no coincidente de cebadores y moldes incluso cuando se monitorizó durante 60 min (Fig. 4C, Fig. Complementaria S2). Cada experimento se realizó por duplicado, por lo tanto, cada gráfico muestra dos perfiles de amplificación positivos para cada uno de los conjuntos de cebadores de deleción.

Sensibilidad de la detección de mutaciones basada en SMAP en poblaciones de células mixtas. Las muestras de tumores suelen estar formadas por numerosas subpoblaciones de células cancerosas. Un diagnóstico útil para la detección de mutaciones debe poder detectar mutaciones en muestras de ADN genómico heterogéneas. Para probar SMAP para esta capacidad, llevamos a cabo experimentos de dilución en serie para examinar la sensibilidad de detección y experimentos de mezcla de ADN genómico para examinar la sensibilidad de detectar mutantes como una subpoblación en un fondo de ADN de tipo salvaje. En los experimentos de dilución en serie, utilizando los ADN genómicos de la línea celular NC1-H1975 y NSC-H1650, los cebadores específicos de alelo para la amplificación de la mutación puntual del exón 21 L858R y la deleción del exón 19 E746-A750 pudieron detectar cada uno 30 copias en SMAP amplificación (reacción de 25 μL) en 30 min cuando se utiliza el ADN de la línea celular de coincidencia completa respectiva (Fig. 4D).

Para determinar los límites de detección mínimos para secuencias mutantes en un fondo de ADN de tipo salvaje, se mezcló el ADN de la línea celular mutante con cantidades crecientes de ADN de tipo salvaje, y los ensayos SMAP se realizaron con conjuntos de cebadores mutantes de coincidencia completa. Usando el ADN genómico de la línea celular NC1-H1975 y los cebadores específicos de alelo para la amplificación de la mutación puntual del exón 21 L858R, las secuencias mutantes podrían detectarse incluso cuando estaban presentes en solo el 0,5% en 60 min. Del mismo modo, utilizando el ADN genómico de la línea celular NC1-H1650 y los cebadores específicos de alelo para la amplificación de la deleción del exón 19 E746-A750, las secuencias mutantes podrían detectarse incluso cuando estaban presentes en solo el 0,1% en 60 min (Fig. 4E).

Genotipado de muestras clínicas. Nos propusimos diseñar un sistema de detección de mutaciones que fuera preciso y rápido. Por lo tanto, minimizamos la preparación de la muestra de ADN genómico a una simple lisis en NaOH como se describe en Materiales y métodos y, por lo general, en varios minutos teníamos material listo para los ensayos SMAP. Con este procedimiento de extracción crudo y el análisis SMAP, pudimos diagnosticar mutaciones específicas de muestras clínicas en aproximadamente 30 minutos.

El estado genómico del gen EGFR se evaluó en una serie de 45 muestras primarias de NSCLC mediante secuenciación convencional y SMAP. Se encontraron nueve mutaciones por secuenciación, de las cuales cuatro casos fueron sustitución en el exón 21 y cinco casos fueron una deleción en el exón 19. Se creía que todas estas mutaciones eran heterocigóticas y tenían también un alelo de tipo salvaje. Los nueve casos que demostraron tener mutaciones por secuenciación también fueron verificados de forma independiente por SMAP (Fig. 5, Tabla 1). Las cuatro muestras clínicas que tenían sustituciones del exón 21 mostraron perfiles de amplificación similares al caso 16 (Fig. 5A). Las curvas de amplificación tanto de tipo salvaje como mutante fueron evidentes en los cuatro casos, lo que indica que las muestras eran muy probablemente heterocigóticas tanto para los alelos de tipo salvaje como para los mutantes. Basándonos en estos datos, no podemos descartar la posibilidad de que existiera una subpoblación mutante homocigótica en una proporción casi equivalente a una subpoblación normal (homocigótica de tipo salvaje) y explicara los resultados aparentemente heterocigotos. Sin embargo, este escenario no es probable debido a la proporción equivalente de alelos mutantes y de tipo salvaje en los cuatro casos independientes, lo cual es un evento estadísticamente improbable. En un caso, el caso 3, la mutación no fue detectada por secuenciación directa, pero fue identificada como la mutación L858R por SMAP. Esta mutación no se detectó mediante secuenciación porque la abundancia de células que contienen mutantes dentro de la muestra de tumor fue muy baja. Aunque la curva de amplificación para detectar este mutante muestra una cinética exponencial y es fácilmente detectable por SMAP, su gran retraso en la aparición (en relación con el perfil cinético de tipo salvaje) también sugiere que la población de células que contienen mutantes es muy baja en la muestra. La inspección visual de los datos de secuenciación muestra picos de mutación de CT para AG difícilmente identificables en la posición de nucleótidos 2572 a 2573 (Fig. 5B). En las llamadas iniciales, estos picos de secuenciación bajos se descartaron como fondo y no se consideraron indicativos de una mutación. Para probar la validez de los resultados del ensayo SMAP que indican una mutación en el caso 3, realizamos el análisis PCR-RFLP como prueba de confirmación. En el análisis de PCR-RFLP, los resultados homocigóticos de tipo salvaje darían como resultado solo dos bandas cuando se examinaran por MscDigestión y electroforesis en gel de agarosa. Mientras que las muestras que contienen ADN de tipo mutante mostrarán productos de amplicón que son resistentes a la escisión por MscI, y por tanto, tres bandas serían evidentes en el gel en condiciones que favorecieran la digestión completa. Los resultados del caso 3 muestran tres bandas, lo que indica la existencia de una mutación y confirma los resultados anteriores del ensayo SMAP. En total, los resultados de PCR-RFLP encontraron la mutación puntual L858R en cinco muestras, lo que se corresponde completamente con los hallazgos de SMAP.

Genotipado de muestras de tejido de cáncer de pulmón mediante SMAP de alelos específicos y comparación de fidelidad con tecnologías alternativas. A, Ensayos SMAP de detección de mutación L858R utilizando conjuntos de cebadores de tipo salvaje y mutante. El caso 1 es un ejemplo de homocigoto de tipo salvaje. Los casos 3 y 16 muestran la detección de la mutación L858R en la muestra del tumor. Abreviaturas: Wt, Mt de tipo salvaje, tipo mutante. B, secuenciación directa del exón 21: el caso 1 muestra homocigotos de tipo salvaje. El caso 3 muestra un pico de mutación apenas identificable que representa CT para AG en los nucleótidos 2572 a 2573 (dentro de la elipse). El caso 16 muestra la presencia de una mutación de 2573 T para G. C, PCR-RFLP: carril M, marcador en escalera de 100 pb (TAKARA), los carriles 1, 3 y 16 corresponden al número de caso. Izquierda, productos de PCR. Carril derecho, productos de PCR digeridos por MscYo endonucleasa de restricción. La flecha cerca del caso 3 indica un producto de PCR resistente a la digestión por MscI, confirmando la presencia de la mutación L858R en una subpoblación de ADN del tumor del caso 3. D, detección de tipo salvaje y deleciones del gen EGFR en ADN genómico extraído de tejido pulmonar. Juego de cebadores para tipo salvaje (•), juego de cebadores para DE-A (▪), juego de cebadores para DE-B (▴), juego de cebadores para DE-C (⧫), juego de cebadores para DE-D (*), juego de imprimación para DE-E (○), juego de imprimación para DE-F (□), juego de imprimación para DE-G (▾). Se detectó ADN de tipo salvaje en cada tumor además de diferentes deleciones como se indica. Solo un cebador específico de deleción amplifica y, por lo tanto, identifica la mutación en la muestra de tumor.


Ver el vídeo: Ejercicios de transcripción y traducción del ADN - 1ro BGU (Julio 2022).


Comentarios:

  1. Akigis

    Hay algo en esto. Gracias por su ayuda en este asunto, ahora no cometeré tal error.

  2. Faekus

    Gracias. Solo gracias por pensar en voz alta. En el libro de citas.

  3. Dantel

    ¿Eres, por casualidad, no un experto?



Escribe un mensaje