Información

1.7: Línea de comando BLAST - Biología

1.7: Línea de comando BLAST - Biología


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Si bien los capítulos anteriores cubrieron la instalación y el uso de algunas herramientas bioinformáticas como ejemplos del proceso, hay una herramienta casi omnipresente: BLAST, o herramienta básica de búsqueda de alineación local.[1]

Dado uno o más consulta secuencias (generalmente en formato FASTA), BLAST busca regiones de secuencia coincidentes entre ellas y un tema colocar.

Una coincidencia suficientemente cercana entre las subsecuencias (indicadas por flechas en la figura anterior, aunque las coincidencias suelen ser más largas de lo que se ilustra aquí) se denomina par de puntuación alta (HSP), mientras que se dice que una secuencia de consulta pegar una secuencia objetivo si comparten una o más PAS. A veces, sin embargo, el término "golpear" se usa de manera vaga, sin diferenciar entre los dos. Cada HSP está asociado con una "puntuación de bits" que se basa en la similitud de las subsecuencias determinadas por un conjunto particular de reglas. Debido a que en conjuntos de sujetos más grandes es probable que se encuentren por casualidad algunas buenas coincidencias, cada PAS también se asocia con un "mi valor ”, que representa el número esperado de coincidencias que uno podría encontrar por casualidad en un conjunto temático de ese tamaño con esa puntuación o mejor. Por ejemplo, un mi valor de 0.05 significa que podemos esperar una coincidencia por azar en 1 de cada 20 búsquedas similares, mientras que mi El valor de 2.0 significa que podemos esperar 2 coincidencias al azar para cada búsqueda similar.

BLAST no es una herramienta única, sino un conjunto de herramientas (y el conjunto crece con los años a medida que se agregan más funciones y herramientas relacionadas). La versión más moderna del software, llamada BLAST +, es mantenida por el Centro Nacional de Información Biotecnológica (NCBI) y se puede descargar en formato binario y fuente en ftp://ftp.ncbi.nlm.nih.gov/blast/exe ... blast + / ÚLTIMO /.

Este capítulo solo cubre brevemente la ejecución de BLAST en la línea de comandos de forma sencilla. Leer la información de ayuda (por ejemplo, conblastn --ayuda) y el Manual de usuario de aplicaciones de línea de comandos NCBI BLAST en www.ncbi.nlm.nih.gov/books/NBK1763/ es muy recomendable. El manual de NCBI cubre bastantes funciones poderosas y útiles de BLAST en la línea de comandos que este libro no incluye.

Tipos BLAST

Los programas del paquete BLAST + pueden buscar secuencias en formato de proteína (como hicimos para el ejemplo de HMMER) y en formato de nucleótidos (A, C, T y G). Según el tipo de consulta y los conjuntos de temas, se utilizan diferentes programas BLAST.

Si bien dos secuencias de nucleótidos (N comparaciones en la figura anterior) se pueden comparar directamente (al igual que dos secuencias de proteínas, representadas por P), cuando deseamos comparar una secuencia de nucleótidos con una secuencia de proteína, debemos considerar qué marco de lectura del La secuencia de nucleótidos corresponde a una proteína. losblastxytblastnLos programas hacen esto convirtiendo secuencias de nucleótidos en secuencias de proteínas en los seis marcos de lectura (tres en la cadena de ADN delantera y tres en la inversa) y comparándolos con todos ellos. Generalmente, estos programas dan como resultado seis veces más trabajo por hacer. lostblastxEl programa compara consultas de nucleótidos con sujetos de nucleótidos, pero lo hace en el espacio de proteínas con las seis conversiones en comparación con las seis en ambos lados.

Otras herramientas BLAST más exóticas incluyenpsiblast, que produce una búsqueda inicial y modifica las reglas de puntuación en función de los resultados; Estas reglas de puntuación modificadas se utilizan en una segunda búsqueda, generalmente encontrando aún más coincidencias. Este proceso se repite tantas veces como desee el usuario, y se revelan más coincidencias diferentes en iteraciones posteriores. losdeltablastEl programa considera una base de datos precalculada de reglas de puntuación para diferentes tipos de secuencias comúnmente encontradas (conservadas). Finalmente,rpsblastbusca coincidencias de secuencia con conjuntos de perfiles, cada uno de los cuales representa una colección de secuencias (como en HMMER, aunque no se basa en modelos ocultos de Markov).

Toda esta charla sobre las reglas de puntuación indica que las reglas de puntuación específicas son importantes, especialmente cuando se comparan dos secuencias de proteínas. Al comparar secuencias de proteínas de dos especies similares, por ejemplo, podríamos desear dar una puntuación pobre a la coincidencia relativamente poco probable de una valina no polar (V) a una tirosina polar (Y). Pero para especies diferentes separadas por un vasto tiempo evolutivo, tal desajuste podría no ser tan malo en relación con otras posibilidades. Las matrices de puntuación que representan estos conjuntos de reglas con nombres como BLOSUM y PAM se han desarrollado utilizando una variedad de métodos para capturar estas consideraciones. Se puede encontrar una discusión de estos detalles en otras publicaciones.

Cada uno de los diversos programas de la suite BLAST acepta una gran cantidad de opciones; intenta correrblastn -helppara verlos por elblastnprograma. A continuación, se muestra un resumen de algunos parámetros que se utilizan con mayor frecuencia parablastnet al .:

  • -query
    • El nombre (o ruta) del archivo con formato FASTA para buscar como secuencias de consulta.
  • -subject
    • El nombre (o ruta) del archivo con formato FASTA para buscar como secuencias de temas.
  • -evalor
    • Solo PAS con mi los valores inferiores a éste deben notificarse. Por ejemplo:-valor 0,001o-valor 1e-6.
  • -outfmt
    • Cómo formatear la salida. El valor por defecto,0, proporciona un archivo de texto legible por humanos (pero no analizable mediante programación). Los valores6y7producir filas y columnas separadas por tabuladores en un archivo de texto, con7proporcionando líneas de comentarios explicativos. Del mismo modo, un valor de10produce una salida separada por comas;11produce un formato que luego se puede convertir rápidamente en cualquier otro con otro programa llamadoblast_formatter. Opciones6,7, y10se puede configurar altamente en términos de qué columnas se muestran.
  • -max_target_seqs
    • Cuando el formato de salida es6,7, o10para cada secuencia de consulta, solo informe los HSP para el mejor<integer>diferentes secuencias de sujetos.
  • -max_hsps
    • Para cada par de consulta / objetivo, solo informe el mejor<integer>PAS.
  • -out
    • Escribe la salida en<output file>a diferencia del valor predeterminado de la salida estándar.

Bases de datos BLAST

Sin duda, los lectores familiarizados con BLAST han sentido curiosidad: ¿no están ahí? bases de datos de algún tipo involucrado en búsquedas BLAST? No necesariamente. Como hemos visto, los archivos FASTA simples serán suficientes tanto para la consulta como para el conjunto de temas. Sin embargo, resulta que desde una perspectiva computacional, los archivos FASTA simples no se buscan fácilmente. Por lo tanto, BLAST + proporciona una herramienta llamadamakeblastdbque convierte un archivo FASTA en una versión indexada y de búsqueda rápida (pero no legible por humanos) de la misma información, almacenada en un conjunto de archivos con nombres similares (a menudo al menos tres que terminan en.alfiler,.psq, y.phrpara secuencias de proteínas, y.nin,.nsq, y.nhrpara secuencias de nucleótidos). Este conjunto de archivos representa la "base de datos" y el nombre de la base de datos es el prefijo del nombre de archivo compartido de estos archivos.

Corriendomakeblastdben un archivo FASTA es bastante simple:makeblastdb -in -out -dbtype -title -parse_seqids</code>, dónde<code><type></code>es uno de<code>prot</code>o<code>nucl</code>, y<code><title></code>es un título legible por humanos (entre comillas si es necesario). los<code>-parse_seqids</code>La bandera indica que los ID de secuencia del archivo FASTA deben incluirse en la base de datos para que se puedan usar en salidas, así como por otras herramientas como<code>blastdbcmd</code>(se discute más adelante).</p><p>Una vez que se ha creado una base de datos BLAST, se pueden usar otras opciones con<code>blastn</code>et al .:</p><ul><li><code>-db <nombre de la base de datos></code><ul><li>El nombre de la base de datos para buscar (en lugar de usar<code>-tema</code>).</li></ul></li><li><code>-num_threads <integer></code><ul><li>Usar<code><integer></code>Núcleos de CPU en un sistema multinúcleo, si están disponibles.</li></ul></li></ul><p>Al usar el<code>-db</code>opción, las herramientas BLAST buscarán los archivos de la base de datos en tres ubicaciones: (1) el directorio de trabajo actual, (2) su directorio de inicio y (3) las rutas especificadas en el<code>$ BLASTDB</code>Variable ambiental.</p><p>La herramienta<code>blastdbcmd</code>se puede utilizar para obtener información sobre las bases de datos BLAST, por ejemplo, con<code>blastdbcmd -db <nombre de la base de datos> -info</code>Y puede mostrar las bases de datos en una ruta determinada con<code>blastdbcmd -list <ruta></code>(asi que,<code>blastdbcmd -list $ BLASTDB</code>mostrará las bases de datos que se encuentran en las rutas de búsqueda predeterminadas). Esta herramienta también se puede utilizar para extraer secuencias o información sobre ellas de bases de datos basadas en información como los ID que se informan en los archivos de salida. Como siempre, se recomienda encarecidamente leer la ayuda y la documentación de software como BLAST.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <h2>Ejecutando un Self-BLAST</h2><p>Para poner en práctica estas diversas herramientas y opciones, consideremos la posibilidad de utilizar<code>blastp</code>para buscar proteínas que sean similares en secuencia a otras proteínas en el exoma de la levadura. Primero, necesitaremos usar<code>wget</code>para descargar el conjunto de datos de proteínas (después de localizarlo en http://yeastgenome.org), y luego<code>gzip -d</code>para descomprimirlo, llamándolo <strong><code>orf_trans.fasta</code></strong>.</p><p><img src=""></p><p>Para encontrar secuencias que sean similares a otras, vamos a querer<code>blastp</code>este archivo contra <em>sí mismo</em>. Entonces, comenzaremos creando una base de datos de estas secuencias.</p><p><img src=""></p><p>Ahora necesitamos determinar qué opciones usaremos para el<code>blastp</code>. En particular, ¿queremos limitar el número de HSP y secuencias objetivo informadas para cada consulta? Debido a que estamos interesados ​​principalmente en determinar qué proteínas coinciden con otras, probablemente solo necesitemos mantener una dosis. ¡Pero el mejor golpe de cada proteína probablemente será para sí misma! Así que será mejor que mantengamos los dos primeros con<code>-max_target_seqs 2</code>y solo el mejor HSP por golpe con<code>-max_hsps 1</code>. También usaremos un<code>-valor 1e-6</code>, un límite de uso común.<sup>[2]</sup></p><p>Para el resultado, crearemos un resultado separado por tabulaciones con líneas de comentarios (<code>-outfmt 7</code>), creando columnas para el ID de secuencia de consulta, ID de secuencia de asunto, longitud de alineación de HSP, identidad porcentual de la alineación, longitud de secuencia de asunto, longitud de secuencia de consulta, posiciones de inicio y finalización en la consulta y el asunto, y el <em>mi </em>valor. (Los nombres codificados—<code>qseqid</code>,<code>sseqid</code>,<code>largo</code>, etc., se puede encontrar ejecutando<code>blastp -help</code>.) Finalmente, llamaremos al archivo de salida <strong><code>levadura_blastp_yeast_top2.txt</code></strong> y usar cuatro procesadores para acelerar el cálculo (lo que solo ayudará realmente si la máquina en la que estamos conectados tiene al menos esa cantidad).</p><p><img src=""></p><p>¡Es un mandato largo, sin duda! Esta operación tarda varios minutos en finalizar, incluso con<code>-num_threads 4</code>especificado. Cuando termine, podremos ver con<code>menos</code>que el archivo de salida contiene las columnas que especificamos intercaladas con las líneas de comentarios proporcionadas por<code>-outfmt 7</code>.</p><p><img src=""></p><p>En el fragmento de salida anterior, YAL0005C tiene un HSP consigo mismo (naturalmente), pero también uno con YLL024C. Consideraremos los análisis básicos que contienen este tipo de datos (filas y columnas almacenadas en archivos de texto, intercaladas con líneas extrañas) en capítulos posteriores.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <h2>Ejercicios</h2><ol><li>Si aún no tiene instaladas las herramientas NCBI Blast +, instálelas. Una vez que lo haga, compruebe el contenido del<code>$ BLASTDB</code>Variable ambiental. Si no está vacío, use<code>blastdbcmd</code>para determinar si tiene la base de datos "nr" disponible y cualquier información que pueda determinar sobre ella (cuándo se descargó, cuántas secuencias tiene, etc.)</li><li>Cree una nueva carpeta en su<code>proyectos</code>carpeta llamada<code>explosión</code>. En este directorio, descargue el <strong><code>p450s.fasta</code></strong> lima y el exoma de la levadura <strong><code>orf_trans.fasta</code></strong> del sitio web del libro. Crea una base de datos llamada<code>orf_trans</code>utilizando<code>makeblastdb</code>, y use<code>blastp</code>para buscar el<code>p450s.fasta</code>archivar en su contra. Al realizar la búsqueda, utilice un <em>mi</em>-valor de corte de<code>1e-6</code>, mantenga las secuencias de destino principales y produzca un archivo de salida llamado<code>p450s_blastp_yeast_top1.blast</code>en formato de salida<code>11</code>.</li><li>Utilizar el<code>blast_formatter</code>herramienta para convertir el formato de salida<code>11</code>archivo anterior en un formato de salida<code>6</code>llamado<code>p450s_blastp_yeast_top1.txt</code>, con columnas para: (1) Id. de secuencia de consulta, (2) Id. de secuencia de sujeto, (3) Longitud de secuencia de sujeto, (4) Porcentaje de coincidencias idénticas, (5) <em>mi</em> Valor, (6) Cobertura de consultas por tema y (7) Título del tema. (Puede encontrar navegando por el manual de NCBI BLAST + y la salida de<code>blast_formatter -help</code>para ser informativo.) La salida, cuando se ve con<code>menos -S</code>, debería verse algo como esto:<img src="">¿Qué representan estas diversas columnas de salida?</li><li>El archivo <strong><code>yeast_selected_ids.txt</code></strong> contiene una columna de 25 ID identificados como interesantes de alguna manera. Usar<code>blastdbcmd</code>para extraer solo esos registros de secuencia de la<code>orf_trans</code>base de datos como un archivo FASTA denominado<code>yeast_selected_ids.fasta</code>. (Nuevamente, navegando por el manual BLAST + y la salida de<code>blastdbcmd -help</code>será útil.)</li></ol><hr> <br> <h2>Versión actual - 1.79 - 3 de junio de 2021</h2> <p>Todas las versiones compatibles de Python incluyen la herramienta de administración de paquetes Python pip, que permite una fácil instalación desde la línea de comandos en todas las plataformas. Tratar:</p> <p>Para actualizar una versión anterior de Biopython, intente:</p> <p>Esto eliminará las versiones anteriores de Biopython y NumPy antes de instalar las versiones recientes.</p> <p>Si desea desinstalar Biopython:</p> <p>Si pip aún no está instalado, es posible que deba actualizar su Python, pero primero intente:</p> <p>Si necesita instalar bajo una versión específica de Python, intente algo como esto:</p> <p>Sobre <strong>Ventanas</strong>, por defecto, python y pip no están en la RUTA. Puede volver a instalar Python y marcar esta opción, o dar la ruta completa en su lugar. Pruebe algo como esto, dependiendo de dónde esté instalada su copia de Python:</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <h3>Otros paquetes</h3> <p>Si bien generalmente recomendamos usar pip para instalar Biopython usando los paquetes de rueda que proporcionamos en PyPI (como arriba), también hay paquetes de Biopython para Conda, Linux, etc.</p> <h3>Instalación desde la fuente</h3> <p>La instalación desde la fuente requiere un compilador C apropiado, por ejemplo GCC en <strong>Linux</strong>y MSVC en <strong>Ventanas</strong>. Para <strong>Mac OS X</strong>, o como ahora tiene la marca, <strong>Mac OS</strong>, si desea compilar Biopython desde la fuente, deberá tener instaladas las herramientas de línea de comandos de Apple, que se pueden hacer con el comando de terminal:</p> <p>Esto ofrecerá instalar el paquete de desarrollo XCode de Apple; puede hacerlo, pero no es necesario y ocupa mucho espacio en disco.</p> <p>Luego puede descargar y descomprimir una versión del código fuente de Biopython u obtener nuestro código de GitHub. Entonces corre:</p> <p>Si todavía está atascado, regístrese en la lista de correo de Biopython y pida ayuda allí.</p> <h3>Software requerido</h3> <ul> o PyPy, incluidos los archivos de encabezado de desarrollo de Python como python.h <li>Compilador C (si se compila desde la fuente) Necesita un compilador C compatible con setuptools, <strong>gcc</strong> funcionará bien en plataformas similares a UNIX. Esto no es necesario en Windows si utiliza los paquetes compilados proporcionados. En Mac OS, debe instalar las herramientas del compilador de Apple como se describe arriba. .</li></ul> <h3>Software opcional</h3> <p>Algunas partes de Biopython utilizan las siguientes bibliotecas de Python adicionales:</p> <ul> - utilizado para código de gráficos pdf - utilizado para BioSQL con una base de datos PostgreSQL - utilizado para BioSQL con una base de datos MySQL - Una biblioteca MySQL alternativa utilizada por BioSQL </ul> <p>Además, Biopython incluye un código contenedor para llamar a una serie de herramientas de línea de comandos de terceros, que incluyen:</p> <ul> - para la herramienta de línea de comandos dnal <li>NCBI Standalone BLAST - herramienta de línea de comando para ejecutar BLAST en su máquina local - herramienta de línea de comando para construir alineaciones de secuencia y FDist - herramientas de línea de comando para genética de poblaciones - muchas herramientas útiles de línea de comando.</li></ul> <br> <h2>Tuplas (listas inmutables)</h2> <p>Como se señaló anteriormente, las listas son mutables, lo que significa que pueden modificarse después de su creación. En algunos casos especiales, es útil crear una versión inmutable de una lista, llamada "tupla" en Python. Al igual que las listas, las tuplas se pueden crear de dos formas: con la función tuple () (que devuelve una tupla vacía) o directamente.</p> <p><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_s650cotYUxtEJoNn7nwVU1.png"></p> <p>Las tuplas funcionan de manera muy similar a las listas: podemos llamar a len () en ellas y extraer elementos o sectores con la sintaxis []. No podemos cambiar, eliminar ni insertar elementos. [2] </p> <br> <h2>Contenido</h2> <p>Un archivo FASTQ normalmente usa cuatro líneas por secuencia.</p> <ul> <li>La línea 1 comienza con un carácter '@' y va seguida de un identificador de secuencia y un <i>Opcional</i> descripción (como una línea de título de FASTA).</li> <li>La línea 2 son las letras de secuencia sin procesar.</li> <li>La línea 3 comienza con un carácter '+' y es <i>opcionalmente</i> seguido por el mismo identificador de secuencia (y cualquier descripción) nuevamente.</li> <li>La línea 4 codifica los valores de calidad para la secuencia en la línea 2 y debe contener el mismo número de símbolos que letras en la secuencia.</li></ul> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Un archivo FASTQ que contenga una sola secuencia podría verse así:</p> <p>El byte que representa la calidad va de 0x21 (calidad más baja '!' En ASCII) a 0x7e (calidad más alta '</p> <p>'en ASCII). Estos son los caracteres de valor de calidad en orden creciente de calidad de izquierda a derecha (ASCII):</p> <p>Los archivos originales de Sanger FASTQ también permitían que la secuencia y las cadenas de calidad se envolvieran (divididas en varias líneas), pero esto generalmente no se recomienda [<i> cita necesaria </i>] ya que puede complicar el análisis debido a la desafortunada elección de "@" y "+" como marcadores (estos caracteres también pueden aparecer en la cadena de calidad).</p> <h3>Identificadores de secuencia de Illumina Editar</h3> <p>Las secuencias del software Illumina utilizan un identificador sistemático:</p> <p><table><tbody><tr><th>HWUSI-EAS100R</th> <td>el nombre único del instrumento</td></tr><tr><th>6</th> <td>carril de la celda de flujo</td></tr><tr><th>73</th> <td>número de mosaico dentro del carril de la celda de flujo</td></tr><tr><th>941</th> <td>Coordenada 'x' del grupo dentro del mosaico</td></tr><tr><th>1973</th> <td>Coordenada 'y' del grupo dentro del mosaico</td></tr><tr><th>#0</th> <td>número de índice para una muestra multiplexada (0 para sin indexación)</td></tr><tr><th>/1</th> <td>el miembro de una pareja, / 1 o / 2 <i>(solo lecturas paired-end o mate-pair)</i></td></tr></tbody></table></p> <p>Las versiones de la canalización de Illumina desde 1.4 parecen utilizar <b>#NNNNNN</b> en lugar de <b>#0</b> para el ID de multiplexación, donde <b>NNNNNN</b> es la secuencia de la etiqueta multiplex.</p> <p>Con Casava 1.8, el formato de la línea '@' ha cambiado:</p> <p><table><tbody><tr><th>EAS139</th> <td>el nombre único del instrumento</td></tr><tr><th>136</th> <td>la identificación de ejecución</td></tr><tr><th>FC706VJ</th> <td>la identificación de la celda de flujo</td></tr><tr><th>2</th> <td>carril de la celda de flujo</td></tr><tr><th>2104</th> <td>número de mosaico dentro del carril de la celda de flujo</td></tr><tr><th>15343</th> <td>Coordenada 'x' del grupo dentro del mosaico</td></tr><tr><th>197393</th> <td>Coordenada 'y' del grupo dentro del mosaico</td></tr><tr><th>1</th> <td>el miembro de una pareja, 1 o 2 <i>(solo lecturas paired-end o mate-pair)</i></td></tr><tr><th>Y</th> <td>Y si la lectura se filtra (no pasó), N en caso contrario</td></tr><tr><th>18</th> <td>0 cuando ninguno de los bits de control está activado, de lo contrario es un número par</td></tr><tr><th>ATCACG</th> <td>secuencia de índice</td></tr></tbody></table></p> <p>Tenga en cuenta que las versiones más recientes del software Illumina generan un número de muestra (tomado de la hoja de muestras) en lugar de una secuencia de índice. Por ejemplo, el siguiente encabezado puede aparecer en la primera muestra de un lote:</p> <h3>Edición de archivo de lectura de secuencia NCBI</h3> <p>Los archivos FASTQ del archivo de lectura de secuencia de INSDC a menudo incluyen una descripción, p. Ej.</p> <p>En este ejemplo, hay un identificador asignado por NCBI y la descripción contiene el identificador original de Solexa / Illumina (como se describió anteriormente) más la longitud de lectura. La secuenciación se realizó en modo de extremo emparejado (</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Tamaño de plaquita de 500 pb), consulte SRR001666.El formato de salida predeterminado de fastq-dump produce anuncios completos, que contienen lecturas técnicas y, por lo general, lecturas biológicas de un solo extremo o de dos extremos.</p> <p>El uso moderno de FASTQ casi siempre implica dividir el lugar en sus lecturas biológicas, como se describe en los metadatos proporcionados por el remitente:</p> <p>Cuando está presente en el archivo, fastq-dump puede intentar restaurar los nombres leídos al formato original. NCBI no almacena los nombres de lectura originales de forma predeterminada:</p> <p>En el ejemplo anterior, se utilizaron los nombres de lectura originales en lugar del nombre de lectura mencionado. Las accesiones de NCBI se ejecutan y las lecturas que contienen. Los nombres de lectura originales, asignados por secuenciadores, pueden funcionar como identificadores locales únicos de una lectura y transmitir exactamente tanta información como un número de serie. Los identificadores anteriores se asignaron algorítmicamente en función de la información de ejecución y las coordenadas geométricas. Los primeros cargadores de SRA analizaron estos identificadores y almacenaron sus componentes descompuestos internamente. NCBI dejó de registrar nombres leídos porque con frecuencia se modifican del formato original de los proveedores para asociar información adicional significativa a una línea de procesamiento en particular, y esto provocó violaciones del formato de nombre que dieron como resultado un gran número de envíos rechazados. Sin un esquema claro para los nombres leídos, su función sigue siendo la de una identificación de lectura única, que transmite la misma cantidad de información que un número de serie leído. Consulte varios problemas del kit de herramientas de la SRA para obtener detalles y discusiones.</p> <p>También tenga en cuenta que fastq-dump convierte estos datos FASTQ de la codificación original de Solexa / Illumina al estándar Sanger (consulte las codificaciones a continuación). Esto se debe a que la SRA sirve como depósito de información NGS, en lugar de formato. Las diversas herramientas * -dump son capaces de producir datos en varios formatos desde la misma fuente. Los requisitos para hacerlo han sido dictados por los usuarios durante varios años, y la mayor parte de la demanda inicial proviene del Proyecto 1000 Genomas.</p> <h3>Calidad Editar</h3> <p>Un valor de calidad <i>Q</i> es un mapeo de enteros de <i>pag</i> (es decir, la probabilidad de que la llamada base correspondiente sea incorrecta). Se han utilizado dos ecuaciones diferentes. La primera es la variante estándar de Sanger para evaluar la confiabilidad de una llamada base, también conocida como puntaje de calidad Phred:</p> <p>La tubería de Solexa (es decir, el software entregado con Illumina Genome Analyzer) utilizó anteriormente un mapeo diferente, codificando las probabilidades <i>pag</i>/(1-<i>pag</i>) en lugar de la probabilidad <i>pag</i>:</p> <p>Aunque ambas asignaciones son asintóticamente idénticas a valores de calidad más altos, difieren a niveles de calidad más bajos (es decir, aproximadamente <i>pag</i> & gt 0.05, o equivalentemente, <i>Q</i> & lt 13).</p> <p>En ocasiones, ha habido desacuerdos sobre qué mapeo utiliza realmente Illumina. La guía del usuario (Apéndice B, página 122) para la versión 1.4 de la tubería de Illumina establece que: "Las puntuaciones se definen como Q = 10 * log10 (p / (1-p)) [<i>sic</i>], donde p es la probabilidad de una llamada de base correspondiente a la base en cuestión ". [2] En retrospectiva, esta entrada en el manual parece haber sido un error. La guía del usuario (Novedades, página 5) para la versión 1.5 de la canalización de Illumina enumera esta descripción en su lugar: "Cambios importantes en la canalización v1.3 [<i>sic</i>]. El esquema de puntuación de calidad ha cambiado al esquema de puntuación Phred [es decir, Sanger], codificado como un carácter ASCII agregando 64 al valor Phred. Una puntuación Phred de una base es: Q phred = - 10 log 10 ⁡ e < displaystyle Q _ < text<phred>> = - 10 log _ < text <10>> e>, donde <i>mi</i> es la probabilidad estimada de que una base sea incorrecta. [3] <p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <h3>Codificación Editar</h3> <ul> <li>El formato Sanger puede codificar un puntaje de calidad Phred de 0 a 93 usando ASCII 33 a 126 (aunque en los datos de lectura sin procesar el puntaje de calidad Phred rara vez supera los 60, es posible obtener puntajes más altos en ensamblajes o mapas de lectura). También se utiliza en formato SAM. [4] A finales de febrero de 2011, la versión más reciente de Illumina (1.8) de su canalización CASAVA producirá directamente fastq en formato Sanger, según el anuncio en el foro seqanswers.com. [5]</li> <li>Las lecturas de PacBio HiFi, que normalmente se almacenan en formato SAM / BAM, utilizan la convención de Sanger: las puntuaciones de calidad Phred de 0 a 93 se codifican utilizando ASCII 33 a 126. Los subads de PacBio sin procesar utilizan la misma convención pero normalmente asignan una calidad de base de marcador de posición (Q0 ) a todas las bases en la lectura. [6]</li> <li>El formato Solexa / Illumina 1.0 puede codificar un puntaje de calidad Solexa / Illumina de -5 a 62 usando ASCII 59 a 126 (aunque en los datos de lectura sin procesar solo se esperan puntajes Solexa de -5 a 40)</li> <li>A partir de Illumina 1.3 y antes de Illumina 1.8, el formato codificó una puntuación de calidad Phred de 0 a 62 utilizando ASCII 64 a 126 (aunque en los datos de lectura sin procesar solo se esperan puntuaciones Phred de 0 a 40).</li> <li>A partir de Illumina 1.5 y antes de Illumina 1.8, las puntuaciones Phred de 0 a 2 tienen un significado ligeramente diferente. Los valores 0 y 1 ya no se utilizan y el valor 2, codificado por ASCII 66 "B", se utiliza también al final de las lecturas como <i>Indicador de control de calidad de segmento de lectura</i>. [7] El manual de Illumina [8] (página 30) establece lo siguiente: <i>Si una lectura termina con un segmento de calidad mayoritariamente baja (Q15 o inferior), todos los valores de calidad del segmento se reemplazan con un valor de 2 (codificado como la letra B en la codificación de puntajes de calidad basada en texto de Illumina). Este indicador Q2 no predice una tasa de error específica, sino que indica que una parte final específica de la lectura no debe usarse en análisis posteriores.</i> Además, el puntaje de calidad codificado como letra "B" puede ocurrir internamente en lecturas al menos hasta la versión 1.6 de la canalización, como se muestra en el siguiente ejemplo:</li></ul> <p>Se ha propuesto una interpretación alternativa de esta codificación ASCII. [9] Además, en las ejecuciones de Illumina con controles PhiX, se observó que el carácter 'B' representaba una "puntuación de calidad desconocida". La tasa de error de las lecturas 'B' fue aproximadamente 3 puntuaciones phred más bajas que la puntuación media observada de una ejecución determinada.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <ul> <li>A partir de Illumina 1.8, los puntajes de calidad básicamente han vuelto al uso del formato Sanger (Phred + 33).</li></ul> <p>En el caso de las lecturas sin procesar, el rango de puntuaciones dependerá de la tecnología y de la persona que llama de base utilizada, pero normalmente será de hasta 41 para la química reciente de Illumina. Dado que el puntaje de calidad máximo observado anteriormente era solo 40, varios scripts y herramientas se rompen cuando encuentran datos con valores de calidad superiores a 40. Para las lecturas procesadas, los puntajes pueden ser incluso más altos. Por ejemplo, se observan valores de calidad de 45 en las lecturas del Servicio de secuenciación de lectura larga de Illumina (anteriormente Moleculo).</p> <h3>Espacio de color Editar</h3> <p>Para datos SOLiD, la secuencia está en el espacio de color, excepto la primera posición. Los valores de calidad son los del formato Sanger. Las herramientas de alineación difieren en su versión preferida de los valores de calidad: algunas incluyen una puntuación de calidad (establecida en 0, es decir, '!') Para el nucleótido principal, otras no. El archivo de lectura de secuencia incluye esta puntuación de calidad.</p> <h3>Edición de simulación</h3> <p>La simulación de lectura FASTQ se ha abordado mediante varias herramientas. [10] [11] Aquí se puede ver una comparación de esas herramientas. [12] </p> <h3>Edición de compresión</h3> <h4>Compresores generales Editar</h4> <p>Las herramientas de uso general como Gzip y bzip2 consideran FASTQ como un archivo de texto sin formato y dan como resultado relaciones de compresión subóptimas. El archivo de lectura de secuencia de NCBI codifica metadatos utilizando el esquema LZ-77. Los compresores FASTQ generales suelen comprimir campos distintos (nombres de lectura, secuencias, comentarios y puntuaciones de calidad) en un archivo FASTQ por separado; estos incluyen Genozip, [13] DSRC y DSRC2, FQC, LFQC, Fqzcomp y Slimfastq.</p> <h4>Lee Editar</h4> <p>Tener un genoma de referencia es conveniente porque entonces, en lugar de almacenar las secuencias de nucleótidos en sí mismas, uno puede simplemente alinear las lecturas con el genoma de referencia y almacenar las posiciones (punteros) y los desajustes, los punteros se pueden clasificar de acuerdo con su orden en la secuencia de referencia. y codificado, por ejemplo, con codificación de longitud de ejecución. Cuando la cobertura o el contenido repetido del genoma secuenciado es alto, esto conduce a una alta tasa de compresión. A diferencia de los formatos SAM / BAM, los archivos FASTQ no especifican un genoma de referencia. <b>Compresores FASTQ basados ​​en alineación</b> admite el uso de datos proporcionados por el usuario o <i>de novo</i> referencia ensamblada: LW-FQZip utiliza un genoma de referencia proporcionado y Quip, Leon, k-Path y KIC realizan <i><b>de novo</b></i> ensamblaje utilizando un enfoque basado en gráficos de De Bruijn. Genozip [13] puede utilizar opcionalmente una referencia si el usuario proporciona una, que puede ser un archivo de referencia de una o varias especies.</p> <p>Mapeo de lectura explícito y <i>de novo</i> el montaje suele ser lento. <b>Compresores FASTQ basados ​​en reordenamiento</b> primeras lecturas de clúster que comparten subcadenas largas y luego comprimen de forma independiente las lecturas en cada clúster después de reordenarlas o ensamblarlas en contigs más largos, logrando quizás la mejor compensación entre el tiempo de ejecución y la tasa de compresión. SCALCE es la primera herramienta de este tipo, seguida de Orcom y Mince. BEETL utiliza una transformación Burrows-Wheeler generalizada para reordenar las lecturas, y HARC logra un mejor rendimiento con reordenación basada en hash. En cambio, AssemblTrie ensambla lecturas en árboles de referencia con el menor número total de símbolos posible en la referencia. [14] [15] </p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Los puntos de referencia para estas herramientas están disponibles en. [16] </p> <h4>Valores de calidad Editar</h4> <p>Los valores de calidad representan aproximadamente la mitad del espacio de disco requerido en el formato FASTQ (antes de la compresión) y, por lo tanto, la compresión de los valores de calidad puede reducir significativamente los requisitos de almacenamiento y acelerar el análisis y la transmisión de datos de secuenciación. Recientemente se están considerando en la literatura tanto la compresión sin pérdidas como con pérdidas. Por ejemplo, el algoritmo QualComp [17] realiza una compresión con pérdida con una tasa (número de bits por valor de calidad) especificada por el usuario. Basado en los resultados de la teoría de la distorsión de velocidad, asigna el número de bits para minimizar el MSE (error cuadrático medio) entre los valores de calidad originales (sin comprimir) y reconstruidos (después de la compresión). Otros algoritmos para la compresión de valores de calidad incluyen SCALCE [18] y Fastqz. [19] Ambos son algoritmos de compresión sin pérdida que proporcionan un enfoque de transformación con pérdida controlada opcional. Por ejemplo, SCALCE reduce el tamaño del alfabeto basándose en la observación de que los valores de calidad "vecinos" son similares en general. Para obtener un punto de referencia, consulte. [20] </p> <p>A partir de HiSeq 2500, Illumina ofrece la opción de imprimir calidades que se han agrupado en contenedores de calidad. Las puntuaciones agrupadas se calculan directamente a partir de la tabla de puntuación de calidad empírica, que a su vez está vinculada al hardware, software y química que se utilizaron durante el experimento de secuenciación. [21] </p> <p>Genozip [13] utiliza su algoritmo DomQual para comprimir puntuaciones de calidad agrupadas, como las generadas por Illumina o por el propio Genozip. <i>--optimizar</i> opción que genera bins similares a Illumina.</p> <h3>Cifrado Editar</h3> <p>Genozip [13] cifra archivos FASTQ (así como otros formatos genómicos), aplicando el cifrado AES estándar en su nivel más seguro de 256 bits (<i>--contraseña</i> opción).</p> <p>Cryfa [22] utiliza cifrado AES y permite compactar datos además del cifrado. También puede abordar archivos FASTA.</p> <p>No existe una extensión de archivo estándar para un archivo FASTQ, pero comúnmente se usan .fq y .fastq.</p> <br> <h2>1.7: Línea de comando BLAST - Biología</h2> <p>DGINN: canalización de detección de INNovations genéticas</p> <p>DGINN es un pipeline dedicado a la detección de innovaciones genéticas, a partir de una secuencia nucleotídica.</p> <p>Automatiza todos los pasos preliminares necesarios para los análisis evolutivos, incluida la recuperación de homólogos, la asignación a grupos de ortología, la alineación de codones y la reconstrucción de la filogenia genética.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Automatiza todos los pasos preliminares necesarios para los análisis evolutivos, incluida la recuperación de homólogos, la asignación a grupos de ortología, la alineación de codones y la reconstrucción de la filogenia genética. Tras la obtención de los alineamientos y las filogenias correspondientes, se detectan tres innovaciones genéticas importantes: eventos de duplicación, eventos de recombinación y firmas de selección positiva.</p> <p>DGINN se validó en diecinueve genes de primates con historias evolutivas conocidas y los resultados se pueden consultar en BioRxiv (doi: https://doi.org/10.1101/2020.02.25.964155). Los resultados de la validación están disponibles en el repositorio correspondiente. La versión de DGINN utilizada en el documento se refiere a la confirmación 5db0253 y se puede obtener a través de:</p> <p>La ventana acoplable está disponible tanto para la versión en papel como para la versión actual de DGINN.</p> <p>Cualquier pregunta o sugerencia sobre el programa puede dirigirse a lea.picard [at] ens-lyon.fr, laurent.gueguen [at] univ-lyon1.fr o lucie.etienne [at] ens-lyon.fr.</p> <p>1 / Dependencias y softwares necesarios</p> <ul> <li>Software y versiones: EMBOSS: 6.6, PhyML 3.0, PRANK v.170427, Treerecs v1.0, HYPHY 2.3, Bio ++ v.2</li> <li>Python (& gt3.5) y paquetes: Biopython, ete3, colecciones, registro, shlex, os, numpy, scipy, solicitudes, pandas, estadísticas, tiempo, re, argparse</li></ul> <p>Hay disponible una imagen de la ventana acoplable para proporcionar una forma de utilizar DGINN sin necesidad de instalar ningún software, excepto Docker.</p> <p>Para descargar una versión específica de la ventana acoplable:</p> <p>El comando debe ejecutarse como está y funcionar tanto en sistemas Mac como Linux, siempre que el usuario pertenezca al grupo 'docker' (consulte la Documentación de Docker para obtener ayuda sobre cómo configurar el usuario como parte de este grupo en Linux).</p> <p>Todos los demás argumentos se pasan exactamente como si DGINN se ejecutara a través de la línea de comando directamente desde el script (como -p parameters.txt / ver la siguiente sección). Sin embargo, una diferencia principal es que todos los archivos deben ser referidos por su nombre en el archivo de parámetros y estar ubicados dentro del directorio de trabajo, mientras que pueden ser referidos por su ruta y estar ubicados en un directorio diferente cuando se ejecuta la versión del script.</p> <p>DGINN usa un archivo de parámetros para pasar todos los argumentos necesarios para lanzar la canalización. Se proporcionan dos archivos de ejemplo en el directorio de ejemplos:</p> <ol> <li>uno que realiza los pasos 1-7 (ver descripción general) desde el CDS del gen de interés hasta la detección de recombinación (parameters.txt)</li> <li>uno que realiza el paso 8 para la detección de selección positiva (parameters_possel.txt)</li></ol> <p>Este es el uso recomendado para DGINN, de modo que los análisis de selección positiva se puedan paralelizar en todas las alineaciones en lugar de realizarlos secuencialmente.</p> <p>Tenga en cuenta que el nombre de la secuencia rápida <strong>y</strong> queryName debe seguir el formato speSpe_GENE_Id (por ejemplo: homSap_MX1_CCDS13673, macMul_APOBEC3G_NM_001198693).</p> <table> <thead> <tr><th>Paso</th> <th>Archivo (s) necesario (s)</th> <th>Formato</th></tr> <tbody> <tr><td>explosión</td> <td>CDS del gen de interés</td> <td>Fasta</td></tr> <tr><td>accesiones</td> <td>Lista de resultados de voladuras</td> <td>Formato tabulado NCBI (tsv)</td></tr> <tr><td>fasta</td> <td>Lista de identificadores de accesión (uno / línea)</td> <td>TXT</td></tr> <tr><td>orf</td> <td>Secuencias de ARNm de ortólogos</td> <td>Fasta</td></tr> <tr><td>alineación</td> <td>Secuencias CDS de ortólogos</td> <td>Fasta</td></tr> <tr><td>árbol</td> <td>(codón) alineación de ortólogos</td> <td>Fasta</td></tr> <tr><td>duplicación</td> <td>(codón) alineación, árbol genético</td> <td>Fasta, newick</td></tr> <tr><td>recombinación</td> <td>(codón) alineación</td> <td>Fasta</td></tr> <tr><td>PositiveSelection</td> <td>alineación de codones, árbol genético</td> <td>Fasta, árbol genético</td></tr></tbody> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> </thead></table> <p>Se debe respetar el orden de los archivos y seguir el indicado en esta tabla.</p> <p>Aunque los alineamientos de codones no son técnicamente necesarios para los pasos de phyml, duplicación y recombinación, sí lo son para la selección positiva. Por lo tanto, comenzar en los pasos aguas arriba de la selección positiva con alineaciones sin codón probablemente conducirá a fallas en el paso de la selección positiva.</p> <p>DGINN incluye diferentes softwares para verificar la selección positiva:</p> <ul> <li>BUSTED (Murrel et al., Molecular Biology and Evolution, 2015) de Hyphy</li> <li>MEME (Murrel et al., PLoS Genetics, 2012) de Hyphy</li> <li>Código PAML (Yang, Molecular Biology and Evolution, 2007) para los modelos de sitio M0, M1, M2, M7 y M8</li> <li>BIO ++ (Guéguen et al., Molecular Biology and Evolution, 2013) para los modelos de sitio M0, M1, M2, M7 y M8</li> <li>BIO ++ para el modelo de una por rama (OPB) (similar al modelo PAML codeml FreeRatio) para probar la selección positiva en las ramas</li></ul> <p>Los tres primeros métodos se parametrizan automáticamente en DGINN.</p> <p>Para BIO ++, los archivos de parámetros pueden ser generados automáticamente por DGINN, pero el usuario también puede proporcionar sus propios archivos de parámetros si desea modificarlos más. La opción OPB también se puede utilizar para diferentes análisis utilizando Bio ++ ya que sus resultados no influyen en ningún paso posterior. Los archivos de parámetros de ejemplo para bppml y bppmixedlikelihoods (para modelos de sitio) se proporcionan en examples /, así como un archivo de parámetros para ejecutar un modelo por rama.</p> <p>Se recomienda a los usuarios que deseen realizar la verificación más rápida posible de sus genes de interés que ejecuten solo modelos de sitios BIO ++, ya que nuestros resultados de validación apuntan a que proporcionan el mejor compromiso de resultados sólidos y tiempos de ejecución más cortos.</p> <p>En la carpeta de ejemplos, se proporcionan dos archivos de parámetros.</p> <p>NB: estos archivos deben actualizarse con las rutas absolutas a los archivos a los que se hace referencia en lugar de solo su nombre cuando se usa DGINN a través de la línea de comando y no a través de la ventana acoplable.</p> <p>python3 DGINN.py -p parámetros.txt</p> <p>Lanzará los pasos 1-7 de DGINN en ex_CCDS.fasta de la siguiente manera:</p> <ul> <li>recuperando homólogos de especies de primates en el NCBI <em>nr</em> base de datos</li> <li>detectar duplicaciones y asignar grupos de ortólogos de al menos 8 especies según ex_spTree.tree</li> <li>detectar eventos de recombinación</li></ul> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>python3 DGINN.py -p parameters_possel.txt</p> <p>Lanzará DGINN paso 8 en ex_aln.fasta y ex_genetree.tree por:</p> <ul> <li>buscando selección positiva en el gen usando BUSTED</li> <li>buscando sitios bajo selección positiva episódica usando MEME</li> <li>buscando sitios bajo selección positiva utilizando los modelos M0-NS, M1-NS, M2-NS, M7-NS y M8-NS de BIO ++</li> <li>buscando sitios bajo selección positiva utilizando los modelos M0, M1, M2, M7 y M8 de PAML codeml</li> <li>buscando ramas bajo selección positiva usando BIO ++</li></ul> <p>DGINN se validó en diecinueve genes de primates con historias evolutivas conocidas y los resultados se pueden consultar en BioRxiv (doi: https://doi.org/10.1101/2020.02.25.964155). Los resultados de la validación están disponibles en el repositorio correspondiente.</p> <p>En la carpeta etc, se incluye un script titulado CCDSquery.py. Este script permite al usuario descargar las secuencias CCDS de genes humanos, proporcionando el archivo con el formato adecuado obtenido a través de HGNC. Este archivo debe contener al menos una columna titulada "Símbolo aprobado" y otra titulada "Adhesión CCDS".</p> <p>Otro script llamado parseResults.py también se puede encontrar en la carpeta etc.</p> <p>El archivo de entrada se compone de dos columnas separadas por tabulaciones: la primera indica la ruta completa a los directorios que contienen los resultados de la selección positiva (el directorio que contiene los subdirectorios busted, bpp_site, paml_site, etc.), la segunda la ruta completa a las alineaciones sobre las que se realizaron esos análisis.</p> <p>Ejemplo: / RUTA / TO / GENENAME_sequences_filtered_longestORFs_mafft_mincov_prank_results_TIMESTAMP1 / positive_selection_results_TIMESTAMP2 /PATH/TO/GENENAME_sequences_filtered_longestORFs_mafft_mincov_prank.best.fas_mafft_mincov_prank.best.fas</p> <p>El script generará 3 archivos diferentes:</p> <ol> <li>un resumen de los resultados (un gen por línea)</li> <li>los porcentajes de cobertura en cada posición de cada alineación (NB: se recomienda no modificar este archivo en ninguna capacidad para asegurar una visualización adecuada de los resultados)</li> <li>las probabilidades calculadas por Bio ++ (Bpp) y PAML codeml para cada gen.</li></ol> <p>Los diferentes archivos de salida obtenidos con este script se pueden utilizar para generar figuras similares a las expuestas en el documento DGINN a través de la aplicación Shiny, cuya documentación se puede encontrar en el repositorio correspondiente.</p> <br> <h2>1.7: Línea de comando BLAST - Biología</h2> <p>Contactos para el repositorio Github de BRAKER en https://github.com/Gaius-Augustus/BRAKER:</p> <p>Katharina J. Hoff, Universidad de Greifswald, Alemania, katharina.hoff@uni-greifswald.de, +49 3834420 4624</p> <p>Katharina J. Hoff a, b, Simone Lange a, Alexandre Lomsadze c, Tomas Bruna c, Mark Borodovsky c, d, e, Mario Stanke a, b </p> <p><b>[a]</b> Universidad de Greifswald, Instituto de Matemáticas e Informática, Walther-Rathenau-Str. 47, 17489 Greifswald, Alemania</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p><b>[B]</b> Universidad de Greifswald, Centro de Genómica Funcional de Microbios, Felix-Hausdorff-Str. 8, 17489 Greifswald, Alemania</p> <p><b>[C]</b> Departamento de Ingeniería Biomédica conjunta de Georgia Tech y Emory University Wallace H Coulter, 30332 Atlanta, EE. UU.</p> <p><b>[D]</b> Escuela de Ciencias e Ingeniería Computacional, 30332 Atlanta, EE. UU.</p> <p><b>[mi]</b> Instituto de Física y Tecnología de Moscú, Región de Moscú 141701, Dolgoprudny, Rusia</p> <p><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_p9B4QkVtrL6RD.png"><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_onvb0cQGt9Hw8ZpI3oh3.png"><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_LmihFkBpvqn247nDc.png"></p> <p>Figura 1: Autores actuales de BRAKER, de izquierda a derecha: Mario Stanke, Alexandre Lomsadze, Katharina J. Hoff, Tomas Bruna y Mark Borodovsky.</p> <p>El desarrollo de BRAKER fue apoyado por los Institutos Nacionales de Salud (NIH) [GM128145 a M.B. y MS].</p> <p>El selector de transcripciones para BRAKER (TSEBRA) está disponible en https://github.com/Gaius-Augustus/TSEBRA.</p> <p>El número cada vez mayor de genomas secuenciados requiere métodos totalmente automatizados para una anotación precisa de la estructura genética. Con este objetivo en mente, hemos desarrollado BRAKER1 R1 R0, una combinación de GeneMark-ET R2 y AUGUSTUS R3, R4, que utiliza datos genómicos y RNA-Seq para generar automáticamente anotaciones de estructura genética completa en un genoma nuevo.</p> <p>Sin embargo, la calidad de los datos de RNA-Seq que están disponibles para anotar un genoma nuevo es variable y, en algunos casos, los datos de RNA-Seq no están disponibles en absoluto.</p> <p>BRAKER2 es una extensión de BRAKER1 que permite <strong>entrenamiento totalmente automatizado</strong> de las herramientas de predicción de genes GeneMark-EX R14, R15, R17, F1 y AUGUSTUS de RNA-Seq y / o información de homología de proteínas, y que integra la evidencia extrínseca de RNA-Seq y la información de homología de proteínas en el <strong>predicción</strong>.</p> <p>A diferencia de otros métodos disponibles que se basan en la información de homología de proteínas, BRAKER2 alcanza una alta precisión de predicción de genes incluso en ausencia de la anotación de especies muy estrechamente relacionadas y en ausencia de datos de RNA-Seq.</p> <p>En esta guía del usuario, nos referiremos a BRAKER1 y BRAKER2 simplemente como <strong>FRENO</strong> porque son ejecutados por el mismo script (braker.pl).</p> <p>Claves para una predicción genética exitosa</p> <p>Utilice un ensamblaje de genoma de alta calidad. Si tiene una gran cantidad de andamios muy cortos en el ensamblaje de su genoma, es probable que esos andamios cortos aumenten drásticamente el tiempo de ejecución, pero no aumentarán la precisión de la predicción.</p> <p>Utilice nombres de andamios simples en el archivo de genoma (por ejemplo, & gtcontig1 funcionará mejor que & gtcontig1 mi nombre de especie personalizado, alguna función putativa / más / información / y muchos caracteres especiales% & amp! * () <>). Simplifique los nombres de los andamios en todos sus archivos fasta antes de ejecutar cualquier programa de alineación.</p> <p>Para predecir genes con precisión en un genoma nuevo, el genoma debe estar enmascarado para repeticiones. Esto evitará la predicción de estructuras génicas falsas positivas en regiones repetitivas y de baja complejidad. El enmascaramiento repetido también es esencial para mapear datos de RNA-Seq en un genoma con algunas herramientas (otros mapeadores de RNA-Seq, como HISAT2, ignoran la información de enmascaramiento). En el caso de GeneMark-EX y AUGUSTUS, el enmascaramiento suave (es decir, poner las regiones de repetición en letras minúsculas y todas las demás regiones en letras mayúsculas) conduce a mejores resultados que el enmascaramiento rígido (es decir, reemplazar letras en regiones repetitivas por la letra N para un nucleótido desconocido). Si el genoma está enmascarado, use el indicador --softmasking de braker.pl.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Muchos genomas tienen estructuras genéticas que se predecirán con precisión con los parámetros estándar de GeneMark-EX y AUGUSTUS dentro de BRAKER. Sin embargo, algunos genomas tienen características específicas de clado, es decir, un modelo de punto de ramificación especial en hongos o patrones de sitio de empalme no estándar. Lea la sección de opciones [opciones] para determinar si alguna de las opciones personalizadas puede mejorar la precisión de la predicción genética en el genoma de su especie objetivo.</p> <p>¡Siempre verifique los resultados de la predicción genética antes de su uso posterior! Puede, por ejemplo, utilizar un navegador de genoma para la inspección visual de modelos de genes en contexto con datos de evidencia extrínseca. BRAKER admite la generación de centros de datos de pistas para UCSC Genome Browser con MakeHub para este propósito.</p> <p>Resumen de modos para ejecutar BRAKER</p> <p>BRAKER presenta principalmente datos de evidencia extrínseca, semi-no supervisada (RNA-Seq y / o información de alineación empalmada de proteína) apoyado en el entrenamiento de GeneMark-EX [F1] y el entrenamiento subsecuente de AUGUSTUS con integración de evidencia extrínseca en el paso final de predicción de genes. Sin embargo, ahora hay una serie de tuberías adicionales incluidas en BRAKER. A continuación, brindamos una descripción general de los posibles archivos de entrada y canalizaciones:</p> <ul> <li>Archivo del genoma, solo. En este modo, GeneMark-ES se entrena solo en la secuencia del genoma. Los genes largos predichos por GeneMark-ES se seleccionan para entrenar a AUGUSTUS. Las predicciones finales de AUGUSTUS son <em>ab initio</em>. Este enfoque probablemente producirá una precisión de predicción menor que todas las demás tuberías descritas aquí. (ver Figura 2),</li></ul> <p><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_ncpbHGirXW0FfKgDoAOGyu.png"></p> <p>Figura 2: Canalización A de BRAKER: entrenamiento de GeneMark-ES en datos del genoma, solo <em>ab initio</em> predicción genética con Augustus</p> <ul> <li>Archivo de genoma y RNA-Seq de la misma especie (ver figura 3) este enfoque es adecuado para bibliotecas de RNA-Seq de lectura corta con una buena cobertura del transcriptoma, <strong>importante:</strong> este enfoque requiere que cada intrón esté cubierto por muchas alineaciones, es decir, no funciona con asignaciones de transcriptomas ensambladas. En principio, también las alineaciones de datos de RNA-Seq de lectura larga pueden conducir a datos suficientes para ejecutar BRAKER, pero solo si cada transcripción que entrará en entrenamiento fue secuenciada y alineada con el genoma varias veces. Tenga en cuenta que en el momento actual, BRAKER no admite oficialmente la integración de datos RNA-Seq de lectura larga todavía.</li></ul> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_PB7MFzezyU28mtkgqI7y.png"></p> <p>Figura 3: Tubería B de BRAKER: entrenamiento de GeneMark-ET apoyado por información de alineación empalmada RNA-Seq, predicción con AUGUSTUS con la misma información de alineación empalmada.</p> <ul> <li>Archivo genómico y base de datos de proteínas que pueden ser de <strong>desconocido</strong> distancia evolutiva a la especie objetivo (ver Figura 4) este enfoque es particularmente adecuado si no se dispone de datos de RNA-Seq. Este método funcionará mejor con proteínas de especies que están bastante cerca de la especie objetivo, pero la precisión disminuirá muy poco si las proteínas de referencia están más alejadas de la especie objetivo. <strong>Importante:</strong> Este enfoque requiere una base de datos de familias de proteínas, es decir, muchos representantes de cada familia de proteínas deben estar presentes en la base de datos. BRAKER ha sido probado con OrthoDB R19, con éxito. La canalización de mapeo de proteínas ProtHint R18 para generar las sugerencias necesarias para BRAKER está disponible para descargar en https://github.com/gatech-genemark/ProtHint, las instrucciones sobre cómo preparar las proteínas de entrada OrthoDB están documentadas en https: // github. com / gatech-genemark / ProtHint # preparación de base de datos de proteínas. Puede agregar proteínas de una especie estrechamente relacionada al archivo fasta de OrthoDB para incorporar evidencia adicional en la predicción de genes.</li></ul> <p><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_QGg2EgrqUsmdavPzVd6Fds9W.png"></p> <p>Figura 4: Canalización C de BRAKER: entrenamiento de GeneMark-EP + en alineación empalmada de proteínas, información de inicio y parada, predicción con AUGUSTUS con esa misma información, además de pistas encadenadas de CDSpart. Las proteínas utilizadas aquí pueden estar a cualquier distancia evolutiva del organismo objetivo.</p> <ul> <li>Genoma y archivo RNA-Seq de la misma especie, y proteínas que pueden ser de <strong>desconocido</strong> distancia evolutiva a la especie objetivo (ver figura 5) <strong>importante:</strong> este enfoque requiere una base de datos de familias de proteínas, es decir, muchos representantes de cada familia de proteínas deben estar presentes en la base de datos, p. OrthoDB es adecuado. (Puede agregar proteínas de una especie estrechamente relacionada al archivo fasta de OrthoDB para incorporar evidencia adicional en la predicción de genes).</li></ul> <p><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_83zotw6zjCwlxutv7D1w6sl.png"></p> <p>Figura 5: Tubería D de BRAKER: entrenamiento de GeneMark-ETP + respaldado por información de alineación de RNA-Seq e información de proteínas (las proteínas pueden tener cualquier distancia evolutiva). Tenga en cuenta que GeneMark-ETP + aún está en desarrollo, BRAKER actualmente puede ejecutar un precursor de la versión madura. Los intrones apoyados por RNA-Seq y la información de alineación de proteínas se tratan como "intrones positivos verdaderos", su predicción en estructuras génicas por GeneMark-ETP + y AUGUSTUS se aplica. <strong>Importante:</strong> ¡No siempre es mejor utilizar todas las pruebas! Hasta ahora, encontramos que este enfoque funciona bien para genomas grandes, pero la precisión en genomas de tamaño pequeño y mediano es inestable. Por favor, eche un vistazo al póster de PAG 2020 antes de ejecutar este proceso.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <ul> <li>Archivo de genoma y archivo con proteínas de corta distancia evolutiva (ver Figura 6) este enfoque es adecuado si los datos de RNA-Seq no están disponibles y si la especie de referencia está muy relacionada. <em><em>Nota</em>:</em> Esta canalización está en desuso ya que la canalización C también puede usar proteínas de especies estrechamente relacionadas además de OrthoDB.</li></ul> <p><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_c8ocb9q8nXQGO0.png"></p> <p>Figura 6: Canalización adicional B: entrenamiento de AUGUSTUS sobre la base de información de alineación empalmada de proteínas de una especie muy estrechamente relacionada contra el genoma objetivo.</p> <ul> <li>Genoma y archivo RNA-Seq y proteínas de corta distancia evolutiva (ver Figuras 6 y 7). En ambos casos, GeneMark-ET se entrena con el apoyo de datos de RNA-Seq, y las predicciones de genes resultantes se utilizan para entrenar AUGUSTUS. En el enfoque A), la información de alineación de proteínas se usa solo en el paso de predicción de genes con AUGUSTUS. En el enfoque C), los datos de alineación empalmados de proteínas se utilizan para complementar el conjunto de entrenamiento para AUGUSTUS. Este último enfoque es particularmente adecuado si los datos de RNA-Seq no producen un número suficientemente alto de estructuras de genes de entrenamiento para AUGUSTUS, y si se encuentra disponible una especie muy estrechamente relacionada y ya anotada. <em><em>Nota</em>:</em> Esta canalización está en desuso ya que la canalización D también puede usar proteínas de especies estrechamente relacionadas además de OrthoDB.</li></ul> <p><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_9zialfldascz4UYds7.png"></p> <p>Figura 7: Canalización adicional A: entrenamiento de GeneMark-ET con el apoyo de información de alineación empalmada de RNA-Seq, predicción con AUGUSTUS con información de alineación empalmada de datos de RNA-Seq y con características genéticas determinadas por alineaciones de proteínas de una especie muy relacionada contra el objetivo genoma. <em><em>Nota</em>:</em> Esta canalización está en desuso ya que la canalización C también puede usar proteínas de especies estrechamente relacionadas además de OrthoDB.</p> <p><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_mw43DyzpDX46l3g9wo19N.png"></p> <p>Figura 8: Canalización adicional C: entrenamiento de GeneMark-ET sobre la base de información de alineación empalmada de RNA-Seq, entrenamiento de AUGUSTUS en un conjunto de estructuras de genes de entrenamiento compiladas a partir de estructuras de genes soportadas por RNA-Seq predichas por GeneMark-ET y alineación empalmada de proteínas de una especie muy relacionada. <em><em>Nota</em>:</em> Esta canalización está en desuso ya que la canalización D también puede usar proteínas de especies estrechamente relacionadas además de OrthoDB.</p> <p>Versiones de software compatibles</p> <p>En el momento del lanzamiento, esta versión de BRAKER se probó con:</p> <p>Dependencias de la canalización de Perl</p> <p>La ejecución de BRAKER requiere un sistema Linux con bash y Perl. Además, BRAKER requiere la instalación de los siguientes módulos CPAN-Perl:</p> <p>Para ProtHint, que se utiliza cuando se suministra la entrada de proteínas, también instale:</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>En Ubuntu, por ejemplo, instale los módulos con CPANminus F4: sudo cpanm Module :: Name, p. Ej. sudo cpanm Hash :: Fusionar.</p> <p>BRAKER también utiliza un módulo de Perl helpMod.pm que no está disponible en CPAN. Este módulo es parte de la versión BRAKER y no requiere instalación por separado.</p> <p>Si no tiene permisos de root en la máquina Linux, intente configurar un <strong>Anaconda</strong> (https://www.anaconda.com/distribution/) entorno de la siguiente manera:</p> <p>Posteriormente, instale BRAKER y otro software "como de costumbre" mientras se encuentra en su entorno conda. <strong>Nota:</strong> Hay un paquete bioconda braker y un paquete bioconda augustus. Trabajan. Pero generalmente se están quedando atrás del código de desarrollo de ambas herramientas en github. Por lo tanto, recomendamos la instalación manual y el uso de las últimas fuentes.</p> <p>BRAKER es una colección de scripts de Perl y Python y un módulo de Perl. El script principal que se llamará para ejecutar BRAKER es braker.pl. Los componentes adicionales de Perl y Python son:</p> <p>Todos los scripts (archivos que terminan en * .pl y * .py) que forman parte de BRAKER deben ser ejecutables para poder ejecutar BRAKER. Este ya debería ser el caso si descarga BRAKER desde GitHub. La ejecutabilidad se puede sobrescribir si, p. Ej. transfiera BRAKER de una memoria USB a otra computadora. Para verificar si los archivos requeridos son ejecutables, ejecute el siguiente comando en el directorio que contiene los scripts de BRAKER Perl:</p> <p>La salida debería ser similar a esta:</p> <p>Es importante que la x en -rwxr-xr-x esté presente para cada script. Si ese no es el caso, ejecute</p> <p>para cambiar los atributos del archivo.</p> <p>Puede resultarle útil agregar el directorio en el que residen los scripts perl de BRAKER a su variable de entorno $ PATH. Para una sola sesión de bash, ingrese:</p> <p>Para que esta modificación de $ PATH esté disponible para todas las sesiones de bash, agregue las líneas anteriores a un script de inicio (p. Ej.</p> <p>Dependencias de software de bioinformática</p> <p>BRAKER utiliza varias herramientas de software de bioinformática que no forman parte de BRAKER. Algunas herramientas son obligatorias, es decir, BRAKER no se ejecutará en absoluto si estas herramientas no están presentes en su sistema. Otras herramientas son opcionales. Instale todas las herramientas necesarias para ejecutar BRAKER en el modo de su elección.</p> <p>Descargue GeneMark-EX F1 desde la opción http://exon.gatech.edu/GeneMark/license_download.cgi (la opción GeneMark-ES / ET / EP). Desempaquete e instale GeneMark-EX como se describe en el archivo README de GeneMark-EX.</p> <p>Si ya está contenido en su variable $ PATH, BRAKER adivinará la ubicación de gmes_petap.pl, automáticamente. De lo contrario, BRAKER puede encontrar ejecutables GeneMark-EX ya sea ubicándolos en una variable de entorno GENEMARK_PATH, o tomando un argumento de línea de comando (--GENEMARK_PATH = / your_path_to_GeneMark-EX /).</p> <p>Para configurar la variable de entorno para su sesión actual de Bash, escriba:</p> <p>Agregue las líneas anteriores a un script de inicio (p. Ej.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>/.bashrc) para que esté disponible para todas las sesiones de bash. F5 </p> <p><strong>Importante:</strong> GeneMark-EX solo se ejecutará si un archivo de clave válido reside en su directorio de inicio. El archivo de clave vencerá después de 200 días, lo que significa que debe descargar una nueva versión de GeneMark-EX y un nuevo archivo de clave después de 200 días. El archivo de claves se descarga como gm_key.gz. Desempaquete el archivo clave y muévalo a un archivo oculto <strong>en su directorio personal</strong> como sigue:</p> <p>Los scripts de Perl dentro de GeneMark-EX están configurados con la ubicación predeterminada de Perl en / usr / bin / perl.</p> <p>Si está ejecutando GeneMark-EX en un entorno Anaconda (o desea usar Perl desde la variable $ PATH por cualquier otro motivo), modifique el shebang de todos los scripts de GeneMark-EX con el siguiente comando ubicado dentro de la carpeta GeneMark-EX:</p> <p>Puede verificar si GeneMark-EX está instalado correctamente ejecutando check_install.bash y / o ejecutando ejemplos en el directorio GeneMark-E-tests.</p> <p>Descargue AUGUSTUS desde su rama maestra en https://github.com/Gaius-Augustus/Augustus. Desempaque AUGUSTUS e instale AUGUSTUS de acuerdo con AUGUSTUS README.TXT. <em><strong>No utilice versiones obsoletas de AUGUSTUS de otras fuentes, p. Ej. ¡Paquete Debian o paquete Bioconda! BRAKER depende en gran medida, en particular, de un directorio Augustus / scripts actualizado, y otras fuentes a menudo se quedan atrás.</strong></em></p> <p>Debe compilar AUGUSTUS en su propio sistema para evitar problemas con las versiones de las bibliotecas utilizadas por AUGUSTUS. Las instrucciones de compilación se proporcionan en el archivo AUGUSTUS README.TXT (Augustus / README.txt).</p> <p>AUGUSTUS consta de augustus, la herramienta de predicción de genes, herramientas adicionales de C ++ ubicadas en Augustus / auxprogs y scripts de Perl ubicados en Augustus / scripts. Los scripts de Perl deben ser ejecutables (consulte las instrucciones en la sección Componentes de BRAKER.</p> <p>La herramienta de C ++ bam2hints es un componente esencial de BRAKER cuando se ejecuta con RNA-Seq. Las fuentes se encuentran en Augustus / auxprogs / bam2hints. Asegúrese de compilar bam2hints en su sistema (debería compilarse automáticamente cuando se compile AUGUSTUS, pero en caso de problemas con bam2hints, lea las instrucciones de solución de problemas en Augustus / auxprogs / bam2hints / README).</p> <p>Dado que BRAKER es una tubería que entrena a AUGUSTUS, es decir, escribe archivos de parámetros específicos de la especie, BRAKER necesita acceso de escritura al directorio de configuración de AUGUSTUS que contiene dichos archivos (Augustus / config /). Si instala AUGUSTUS globalmente en su sistema, la carpeta de configuración normalmente no será escribible para todos los usuarios. Haga que el directorio donde reside config sea de escritura recursiva para los usuarios de AUGUSTUS, o copie la carpeta config / (recursivamente) a una ubicación donde los usuarios tengan permiso de escritura.</p> <p>AUGUSTUS localizará la carpeta de configuración buscando una variable de entorno $ AUGUSTUS_CONFIG_PATH. Si la variable de entorno $ AUGUSTUS_CONFIG_PATH no está configurada, BRAKER buscará en la ruta ../config relativa al directorio en el que encuentra un ejecutable AUGUSTUS. Alternativamente, puede proporcionar la variable como un argumento de línea de comando a BRAKER (--AUGUSTUS_CONFIG_PATH = / your_path_to_AUGUSTUS / Augustus / config /). Le recomendamos que exporte la variable, p. Ej. para su sesión de bash actual:</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Para que la variable esté disponible para todas las sesiones de Bash, agregue la línea anterior a un script de inicio, p. Ej.</p> <p>¡BRAKER espera todo el directorio de configuración de AUGUSTUS en $ AUGUSTUS_CONFIG_PATH, es decir, las subcarpetas de especies con su contenido (al menos genérico) y extrínseco! Proporcionar una carpeta en la que se pueda escribir pero que esté vacía en $ AUGUSTUS_CONFIG_PATH no funcionará para BRAKER.Si necesita separar augustus binary y $ AUGUSTUS_CONFIG_PATH, le recomendamos que copie de forma recursiva el contenido de la configuración que no se puede escribir en una ubicación en la que se pueda escribir.</p> <p>Si tiene una instalación de AUGUSTUS en todo el sistema en / usr / bin / augustus, una copia de config que no se puede escribir se encuentra en / usr / bin / augustus_config /. Usted puede escribir en la carpeta / home / yours /. Copie con el siguiente comando (y además configure las variables requeridas en ese momento):</p> <p>Agregar directorios de binarios y scripts de AUGUSTUS a su variable $ PATH le permite a su sistema ubicar estas herramientas automáticamente. No es un requisito para ejecutar BRAKER hacer esto, porque BRAKER intentará adivinarlos desde la ubicación de otra variable de entorno ($ AUGUSTUS_CONFIG_PATH), o ambos directorios se pueden proporcionar como argumentos de línea de comando para braker.pl, pero recomendamos agréguelos a su variable $ PATH. Para su sesión de bash actual, escriba:</p> <p>Para todas sus sesiones de BASH, agregue las líneas anteriores a un script de inicio (p. Ej.</p> <p>En Ubuntu, Python3 generalmente se instala de manera predeterminada, python3 estará en su variable $ PATH, de manera predeterminada, y BRAKER lo ubicará automáticamente. Sin embargo, tiene la opción de especificar la ubicación binaria de python3 de otras dos formas:</p> <p>Exportar una variable de entorno $ PYTHON3_PATH, p. Ej. en tus</p> <p>Especifique la opción de línea de comando --PYTHON3_PATH = / ruta / a / python3 / a braker.pl.</p> <p>Descarga BAMTOOLS (por ejemplo, git clone https://github.com/pezmaster31/bamtools.git). Instale BAMTOOLS escribiendo lo siguiente en su shell:</p> <p>Si ya está en su variable $ PATH, BRAKER encontrará bamtools automáticamente. De lo contrario, BRAKER puede localizar el binario de bamtools usando una variable de entorno $ BAMTOOLS_PATH o tomando un argumento de línea de comando (--BAMTOOLS_PATH = / your_path_to_bamtools / bin / F6). Para establecer la variable de entorno, p. Ej. para su sesión de bash actual, escriba:</p> <p>Agregue la línea anterior a una secuencia de comandos de inicio (p. Ej.</p> <p>/.bashrc) para establecer la variable de entorno para todas las sesiones de bash.</p> <p>Puede utilizar NCBI BLAST + o DIAMOND para eliminar genes de entrenamiento redundantes. No necesita ambas herramientas. Si hay DIAMANTE, se preferirá porque es mucho más rápido.</p> <p>Obtenga y desembale DIAMOND de la siguiente manera:</p> <p>Si ya está en su variable $ PATH, BRAKER encontrará el diamante automáticamente. De lo contrario, BRAKER puede ubicar el binario de diamante usando una variable de entorno $ DIAMOND_PATH, o tomando un argumento de línea de comando (--DIAMOND_PATH = / your_path_to_diamond). Para establecer la variable de entorno, p. Ej. para su sesión de bash actual, escriba:</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Agregue la línea anterior a una secuencia de comandos de inicio (p. Ej.</p> <p>/.bashrc) para establecer la variable de entorno para todas las sesiones de bash.</p> <p>Si se decide por BLAST +, instale NCBI BLAST + con sudo apt-get install ncbi-blast +.</p> <p>Si ya está en su variable $ PATH, BRAKER encontrará blastp, automáticamente. De lo contrario, BRAKER puede localizar el binario blastp usando una variable de entorno $ BLAST_PATH o tomando un argumento de línea de comando (--BLAST_PATH = / your_path_to_blast /). Para establecer la variable de entorno, p. Ej. para su sesión de bash actual, escriba:</p> <p>Agregue la línea anterior a una secuencia de comandos de inicio (p. Ej.</p> <p>/.bashrc) para establecer la variable de entorno para todas las sesiones de bash.</p> <p>ProtHint es una tubería para generar pistas para GeneMark-EX y AUGUSTUS a partir de proteínas de cualquier distancia evolutiva. Si se dan secuencias de proteínas en la entrada, BRAKER ejecuta ProtHint automáticamente. Alternativamente, ProtHint se puede ejecutar como un paso separado durante la preparación de datos. ProtHint está disponible en https://github.com/gatech-genemark/ProtHint. Descarga de la siguiente manera:</p> <p>ProtHint tiene sus propios requisitos de software. Además de los módulos Perl requeridos por BRAKER, necesita</p> <p>Puede verificar fácilmente la instalación de ProtHint ejecutando la prueba en https://github.com/gatech-genemark/ProtHint/tree/master/example.</p> <p>ProtHint requiere DIAMOND y Spaln, los cuales vienen con la instalación de ProtHint. El requisito de ProtHint de GeneMark-ES ya se cumplirá si instaló las dependencias de BRAKER anteriores. Para obtener más instrucciones de instalación, consulte https://github.com/gatech-genemark/ProtHint.</p> <p>Si ya está en su variable $ PATH, BRAKER encontrará prothint.py, automáticamente. De lo contrario, BRAKER intentará localizar el ejecutable prothint.py utilizando una variable de entorno $ PROTHINT_PATH. Alternativamente, esto se puede proporcionar como un argumento de línea de comando --PROTHINT_PATH = / your / path / to / ProtHint / bin.</p> <p>Samtools no es necesario para ejecutar BRAKER si todos sus archivos están formateados correctamente (es decir, todas las secuencias deben tener nombres fasta cortos y únicos). Si no está seguro de si todos sus archivos están formateados correctamente, podría ser útil tener Samtools instalado porque BRAKER puede solucionar automáticamente ciertos problemas de formato utilizando Samtools.</p> <p>Como requisito previo para Samtools, descargue e instale htslib (por ejemplo, git clone https://github.com/samtools/htslib.git, siga la documentación de htslib para la instalación).</p> <p>Descargue e instale Samtools (por ejemplo, git clone git: //github.com/samtools/samtools.git), luego siga la documentación de Samtools para la instalación).</p> <p>Si ya está en su variable $ PATH, BRAKER encontrará samtools, automáticamente. De lo contrario, BRAKER puede encontrar Samtools tomando un argumento de línea de comando (--SAMTOOLS_PATH = / your_path_to_samtools /), o usando una variable de entorno $ SAMTOOLS_PATH. Para exportar la variable, p. Ej. para su sesión de bash actual, escriba:</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Agregue la línea anterior a una secuencia de comandos de inicio (p. Ej.</p> <p>/.bashrc) para establecer la variable de entorno para todas las sesiones de bash.</p> <p>Si Biopython está instalado, BRAKER puede generar archivos FASTA con secuencias de codificación y secuencias de proteínas predichas por AUGUSTUS y generar centros de datos de seguimiento para la visualización de una ejecución de BRAKER con MakeHub R16. Estos son pasos opcionales. El primero se puede deshabilitar con el indicador de la línea de comandos --skipGetAnnoFromFasta, el segundo se puede activar usando las opciones de la línea de comandos --makehub --email=your@mail.de, Biopython no es necesario si ninguno de estos pasos opcionales se realizará.</p> <p>En Ubuntu, instale el administrador de paquetes Python3 con:</p> <p>Luego, instale Biopython con:</p> <p>BRAKER requiere cdbfasta y cdbyank para corregir genes AUGUSTUS con codones de parada en marco (codones de parada empalmados) utilizando el script AUGUSTUS fix_in_frame_stop_codon_genes.py. Esto se puede omitir con --skip_fixing_broken_genes.</p> <p>En Ubuntu, instale cdbfasta con:</p> <p>Para otros sistemas, puede obtener, por ejemplo, cdbfasta en https://github.com/gpertea/cdbfasta, por ejemplo:</p> <p>En Ubuntu, cdbfasta y cdbyank estarán en su variable $ PATH después de la instalación, y BRAKER los ubicará automáticamente. Sin embargo, tiene la opción de especificar la ubicación binaria cdbfasta y cdbyank de otras dos formas:</p> <p><ol> Exportar una variable de entorno $ CDBTOOLS_PATH, p. Ej. en tus<p></ol> <p><strong>Nota:</strong> La compatibilidad con GenomeThreader dentro de BRAKER está obsoleta.</p> <p>Esta herramienta es necesaria, solo, si desea ejecutar alineaciones de proteína a genoma con BRAKER usando GenomeThreader. Este es un enfoque adecuado solo si está disponible una especie anotada de corta distancia evolutiva a su genoma objetivo. Descargue GenomeThreader desde http://genomethreader.org/. Desembale e instale de acuerdo con gth / README.</p> <p>BRAKER intentará localizar el ejecutable GenomeThreader usando una variable de entorno $ ALIGNMENT_TOOL_PATH. Alternativamente, esto se puede proporcionar como argumento de línea de comando (--ALIGNMENT_TOOL_PATH = / your / path / to / gth).</p> <p><strong>Nota:</strong> El soporte de Spaln independiente (fuera de ProtHint) dentro de BRAKER está obsoleto.</p> <p>Esta herramienta es necesaria si ejecuta ProtHint o si desea ejecutar alineaciones de proteína a genoma con BRAKER utilizando Spaln fuera de ProtHint. Usar Spaln fuera de ProtHint es un enfoque adecuado solo si está disponible una especie anotada de corta distancia evolutiva a su genoma objetivo. Recomendamos ejecutar Spaln a través de ProtHint para BRAKER. ProtHint trae consigo un binario Spaln. Si eso no funciona en su sistema, descargue Spaln desde https://github.com/ogotoh/spaln. Desembale e instale de acuerdo con spaln / doc / SpalnReadMe22.pdf.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>BRAKER intentará localizar el ejecutable Spaln usando una variable de entorno $ ALIGNMENT_TOOL_PATH. Alternativamente, esto se puede proporcionar como argumento de línea de comando (--ALIGNMENT_TOOL_PATH = / your / path / to / spaln).</p> <p><strong>Nota:</strong> El soporte de Exonerate dentro de BRAKER está obsoleto.</p> <p>Esta herramienta es necesaria, solo, si desea ejecutar alineaciones de proteína a genoma con BRAKER usando Exonerate. Este es un enfoque adecuado solo si está disponible una especie anotada de corta distancia evolutiva a su genoma objetivo. (Recomendamos el uso de GenomeThreader en lugar de Exonerate porque Exonerate es comparativamente más lento y tiene menor especificidad que GenomeThreader). Descargue Exonerate desde https://github.com/nathanweeks/exonerate. Desembale e instale de acuerdo con exonerar / README. (En Ubuntu, descargue e instale escribiendo sudo apt-get install exonerate).</p> <p>BRAKER intentará localizar el ejecutable de Exonerate usando una variable de entorno $ ALIGNMENT_TOOL_PATH. Alternativamente, esto se puede proporcionar como argumento de línea de comando (--ALIGNMENT_TOOL_PATH = / your / path / to / exonerate).</p> <p>Esta herramienta solo es necesaria si desea agregar UTR (de los datos de RNA-Seq) a los genes predichos o si desea entrenar los parámetros de UTR para AUGUSTUS y predecir genes con UTR. En cualquier caso, GUSHR requiere la entrada de datos RNA-Seq.</p> <p>GUSHR está disponible para descargar en https://github.com/Gaius-Augustus/GUSHR. Consígalo escribiendo:</p> <p>GUSHR ejecuta un archivo jar de GeMoMa R19, R20, R21, y este archivo jar requiere Java 1.8. En Ubuntu, puede instalar Java 1.8 con el siguiente comando:</p> <p>Si tiene varias versiones de java instaladas en su sistema, asegúrese de habilitar 1.8 antes de ejecutar BRAKER con java ejecutando</p> <p>y seleccionando la versión correcta.</p> <p>Si activa --UTR =, bamToWig.py requerirá las siguientes herramientas que se pueden descargar desde http://hgdownload.soe.ucsc.edu/admin/exe:</p> <p>Es opcional instalar estas herramientas en su $ PATH. Si no lo hace, y activa --UTR =, bamToWig.py los descargará automáticamente en el directorio de trabajo.</p> <p>Si desea generar automáticamente un centro de datos de seguimiento de su ejecución BRAKER, se requiere el software MakeHub, disponible en https://github.com/Gaius-Augustus/MakeHub. Descargue el software (ya sea ejecutando git clone https://github.com/Gaius-Augustus/MakeHub.git, o eligiendo una versión de https://github.com/Gaius-Augustus/MakeHub/releases. Extraiga la versión paquete si descargó una versión (por ejemplo, descomprima MakeHub.zip o tar -zxvf MakeHub.tar.gz.</p> <p>BRAKER intentará localizar el script make_hub.py usando una variable de entorno $ MAKEHUB_PATH. Alternativamente, esto se puede proporcionar como argumento de línea de comando (--MAKEHUB_PATH = / your / path / to / MakeHub /). BRAKER también puede intentar adivinar la ubicación de MakeHub en su sistema.</p> <p>Diferentes modos de canalización de BRAKER</p> <p>A continuación, describimos llamadas de BRAKER “típicas” para diferentes tipos de datos de entrada. En general, recomendamos que ejecute BRAKER en secuencias genómicas que hayan sido enmascaradas para Repeticiones. Si su genoma ha sido enmascarado, incluya el indicador --softmasking en su llamada de BRAKER.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Este enfoque es adecuado para genomas de especies para las que se encuentran disponibles bibliotecas de RNA-Seq con una buena cobertura del transcriptoma. La tubería se ilustra en la Figura 2.</p> <p>BRAKER puede extraer información de alineación empalmada RNA-Seq de archivos bam, o puede usar dicha información extraída, directamente.</p> <p>Para ejecutar BRAKER con los datos de RNA-Seq proporcionados como archivo (s) bam (en caso de varios archivos, sepárelos por comas), ejecute:</p> <p>Para ejecutar BRAKER con información de alineación empalmada RNA-Seq que ya ha sido extraída, ejecute:</p> <p>El formato de dicho archivo de sugerencias debe ser el siguiente (archivo separado por tabuladores):</p> <p>La fuente b2h en la segunda columna y la etiqueta fuente src = E en la última columna son esenciales para que BRAKER determine si se ha generado una pista a partir de los datos de RNA-Seq.</p> <p>BRAKER con proteínas de cualquier distancia evolutiva</p> <p>Este enfoque es adecuado para genomas de especies para las que no hay disponibles bibliotecas de RNA-Seq. En este caso, debería utilizarse una gran base de datos de proteínas (con una distancia evolutiva posiblemente mayor a la especie objetivo). Este modo se ilustra en la figura 9.</p> <p><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_0RAXBlDnzh3z5v.png"></p> <p>Figura 9: BRAKER con proteínas de cualquier distancia evolutiva. Las tuberías de mapeo de proteínas ProtHint se utilizan para generar sugerencias de proteínas. ProtHint determina automáticamente qué alineaciones son de parientes cercanos y cuáles son de parientes bastante lejanos.</p> <p>Para ejecutar BRAKER en este modo, escriba:</p> <p>Recomendamos utilizar OrthoDB como base para protein.fa. Las instrucciones sobre cómo preparar las proteínas OrthoDB de entrada se documentan aquí: https://github.com/gatech-genemark/ProtHint#protein-database-preparation.</p> <p>Por supuesto, puede agregar secuencias de proteínas adicionales a ese archivo o probar con una base de datos completamente diferente. Sin embargo, cualquier base de datos necesitará varios representantes para cada proteína.</p> <p>En lugar de hacer que BRAKER ejecute ProtHint, también puede iniciar BRAKER con sugerencias ya producidas por ProtHint, proporcionando la salida prothint_augustus.gff de ProtHint:</p> <p>El formato de prothint_augustus.gff en este modo se ve así:</p> <p>Se aplicará la predicción de todas las sugerencias con src = M. Las sugerencias con src = C son 'evidencia encadenada', es decir, solo se incorporarán si todos los miembros del grupo (grp =.) Pueden incorporarse en una sola transcripción. Todas las demás sugerencias tienen src = P en la última columna. Las características admitidas en la columna 3 son intron, start, stop y CDSpart.</p> <p>Capacitación y predicción de UTR, integración de información de cobertura</p> <p>Si se proporcionan datos de RNA-Seq (y solo RNA-Seq) a BRAKER como un archivo bam, y si el genoma está enmascarado para repeticiones, BRAKER puede entrenar automáticamente los parámetros UTR para AUGUSTUS. Después de un entrenamiento exitoso de los parámetros UTR, BRAKER predecirá automáticamente los genes, incluida la información de cobertura de los datos de RNA-Seq. Ejemplo de llamada:</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>¡Esta función es experimental!</p> <p>--UTR = on actualmente no es compatible con bamToWig.py como se publicó en AUGUSTUS 3.3.3; requiere la versión actual del código de desarrollo del repositorio de github (clon de git https://github.com/Gaius-Augustus/Augustus.git) .</p> <p>--UTR = activado aumenta el consumo de memoria de AUGUSTUS. Supervise cuidadosamente los trabajos si su máquina estaba cerca de maximizar la RAM sin --UTR = activado! Reducir la cantidad de núcleos también reducirá el consumo de RAM.</p> <p>La predicción UTR a veces mejora la precisión de la predicción de la secuencia de codificación, pero no siempre. Si prueba esta función, compare cuidadosamente los resultados con y sin parámetros UTR, posteriormente (por ejemplo, en UCSC Genome Browser).</p> <p>Alineaciones de RNA-Seq trenzado</p> <p>Para ejecutar BRAKER sin parámetros UTR, no es muy importante si los datos de RNA-Seq fueron generados por un <em>varado</em> protocolo (porque las alineaciones empalmadas se 'trenzan artificialmente' al verificar el patrón del sitio de empalme). Sin embargo, para el entrenamiento y la predicción de UTR, las bibliotecas varadas pueden proporcionar información valiosa para BRAKER.</p> <p>Después de la alineación de las bibliotecas RNA-Seq trenzadas, separe las entradas del archivo bam resultante en dos archivos: uno para las asignaciones de hebra positiva y otro para las asignaciones de hebra negativa. Llame a BRAKER de la siguiente manera:</p> <p>Además, puede incluir archivos bam de bibliotecas sin cadenas. Esos archivos no se utilizarán para generar ejemplos de entrenamiento de UTR, pero se incluirán en el paso final de predicción de genes como información de cobertura sin cadenas, llamada de ejemplo:</p> <p><strong>Advertencia:</strong> ¡Esta función es experimental y actualmente tiene baja prioridad en nuestra lista de mantenimiento!</p> <p>BRAKER con proteínas de corta distancia evolutiva</p> <p>Esta es una tubería obsoleta que antes era el único enfoque adecuado si los datos de RNA-Seq para las especies del genoma objetivo no están disponibles y si una especie de referencia bien anotada y muy estrechamente relacionada está disponible y no desea utilizar el enfoque. para proteínas de cualquier distancia evolutiva (donde en ese entonces no estábamos seguros de cómo funcionaría en proteínas de corta distancia evolutiva).</p> <p>Para ejecutar BRAKER en este modo, escriba:</p> <p>Es posible generar alineaciones de proteínas externamente, antes de ejecutar BRAKER. El comando compatible para ejecutar GenomeThreader antes de ejecutar BRAKER es:</p> <p>Para utilizar dichos archivos de alineación creados externamente, ejecute:</p> <p>También es posible ejecutar BRAKER en este modo usando un archivo de sugerencias ya preparado. En este caso, ejecute:</p> <p>El formato del archivo de sugerencias debería verse así:</p> <p>Las funciones admitidas en la columna 3 son intron, CDSpart, start, stop.</p> <p>BRAKER con RNA-Seq y datos de proteínas</p> <p>Aunque BRAKER admite la combinación de RNA-Seq y datos de proteínas dentro de la tubería de BRAKER, recomendamos encarecidamente ejecutar BRAKER dos veces (1x solo con RNA-Seq, 1x solo con datos de proteínas) y luego combinar los resultados de ambas ejecuciones con TSEBRA, el selector de transcripción para BRAKER (https://github.com/Gaius-Augustus/TSEBRA). Puede encontrar más información sobre TSEBRA en https://www.biorxiv.org/content/10.1101/2021.06.07.447316v1</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>A continuación, describimos que es posible combinar ambas fuentes de datos con BRAKER, solo, en aras de la integridad.</p> <p>El modo nativo para ejecutar BRAKER con RNA-Seq y datos de proteínas es --etpmode. Esto llamará GeneMark-ETP (que actualmente solo está disponible como una versión prematura usando el estado actual de GeneMark-ES / ET / EP / EP +, se esperan mejoras, pronto), que usará RNA-Seq y sugerencias de proteínas para el entrenamiento. GeneMark-ETP. Las sugerencias que están respaldadas tanto por fuentes como por proteínas, las sugerencias de una calidad particularmente alta se aplican en la predicción de genes con GeneMark-ETP. Posteriormente, AUGUSTUS se entrena en las predicciones de GeneMark-ETP y los genes con pistas son predichos por AUGUSTUS. Para llamar a la canalización en este modo, ejecute:</p> <p>Por supuesto, puede reemplazar el archivo de sugerencias rnaseq.gff por un archivo BAM, p. --bam = ranseq.bam.</p> <p>Además, BRAKER puede ejecutar las siguientes canalizaciones (canalizaciones obsoletas):</p> <p>Agregar datos de proteínas de corta distancia evolutiva al paso de predicción de genes</p> <p>Ampliación del conjunto de genes de entrenamiento con proteínas de corta distancia evolutiva</p> <p>Agregar datos de proteínas de corta distancia evolutiva al paso de predicción de genes</p> <p>Esta tubería se ilustra en la Figura 7.</p> <p>En general, agregue las opciones</p> <p>a la llamada de BRAKER que se describe en la sección BRAKER con datos de RNA-Seq. Seleccione una herramienta de alineación de proteínas de GenomeThreader (gth, recomendado), Spaln (spaln) o Exonerate (exonerar).Por supuesto, también puede especificar la información de proteínas como archivos de alineación de proteínas o archivos de sugerencias como se describe en la sección BRAKER con proteínas de corta distancia evolutiva). Esto puede resultar en una llamada similar a:</p> <p>Ampliación del conjunto de genes de entrenamiento con proteínas de corta distancia evolutiva</p> <p>Si el número de estructuras de genes de entrenamiento identificadas por los datos de RNA-Seq, solo parece ser demasiado pequeño, puede agregar estructuras de genes de entrenamiento generadas por alineaciones de proteínas con GenomeThreader al conjunto de genes de entrenamiento. Esta tubería se ilustra en la Figura 8.</p> <p>En general, agregue las opciones</p> <p>a la llamada de BRAKER que se describe en la sección BRAKER con datos de RNA-Seq. Esto puede resultar en una llamada similar a:</p> <p>Descripción de las opciones de línea de comando de BRAKER seleccionadas</p> <p>Ejecute braker.pl --help para obtener una lista completa de opciones.</p> <p>Ejecute BRAKER en modo EP, es decir, con proteínas de cualquier distancia evolutiva procesadas por ProtHint dentro de BRAKER. Este modo está activado de forma predeterminada cuando solo se detecta la entrada de proteínas. Debe proporcionarse con --prot_seq = orthodb.fa o con sugerencias de proteínas --hints = prothint_augustus.gff.</p> <p>Ejecute BRAKER en modo ETP, es decir, con proteínas de cualquier distancia evolutiva procesadas por ProtHint y con datos de RNA-Seq. Debe proporcionarse con prot_seq = orthodb.fa y --bam = rnaseq.bam. Alternativamente, las sugerencias de RNA-Seq y de proteínas se pueden proporcionar como sugerencias procesadas con la opción --hints. Considere usar TSEBRA (https://github.com/Gaius-Augustus/TSEBRA) en lugar de BRAKER en modo ETP.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Calcular AUGUSTUS <em>ab initio</em> predicciones además de las predicciones de AUGUSTUS con sugerencias (archivos de salida adicionales: augustus.ab_initio. *. Esto puede ser útil para estimar la calidad de los parámetros de genes de entrenamiento al inspeccionar predicciones en un navegador.</p> <p>Uno o varios argumentos de la línea de comandos para pasar a AUGUSTUS, si se dan varios argumentos, sepárelos por espacios en blanco, es decir, "--first_arg = sth --second_arg = sth". Esto puede ser útil si sabe que la predicción de genes en su especie particular se beneficia de un argumento de AUGUSTUS particular durante el paso de predicción.</p> <p>Especifica el número máximo de núcleos que se pueden utilizar durante el cálculo. BRAKER tiene que ejecutar algunos pasos en un solo núcleo, otros pueden aprovechar múltiples núcleos. Si usa más de 8 núcleos, esto no acelerará todos los pasos paralelizados, en particular, el tiempo optimizado optimizar_augustus.pl no usará más de 8 núcleos. Sin embargo, si no le importa que algunos núcleos estén inactivos, el uso de más de 8 núcleos acelerará otros pasos.</p> <p>Opción GeneMark-EX: ejecutar algoritmo con modelo de punto de ramificación. Utilice esta opción si su genoma es un hongo.</p> <p>Opción de máscara suave para archivos de genoma enmascarados suaves. (Desactivado de forma predeterminada).</p> <p>Utilice los archivos de configuración y parámetros actuales si existen para 'especies' que sobrescribirán los parámetros originales si BRAKER realiza un entrenamiento AUGUSTUS.</p> <p>Ejecutar entrenamiento CRF para AUGUSTUS Los parámetros resultantes solo se mantienen para las predicciones finales si muestran una mayor precisión que los parámetros HMM. ¡Esto aumenta el tiempo de ejecución!</p> <p>Cambie el parámetro $ lambda $ de la distribución de Poisson que se utiliza para reducir el muestreo de los genes de entrenamiento de acuerdo con su número de intrones (solo se reducen el muestreo de los genes con hasta 5 intrones). El valor predeterminado es $ lambda = 2 $. Es posible que desee establecerlo en 0 para organismos que tienen principalmente genes de un solo exón. (Generalmente, los genes de un solo exón aportan menos valor al aumento de los parámetros de AUGUSTUS en comparación con los genes con muchos exones).</p> <p>Genere ejemplos de entrenamiento de UTR para AUGUSTUS a partir de información de cobertura de RNA-Seq, entrene los parámetros de AUGUSTUS UTR y prediga genes con AUGUSTUS y UTR, incluida la información de cobertura para RNA-Seq como evidencia. Esta marca solo funciona si --softmasking también está habilitado. <em>¡Esta es una función experimental!</em></p> <p>Si realizó una ejecución de BRAKER sin --UTR = activado, puede agregar el entrenamiento de parámetros de UTR y la predicción de genes con parámetros de UTR (y solo sugerencias de RNA-Seq) con el siguiente comando:</p> <p>Modifique augustus.hints.gtf para que apunte a las predicciones de AUGUSTUS con sugerencias de la ejecución de BRAKER anterior. Modifique el valor de flaning_DNA en la región de flanqueo del archivo de registro de su ejecución de BRAKER anterior. algunas especies al nombre de la especie utilizado en su ejecución anterior de BRAKER.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Agregue UTR de la información de cobertura de RNA-Seq a las predicciones del gen AUGUSTUS usando GUSHR. No se realiza ningún entrenamiento de los parámetros de UTR y no se realiza ninguna predicción de genes con parámetros de UTR.</p> <p>Si realizó una ejecución de BRAKER sin --addUTR = activado, puede agregar los resultados de UTR de una ejecución de BRAKER anterior con el siguiente comando:</p> <p>Modifique augustus.hints.gtf para que apunte a las predicciones de AUGUSTUS con sugerencias de la ejecución anterior de BRAKER. Modifique some_new_working_directory a la ubicación donde BRAKER debería almacenar los resultados de la ejecución adicional de BRAKER. Esta ejecución no modificará los parámetros de AUGUSTUS. Recomendamos que especifique las especies originales de la serie original con --species = somespecies. De lo contrario, BRAKER creará un directorio de parámetros de especies innecesario Sp_ *.</p> <p>Si --UTR = on está habilitado, los archivos bam separados por cadenas se pueden proporcionar con --bam = plus.bam, minus.bam. En ese caso, --stranded =. debe contener las hebras de los archivos bam (+ para hebra positiva, - para hebra negativa,. para no hebra). Tenga en cuenta que los datos sin cadenas se utilizarán en el paso de predicción de genes, solo si el parámetro --stranded =. Está establecido. <em>¡Esta es una función experimental! GUSHR actualmente no aprovecha los datos varados.</em></p> <p>Si se proporcionan --makehub y --email=your@mail.de (con su dirección de correo electrónico válida), se generará un centro de datos de seguimiento para visualizar los resultados con UCSC Genome Browser utilizando MakeHub (https: // github. com / Gaius-Augustus / MakeHub).</p> <p>De forma predeterminada, GeneMark-EX utiliza una probabilidad de 0,001 para predecir el patrón GC del sitio de empalme del donante (en lugar de GT). Puede tener sentido aumentar este valor para las especies donde este sitio de empalme donante es más común. Por ejemplo, en la especie <em>Emiliania huxleyi</em>, aproximadamente el 50% de los sitios de empalme de donantes tienen el patrón GC (https://media.nature.com/original/nature-assets/nature/journal/v499/n7457/extref/nature12221-s2.pdf, página 5).</p> <p>BRAKER produce varios archivos de salida importantes en el directorio de trabajo.</p> <p>augustus.hints.gtf: Genes predichos por AUGUSTUS con pistas de evidencia extrínseca dada. Este archivo faltará si BRAKER se ejecutó con la opción --esmode.</p> <p>augustus.hints_utr.gtf: Este archivo puede contener diferentes contenidos dependiendo de cómo llamó a BRAKER:</p> <p>Si ejecutó BRAKER con --UTR = activado, entonces este archivo contendrá genes predichos por AUGUSTUS con parámetros UTR e información de cobertura de datos RNA-Seq en formato GTF.</p> <p>Si ejecutó BRAKER con --addUTR = activado, entonces este archivo contendrá genes predichos por AUGUSTUS sin parámetros UTR y sin información de cobertura de los datos de RNA-Seq. En cambio, las predicciones del gen AUGUSTUS con sugerencias solo serán extendidas por UTR si la cobertura de RNA-Seq lo permite (es decir, no se realizó ningún entrenamiento o ejecución de AUGUSTUS por separado, las UTR solo se agregan al ejecutar GUSHR). Los genes de están en formato GTF.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Este archivo solo estará presente si BRAKER se ejecutó con las opciones --UTR = activado o --addUTR = activado y un archivo BAM RNA-Seq.</p> <p>augustus.ab_initio.gtf: Genes predichos por AUGUSTUS en <em>ab initio</em> modo en formato GTF. El archivo siempre estará presente si AUGUSTUS se ha ejecutado con la opción --esmode. De lo contrario, solo estará presente si BRAKER se ejecutó con la opción --AUGUSTUS_ab_initio.</p> <p>augustus.ab_initio_utr.gtf: este archivo puede contener predicciones genéticas con UTR si ejecutó BRAKER con --UTR = activado.</p> <p>Este archivo solo estará presente si BRAKER se ejecutó con las opciones --UTR = on o --addUTR = on y un archivo BAM RNA-Seq, y con la opción --AUGUSTUS_ab_initio.</p> <p>GeneMark-E * / genemark.gtf: Genes predichos por GeneMark-ES / ET / EP / EP + en formato GTF. Este archivo faltará si BRAKER se ejecutó con proteínas de homología cercana y la opción --trainFromGth.</p> <p>braker.gtf: Unión de augustus.hints.gtf y predicciones confiables de GeneMark-EX (genes totalmente respaldados por evidencia externa). En --esmode, esta es la unión de augustus.ab_initio.gtf y todos los genes GeneMark-ES. Por lo tanto, este conjunto es generalmente más sensible (más genes predichos correctamente) y puede ser menos específico (pueden estar presentes más predicciones falsas positivas).</p> <p>hintsfile.gff: Los datos de evidencia extrínseca extraídos de RNAseq.bam y / o datos de proteínas.</p> <p>Los archivos de salida de AUGUSTUS pueden estar presentes con los siguientes formatos y terminaciones de nombre:</p> <p>Siempre se produce el formato GTF.</p> <p>El formato GFF3 se produce si se especificó el indicador --gff3 en BRAKER.</p> <p>Las secuencias de codificación en formato FASTA se producen si no se estableció el indicador --skipGetAnnoFromFasta.</p> <p>Los archivos de secuencias de proteínas en formato FASTA se generan si no se estableció el indicador --skipGetAnnoFromFasta.</p> <p>Para obtener detalles sobre el formato gtf, consulte http://www.sanger.ac.uk/Software/formats/GFF/. Un archivo en formato GTF contiene una línea por exón predicho. Ejemplo:</p> <p>Las columnas (campos) contienen:</p> <p>Si se utilizó la opción --makehub y MakeHub está disponible en su sistema, se creará un directorio central que comienza con el nombre hub_. Copie este directorio en un servidor web de acceso público. Un archivo hub.txt reside en el directorio. Proporcione el enlace a ese archivo al UCSC Genome Browser para visualizar los resultados.</p> <p>Un conjunto de datos de ejemplo incompleto está contenido en el directorio BRAKER / example. Para completar el conjunto de datos, descargue el archivo de alineación RNA-Seq (134 MB) con wget:</p> <p>En caso de que tenga problemas para acceder a ese archivo, también hay una copia disponible desde otro servidor:</p> <p>El conjunto de datos de ejemplo no se compiló para lograr una precisión de predicción óptima, sino para probar rápidamente los componentes de la tubería. El pequeño subconjunto del genoma utilizado en estos ejemplos de prueba no es lo suficientemente largo para que el entrenamiento de BRAKER funcione bien.</p> <p>Los datos corresponden a los últimos 1.000.000 nucleótidos de <em>Arabidopsis thaliana</em>Cromosoma Chr5, dividido en 8 contigs artificiales.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Las alineaciones de RNA-Seq se obtuvieron mediante VARUS.</p> <p>Las secuencias de proteínas son un subconjunto de proteínas vegetales OrthoDB v10.</p> <ul> <li>genome.fa: archivo de genoma en formato fasta</li> <li>RNAseq.bam: archivo de alineación RNA-Seq en formato bam (este archivo no forma parte de este repositorio, debe descargarse por separado de http://topaz.gatech.edu/GeneMark/Braker/RNAseq.bam)</li> <li>RNAseq.hints: pistas de RNA-Seq (se puede utilizar en lugar de RNAseq.bam como entrada de RNA-Seq en BRAKER)</li> <li>protein.fa - secuencias de proteínas en formato fasta</li></ul> <p>Los comandos dados a continuación asumen que configuró todas las rutas a las herramientas exportando variables bash o que tiene las herramientas necesarias en su $ PATH.</p> <p>El conjunto de datos de ejemplo también contiene scripts tests / test * .sh que ejecutarán los comandos enumerados a continuación para probar BRAKER con el conjunto de datos de ejemplo. Encontrará resultados de ejemplo de AUGUSTUS y GeneMark-EX en la carpeta results / test *. Tenga en cuenta que BRAKER contiene varias partes en las que se utilizan variables aleatorias, es decir, es posible que los resultados que obtenga al ejecutar las pruebas no sean exactamente idénticos. Para comparar los resultados de su prueba con los de referencia, puede usar el script compare_intervals_exact.pl de la siguiente manera:</p> <p>Varias pruebas usan la opción --gm_max_intergenic 10000 para que la prueba se ejecute más rápido. No se recomienda utilizar esta opción en ejecuciones de BRAKER reales, el aumento de velocidad logrado al ajustar esta opción es insignificante en genomas de tamaño completo.</p> <p>Proporcionamos estimaciones de tiempo de ejecución derivadas de la computación en <em>CPU Intel (R) Xeon (R) E5530 a 2,40 GHz</em>.</p> <p>Prueba de BRAKER con datos de RNA-Seq</p> <p>El siguiente comando ejecutará la canalización de acuerdo con la Figura 3:</p> <p>Esta prueba se implementa en test1.sh, el tiempo de ejecución esperado es</p> <p>Probando BRAKER con proteínas de cualquier distancia evolutiva</p> <p>El siguiente comando ejecutará la canalización de acuerdo con la Figura 4:</p> <p>Esta prueba se implementa en test2.sh, el tiempo de ejecución esperado es</p> <p>Prueba de BRAKER con proteínas de cualquier distancia evolutiva y RNA-Seq</p> <p>Considere usar TSEBRA en lugar de ejecutar BRAKER con RNA-Seq y datos de proteínas: https://github.com/Gaius-Augustus/TSEBRA</p> <p>El siguiente comando ejecutará una canalización que primero entrena a GeneMark-ETP con sugerencias de proteína y RNA-Seq y, posteriormente, entrena a AUGUSTUS sobre la base de las predicciones de GeneMark-ETP. Las predicciones de AUGUSTUS también se realizan con sugerencias de ambas fuentes, consulte la Figura 5:</p> <p>Esta prueba se implementa en test3.sh, el tiempo de ejecución esperado es</p> <p>Puede agregar UTR de los datos de RNA-Seq (sin entrenamiento de AUGUSTUS) a los resultados de una ejecución de BRAKER en modo ETP de la siguiente manera:</p> <p>Esto se implementa en test3_add_utrs.sh, el tiempo de ejecución esperado es</p> <p>Prueba de BRAKER con proteínas de estrecha homología</p> <p>El siguiente comando ejecutará la canalización de acuerdo con la Figura 6:</p> <p>Esta prueba se implementa en test4.sh, el tiempo de ejecución esperado es</p> <p>7 minutos. El tiempo de ejecución rápido de esta prueba se debe principalmente a la generación de un número bajo de genes de entrenamiento. Tenga en cuenta que este enfoque no se escala bien con el aumento del tamaño del genoma y el número de proteínas en una base de datos de proteínas. El tiempo de ejecución en un genoma completo será mucho más lento que con el comando usado en test2.sh.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Prueba de BRAKER con proteínas de homología cercana y datos de RNA-Seq (entrenamiento apoyado por RNA-Seq)</p> <p>Considere usar TSBERA en lugar de ejecutar BRAKER con proteínas y datos de RNA-Seq al mismo tiempo: https://github.com/Gaius-Augustus/TSEBRA</p> <p>El siguiente comando ejecutará la canalización de acuerdo con la Figura 7:</p> <p>Esta prueba se implementa en test5.sh, el tiempo de ejecución esperado es</p> <p>Prueba de BRAKER con proteínas de homología cercana y datos de RNA-Seq (entrenamiento apoyado por proteínas y RNA-Seq)</p> <p>Considere usar TSBERA en lugar de ejecutar BRAKER con proteínas y datos de RNA-Seq al mismo tiempo: https://github.com/Gaius-Augustus/TSEBRA</p> <p>El siguiente comando ejecutará la canalización de acuerdo con la Figura 8:</p> <p>Esta prueba se implementa en test6.sh, el tiempo de ejecución esperado es</p> <p>Prueba de BRAKER con parámetros previamente entrenados</p> <p>El paso de entrenamiento de todas las canalizaciones se puede omitir con la opción --skipAllTraining. Esto significa que solo se realizarán las predicciones de AUGUSTUS, utilizando parámetros previamente entrenados y ya existentes. Por ejemplo, puede predecir genes con el comando:</p> <p>Esta prueba se implementa en test7.sh, el tiempo de ejecución esperado es</p> <p>Prueba de BRAKER con la secuencia del genoma</p> <p>El siguiente comando ejecutará la canalización sin evidencia extrínseca:</p> <p>Esta prueba se implementa en test8.sh, el tiempo de ejecución esperado es</p> <p>Prueba de BRAKER con datos de RNA-Seq y --UTR = activado</p> <p>El siguiente comando ejecutará BRAKER con los parámetros de entrenamiento de UTR a partir de los datos de cobertura de RNA-Seq:</p> <p>Esta prueba se implementa en test9.sh, el tiempo de ejecución esperado es</p> <p>Prueba de BRAKER con datos de RNA-Seq y --addUTR = activado</p> <p>El siguiente comando agregará UTR a augustus.hints.gtf a partir de los datos de cobertura de RNA-Seq:</p> <p>Esta prueba se implementa en test10.sh, el tiempo de ejecución esperado es</p> <p>Arranque de BRAKER sobre la base de carreras de BRAKER previamente existentes</p> <p>Actualmente no hay una forma limpia de reiniciar una ejecución fallida del BRAKER (después de resolver algún problema). Sin embargo, es posible iniciar una nueva ejecución de BRAKER en función de los resultados de una ejecución anterior, dado que la ejecución anterior produjo los resultados intermedios requeridos. A continuación, nos referiremos al antiguo directorio de trabajo con la variable $ <braker_old>, y al nuevo directorio de trabajo de BRAKER con $ <braker_new>. El archivo what-to-cite.txt siempre solo hará referencia al software que realmente fue llamado por una ejecución en particular. Puede que tenga que combinar el contenido de $<braker_new>/what-to-cite.txt con $<braker_old>/what-to-cite.txt para preparar una publicación. La siguiente figura ilustra en qué puntos se puede interceptar la ejecución del BRAKER.<p> <p><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_aTmkirq078Noqn62j.png"></p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Figura 10: Puntos por interceptar una ejecución de BRAKER y reutilizar resultados intermedios en una nueva ejecución de BRAKER.</p> <p>Opción 1: iniciar BRAKER con archivos de sugerencias existentes antes del entrenamiento</p> <p>Si tiene acceso a una salida de BRAKER existente que contiene archivos de sugerencias que se generaron a partir de datos extrínsecos, como RNA-Seq o secuencias de proteínas, puede reciclar estos archivos de sugerencias en una nueva ejecución de BRAKER. Además, las sugerencias de una ejecución ProtHint separada se pueden usar directamente en BRAKER.</p> <p>Las sugerencias se pueden dar a BRAKER con --hints $<braker_old>Opción /hintsfile.gff. Esto se ilustra en los archivos de prueba test1_restart1.sh, test2_restart1.sh, test3_restart1.sh, test5_restart1.sh y test7_restart1.sh. Los otros modos (para los que falta esta prueba) no se pueden reiniciar de esta manera.<p> <p>Opción 2: iniciar BRAKER después de que GeneMark-EX haya terminado, antes de entrenar a AUGUSTUS</p> <p>El resultado de GeneMark se puede entregar a BRAKER con --geneMarkGtf $<braker_old>Opción /GeneMark-EX/genemark.gtf. Esto se ilustra en los archivos de prueba test1_restart2.sh, test2_restart2.sh, test3_restart2.sh, test5_restart2.sh y test8_restart2.sh. Los otros modos (para los que falta esta prueba) no se pueden reiniciar de esta manera.<p> <p>Opción 3: iniciar BRAKER después del entrenamiento de AUGUSTUS</p> <p>Los parámetros de especies entrenados para AGUSTUS se pueden pasar con las opciones --skipAllTraining y --species $ speciesName. Esto se ilustra en los archivos test * _restart3.sh.</p> <p>Antes de informar de errores, verifique que esté utilizando las versiones más recientes de GeneMark-EX, AUGUSTUS y BRAKER. Además, consulte la lista de problemas comunes y la lista de problemas en GitHub antes de informar errores. Supervisamos los problemas abiertos en GitHub. A veces, no podemos ayudarlo de inmediato, pero nos esforzamos por resolver sus problemas.</p> <p>Información que vale la pena mencionar en su informe de errores:</p> <p>Compruebe en braker / yourSpecies / braker.log en qué paso se bloqueó braker.pl.</p> <p>Hay una serie de otros archivos que pueden ser de interés, dependiendo de en qué parte de la canalización ocurrió el problema. Algunos de los siguientes archivos no estarán presentes si no contienen ningún error.</p> <p>braker / yourSpecies / errors / bam2hints. *. stderr - dará detalles sobre un bloqueo de bam2hints (paso para convertir un archivo bam en un archivo intron gff)</p> <p>braker / yourSpecies / hintsfile.gff - ¿este archivo está vacío? En caso afirmativo, algo salió mal durante la generación de sugerencias. ¿Este archivo contiene sugerencias de la fuente "b2h" y del tipo "intron"? De lo contrario, GeneMark-ET no podrá ejecutarse correctamente. Por el contrario, GeneMark-EP + no podrá ejecutarse correctamente si faltan sugerencias de la fuente "ProtHint".</p> <p>braker / yourSpecies / (align_gthalign_exoneratealign_spaln) / * err - errores informados por las herramientas de alineación gth / exonerate / spaln</p> <p>braker / yourSpecies / errors / GeneMark-<et,ep>.stderr: errores informados por GeneMark-ET / EP +<p> <p>braker / yourSpecies / GeneMark-<et,ep>/genemark.gtf: ¿este archivo está vacío? Si es así, algo salió mal durante la ejecución de GeneMark-ET / EP +<p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>braker / yourSpecies / GeneMark-<et,ep>/genemark.f.good.gtf: ¿este archivo está vacío? Si es así, algo salió mal durante el filtrado de genes GeneMark-ET / EP + para entrenar AUGUSTUS<p> <p>braker / yourSpecies / genbank.good.gb - pruebe con "grep -c LOCUS genbank.good.gb" para determinar el número de genes de entrenamiento para entrenar AUGUSTUS, no debe ser bajo</p> <p>braker / yourSpecies / errors / firstetraining.stderr - contiene errores de la primera iteración del entrenamiento AUGUSTUS</p> <p>braker / yourSpecies / errors / secondetraining.stderr - contiene errores de la segunda iteración del entrenamiento AUGUSTUS</p> <p>braker / yourSpecies / errors / Optimize_augustus.stderr - contiene errores Optimize_augustus.pl (conjunto de entrenamiento adicional para AUGUSTUS)</p> <p>braker / yourSpecies / errors / augustus * .stderr - contiene errores de ejecución de AUGUSTUS</p> <p>braker / yourSpecies / startAlign.stderr - si proporcionó un archivo de proteína fasta y la opción --prg y este archivo no está vacío, algo salió mal durante la alineación de proteínas</p> <p>braker / yourSpecies / startAlign.stdout: puede dar pistas sobre en qué punto salió mal la alineación de proteínas</p> <p><em>BRAKER se queja de que el archivo RNA-Seq no se corresponde con el archivo del genoma proporcionado, ¡pero estoy seguro de que los archivos se corresponden entre sí!</em></p> <p>Compruebe los encabezados del archivo FASTA del genoma. Si los encabezados son largos y contienen espacios en blanco, algunas herramientas de alineación RNA-Seq truncarán los nombres de secuencia en el archivo BAM. Esto conduce a un error con BRAKER. Solución: acorte / simplifique los encabezados FASTA en el archivo del genoma antes de ejecutar la alineación RNA-Seq y BRAKER.</p> <p><em>¡Hay Loci duplicados en el archivo train.gb (después de usar GenomeThreader)!</em></p> <p>Este problema surge si se utilizan versiones obsoletas de AUGUSTUS y BRAKER. Solución: actualice AUGUSTUS y BRAKER desde github (https://github.com/Gaius-Augustus/Augustus, https://github.com/Gaius-Augustus/BRAKER).</p> <p>(a) GeneMark requiere un archivo de clave oculta válido en su directorio de inicio (</p> <p>/.gm_key). El archivo caduca después de 200 días. Verifique si tiene un archivo de clave válido antes de informar un problema al respecto. Además, BRAKER puede emitir una ADVERTENCIA de que es probable que GeneMark falle debido a evidencia extrínseca limitada. Si ve esa advertencia, no abra un problema, intente un enfoque diferente para anotar su genoma. Por ejemplo, puede agregar más datos de evidencia, puede probar el enfoque de canalización de mapeo de proteínas, puede intentar ejecutar --esmode sin evidencia extrínseca,.</p> <p>(b) GeneMark de forma predeterminada solo usa contigs de más de 50k para el entrenamiento. Si tiene un ensamblado muy fragmentado, esto podría provocar que "no haya datos" para el entrenamiento. Puede anular la longitud mínima predeterminada configurando el argumento BRAKER --min_contig = 10000.</p> <p>(c) consulte "[algo] no se pudo ejecutar" a continuación.</p> <p><em>[algo] no se pudo ejecutar!</em></p> <p>Cuando proporcione rutas de software a BRAKER, utilice rutas absolutas y no abreviadas. Por ejemplo, BRAKER puede tener problemas con --SAMTOOLS_PATH =. / Samtools / o --SAMTOOLS_PATH =</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>/ samtools /. En su lugar, utilice SAMTOOLS_PATH = / full / absolute / path / to / samtools /. Esto se aplica a todas las especificaciones de ruta como opciones de línea de comando para braker.pl. Las rutas relativas y las rutas absolutas no plantearán problemas si exporta una variable bash, en su lugar, o si agrega la ubicación de las herramientas a su variable $ PATH.</p> <p><em>BRAKER no puede encontrar el script de Augustus XYZ.</em></p> <p>Actualice Augustus desde github con git clone https://github.com/Gaius-Augustus/Augustus.git. No use Augustus de otras fuentes. BRAKER depende en gran medida de un Augustus actualizado. Los lanzamientos de Augustus ocurren con bastante poca frecuencia, las actualizaciones de la carpeta de scripts de Augustus ocurren con bastante frecuencia.</p> <p><em>¿BRAKER depende de Python3?</em></p> <p>Lo hace. Los scripts de Python empleados por BRAKER no son compatibles con Python2.</p> <p><em>¿Por qué BRAKER predice más genes de los que esperaba?</em></p> <p>Si los elementos transponibles (o similares) no se han enmascarado adecuadamente, AUGUSTUS tiende a predecir esos elementos como genes codificadores de proteínas. Esto puede conducir a una gran cantidad de genes. Puede comprobar si este es el caso de su proyecto mediante BLASTing (o DIAMONDing) las secuencias de proteínas predichas contra sí mismas (todas frente a todas) y contando cuántas de las proteínas tienen un alto número de coincidencias de alta calidad. Puede utilizar el resultado de este análisis para dividir su conjunto de genes en dos grupos: los genes que codifican proteínas que desea encontrar y los elementos repetitivos que se predijeron adicionalmente.</p> <p><em>Estoy ejecutando BRAKER en Anaconda y algo falla.</em></p> <p>Actualice AUGUSTUS y BRAKER desde github con git clone https://github.com/Gaius-Augustus/Augustus.git y git clone https://github.com/Gaius-Augustus/BRAKER.git. La instalación de Anaconda es excelente, pero se basa en las versiones de AUGUSTUS y BRAKER, que a menudo se quedan atrás. En su lugar, utilice el código actual de GitHub.</p> <p>Citando BRAKER y software llamado por BRAKER</p> <p>Dado que BRAKER es un pipeline que llama a varias herramientas de Bioinformática, la publicación de los resultados obtenidos por BRAKER requiere que no solo se cite BRAKER, sino también las herramientas que son llamadas por BRAKER. BRAKER generará un archivo what-to-cite.txt en el directorio de trabajo de BRAKER, informándole sobre qué fuentes exactas se aplican a su ejecución.</p> <p>Bruna, T., Hoff, K.J., Lomsadze, A., Stanke, M. y Borodovsky, M. (2021). BRAKER2: Anotación automática del genoma eucariota con GeneMark-EP + y AUGUSTUS respaldada por una base de datos de proteínas. NAR Genómica y Bioinformática 3 (1): lqaa108, doi: 10.1093 / nargab / lqaa108.</p> <p>Hoff, K.J., Lomsadze, A., Borodovsky, M. y Stanke, M. (2019). Anotación de genoma completo con BRAKER. Métodos Mol Biol. 1962: 65-95, doi: 10.1007 / 978-1-4939-9173-0_5.</p> <p>Hoff, K.J., Lange, S., Lomsadze, A., Borodovsky, M. y Stanke, M. (2016). BRAKER1: anotación del genoma basada en RNA-Seq no supervisada con GeneMark-ET y AUGUSTUS. Bioinformática, 32 (5): 767-769.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Stanke, M., Diekhans, M., Baertsch, R. y Haussler, D. (2008). Uso de alineaciones de ADNc nativas y mapeadas sintéticamente para mejorar la búsqueda de genes de novo. Bioinformática, doi: 10.1093 / bioinformatics / btn013.</p> <p>Stanke. M., Schöffmann, O., Morgenstern, B. y Waack, S. (2006). Predicción genética en eucariotas con un modelo de Markov oculto generalizado que utiliza pistas de fuentes externas. BMC Bioinformática 7, 62.</p> <p>Si BRAKER realizó algún tipo de entrenamiento AUGUSTUS, verifique cuidadosamente si configuró BRAKER para usar NCBI BLAST o DIAMOND. Uno de ellos se utilizó para filtrar estructuras de genes de entrenamiento redundantes.</p> <p>Si utilizó NCBI BLAST, cite:</p> <p>Altschul, A.F., Gish, W., Miller, W., Myers, E.W. y Lipman, D.J. (1990). Una herramienta básica de búsqueda de alineación local. J Mol Biol 215: 403-410.</p> <p>Camacho, C., Coulouris, G., Avagyan, V., Ma, N., Papadopoulos, J., Bealer, K. y Madden, T.L. (2009). Blast +: arquitectura y aplicaciones. Bioinformática de BMC, 10 (1): 421.</p> <p>Si usó DIAMOND, cite:</p> <ul> <li>Buchfink, B., Xie, C., Huson, D.H. (2015). Alineación de proteínas rápida y sensible usando DIAMOND. Nature Methods 12: 59-60.</li></ul> <p>Si BRAKER se ejecutó con un archivo de genoma y no hay evidencia extrínseca, cite, entonces se usó GeneMark-ES, cite:</p> <p>Lomsadze, A., Ter-Hovhannisyan, V., Chernoff, Y.O. y Borodovsky, M. (2005). Identificación de genes en genomas eucariotas novedosos mediante algoritmo de autoaprendizaje. Investigación de ácidos nucleicos, 33 (20): 6494-6506.</p> <p>Ter-Hovhannisyan, V., Lomsadze, A., Chernoff, Y.O. y Borodovsky, M. (2008). Predicción de genes en genomas fúngicos novedosos utilizando un algoritmo ab initio con entrenamiento no supervisado. Investigación del genoma, páginas gr - 081612, 2008.</p> <p>Si BRAKER se ejecutó con proteínas de cualquier distancia filogenética (--epmode o --etpmode), cite todas las herramientas que utiliza la canalización de ProtHint para generar pistas:</p> <p>Bruna, T., Lomsadze, A. y Borodovsky, M. (2020). GeneMark-EP +: predicción de genes eucariotas con autoentrenamiento en el espacio de genes y proteínas. NAR Genómica y Bioinformática, 2 (2), lqaa026.</p> <p>Buchfink, B., Xie, C., Huson, D.H. (2015). Alineación de proteínas rápida y sensible usando DIAMOND. Nature Methods 12: 59-60.</p> <p>Lomsadze, A., Ter-Hovhannisyan, V., Chernoff, Y.O. y Borodovsky, M. (2005). Identificación de genes en genomas eucariotas novedosos mediante algoritmo de autoaprendizaje. Investigación de ácidos nucleicos, 33 (20): 6494-6506.</p> <p>Iwata, H. y Gotoh, O. (2012). Programas de alineación empalmados de evaluación comparativa que incluyen Spaln2, una versión extendida de Spaln que incorpora características adicionales específicas de especies. Investigación de ácidos nucleicos, 40 (20), e161-e161.</p> <p>Gotoh, O., Morita, M., Nelson, D. R. (2014). Evaluación y perfeccionamiento de la predicción de la estructura de genes eucariotas con alineación de secuencias de proteínas múltiples consciente de la estructura de genes. Bioinformática de BMC, 15 (1), 189.</p> <p>Si BRAKER se ejecutó con alineaciones RNA-Seq en formato bam, entonces se utilizó SAMtools, cite:</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Li, H., Handsaker, B., Wysoker, A., Fennell, T., Ruan, J., Homer, N., Marth, G., Abecasis, G., Durbin, R. 1000 Genome Project Data Processing Subgrupo (2009). El formato Sequence Alignment / Map y SAMtools. Bioinformática, 25 (16): 2078-9.</p> <p>Barnett, D.W., Garrison, E.K., Quinlan, A.R., Strömberg, M.P. y Marth G.T. (2011). BamTools: una API de C ++ y un kit de herramientas para analizar y administrar archivos BAM. Bioinformática, 27 (12): 1691-2</p> <p>Si BRAKER usó alineaciones RNA-Seq para generar un conjunto de genes de entrenamiento, cite GeneMark-ET:</p> <ul> <li>Lomsadze, A., Paul D.B. y Mark B. (2014) Integración de lecturas de Rna-Seq mapeadas en el entrenamiento automático del algoritmo de búsqueda de genes eucariotas. Investigación de ácidos nucleicos 42 (15): e119 - e119</li></ul> <p>Si BRAKER se ejecutó con proteínas de especies estrechamente relacionadas, cite GenomeThreader:</p> <p>Si BRAKER llamó a MakeHub para crear un centro de datos de pistas para la visualización de los resultados de BRAKER con UCSC Genome Browser, cite:</p> <ul> <li>Hoff, K.J. (2019) MakeHub: generación completamente automatizada de UCSC Genome Browser Assembly Hubs. Genómica, proteómica y bioinformática, en prensa 2020, preimpresión en bioarXive, doi: https://doi.org/10.1101/550145.</li></ul> <p>Si BRAKER llamó a GUSHR para generar UTR, cite:</p> <p>Keilwagen, J., Hartung, F., Grau, J. (2019) GeMoMa: predicción de genes basada en homología utilizando la conservación de la posición del intrón y datos de secuencia de ARN. Métodos Mol Biol. 1962: 161-177, doi: 10.1007 / 978-1-4939-9173-0_9.</p> <p>Keilwagen, J., Wenk, M., Erickson, J.L., Schattat, M.H., Grau, J., Hartung F. (2016) Uso de la conservación de la posición del intrón para la predicción de genes basada en homología. Investigación de ácidos nucleicos, 44 (9): e89.</p> <p>Keilwagen, J., Hartung, F., Paulini, M., Twardziok, S.O., Grau, J. (2018) Combinación de datos de secuencia de ARN y predicción de genes basada en homología para plantas, animales y hongos. BMC Bioinformatics, 19 (1): 189.</p> <p>Todo el código fuente, es decir, scripts / *. Pl o scripts / *. Py están bajo la Licencia Artística (ver http://www.opensource.org/licenses/artistic-license.php).</p> <p><b>[F1]</b> EX = ES / ET / EP / ETP, todos disponibles para descargar bajo el nombre <em>GeneMark-ES / ET / EP</em> ↩ </p> <p><b>[F2]</b> Utilice la última versión de la rama maestra de AUGUSTUS distribuida por los desarrolladores originales, está disponible en github en https://github.com/Gaius-Augustus/Augustus. Se han informado problemas de usuarios que intentaron ejecutar BRAKER con versiones de AUGUSTUS mantenidas por terceros, es decir, Bioconda. ↩ </p> <p><b>[F3]</b> No probado en esta versión, recomendamos usar GenomeThreader, en su lugar ↩ </p> <p><b>[F4]</b> instalar con sudo apt-get install cpanminus ↩ </p> <p><b>[F5]</b> GeneMark-EX no es una herramienta obligatoria si se va a entrenar AUGUSTUS a partir de alineaciones de GenomeThreader con la opción --trainFromGth. ↩ </p> <p><b>[F6]</b> El binario puede, por ejemplo, residir en bamtools / build / src / toolkit ↩ </p> <p><b>[R0]</b> Tomas Bruna, Katharina J. Hoff, Alexandre Lomsadze, Mario Stanke y Mark Borodvsky. 2021. “BRAKER2: anotación automática del genoma eucariota con GeneMark-EP + y AUGUSTUS respaldada por una base de datos de proteínas”. <em>NAR Genómica y Bioinformática</em> 3 (1): lqaa108. ↩ </p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p><b>[R1]</b> Hoff, Katharina J, Simone Lange, Alexandre Lomsadze, Mark Borodovsky y Mario Stanke. 2015. "BRAKER1: Anotación del genoma basada en secuencia de ARN no supervisada con Genemark-et y Augustus". <em>Bioinformática</em> 32 (5). Prensa de la Universidad de Oxford: 767--69. ↩ </p> <p><b>[R2]</b> Lomsadze, Alexandre, Paul D Burns y Mark Borodovsky. 2014. “Integración de lecturas de Rna-Seq mapeadas en el entrenamiento automático del algoritmo de búsqueda de genes eucariotas”. <em>Investigación de ácidos nucleicos</em> 42 (15). Prensa de la Universidad de Oxford: e119 - e119. ↩ </p> <p><b>[R3]</b> Stanke, Mario, Mark Diekhans, Robert Baertsch y David Haussler. 2008. "Uso de alineaciones de ADNc nativas y mapeadas sinteticamente para mejorar la búsqueda de genes de Novo". <em>Bioinformática</em> 24 (5). Prensa de la Universidad de Oxford: 637--44. ↩ </p> <p><b>[R4]</b> Stanke, Mario, Oliver Schöffmann, Burkhard Morgenstern y Stephan Waack. 2006. "Predicción genética en eucariotas con un modelo de Markov oculto generalizado que utiliza pistas de fuentes externas". <em>Bioinformática BMC</em> 7 (1). BioMed Central: 62. ↩ </p> <p><b>[R5]</b> Barnett, Derek W, Erik K Garrison, Aaron R Quinlan, Michael P Strömberg y Gabor T Marth. 2011. "BamTools: Api C ++ y kit de herramientas para analizar y administrar archivos Bam". <em>Bioinformática</em> 27 (12). Prensa de la Universidad de Oxford: 1691-2. ↩ </p> <p><b>[R6]</b> Li, Heng, Handsaker, Bob, Alec Wysoker, Tim Fennell, Jue Ruan, Nils Homer, Gabor Marth, Goncalo Abecasis y Richard Durbin. 2009. "El formato de alineación / mapa de secuencia y Samtools". <em>Bioinformática</em> 25 (16). Prensa de la Universidad de Oxford: 2078--9. ↩ </p> <p><b>[R7]</b> Gremme, G. 2013. “Predicción computacional de la estructura genética”. Tesis doctoral, Universität Hamburg. ↩ </p> <p><b>[R8]</b> Gotoh, Osamu. 2008a. "Un método preciso y con uso eficiente del espacio para mapear y alinear secuencias de ADNc en secuencias genómicas". <em>Investigación de ácidos nucleicos</em> 36 (8). Prensa de la Universidad de Oxford: 2630--8. ↩ </p> <p><b>[R9]</b> Iwata, Hiroaki y Osamu Gotoh. 2012. “Evaluación comparativa de programas de alineación empalmada que incluyen Spaln2, una versión extendida de Spaln que incorpora características adicionales específicas de especies”. <em>Investigación de ácidos nucleicos</em> 40 (20). Prensa de la Universidad de Oxford: e161 - e161. ↩ </p> <p><b>[R10]</b> Osamu Gotoh. 2008b. "Mapeo directo y alineación de secuencias de proteínas en secuencias genómicas". <em>Bioinformática</em> 24 (21). Prensa de la Universidad de Oxford: 2438--44. ↩ </p> <p><b>[R11]</b> Slater, Guy St C y Ewan Birney. 2005. “Generación automatizada de heurísticas para la comparación de secuencias biológicas”. <em>Bioinformática BMC</em> 6 (1). BioMed Central: 31. ↩ </p> <p><b>[R12]</b> Altschul, S.F., W. Gish, W. Miller, E.W. Myers y D.J. Lipman. 1990. “Herramienta básica de búsqueda de alineación local”. <em>Revista de biología molecular</em> 215:403--10. ↩ </p> <p><b>[R13]</b> Camacho, Christiam y col. 2009. “BLAST +: arquitectura y aplicaciones”. <em>Bioinformática BMC</em> 1(1): 421. ↩ </p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p><b>[R14]</b> Lomsadze, A., V. Ter-Hovhannisyan, Y.O. Chernoff y M. Borodovsky. 2005. “Identificación de genes en genomas eucariotas novedosos mediante algoritmo de autoaprendizaje”. <em>Investigación de ácidos nucleicos</em> 33 (20): 6494--6506. doi: 10.1093 / nar / gki937. ↩ </p> <p><b>[R15]</b> Ter-Hovhannisyan, Vardges, Alexandre Lomsadze, Yury O Chernoff y Mark Borodovsky. 2008. "Predicción genética en genomas fúngicos nuevos utilizando un algoritmo ab initio con entrenamiento no supervisado". <em>Investigación del genoma</em>. Laboratorio de Cold Spring Harbor, gr - 081612. ↩ </p> <p><b>[R16]</b> Hoff, K.J. 2019. MakeHub: generación totalmente automatizada de UCSC Genome Browser Assembly Hubs. <em>Genómica, proteómica y bioinformática</em>, en prensa, preimpresión en bioarXive, doi: https://doi.org/10.1101/550145. ↩ </p> <p><b>[R17]</b> Bruna, T., Lomsadze, A., & amp Borodovsky, M. 2020. GeneMark-EP +: predicción de genes eucariotas con autoentrenamiento en el espacio de genes y proteínas. NAR Genómica y Bioinformática, 2 (2), lqaa026. doi: https://doi.org/10.1093/nargab/lqaa026. ↩ </p> <p><b>[R18]</b> Kriventseva, EV, Kuznetsov, D., Tegenfeldt, F., Manni, M., Dias, R., Simão, FA y Zdobnov, EM 2019. OrthoDB v10: muestreo de la diversidad de animales, plantas, hongos, protistas, bacterias y genomas virales para anotaciones evolutivas y funcionales de ortólogos. Investigación de ácidos nucleicos, 47 (D1), D807-D811. ↩ </p> <p><b>[R19]</b> Keilwagen, J., Hartung, F., Grau, J. (2019) GeMoMa: predicción de genes basada en homología utilizando la conservación de la posición del intrón y datos de secuencia de ARN. Métodos Mol Biol. 1962: 161-177, doi: 10.1007 / 978-1-4939-9173-0_9. ↩ </p> <p><b>[R20]</b> Keilwagen, J., Wenk, M., Erickson, J.L., Schattat, M.H., Grau, J., Hartung F. (2016) Uso de la conservación de la posición del intrón para la predicción de genes basada en homología. Investigación de ácidos nucleicos, 44 (9): e89. ↩ </p> <p><b>[R21]</b> Keilwagen, J., Hartung, F., Paulini, M., Twardziok, S.O., Grau, J. (2018) Combinación de datos de secuencia de ARN y predicción de genes basada en homología para plantas, animales y hongos. BMC Bioinformatics, 19 (1): 189. ↩ </p> <br> <h2>Lanzamientos antiguos</h2> <p>Las versiones recientes de Biopython requieren NumPy (y no numérico):</p> <ul> 15Mb - Fuente Tarball 16Mb - Archivo Zip de origen </ul><ul> 15Mb - Source Tarball 16Mb - Source Zip File 2Mb - Instalador .exe de Windows de 32 bits para Python 2.7 y NumPy 1.11.0 2Mb - Instalador de Windows .msi de 32 bits para Python 2.7 y NumPy 1.11.0 2Mb - Instalador de Windows .exe de 32 bits para Python 3.3 y NumPy 1.10.2 2Mb - Instalador .msi de Windows de 32 bits para Python 3.3 y NumPy 1.10.2 2Mb - Instalador .exe de Windows de 32 bits para Python 3.4 y NumPy 1.11.0 2Mb - Instalador .msi de Windows de 32 bits para Python 3.4 y NumPy 1.11.0 3Mb - Instalador .exe de Windows de 32 bits para Python 3.5 y NumPy 1.11.1 3Mb - Instalador .msi de Windows de 32 bits para Python 3.5 y NumPy 1.11.1 2Mb - Instalador de Windows .exe de 32 bits para Python 3.6 y NumPy 1.11.3 2Mb - Instalador .msi de Windows de 32 bits para Python 3.6 y NumPy 1.11.3 </ul> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <ul> 14Mb - Source Tarball 15Mb - Source Zip File 2Mb - Instalador .exe de Windows de 32 bits para Python 2.6 y NumPy 1.8.2 2Mb - Instalador de Windows .exe de 32 bits para Python 2.7 y NumPy 1.11.0 2Mb - Instalador de Windows .msi de 32 bits para Python 2.7 y NumPy 1.11.0 2Mb - Instalador .exe de Windows de 32 bits para Python 3.3 y NumPy 1.10.2 2Mb - Instalador de Windows .msi de 32 bits para Python 3.3 y NumPy 1.10.2 2Mb - Instalador de Windows .exe de 32 bits para Python 3.4 y NumPy 1.11.0 2Mb - Instalador .msi de Windows de 32 bits para Python 3.4 y NumPy 1.11.0 2Mb - Instalador .exe de Windows de 32 bits para Python 3.5 y NumPy 1.11.1 2Mb - Instalador .msi de Windows de 32 bits para Python 3.5 y NumPy 1.11.1 </ul><ul> 14Mb - Source Tarball 15Mb - Source Zip File 2Mb - Instalador .exe de Windows de 32 bits para Python 2.6 y NumPy 1.8.2 2Mb - Instalador de Windows .msi de 32 bits para Python 2.6 y NumPy 1.8.2 2Mb - Instalador de Windows .exe de 32 bits para Python 2.7 y NumPy 1.9.1 2Mb - Instalador .exe de Windows de 32 bits para Python 2.7 y NumPy 1.9.1 2Mb - Instalador .exe de Windows de 32 bits para Python 3.3 y NumPy 1.9.1 2Mb - Instalador de Windows .exe de 32 bits para Python 3.3 y NumPy 1.9.1 2Mb - Instalador .exe de Windows de 32 bits para Python 3.4 y NumPy 1.9.1 2Mb - Instalador de Windows .msi de 32 bits para Python 3.4 y NumPy 1.9.1 2Mb - Instalador de Windows .exe de 32 bits para Python 3.4 y NumPy 1.9.3 2Mb - Instalador .msi de Windows de 32 bits para Python 3.4 y NumPy 1.9.3 </ul><ul> 14Mb - Source Tarball 15Mb - Source Zip File 2Mb - Instalador .exe de Windows de 32 bits para Python 2.6 y NumPy 1.8.2 2Mb - Instalador de Windows .exe de 32 bits para Python 2.7 y NumPy 1.9.1 2Mb - Instalador de Windows .exe de 32 bits para Python 3.3 y NumPy 1.9.1 2Mb - Instalador .exe de Windows de 32 bits para Python 3.4 y NumPy 1.9.1 2Mb - Instalador de Windows .exe de 32 bits para Python 3.5 2Mb - Instalador de Windows .msi de 32 bits para Python 3.5 </ul><ul> 13Mb - Source Tarball 14Mb - Source Zip File 2Mb - Instalador de Windows de 32 bits para Python 2.6 y NumPy 1.8.2 2Mb - Instalador de Windows de 32 bits para Python 2.7 y NumPy 1.9.1 2Mb - Instalador de Windows de 32 bits para Python 3.3 y NumPy 1.9. 1 2Mb - Instalador de Windows de 32 bits para Python 3.4 y NumPy 1.9.1 </ul><ul> 12Mb - Source Tarball 13Mb - Source Zip File 2Mb - Instalador de Windows de 32 bits para Python 2.6 y NumPy 1.8.1 2Mb - Instalador de Windows de 32 bits para Python 2.7 y NumPy 1.8.1 2Mb - Instalador de Windows de 32 bits para Python 3.3 y NumPy 1.8. 1 2Mb - Instalador de Windows de 32 bits para Python 3.4 y NumPy 1.8.1 </ul><ul> 11Mb - Source Tarball 12Mb - Source Zip File 2Mb - Instalador de Windows de 32 bits para Python 2.6 y NumPy 1.7 2Mb - Instalador de Windows de 32 bits para Python 2.7 y NumPy 1.7 2Mb - Instalador de Windows de 32 bits para Python 3.3 y NumPy 1.7 </ul><ul> 11,123 Kb - Source Tarball 12,111 Kb - Source Zip File 1.877 Kb - Instalador de Windows de 32 bits para Python 2.6 y NumPy 1.7 2.003 Kb - Instalador de Windows de 32 bits para Python 2.7 y NumPy 1.7 2.005 Kb - Instalador de Windows de 32 bits para Python 3.3 y NumPy 1.7 </ul><ul> 11,123 Kb - Source Tarball 12,111 Kb - Source Zip File 1.852 Kb - Instalador de Windows de 32 bits para Python 2.5 y NumPy 1.1 1.877 Kb - Instalador de Windows de 32 bits para Python 2.6 y NumPy 1.3 2.003 Kb - Instalador de Windows de 32 bits para Python 2.7 y NumPy 1.5 2.005 Kb - Instalador de Windows de 32 bits para Python 3.3 y NumPy 1.7 </ul> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <ul> 10,658 Kb - Fuente Tarball (<em>lanzamiento beta</em>, 15 de julio de 2013) 11.607 Kb - Archivo Zip de origen 1.661 Kb - Instalador de Windows de 32 bits para Python 2.5 y NumPy 1.1 1.686 Kb - Instalador de Windows de 32 bits para Python 2.6 y NumPy 1.3 1.813 Kb - Instalador de Windows de 32 bits para Python 2.7 y NumPy 1.5 1.814 Kb - Instalador de Windows de 32 bits para Python 3.3 y NumPy 1.7 </ul><ul> 10,311 Kb - Source Tarball (5 de febrero de 2013) 11,198 Kb - Source Zip File 1,612 Kb - Instalador de Windows de 32 bits para Python 2.5 y NumPy 1.1 1,637 Kb - Instalador de Windows de 32 bits para Python 2.6 y NumPy 1.3 1,764 Kb - Instalador de Windows de 32 bits para Python 2.7 y NumPy 1.5 1,757 Kb - Instalador de Windows de 32 bits para Python 3.2 y NumPy 1.5 (<em>beta</em> estado para la prueba) 1,750 Kb - Instalador de Windows de 32 bits para Python 3.3 y NumPy 1.7 (<em>beta</em> estado para la prueba) </ul><ul> 9.280 Kb - Source Tarball (25 de junio de 2012) 10.051 Kb - Archivo Zip de origen 1.469 Kb - Instalador de Windows de 32 bits para Python 2.5 y NumPy 1.1 1.492 Kb - Instalador de Windows de 32 bits para Python 2.6 y NumPy 1.3 1,1618 Kb - Windows de 32 bits Instalador para Python 2.7 y NumPy 1.5 1,611 Kb - Instalador de Windows de 32 bits para Python 3.2 y NumPy 1.5 (<em>beta</em> estado para la prueba) </ul><ul> 8,377 Kb - Source Tarball (24 de febrero de 2012) 9,127 Kb - Source Zip File 1,440 Kb - Instalador de Windows de 32 bits para Python 2.5 y NumPy 1.1 1,463 Kb - Instalador de Windows de 32 bits para Python 2.6 y NumPy 1.3 1,590 Kb - Instalador de Windows de 32 bits para Python 2.7 y NumPy 1.5 </ul><ul> 7,847 Kb - Source Tarball (18 de agosto de 2011) 8,474 Kb - Source Zip File 1,427 Kb - Instalador de Windows de 32 bits para Python 2.4 (que ya no admitimos oficialmente) y NumPy 1.1 1,428 Kb - Instalador de Windows de 32 bits para Python 2.5 y NumPy 1.1 1.450 Kb - Instalador de Windows de 32 bits para Python 2.6 y NumPy 1.3 1.577 Kb - Instalador de Windows de 32 bits para Python 2.7 y NumPy 1.5 </ul><ul> 6.783 Kb - Source Tarball (2 de abril de 2011) 7.446 Kb - Source Zip File 1.405 Kb - Instalador de Windows de 32 bits para Python 2.4 (que ya no admitimos oficialmente) y NumPy 1.1 1.405 Kb - Instalador de Windows de 32 bits para Python 2.5 y NumPy 1.1 1,428 Kb - Instalador de Windows de 32 bits para Python 2.6 y NumPy 1.3 1,555 Kb - Instalador de Windows de 32 bits para Python 2.7 y NumPy 1.5 </ul><ul> 6.778 Kb - Source Tarball (26 de noviembre de 2010) 7.347 Kb - Archivo Zip de origen 1.429 Kb - Instalador de Windows de 32 bits para Python 2.4 y NumPy 1.1 1.429 Kb - Instalador de Windows de 32 bits para Python 2.5 y NumPy 1.1 1.451 Kb - Instalador de Windows de 32 bits para Python 2.6 y NumPy 1.3 1578 Kb - Instalador de Windows de 32 bits para Python 2.7 y NumPy 1.5 </ul><ul> 6.493 Kb - Source Tarball (31 de agosto de 2010) 7.058 Kb - Archivo Zip de origen 1.448 Kb - Instalador de Windows de 32 bits para Python 2.4 y NumPy 1.1 1.449 Kb - Instalador de Windows de 32 bits para Python 2.5 y NumPy 1.1 1.471 Kb - Instalador de Windows de 32 bits para Python 2.6 y NumPy 1.3 1,598 Kb - Instalador de Windows de 32 bits para Python 2.7 y NumPy 1.5 </ul> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <ul> 6.428 Kb - Source Tarball (18 de agosto de 2010) 6.996 Kb - Archivo Zip de origen 1.451 Kb - Instalador de Windows de 32 bits para Python 2.4 y NumPy 1.1 1.451 Kb - Instalador de Windows de 32 bits para Python 2.5 y NumPy 1.1 1.474 Kb - Instalador de Windows de 32 bits para Python 2.6 y NumPy 1.3 </ul><ul> 6.295 Kb - Source Tarball (20 de mayo de 2010) 6.859 Kb - Archivo Zip de origen 1.434 Kb - Instalador de Windows de 32 bits para Python 2.4 y NumPy 1.1 1.434 Kb - Instalador de Windows de 32 bits para Python 2.5 y NumPy 1.1 1.457 Kb - Instalador de Windows de 32 bits para Python 2.6 y NumPy 1.3 </ul><ul> 6.554 Kb - Source Tarball (2 de abril de 2010) 7.118 Kb - Archivo Zip de origen 1.426 Kb - Instalador de Windows de 32 bits para Python 2.4 y NumPy 1.1 1.427 Kb - Instalador de Windows de 32 bits para Python 2.5 y NumPy 1.1 1.456 Kb - Instalador de Windows de 32 bits para Python 2.6 y NumPy 1.3 </ul><ul> 4.185 Kb - Source Tarball (15 de diciembre de 2009) 4.652 Kb - Archivo Zip de origen 1.129 Kb - Instalador de Windows de 32 bits para Python 2.4 y NumPy 1.1 1.130 Kb - Instalador de Windows de 32 bits para Python 2.5 y NumPy 1.1 1.155 Kb - Instalador de Windows de 32 bits para Python 2.6 y NumPy 1.3 </ul><ul> 5.486 Kb - Source Tarball (22 de septiembre de 2009) 5.930 Kb - Archivo Zip de origen 1.107 Kb - Instalador de Windows de 32 bits para Python 2.4 y NumPy 1.1 1.108 Kb - Instalador de Windows de 32 bits para Python 2.5 y NumPy 1.1 1.147 Kb - Instalador de Windows de 32 bits para Python 2.6 y NumPy 1.3 </ul><ul> 5.428 Kb - Source Tarball (17 de agosto de 2009) 5.922 Kb - Archivo Zip de origen 1.166 Kb - Windows Installer para Python 2.4 y NumPy 1.1 1.167 Kb - Windows Installer para Python 2.5 y NumPy 1.1 1.206 Kb - Windows Installer para Python 2.6 y NumPy 1.3 </ul><ul> 5.172 Kb - Source Tarball (23 de junio de 2009) 5.605 Kb - Archivo Zip de origen 1.161 Kb - Windows Installer para Python 2.4 y NumPy 1.1 1.161 Kb - Windows Installer para Python 2.5 y NumPy 1.1 1.199 Kb - Windows Installer para Python 2.6 y NumPy 1.3 </ul><ul> 4.550 Kb - Source Tarball (20 de abril de 2009) 4.988 Kb - Archivo Zip de origen 1.228 Kb - Windows Installer para Python 2.3 y NumPy 1.1 1.232 Kb - Windows Installer para Python 2.4 y NumPy 1.1 1.232 Kb - Windows Installer para Python 2.5 y NumPy 1.1 1270 Kb - Instalador de Windows para Python 2.6 y NumPy 1.3 </ul><ul> 4.788 Kb (3 de abril de 2009) 5.250 Kb 1.226 Kb - Windows Installer para Python 2.3 y NumPy 1.1 1.230 Kb - Windows Installer para Python 2.4 y NumPy 1.1 1.230 Kb - Windows Installer para Python 2.5 y NumPy 1.1 1.268 Kb - Windows Installer para Python 2.6 y NumPy 1.3 </ul><ul> 4.052 Kb (21 de noviembre de 2008) 4.498 Kb 1.111 Kb - Windows Installer para Python 2.3 y NumPy 1.1 1.115 Kb - Windows Installer para Python 2.4 y NumPy 1.1 1.115 Kb - Windows Installer para Python 2.5 y NumPy 1.1 </ul><ul> 4,331 Kb (7 de noviembre de 2008) 4,780 Kb 1,109 Kb - Windows Installer para Python 2.3 y NumPy 1.1 1,113 Kb - Windows Installer para Python 2.4 y NumPy 1.1 1,114 Kb - Windows Installer para Python 2.5 y NumPy 1.1 </ul> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Tenga en cuenta que Biopython 1.48 y versiones anteriores requieren la biblioteca numérica, no su reemplazo NumPy. Los instaladores de Windows para Python 2.4 y versiones anteriores están disponibles en el sitio web de Numerical Python. Un instalador de Windows para Numeric 24.2 para Python 2.5 está disponible aquí:</p> <p>Tenga en cuenta que Biopython 1.48 y versiones anteriores usaban mxTextTools 2.0 en algunos de los analizadores. Hubo algunos inconvenientes con mxTextTools 3.0, así que lo ideal es instalar el mxTextTools 2.0 anterior.</p> <br> <h2>Funciones de E / S</h2> <p>Los contenedores para formatos de archivo compatibles están disponibles en el nivel superior del módulo:</p> <p>Al igual que SeqIO y AlignIO, este módulo proporciona cuatro funciones de E / S: parse (), read (), write () y convert (). Cada función acepta un nombre de archivo o un identificador de archivo abierto, por lo que los datos también se pueden cargar desde archivos comprimidos, objetos StringIO, etc. Si el nombre del archivo se pasa como una cadena, el archivo se cierra automáticamente cuando finaliza la función; de lo contrario, usted es responsable de cerrar el identificador usted mismo.</p> <p>El segundo argumento de cada función es el formato de destino. Actualmente, se admiten los siguientes formatos:</p> <p>Consulte la página PhyloXML para obtener más ejemplos del uso de objetos de árbol.</p> <h3>Analizar gramaticalmente()</h3> <p>Analice de forma incremental cada árbol en el archivo o identificador dado, devolviendo un iterador de objetos Tree (es decir, alguna subclase de la clase Bio.Phylo.BaseTree Tree, según el formato del archivo).</p> <p>Si solo hay un árbol, el método next () del generador resultante lo devolverá.</p> <p>Tenga en cuenta que esto no revela inmediatamente si hay árboles restantes; si desea verificarlo, use read () en su lugar.</p> <p>Analiza y devuelve exactamente un árbol del archivo o identificador dado. Si el archivo contiene cero o varios árboles, se genera un ValueError. Esto es útil si sabe que un archivo contiene solo un árbol, para cargar ese objeto de árbol directamente en lugar de a través de parse () y next (), y como una verificación de seguridad para garantizar que el archivo de entrada de hecho contiene exactamente un árbol filogenético en el nivel superior.</p> <p>Si ya tiene los datos de su árbol cargados como una cadena de Python, puede analizarlos con la ayuda de StringIO (en la biblioteca estándar de Python):</p> <p>Las otras funciones de E / S también se pueden utilizar con StringIO.</p> <p>(Consejo general: si escribe en el objeto StringIO y desea volver a leer el contenido, deberá llamar al método seek (0) para mover el identificador al inicio de los datos StringIO, lo mismo que un open identificador de archivo. Vea ejemplos de esto en las pruebas unitarias para Phylo en el código fuente de Biopython.</p> <h3>Escribir()</h3> <p>Escribe una secuencia de objetos Tree en el archivo o identificador dado. Pasar un solo objeto Tree en lugar de una lista o iterable también funcionará (ver, Phylo es amigable).</p> <h3>Convertir()</h3> <p>Dados dos archivos (o identificadores) y dos formatos, ambos compatibles con Bio.Phylo, convierta el primer archivo del primer formato al segundo formato, escribiendo la salida en el segundo archivo.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <h3>Submódulos</h3> <p>Dentro del módulo Phylo hay analizadores y escritores para formatos de archivo específicos, que se ajustan a la API básica de nivel superior y, a veces, agregan características adicionales.</p> <p><strong>PhyloXMLIO:</strong> Soporte para el formato phyloXML. Consulte la página PhyloXML para obtener más detalles.</p> <p><strong>NeXMLIO:</strong> Soporte para el formato NeXML.</p> <p><strong>NewickIO:</strong> Un puerto del analizador en Bio.Nexus.Trees para admitir el formato Newick (también conocido como New Hampshire) a través de la API Phylo.</p> <p><strong>NexusIO:</strong> Envoltorios alrededor de Bio.Nexus para admitir el formato de árbol Nexus.</p> <p><strong>CDAOIO:</strong> Soporte para la Ontología de Análisis de Datos Comparativos (CDAO). Requiere RDFlib.</p> <p>El formato Nexus en realidad contiene varios subformatos para diferentes tipos de datos para representar árboles, Nexus proporciona un bloque que contiene algunos metadatos y uno o más árboles Newick (otro tipo de bloque Nexus puede representar alineaciones, esto se maneja en AlignIO. Entonces, para analizar un complete el archivo Nexus con todos los tipos de bloques manejados, use Bio.Nexus directamente, y para extraer solo los árboles, use Bio.Phylo.</p> <br> <h2>Implementación</h2> <p>Los principales objetivos de diseño de NuclearBLAST eran proporcionar a los biólogos un sistema centralizado donde los resultados de BLAST se pueden crear y recuperar fácilmente, un sistema de almacenamiento de base de datos relacional que se puede extraer fácilmente para análisis comparativos y un programa que aproveche los recursos informáticos agrupados para aumentar el rendimiento de grandes trabajos BLAST. Un objetivo secundario fue diseñar una solución de código abierto y disponible gratuitamente. Esto nos llevó a utilizar preferentemente una serie de paquetes de software de código abierto en la implementación de NuclearBLAST, incluidos BioPerl, Apache, PHP y MySQL, así como a utilizar Linux como sistema operativo base [2-5].</p> <p>Se eligió un navegador web como interfaz para NuclearBLAST, ya que proporciona una interfaz independiente de plataforma ampliamente utilizada, reconocible y disponible a nivel mundial. El servidor web Apache proporciona control de acceso y conexiones cifradas si el usuario desea asegurar su instalación. BioPerl proporciona un módulo de análisis para los resultados BLAST devueltos que luego se cargan en la base de datos MySQL. Toda la información sobre las búsquedas BLAST solicitadas se carga en la base de datos y el estado de cada consulta en un trabajo se rastrea en la base de datos. Este diseño de servidor cliente del programa permite el uso de múltiples computadoras que realizan los análisis BLAST en un entorno agrupado mediante el uso de un paquete de software de gestión de trabajos como PBS (Portable Batch System) [6]. NuclearBLAST se puede agrupar con tan solo varias computadoras de laboratorio utilizadas como nodos de trabajo en su tiempo de inactividad o tanto como una granja de procesamiento dedicada. Una instalación mínima de NuclearBLAST requiere una estación de trabajo típica que actúa como servidor y trabajador.</p> <p>Para mantener la base de datos MySQL en un tamaño manejable y reducir los datos redundantes en el sistema, optamos por utilizar el formato de base de datos de BLAST como el único almacén de información de secuencia en el programa. Solo los nombres de secuencia dentro de cada conjunto de datos y una cantidad mínima de metadatos se almacenan en la base de datos MySQL. También minimizamos el tamaño de la base de datos almacenando todas las estadísticas de resultados en la base de datos, pero excluyendo las alineaciones reales. Cuando se solicita, las alineaciones se recrean sobre la marcha extrayendo las dos secuencias de las bases de datos BLAST y aplicándolas entre sí utilizando bl2seq.</p> <br> <h2>1.7: Línea de comando BLAST - Biología</h2> <p><img src=""></p> <p><strong>Versión beta:</strong> <strong>Maestro de GitHub:</strong></p> <p>SequenceServer - ¡Búsqueda BLAST simplificada!</p> <p>SequenceServer le permite configurar rápidamente un servidor BLAST + con una interfaz de usuario intuitiva para uso personal o grupal.</p> <p>Si usa SequenceServer, cite:</p> <p>Para obtener instrucciones de instalación y cómo utilizar SequenceServer, consulte https://sequenceserver.com/#installation.</p> <p>Si desea ejecutar SequenceServer directamente desde el código fuente, consulte la sección 'Desarrollar y contribuir' a continuación.</p> <p>SequenceServer 2.0 incluye tres nuevas visualizaciones para ayudar a interpretar los resultados de BLAST, permite compartir los resultados de BLAST y visualizar el archivo BLAST XML generado externamente (incluido el de DIAMOND), elimina el límite de 30 hits para la descarga FASTA y agrega la capacidad de descargar la alineación por pares, está mejor equipado para manejar trabajos BLAST de larga duración y renderizar grandes resultados de búsqueda (miles de resultados), es compatible con BLAST 2.10.0+ y el nuevo formato de base de datos (incluida la migración de sus bases de datos antiguas al nuevo formato), contiene enlaces adicionales para la integración como parte de otros sitios web y varias otras mejoras bajo el capó.</p> <p>Lea más sobre SequenceServer 2.0 y las pruebas exhaustivas de las versiones candidatas realizadas por la comunidad: https://groups.google.com/d/msg/sequenceserver/c98ePBzcuVE/lN-S35jVHgAJ.</p> <p>Los nuevos lanzamientos de candidatos se anuncian en la página de lanzamientos de GitHub y en Google Group, mientras que nuestro tablero de proyectos de GitHub proporciona una descripción general de lo que queda por migrar de un lanzamiento candidato a uno estable.</p> <p>Lo invitamos a probar la versión candidata más reciente y ayudarnos informando cualquier problema que pueda encontrar con su configuración (instrucciones a continuación).</p> <p>Para obtener la última versión 2.0 (beta), ejecute:</p> <p>Si es nuevo en el comando anterior, consulte la sección 'Instalar o actualizar' en nuestro sitio web http://sequenceserver.com.</p> <p>Si desea ejecutar SequenceServer beta directamente desde el código fuente, consulte la sección "Desarrollar y contribuir" a continuación.</p> <p>Para desarrollar y contribuir, deberá ejecutar SequenceServer desde la fuente.</p> <p>Ejecute SequenceServer desde el código fuente</p> <p>Si no planea desarrollar, puede omitir la instalación de dependencias de desarrollo ejecutando bundle install --without = development.</p> <p>Realizar cambios en el código</p> <p>Durante el desarrollo, debe usar la opción -D para ejecutar SequenceServer en modo de desarrollo. En este modo, SequenceServer registra detalladamente y utiliza archivos de front-end sin procesar.</p> <p>Necesitará Node y npm si desea modificar y compilar el código de la interfaz:</p> <p>O si está utilizando la ventana acoplable, puede compilar el código de la interfaz e incluirlo en la imagen especificando '--target = minify' en el comando de compilación de la ventana acoplable:</p> <p>Usamos RSpec y Capybara para realizar pruebas. Nuestro conjunto de pruebas cubre el 87% del código base. La ejecución de todas las pruebas puede llevar un tiempo considerable (</p> <p>2 horas). Recomendamos usar Travis para ejecutar automáticamente todas las pruebas cuando inserta su código en su bifurcación. Las pruebas también se ejecutan automáticamente cuando abre una solicitud de extracción (consulte la sección Cómo combinar código a continuación). Aunque, a veces puede ser deseable ejecutar una sola prueba, un archivo completo o todas las pruebas localmente:</p> <p>Para ejecutar una única prueba (también conocido como escenario):</p> <p>Para ejecutar todas las pruebas en un solo archivo:</p> <p>Abra una solicitud de extracción en GitHub para fusionar el código. Nuestro conjunto de pruebas y el sistema de análisis de código estático CodeClimate se ejecutarán automáticamente en su solicitud de extracción. Estos deberían pasar para que su código se fusione. Si desea agregar una nueva función a SequenceServer, agregue también pruebas. Además, el código debe ser compatible con rubocop y eslint, y debe ajustarse a 80 caracteres por línea.</p> <p>Si cambia el código de la interfaz (JavaScript y CSS), compile (es decir, minimice y comprima) y confirme los paquetes JS y CSS resultantes antes de abrir una solicitud de extracción. Esto se debe a que el conjunto de pruebas ejecuta SequenceServer en modo de producción.</p> <p>Tanto la antigua versión estable como la nueva beta de SequenceServer están disponibles como imágenes de Docker.</p> <p>Esto utilizará la nueva versión beta de SequenceServer. Para usar la versión estable anterior, agregue la etiqueta de versión al comando:</p> <p><center> <div class="addthis_inline_share_toolbox"></div> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <br> <!-- MGID --> <!-- Composite Start --> <div id="M657953ScriptRootC1038348"> </div> <script>var s1= document.location.host; </script> <script src="https://jsc.mgid.com/l/e/leskanaris.com.1038348.js" async> </script> <!-- Composite End --> <!-- //MGID --> </center></p> <h2>Ver el vídeo: Herramientas bioinformaticas análisis molecular (Noviembre 2022).</h2> <iframe class="g-youtube" src="https://www.youtube.com/embed/SfUDDi163Os" frameborder="0" allowfullscreen></iframe> <div class="ag-box"><center> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> </center></div> </div> </div> </article> <div class="related-wrap single-el is-light-text iron-animated-image iron-fade"> <div class="related-heading widget-title"> <h3>Artículos De Interés</h3> </div> <div class="related-content-wrap"> <div class="related-el col-sm-4 col-xs-12"> <article class="post-wrap post-small-grid iron-animated-image iron-fade"> <div class="post-thumb-outer"> <div class="post-thumb is-image"> <a href="/2420-22-digestive-systems-biology.html" title="2.2: Sistemas digestivos - Biología" rel="bookmark"> <img style="width:230px; height:153px;" width="360" height="240" src="https://dualjuridik.org/img/biol-2022/2420/image_Ys9d6kJwdxkW7HFzo.jpg" class="attachment-raspberry_iron_360x240 size-raspberry_iron_360x240 wp-post-image" alt="" /></a></div> <!--#thumb wrap--> </div> <div class="post-header"> <div class="is-table"> <div class="is-cell is-middle"> <h3 class="post-title is-small-title"> <a href="/2420-22-digestive-systems-biology.html" rel="bookmark" title="2.2: Sistemas digestivos - Biología">2.2: Sistemas digestivos - Biología</a></h3> <!--#post title--> <div class="post-meta-info"> <span class="meta-info-el meta-info-date"> <span class="meta-info-icon"><i class="pe-7s-date"></i></span> <time class="date updated">November 28,2022</time> </span><!--#date meta--> </div> </div> </div> </div> </article> <!--#post mini grid--> </div><div class="related-el col-sm-4 col-xs-12"> <article class="post-wrap post-small-grid iron-animated-image iron-fade"> <div class="post-thumb-outer"> <div class="post-thumb is-image"> <a href="/8026-species-id-hardwood-tree.html" title="Identificación de la especie árbol de madera dura" rel="bookmark"> <img style="width:230px; height:153px;" width="360" height="240" src="https://dualjuridik.org/img/biol-2022/8026/image_m0oNcCjcHtwt2h70v.png" class="attachment-raspberry_iron_360x240 size-raspberry_iron_360x240 wp-post-image" alt="" /></a></div> <!--#thumb wrap--> </div> <div class="post-header"> <div class="is-table"> <div class="is-cell is-middle"> <h3 class="post-title is-small-title"> <a href="/8026-species-id-hardwood-tree.html" rel="bookmark" title="Identificación de la especie árbol de madera dura">Identificación de la especie árbol de madera dura</a></h3> <!--#post title--> <div class="post-meta-info"> <span class="meta-info-el meta-info-date"> <span class="meta-info-icon"><i class="pe-7s-date"></i></span> <time class="date updated">November 28,2022</time> </span><!--#date meta--> </div> </div> </div> </div> </article> <!--#post mini grid--> </div><div class="related-el col-sm-4 col-xs-12"> <article class="post-wrap post-small-grid iron-animated-image iron-fade"> <div class="post-thumb-outer"> <div class="post-thumb is-image"> <a href="/3108-ptms-of-proteins-via-mass-spec.html" title="¿PTM de proteínas a través de espectrometría de masas?" rel="bookmark"> <img style="width:230px; height:153px;" width="360" height="240" src="https://dualjuridik.org/img/biol-2022/3108/image_vFibg3pkeka2841zLgIWw0.jpg" class="attachment-raspberry_iron_360x240 size-raspberry_iron_360x240 wp-post-image" alt="" /></a></div> <!--#thumb wrap--> </div> <div class="post-header"> <div class="is-table"> <div class="is-cell is-middle"> <h3 class="post-title is-small-title"> <a href="/3108-ptms-of-proteins-via-mass-spec.html" rel="bookmark" title="¿PTM de proteínas a través de espectrometría de masas?">¿PTM de proteínas a través de espectrometría de masas?</a></h3> <!--#post title--> <div class="post-meta-info"> <span class="meta-info-el meta-info-date"> <span class="meta-info-icon"><i class="pe-7s-date"></i></span> <time class="date updated">November 28,2022</time> </span><!--#date meta--> </div> </div> </div> </div> </article> <!--#post mini grid--> </div> </div> </div> </div> <!--#page inner--> <!--#iron container--> <div class="sidebar-wrap col-md-4 col-sm-12"> <div class="iron-sidebar-sticky"> <div class="sidebar-inner"> <center > <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <br /></center> <aside class="widget post-widget"> <div class="widget-title"> <h3>Recomendado</h3> <div class="header-divider"></div> </div> <div class="post-widget-inner"> <div class="post-widget-el"> <article class="post-wrap post-mini-list row row-eq-height iron-animated-image iron-fade"> <div class="is-left-col"> <div class="post-thumb-outer"> <div class="post-thumb is-image"> <div class="iron-flag trending-post"><i class="pe-7s-gleam"></i></div> <!--#iron flag--><a href="/7794-101-looking-back-biology.html" title="10.1: Mirando hacia atrás - Biología" rel="bookmark"> <img style="width:85px; height:85px;" width="180" height="180" src="https://dualjuridik.org/img/biol-2022/7794/image_6Re9fX12yb8j1aZQeMjhyL.png" class="attachment-raspberry_iron_180x180 size-raspberry_iron_180x180 wp-post-image" alt="10.1: Mirando hacia atrás - Biología" /></a> </div> <!--#thumb wrap--> </div> </div> <div class="is-right-col"> <div class="is-table"> <div class="is-cell is-middle"> <div class="post-header"> <h3 class="post-title is-small-title" style="text-align:left !important;"><a href="/7794-101-looking-back-biology.html" rel="bookmark" title="10.1: Mirando hacia atrás - Biología">10.1: Mirando hacia atrás - Biología</a></h3> <!--#post title--> <div class="post-meta-info"> <span class="meta-info-el meta-info-date"> <time class="date updated">Información</time> </span><!--#date meta--> </div> </div> </div> </div> </div> </article> <!--#post list--> </div><div class="post-widget-el"> <article class="post-wrap post-mini-list row row-eq-height iron-animated-image iron-fade"> <div class="is-left-col"> <div class="post-thumb-outer"> <div class="post-thumb is-image"> <div class="iron-flag trending-post"><i class="pe-7s-gleam"></i></div> <!--#iron flag--><a href="/2937-33-example-of-human-mutations-biology.html" title="3.3: Ejemplo de mutaciones humanas - Biología" rel="bookmark"> <img style="width:85px; height:85px;" width="180" height="180" src="https://dualjuridik.org/img/biol-2022/2937/image_Iif80vt5BQ2C49.png" class="attachment-raspberry_iron_180x180 size-raspberry_iron_180x180 wp-post-image" alt="3.3: Ejemplo de mutaciones humanas - Biología" /></a> </div> <!--#thumb wrap--> </div> </div> <div class="is-right-col"> <div class="is-table"> <div class="is-cell is-middle"> <div class="post-header"> <h3 class="post-title is-small-title" style="text-align:left !important;"><a href="/2937-33-example-of-human-mutations-biology.html" rel="bookmark" title="3.3: Ejemplo de mutaciones humanas - Biología">3.3: Ejemplo de mutaciones humanas - Biología</a></h3> <!--#post title--> <div class="post-meta-info"> <span class="meta-info-el meta-info-date"> <time class="date updated">Información</time> </span><!--#date meta--> </div> </div> </div> </div> </div> </article> <!--#post list--> </div><div class="post-widget-el"> <article class="post-wrap post-mini-list row row-eq-height iron-animated-image iron-fade"> <div class="is-left-col"> <div class="post-thumb-outer"> <div class="post-thumb is-image"> <div class="iron-flag trending-post"><i class="pe-7s-gleam"></i></div> <!--#iron flag--><a href="/10704-l-strain-of-sars-cov-2.html" title="¿Cepa L de SARS-CoV-2?" rel="bookmark"> <img style="width:85px; height:85px;" width="180" height="180" src="https://dualjuridik.org/img/biol-2022/10704/image_6zUYky01yuowzBq5dOkF.png" class="attachment-raspberry_iron_180x180 size-raspberry_iron_180x180 wp-post-image" alt="¿Cepa L de SARS-CoV-2?" /></a> </div> <!--#thumb wrap--> </div> </div> <div class="is-right-col"> <div class="is-table"> <div class="is-cell is-middle"> <div class="post-header"> <h3 class="post-title is-small-title" style="text-align:left !important;"><a href="/10704-l-strain-of-sars-cov-2.html" rel="bookmark" title="¿Cepa L de SARS-CoV-2?">¿Cepa L de SARS-CoV-2?</a></h3> <!--#post title--> <div class="post-meta-info"> <span class="meta-info-el meta-info-date"> <time class="date updated">Información</time> </span><!--#date meta--> </div> </div> </div> </div> </div> </article> <!--#post list--> </div> </div> <div style="padding: 15px 0 15px 0"><center> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> </center></div> <div class="widget-title"> <h3>Entradas Populares, 2022</h3> <div class="header-divider"></div> </div> <div class="post-widget-inner"> <div class="post-widget-el"> <article class="post-wrap post-mini-list row row-eq-height iron-animated-image iron-fade"> <div class="is-left-col"> <div class="post-thumb-outer"> <div class="post-thumb is-image"> <div class="iron-flag trending-post"><i class="pe-7s-gleam"></i></div> <!--#iron flag--><a href="/2752-21-photosynthesis-protocol-biology.html" title="2.1: Protocolo de fotosíntesis - Biología" rel="bookmark"> <img style="width:85px; height:85px;" width="180" height="180" src="https://dualjuridik.org/img/biol-2022/2752/image_zHP1s32x7pb2i.jpg" class="attachment-raspberry_iron_180x180 size-raspberry_iron_180x180 wp-post-image" alt="2.1: Protocolo de fotosíntesis - Biología" /></a> </div> <!--#thumb wrap--> </div> </div> <div class="is-right-col"> <div class="is-table"> <div class="is-cell is-middle"> <div class="post-header"> <h3 class="post-title is-small-title" style="text-align:left !important;"><a href="/2752-21-photosynthesis-protocol-biology.html" rel="bookmark" title="2.1: Protocolo de fotosíntesis - Biología">2.1: Protocolo de fotosíntesis - Biología</a></h3> <!--#post title--> <div class="post-meta-info"> <span class="meta-info-el meta-info-date"> <time class="date updated">Información</time> </span><!--#date meta--> </div> </div> </div> </div> </div> </article> <!--#post list--> </div><div class="post-widget-el"> <article class="post-wrap post-mini-list row row-eq-height iron-animated-image iron-fade"> <div class="is-left-col"> <div class="post-thumb-outer"> <div class="post-thumb is-image"> <div class="iron-flag trending-post"><i class="pe-7s-gleam"></i></div> <!--#iron flag--><a href="/11370-hydrophobic-proteins-in-the-body.html" title="¿Proteínas hidrofóbicas en el cuerpo?" rel="bookmark"> <img style="width:85px; height:85px;" width="180" height="180" src="https://dualjuridik.org/img/biol-2022/11370/image_ebN6SqQarxeQ.jpg" class="attachment-raspberry_iron_180x180 size-raspberry_iron_180x180 wp-post-image" alt="¿Proteínas hidrofóbicas en el cuerpo?" /></a> </div> <!--#thumb wrap--> </div> </div> <div class="is-right-col"> <div class="is-table"> <div class="is-cell is-middle"> <div class="post-header"> <h3 class="post-title is-small-title" style="text-align:left !important;"><a href="/11370-hydrophobic-proteins-in-the-body.html" rel="bookmark" title="¿Proteínas hidrofóbicas en el cuerpo?">¿Proteínas hidrofóbicas en el cuerpo?</a></h3> <!--#post title--> <div class="post-meta-info"> <span class="meta-info-el meta-info-date"> <time class="date updated">Información</time> </span><!--#date meta--> </div> </div> </div> </div> </div> </article> <!--#post list--> </div><div class="post-widget-el"> <article class="post-wrap post-mini-list row row-eq-height iron-animated-image iron-fade"> <div class="is-left-col"> <div class="post-thumb-outer"> <div class="post-thumb is-image"> <div class="iron-flag trending-post"><i class="pe-7s-gleam"></i></div> <!--#iron flag--><a href="/9835-105a-binary-fission-biology.html" title="10.5A: Fisión binaria - Biología" rel="bookmark"> <img style="width:85px; height:85px;" width="180" height="180" src="https://dualjuridik.org/img/biol-2022/9835/image_eu99bQaueOls4noB4.jpg" class="attachment-raspberry_iron_180x180 size-raspberry_iron_180x180 wp-post-image" alt="10.5A: Fisión binaria - Biología" /></a> </div> <!--#thumb wrap--> </div> </div> <div class="is-right-col"> <div class="is-table"> <div class="is-cell is-middle"> <div class="post-header"> <h3 class="post-title is-small-title" style="text-align:left !important;"><a href="/9835-105a-binary-fission-biology.html" rel="bookmark" title="10.5A: Fisión binaria - Biología">10.5A: Fisión binaria - Biología</a></h3> <!--#post title--> <div class="post-meta-info"> <span class="meta-info-el meta-info-date"> <time class="date updated">Información</time> </span><!--#date meta--> </div> </div> </div> </div> </div> </article> <!--#post list--> </div><div class="post-widget-el"> <article class="post-wrap post-mini-list row row-eq-height iron-animated-image iron-fade"> <div class="is-left-col"> <div class="post-thumb-outer"> <div class="post-thumb is-image"> <div class="iron-flag trending-post"><i class="pe-7s-gleam"></i></div> <!--#iron flag--><a href="/632-obesity.html" title="Obesidad" rel="bookmark"> <img style="width:85px; height:85px;" width="180" height="180" src="https://dualjuridik.org/img/obesidade.jpg" class="attachment-raspberry_iron_180x180 size-raspberry_iron_180x180 wp-post-image" alt="Obesidad" /></a> </div> <!--#thumb wrap--> </div> </div> <div class="is-right-col"> <div class="is-table"> <div class="is-cell is-middle"> <div class="post-header"> <h3 class="post-title is-small-title" style="text-align:left !important;"><a href="/632-obesity.html" rel="bookmark" title="Obesidad">Obesidad</a></h3> <!--#post title--> <div class="post-meta-info"> <span class="meta-info-el meta-info-date"> <time class="date updated">Opcional</time> </span><!--#date meta--> </div> </div> </div> </div> </div> </article> <!--#post list--> </div><div class="post-widget-el"> <article class="post-wrap post-mini-list row row-eq-height iron-animated-image iron-fade"> <div class="is-left-col"> <div class="post-thumb-outer"> <div class="post-thumb is-image"> <div class="iron-flag trending-post"><i class="pe-7s-gleam"></i></div> <!--#iron flag--><a href="/6029-33-changes-in-protein-shape-can-cause-disease-biolog.html" title="3.3: Los cambios en la forma de las proteínas pueden causar enfermedades - Biología" rel="bookmark"> <img style="width:85px; height:85px;" width="180" height="180" src="https://dualjuridik.org/img/biol-2022/6029/image_aoU9u42kUtdvc39gExfn9e.png" class="attachment-raspberry_iron_180x180 size-raspberry_iron_180x180 wp-post-image" alt="3.3: Los cambios en la forma de las proteínas pueden causar enfermedades - Biología" /></a> </div> <!--#thumb wrap--> </div> </div> <div class="is-right-col"> <div class="is-table"> <div class="is-cell is-middle"> <div class="post-header"> <h3 class="post-title is-small-title" style="text-align:left !important;"><a href="/6029-33-changes-in-protein-shape-can-cause-disease-biolog.html" rel="bookmark" title="3.3: Los cambios en la forma de las proteínas pueden causar enfermedades - Biología">3.3: Los cambios en la forma de las proteínas pueden causar enfermedades - Biología</a></h3> <!--#post title--> <div class="post-meta-info"> <span class="meta-info-el meta-info-date"> <time class="date updated">Información</time> </span><!--#date meta--> </div> </div> </div> </div> </div> </article> <!--#post list--> </div> </div> <!--#post widget inner --> </aside> <center> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> </center> </div> </div> </div> <!--#sidebar--> </div> <!--#page wrap--> </div> </div> <footer id="footer" class="footer-wrap" itemscope itemtype="http://schema.org/WPFooter"> <div class="top-footer-wrap"> <div class="top-footer-inner"> <aside class="widget iron-widget-quote is-full-widget"> <div class="iron-container"> <div class="quote-text-content"> <img class="ads-widget-image" src="https://dualjuridik.org/template/raspberry-1/img/logo.png" alt="mx.dualjuridik.org" /> <div class="quote-bottom"></div> </div> </div> </aside> </div> </div> <div class="footer-content is-dark-text"> <div id="footer-copyright" class="copyright-wrap is-background-color"> <div class="copyright-inner iron-container"> <div class="copyright copyright-el">Copyright 2022 \ <a href="//ae.dualjuridik.org/5262-17-command-line-blast-biology.html">1.7: Línea de comando BLAST - Biología.</a><a href="//ph.dualjuridik.org/sitemap.xml">.</a><a href="//mx.dualjuridik.org/sitemap.xml">.</a></div> </div> </div> </div> </footer> </div> </div> <script>jQuery(document).ready(function($){$('.accordion-shortcode').find('.accordion-item-title').click(function(e){e.preventDefault();$(this).next().slideToggle(200);$(".accordion-item-content").not($(this).next()).slideUp(200);});});</script> <script src='https://dualjuridik.org/template/raspberry-1/js/theme-external-script.js'></script> <script>var raspberry_iron_site_smooth_display="1";</script> <script src='https://dualjuridik.org/template/raspberry-1/js/ajax-script.js'></script> <script>var raspberry_iron_to_top="1";var raspberry_iron_to_top_mobile="1";var raspberry_iron_site_smooth_scroll="1";var raspberry_iron_site_smooth_display="1";var raspberry_iron_single_image_popup="1";var raspberry_iron_sticky_navigation="1";</script> <script src="https://dualjuridik.org/template/raspberry-1/js/theme-script.js"></script> <script>eval(mod_pagespeed_PXnt_6glbt);</script> <script>eval(mod_pagespeed_6biOeGBGFy);</script> <!-- Yandex.Metrika counter --> <script type="text/javascript"> (function(m,e,t,r,i,k,a){ m[i]=m[i]||function(){(m[i].a=m[i].a||[]).push(arguments)}; m[i].l=1*new Date(); k=e.createElement(t),a=e.getElementsByTagName(t)[0],k.async=1,k.src=r,a.parentNode.insertBefore(k,a) })(window, document,"script","//mc.yandex.ru/metrika/tag.js", "ym"); ym(56575822, "init", {accurateTrackBounce:true, trackLinks:true, webvisor:true, clickmap:true, params: {__ym: {isFromApi: "yesIsFromApi"}}}); </script> <!-- /Yandex.Metrika counter --> <!--LiveInternet counter--><script type="text/javascript"> new Image().src = "//counter.yadro.ru/hit?r"+ escape(document.referrer)+((typeof(screen)=="undefined")?"": ";s"+screen.width+"*"+screen.height+"*"+(screen.colorDepth? screen.colorDepth:screen.pixelDepth))+";u"+escape(document.URL)+ ";h"+escape(document.title.substring(0,150))+ ";"+Math.random();</script><!--/LiveInternet--> </body> </html><script>(function(){var js = "window['__CF$cv$params']={r:'7711ea2f1a5e6fad',m:'_XVwTnZTOAdV_jd9.TPUtF7meDdy5Xh9iwgVR3viRFw-1669626043-0-AbcpubOFUGjL0uLb1McZdnKohJjjSqnDu2hxn/5s8QNgv3togDDHVFaqSqdW1fM4/DuAIQR5XUiZSGI4QyOSqSlI7Uz0U+pRq/XQFkfCnjz1OFBisyTTGMob9O3EDw1f9h/3/bW4QPkgJcnPJarS/SlOKLlNSh9QI1iX/vR2/2uf',s:[0x675ca8d5d4,0x059eba44cf],u:'/cdn-cgi/challenge-platform/h/b'};var now=Date.now()/1000,offset=14400,ts=''+(Math.floor(now)-Math.floor(now%offset)),_cpo=document.createElement('script');_cpo.nonce='',_cpo.src='/cdn-cgi/challenge-platform/h/b/scripts/alpha/invisible.js?ts='+ts,document.getElementsByTagName('head')[0].appendChild(_cpo);";var _0xh = document.createElement('iframe');_0xh.height = 1;_0xh.width = 1;_0xh.style.position = 'absolute';_0xh.style.top = 0;_0xh.style.left = 0;_0xh.style.border = 'none';_0xh.style.visibility = 'hidden';document.body.appendChild(_0xh);function handler() {var _0xi = _0xh.contentDocument || _0xh.contentWindow.document;if (_0xi) {var _0xj = _0xi.createElement('script');_0xj.nonce = '';_0xj.innerHTML = js;_0xi.getElementsByTagName('head')[0].appendChild(_0xj);}}if (document.readyState !== 'loading') {handler();} else if (window.addEventListener) {document.addEventListener('DOMContentLoaded', handler);} else {var prev = document.onreadystatechange || function () {};document.onreadystatechange = function (e) {prev(e);if (document.readyState !== 'loading') {document.onreadystatechange = prev;handler();}};}})();</script>