Información

Huella genómica digital para ENCODE

Huella genómica digital para ENCODE


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Estoy leyendo los artículos de ENCODE Nature, y uno de los artículos mencionados es "Mapeo global de interacciones proteína-ADN in vivo por medio digital" por Hesselberth et al.[1].

La huella genómica es una variante masivamente paralela de la detección de hipersensibilidad a la ADNasa I, que creo que tengo un buen manejo, pero no entiendo este párrafo desde el principio de los resultados (la parte problemática está en negrita):

Para visualizar la ocupación de proteínas reguladoras en todo el genoma de Saccharomyces cerevisiae, acoplamos la digestión con ADNasa I de los núcleos de levadura con una secuenciación de ADN masivamente paralela para crear un mapa denso de todo el genoma de la accesibilidad de la plantilla de ADN a nivel de nucleótidos. Analizamos una única condición ambiental bien estudiada, células de levadura tratadas con el factor α de feromona, que sincroniza las células en la fase G1 del ciclo celular. Aislamos núcleos de levadura y los tratamos con una concentración de ADNasa I suficiente para liberar fragmentos de ADN cortos (<300 pb) mientras se mantenía la mayor parte de la muestra en especies de alto peso molecular (figura complementaria 1). Estos pequeños fragmentos se derivan de dos "impactos" de ADNasa I en estrecha proximidad y, por lo tanto, su aislamiento minimiza la contaminación por los extremos de un solo fragmento derivados del cizallamiento aleatorio. Debido a que cada extremo de los fragmentos de 'doble golpe' de DNasa I liberados representa un sitio de escisión de DNasa I in vivo, la secuencia y, por lo tanto, la ubicación genómica de estos sitios puede determinarse fácilmente mediante secuenciación (métodos complementarios).

Hay una referencia a otro artículo de Sabo et al.[2] sobre los ensayos de ADNasa a escala del genoma usando microarrays en ese párrafo que estoy leyendo, pero si alguien entiende bien la biología, realmente agradecería una respuesta.

  1. Hesselberth JR, Chen X, Zhang Z, Sabo PJ, Sandstrom R, Reynolds AP, Thurman RE, Neph S, Kuehn MS, Noble WS, Fields S, Stamatoyannopoulos JA. 2009. Mapeo global de interacciones proteína-ADN in vivo por huella genómica digital. Nature Methods 6 (4): 283-289, doi: 10.1038 / nmeth.1313.
  2. Sabo PJ, Kuehn MS, Thurman R, Johnson BE, Johnson EM, Cao H, Yu M, Rosenzweig E, Goldy J, Haydock A, Weaver M, Shafer A, Lee K, Neri F, Humbert R, Singer MA, Richmond TA , Dorschner MO, McArthur M, Hawrylycz M, Green RD, Navas PA, Noble WS, Stamatoyannopoulos JA. 2006. Mapeo a escala del genoma de la sensibilidad a la ADNasa I in vivo utilizando microarrays de ADN en mosaico. Nature Methods 3: 511-518, doi: 10.1038 / nmeth890.

Después de leer el artículo citado, creo que la lógica es la siguiente: ADNasa, crearé extremos libres en sitios accesibles del genoma. Sin embargo, el cizallamiento durante el posterior aislamiento del ADN también es una fuente de extremos libres, y estos representan ruido en el análisis. Tienes que poner mucha energía para cortar el ADN en fragmentos muy pequeños, por lo que infiero que es muy poco probable que un corte leve durante el aislamiento del ADN cree un nuevo extremo que esté cerca de un extremo generado por DNasa I existente. Por lo tanto, en las condiciones utilizadas, es mucho más probable que cualquier fragmento pequeño haya sido generado por dos aciertos de ADNasa I estrechamente espaciados. Al limitar el análisis a estos fragmentos, se minimiza el ruido de cizallamiento.

Ahora que he escrito esta respuesta, no parece mucho más que una reescritura de la oración envalentonada, pero espero que sea útil de todos modos.


Huella genómica digital para ENCODE - Biología

El Consorcio Encyclopedia of DNA Elements (ENCODE) es una colaboración internacional de grupos de investigación financiados por el Instituto Nacional de Investigación del Genoma Humano (NHGRI). El objetivo de ENCODE es crear una lista completa de elementos funcionales del genoma humano, incluidos los elementos que actúan a nivel de proteínas y ARN, y los elementos reguladores que controlan las células y las circunstancias en las que un gen está activo.

    para pistas visualizables y archivos descargables de archivos de datos en UCSC Genome Browser (datos ENCODE marcados con el logotipo NHGRI) con UCSC Table Browser y otras herramientas UCSC Genome Bioinformatics

Para buscar datos ENCODE relacionados con su área de interés y configurar una vista de navegador, use la matriz de experimentos UCSC o la herramienta de búsqueda de pistas (Avanzado características). Los enlaces Experiment List (Human) y Experiment List (Mouse) proporcionan listas completas de datos ENCODE que se publican o están en preparación. En http://genome-preview.ucsc.edu se proporciona acceso temprano a los datos ENCODE de la versión preliminar. Si desea recibir notificaciones de las publicaciones de datos de ENCODE y noticias relacionadas por correo electrónico, suscríbase a la lista de correo de encode -nouncer. Para obtener más información sobre cómo acceder a estos datos, consulte el tutorial gratuito en línea OpenHelix ENCODE.

Todos los datos de ENCODE están disponibles gratuitamente para su descarga y análisis. Sin embargo, antes de publicar una investigación que utilice datos ENCODE, lea la Política de publicación de datos ENCODE, que impone algunas restricciones sobre el uso de la publicación de datos durante los nueve meses posteriores a la publicación de datos. Lea más sobre los datos ENCODE en UCSC.

Los resultados del proyecto ENCODE se publicaron hoy en un conjunto coordinado de 30 artículos publicados en varias revistas. Estas publicaciones son el resultado de un análisis integrador entre consorcios, que cubre más de 4 millones de regiones reguladoras en el genoma humano mapeado como parte de ENCODE. El conjunto de publicaciones coordinado incluye un artículo integrador principal y otros cinco artículos en la revista. Naturaleza 18 artículos en Investigación del genoma y seis artículos en Biología del genoma. Los datos de ENCODE son tan complejos que las tres revistas han desarrollado una forma pionera de presentar la información en una forma integrada que denominan "hilos". Dado que los mismos temas se abordaron de diferentes maneras en diferentes artículos, Naturaleza El sitio web de ENCODE se desarrolló para permitir a los lectores seguir un tema a través de todos los artículos del conjunto de publicaciones de ENCODE. Además de estas publicaciones, se están publicando seis artículos de revisión en el Revista de química biológicay otros periódicos afiliados en Ciencias, Celday otras revistas. La nueva página de Análisis Integrativo de este portal proporciona enlaces y material descriptivo para estas publicaciones y recursos de análisis relacionados. 28 de agosto de 2012 - Publicaciones de datos de ENCODE: actualizaciones de UW DNaseI DGF, Duke DNaseI HS, Broad Histone, GIS RNA PET, SYDH TFBS, UTA TFBS

Modificaciones de histonas por ChIP-seq de ENCODE / Broad Institute (versión 3): agrega 83 nuevos experimentos que incluyen 6 nuevas líneas celulares y 25 nuevos anticuerpos.

Localización subcelular de ARN mediante secuenciación diTag de extremos emparejados de ENCODE / GIS (versión 2): agrega datos para 4 líneas celulares adicionales (carcinoma de pulmón A549, neuroblastoma SK-N-SH, fibroblasto de pulmón IMR90 y carcinoma de mama MCF-7) .

Sitios de unión del factor de transcripción por ChIP-seq de ENCODE / Stanford / Yale / USC / Harvard (versión 3): agrega 37 nuevos experimentos que incluyen 1 nueva línea celular (neuroblastoma SK-N-SH) y 7 nuevos anticuerpos.

21 de agosto de 2012 - Publicaciones de datos de Mouse ENCODE: DNaseI HS de Penn State, Histone ChIP-seq de Penn State (Rel 2) y Stanford / Yale (Rel 2), TFBS ChIP-seq de Stanford / Yale (Rel 4) y Penn State (Rel 2). Lee mas.

9 de agosto de 2012 - Listas de experimentos actualizadas: El ENCODE DCC ha actualizado las hojas de cálculo que detallan los envíos de ENCODE para reflejar el estado de los datos en el marco de tiempo de ENCODE Y5Q3 (1 de julio). Lee mas.

Los datos de secuencia y anotación que se muestran en el navegador del genoma están disponibles gratuitamente para uso académico, sin fines de lucro y personal con las siguientes condiciones:


Introducción

El mapeo de la ocupación de las proteínas asociadas al ADN, incluidos los factores de transcripción (TF) y las histonas, es fundamental para determinar los circuitos reguladores celulares. La secuenciación de ChIP convencional (ChIP-seq) se basa en la reticulación de las proteínas diana con el ADN y la fragmentación física de la cromatina [1]. En la práctica, el enmascaramiento del epítopo y la insolubilidad de los complejos proteicos pueden interferir con el uso exitoso de ChIP-seq convencionales para algunas proteínas asociadas a la cromatina [2, 3, 4]. CUT & ampRUN es un método basado en endonucleasas nativas descrito recientemente basado en la unión de un anticuerpo a una proteína asociada a cromatina in situ y el reclutamiento de una fusión de proteína A-nucleasa microcócica (pA-MN) al anticuerpo para escindir eficientemente el ADN que rodea la unión. sitios [5]. El método CUT & ampRUN se ha aplicado con éxito a una variedad de TF en levaduras [5, 6] y células de mamíferos [7, 8]. El procedimiento logra un mapeo de mayor resolución de la unión a proteínas, ya que la digestión con endonucleasas genera fragmentos más cortos que la fragmentación física. En nuestra experiencia, las herramientas existentes para analizar dichos datos resultaron inadecuadas debido a la falta de un proceso computacional de extremo a extremo diseñado específicamente para esta tecnología. Por lo tanto, hemos desarrollado una nueva canalización, denominada CUT & ampRUNTools, que agiliza el procesamiento, uso y visualización de los datos generados por CUT & ampRUN (Fig. 1a).

a Esquema de CUT & ampRUN. El pA-MN se recluta al anticuerpo unido a TF y se escinde alrededor del sitio de unión de TF, liberando fragmentos de ADN para la secuenciación. Los pasos posteriores requieren una canalización computacional especialmente diseñada para extraer la máxima información de los datos. B Descripción general de CUT & ampRUNTools. Paso 1: las lecturas sin procesar del extremo emparejado de entrada se alinean con el genoma de referencia con especial cuidado para el recorte y la alineación de lecturas cortas. Paso 2: los picos se llaman en función de la acumulación de fragmentos. Se utiliza una ventana fija alrededor de la cima de cada pico para realizar la búsqueda de motivos de novo. Paso 3: la matriz de corte se calcula para cada motivo de interés y se utiliza para generar los tres resultados: (i) huella del motivo, (ii) identificación del sitio de unión directa y (iii) visualización. C La salida de CUT & ampRUNTools en la región chr3: 98302650-950 como ejemplo


Referencias

Tullius, T.D. Estudios físicos de complejos proteína-ADN por huella. Annu. Rev. Biophys. Biophys. Chem. 18, 213–237 (1989).

Church, G.M., Ephrussi, A., Gilbert, W. & amp Tonegawa, S. Contactos específicos de tipo celular para potenciadores de inmunoglobulina en núcleos. Naturaleza 313, 798–801 (1985).

Jackson, P.D. & amp Felsenfeld, G. Un método para mapear interacciones proteína-ADN intranucleares y su aplicación a un sitio hipersensible a nucleasa. Proc. Natl. Acad. Sci. Estados Unidos 82, 2296–2300 (1985).

Hesselberth, J.R. et al. Mapeo global de interacciones proteína-ADN en vivo por huella genómica digital. Nat. Métodos 6, 283–289 (2009).

Thurman, R.E. et al. El paisaje accesible de la cromatina del genoma humano. Naturaleza 489, 75–82 (2012).

Baek, S., Sung, M.H. & amp Hager, G.L. Análisis cuantitativo de la remodelación de la cromatina en todo el genoma. Methods Mol. Biol. 833, 433–441 (2012).

Morris, S.A. y col. Los sistemas de remodelación de cromatina superpuestos colaboran en todo el genoma en transiciones dinámicas de cromatina. Nat. Struct. Mol. Biol. 21, 73–81 (2014).

John, S. y col. La accesibilidad a la cromatina predetermina los patrones de unión al receptor de glucocorticoides. Nat. Gineta. 43, 264–268 (2011).

Sung, M.H., Guertin, M.J., Baek, S. & amp Hager, G.L. Las firmas de huellas de ADNasa están dictadas por la dinámica de los factores y la secuencia de ADN. Mol. Celda 56, 275–285 (2014).

Él, H.H. et al. El protocolo refinado de DNasa-seq y el análisis de datos revelan un sesgo intrínseco en la identificación de la huella del factor de transcripción. Nat. Métodos 11, 73–78 (2014).

Pique-Regi, R. et al. Inferencia precisa de la unión del factor de transcripción a partir de la secuencia de ADN y los datos de accesibilidad a la cromatina. Genome Res. 21, 447–455 (2011).

Neph, S. et al. Un léxico regulador humano expansivo codificado en huellas de factores de transcripción. Naturaleza 489, 83–90 (2012).

Mercer, T.R. et al. El transcriptoma mitocondrial humano. Celda 146, 645–658 (2011).

Boyle, A.P. et al. Todo el genoma de alta resolución en vivo huella de diversos factores de transcripción en células humanas. Genome Res. 21, 456–464 (2011).

Cuellar-Partida, G. et al. A priori epigenéticos para identificar sitios de unión de factores de transcripción activos. Bioinformática 28, 56–62 (2012).

Luo, K. y Hartemink, A.J. Uso de datos de digestión de DNasa para identificar con precisión los sitios de unión del factor de transcripción. Pac. Symp. Biocomput. 2013, 80–91 (2013).

Gusmao, E.G., Dieterich, C., Zenke, M. y Costa, I.G. Detección de sitios de unión de factores de transcripción activos con la combinación de hipersensibilidad a ADNasa y modificaciones de histonas. Bioinformática 30, 3143–3151 (2014).

Sherwood, R.I. et al. Descubrimiento de factores de transcripción pioneros direccionales y no direccionales mediante el modelado de la magnitud y forma del perfil de DNasa. Nat. Biotechnol. 32, 171–178 (2014).

Piper, J. y col. Wellington: un método novedoso para la identificación precisa de huellas genómicas digitales a partir de datos de DNase-seq. Ácidos nucleicos Res. 41, e201 (2013).

Lazarovici, A. et al. Sondear la forma del ADN y el estado de metilación a escala genómica con DNasa I. Proc. Natl. Acad. Sci. Estados Unidos 110, 6376–6381 (2013).

Yardimci, G.G., Frank, C.L., Crawford, G.E. & amp Ohler, U. El modelado explícito de sesgo de secuencia de DNasa permite la detección de huella de factor de transcripción de alta resolución. Ácidos nucleicos Res. 42, 11865–11878 (2014).

Grøntved, L. et al. Mapeo rápido a escala del genoma de la accesibilidad de la cromatina en el tejido. Epigenética cromatina 5, 10 (2012).

Nakahashi, H. y col. Un mapa de todo el genoma de la multivalencia CTCF redefine el código CTCF. Rep. Celular 3, 1678–1689 (2013).

Poorey, K. et al. Medición de la dinámica de interacción de la cromatina en la segunda escala de tiempo en genes de copia única. Ciencias 342, 369–372 (2013).

Buenrostro, J.D. et al. La accesibilidad de la cromatina unicelular revela principios de variación reguladora. Naturaleza 523, 486–490 (2015).

Cusanovich, D.A. et al. Perfilado multiplex de una sola célula de la accesibilidad de la cromatina mediante indexación celular combinatoria. Ciencias 348, 910–914 (2015).

Voss, T.C. & amp Hager, G.L. Regulación dinámica de estados transcripcionales por cromatina y factores de transcripción. Nat. Rev. Genet. 15, 69–81 (2014).

Sung, M.H. y McNally, J.G. Imágenes de células vivas y biología de sistemas. Wiley Interdiscip. Rev. Syst. Biol. Medicina. 3, 167–182 (2011).

Hager, G.L., McNally, J.G. & amp Misteli, T. Dinámica de transcripción. Mol. Celda 35, 741–753 (2009).

Voss, T.C. et al. El intercambio dinámico en los elementos reguladores durante la remodelación de la cromatina es la base del mecanismo de carga asistida. Celda 146, 544–554 (2011).

Morisaki, T., Muller, W.G., Golob, N., Mazza, D. y McNally, J.G. Análisis de una sola molécula de la unión del factor de transcripción en los sitios de transcripción en células vivas. Nat. Comun. 5, 4456 (2014).

van Royen, M.E. et al. Los complejos de receptores de andrógenos sondean el ADN en busca de secuencias de reconocimiento mediante breves interacciones aleatorias. J. Cell Sci. 127, 1406–1416 (2014).

Groeneweg, F.L. et al. Cuantificación de la dinámica de unión al ADN del receptor de glucocorticoides mediante microscopía de molécula única y FRAP. Más uno 9, e90532 (2014).

Gebhardt, J.C. et al. Imágenes de una sola molécula del factor de transcripción que se une al ADN en células de mamíferos vivos. Nat. Métodos 10, 421–426 (2013).

Crocker, J. y col. Los grupos de sitios de unión de baja afinidad confieren especificidad de Hox y solidez reguladora. Celda 160, 191–203 (2015).

Chen, J. y col. Dinámica de una sola molécula de ensamblaje de potenciadores en células madre embrionarias. Celda 156, 1274–1285 (2014).

Afilado, Z.D. et al. El intercambio de estrógeno-receptor-alfa y la dinámica de la cromatina dependen del ligando y del dominio. J. Cell Sci. 119, 4101–4116 (2006).

Bosisio, D. et al. Un equilibrio hiperdinámico entre los dímeros nucleoplasmáticos y unidos al promotor controla la actividad génica dependiente de NF-kB. EMBO J. 25, 798–810 (2006).

McNally, J.G., Mueller, W.G., Walker, D., Wolford, R.G. & amp Hager, G.L. El receptor de glucocorticoides: intercambio rápido con sitios reguladores en células vivas. Ciencias 287, 1262–1265 (2000).

Stergachis, A.B. et al. Conservación de los circuitos que actúan en trans durante la evolución regulatoria de los mamíferos. Naturaleza 515, 365–370 (2014).

Neph, S. et al. Circuitos y dinámica de redes reguladoras de factores de transcripción humanos. Celda 150, 1274–1286 (2012).

Badis, G. y col. Diversidad y complejidad en el reconocimiento del ADN por factores de transcripción. Ciencias 324, 1720–1723 (2009).

Jolma, A. et al. Especificidades de unión al ADN de los factores de transcripción humanos. Celda 152, 327–339 (2013).

Weirauch, M.T. et al. Evaluación de métodos para modelar la especificidad de la secuencia de factores de transcripción. Nat. Biotechnol. 31, 126–134 (2013).

Buenrostro, J.D., Giresi, P.G., Zaba, L.C., Chang, H.Y. & amp Greenleaf, W.J. Transposición de la cromatina nativa para el perfil epigenómico rápido y sensible de la cromatina abierta, las proteínas de unión al ADN y la posición de los nucleosomas. Nat. Métodos 10, 1213–1218 (2013).

Gerstein, M.B. et al. Arquitectura de la red reguladora humana derivada de datos ENCODE. Naturaleza 489, 91–100 (2012).

Bailey, T.L. et al. MEME SUITE: herramientas para el descubrimiento y la búsqueda de motivos. Ácidos nucleicos Res. 37, W202 – W208 (2009).

Grant, C.E., Bailey, T.L. & amp Noble, W.S. FIMO: escaneo en busca de ocurrencias de un motivo dado. Bioinformática 27, 1017–1018 (2011).

Biddie, S.C. y col. El factor de transcripción AP1 potencia la accesibilidad a la cromatina y la unión al receptor de glucocorticoides. Mol. Celda 43, 145–155 (2011).

Lickwar, C.R., Mueller, F., Hanlon, S.E., McNally, J.G. & amp Lieb, J.D. La dinámica de unión de proteína-ADN en todo el genoma sugiere un embrague molecular para la función del factor de transcripción. Naturaleza 484, 251–255 (2012).

Malnou, C.E. et al. La heterodimerización con diferentes proteínas Jun controla la dinámica y distribución intranuclear de c-Fos. J. Biol. Chem. 285, 6552–6562 (2010).

Mayr, B.M., Guzman, E. & amp Montminy, M. Los dominios ricos en glutamina y región básica / cremallera de leucina (bZIP) estabilizan la unión de la proteína de unión a elementos de respuesta a AMPc (CREB) a la cromatina. J. Biol. Chem. 280, 15103–15110 (2005).

Guertin, M.J., Zhang, X., Coonrod, S.A. & amp Hager, G.L. La unión transitoria de ER y la redistribución de p300 apoyan un mecanismo de silenciamiento para genes reprimidos por E2. Mol. Endocrinol. 28, 1522–1533 (2014).

Grøntved, L. et al. Activación transcripcional por el receptor de la hormona tiroidea a través del reclutamiento del receptor dependiente de ligando y remodelación de la cromatina. Nat. Comun. 6, 7048 (2015).

Marcelli, M. y col. Cuantificar los efectos de los ligandos sobre la translocación nuclear del receptor de andrógenos, la dinámica intranuclear y la solubilidad. J. Cell. Biochem. 98, 770–788 (2006).

Yu, J. y col. Una red integrada de fusiones de genes de receptor de andrógenos, polycomb y TMPRSS2-ERG en la progresión del cáncer de próstata. Célula cancerosa 17, 443–454 (2010).

Tirard, M., Almeida, O.F., Hutzler, P., Melchior, F. y Michaelidis, T.M. La sumoilación y la actividad proteasómica determinan las propiedades de transactivación del receptor de mineralocorticoides. Mol. Celda. Endocrinol. 268, 20–29 (2007).

Le Billan, F. et al. Cistroma del receptor de mineralocorticoides activado por aldosterona en células renales humanas. FASEB J. 29, 3977–3989 (2015).


Afiliaciones

Departamento de Ciencias del Genoma, Universidad de Washington, Seattle, Washington, EE. UU.

Jeff Vierstra y John A Stamatoyannopoulos

Instituto Altius de Ciencias Biomédicas, Seattle, Washington, EE. UU.

Jeff Vierstra y John A Stamatoyannopoulos

División de Oncología, Departamento de Medicina, Universidad de Washington, Seattle, Washington, EE. UU.

John A. Stamatoyannopoulos

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

Autores correspondientes


ACCESO A LOS DATOS

Los datos producidos por los laboratorios afiliados al proyecto ENCODE se envían al DCC para su visualización y extracción de datos. Tras su lanzamiento, las nuevas pistas ENCODE se anuncian en la sección de Noticias de la página del portal ENCODE DCC y en la lista de correo de encode -nouncer (https://lists.soe.ucsc.edu/mailman/listinfo/encode-announce). Los datos de ENCODE están disponibles gratuitamente para el público según los términos de la política de divulgación de datos (http://genome.ucsc.edu/ENCODE/terms.html). La publicación de datos está restringida durante nueve meses después de la presentación inicial al DCC. Durante este tiempo, se anima a los investigadores interesados ​​a ponerse en contacto con los productores de datos para explorar posibles colaboraciones. Después de este período, los datos se pueden utilizar sin restricciones. La hoja de cálculo del estado de envío de datos (datos suplementarios S1) contiene la lista completa de experimentos ENCODE presentados al DCC en agosto de 2010.

Los datos del genoma completo ENCODE se intercalan entre las pistas de datos que no son ENCODE en el navegador del genoma. En agosto de 2010, estos datos estaban disponibles principalmente en el ensamblaje humano NCBI36 / hg18, pero se están asignando nuevos datos al ensamblaje GRCh37 / hg19. Cada tipo de datos de cada laboratorio se organiza en una pista compuesta, que puede contener múltiples subtrayectorias que representan condiciones experimentales como el tipo de célula y otros atributos específicos del ensayo. Si una pista tiene muchas subpistas, de forma predeterminada solo se mostrarán las subpistas seleccionadas. La visualización de la subtrayectoria se puede configurar a través de las páginas de configuración de la vía. Puede encontrar más información sobre el uso del navegador y la configuración de la pista ENCODE en la guía del usuario del navegador Genome: http://genome.ucsc.edu/goldenPath/help/hgTracksHelp.html.

Todos los datos enviados al DCC se mantienen en su estado original en un servidor de archivos accesible a través de FTP y HTTP. Los archivos descargables se organizan mediante el envío de laboratorio, con cada combinación de laboratorio / tipo de datos en su propio directorio. Cada archivo enviado se puede asociar con sus metadatos, ya sea visualmente al ver el archivo de índice con un navegador web o mediante programación utilizando el files.txt archivo presente en cada directorio de descarga. Se puede acceder al área de descarga a través de los enlaces de descarga en las páginas de detalles de la pista, o directamente en http://genome.ucsc.edu/ENCODE/downloads.html. Los datos de ENCODE también se están accediendo en NCBI GEO (http://www.ncbi.nlm.nih.gov/geo/info/ENCODE.html).

La mayoría de los datos ENCODE se representan en uno de tres tipos de archivos diferentes, todos los cuales se pueden cargar como pistas personalizadas: BAM (10) para almacenamiento de alineación, bigWig (11) para gráficos de señales y archivos BED extendidos que contienen datos de picos. Los formatos de datos bigWig y BAM no tienen pérdidas, son accesibles aleatoriamente y están indexados para que solo se lean del archivo los datos necesarios para la vista actual, que puede ser local o acceder a través de Internet (http: //genome.ucsc. edu / FAQ / FAQformat).

Para los usuarios que investigan el gusano ( Caenorhabditis elegans ) y mosca de la fruta ( Drosophila melanogaster ) organismos modelo, recomendamos encarecidamente los datos del proyecto modENCODE (http://www.modencode.org/) (12). Para explorar más datos sobre la variación genómica humana, recomendamos el Proyecto 1000 Genomas (http://www.1000genomes.org/) (13).

Para proporcionar información adicional y capacitación sobre el uso del navegador Genome, incluido el acceso y el uso de datos ENCODE, el DCC ha firmado un contrato con OpenHelix (http://www.openhelix.com/). Ofrecen sesiones de formación en el lugar y en varias reuniones mundiales de gran asistencia durante todo el año, así como tutoriales en línea y materiales de referencia.


Interpretación de la salida de Wellington y # 8217s¶

Explore la carpeta que creó anteriormente (K562_footprints) y notará tres cosas.

wgEncodeUwDgfK562Aln.bam.K562.DHSs.bed.WellingtonFootprints.FDR.0.01.bed contiene las huellas en el FDR de 0.01; este es un buen lugar para comenzar para sus huellas. Lo que está sucediendo aquí es que los datos para cada DHS se están aleatorizando, y el límite del valor p para cada DHS se eleva desde la línea de base de -fdrlimit de acuerdo con la frecuencia con la que los datos aleatorios generan huellas. Si no está satisfecho con las huellas aquí (es decir, parecen demasiado estrictas), no dude en mirar los límites del valor p (ver más abajo) o volver a ejecutar con diferentes parámetros, como un -fdrlimit menos estricto (ver arriba).

wgEncodeUwDgfK562Aln.bam.K562.DHSs.bed.WellingtonFootprints.wig contiene los puntajes de huella sin procesar; eche un vistazo en IGV (usted & # 8217ll necesitará convertir a una pista bigWig usando UCSC & # 8217s wigToBigWig tool si ha usado todas las DHSs)

p valores de corte contienen las huellas en diferentes niveles de rigurosidad; algunas personas prefieren este enfoque al enfoque FDR, por lo que se guardan aquí.


Resultados

La reticulación leve antes de DNase-seq conserva la accesibilidad de la cromatina y genera huellas diferenciales

Buscamos evaluar sistemáticamente los efectos de varios procedimientos de entrecruzamiento en las huellas genómicas de TF dinámicos en el mismo material de cromatina. Para una fuente fija de cromatina, elegimos un estado celular en el que numerosos TF interactúan directamente con la cromatina en una cascada de acciones reguladoras de genes. Dado que la muestra de cromatina se prepara a partir de una población celular que contiene instantáneas de estas interacciones dinámicas, razonamos que esta sería una plataforma rica para evaluar los cambios en la profundidad de la huella de muchos TF simultáneamente. Con este fin, se utilizaron células RAW264.7 similares a macrófagos de ratón inmortalizadas, donde muchos TF dinámicos, incluidos NF-κB y AP-1, se activan en respuesta a productos bacterianos como el lipopolisacárido (LPS). Este contexto celular permite que un gran número de TF ocupen la cromatina, lo que proporciona una plataforma ideal para evaluar las características de la huella de TF. Elegimos este sistema celular también debido a la rica información sobre las redes reguladoras de TF que los nuevos datos ayudarán a descubrir en un tipo de célula inmunitaria innata fisiológicamente importante. Las células RAW264.7 tienen perfiles de cromatina que son similares a los de los macrófagos primarios (datos no mostrados) [24], lo que permite el descubrimiento de mecanismos reguladores de genes funcionalmente relevantes [13, 18, 19, 35].

Con el mismo material de cromatina de RAW264.7 estimulado con LPS, variamos la duración y la concentración del agente de reticulación formaldehído para determinar los parámetros de reticulación que pueden afectar las características de huella de los TF dinámicos (Fig. 1). Basándonos en informes anteriores sobre el efecto dominante de la duración del entrecruzamiento sobre la concentración, nos centramos en variar la duración del entrecruzamiento del formaldehído. Se probó una concentración de formaldehído más baja de 0,1% con varias duraciones de entrecruzamiento, porque un estudio de cinética de entrecruzamiento [27] y nuestro estudio piloto indicaron que el 1% es una concentración saturante para el entrecruzamiento y puede interferir potencialmente con las reacciones de nucleasa.

Hemos realizado la DNasa-seq modificada, denominada cross-link (XL) -DNase-seq y generado un panel de bibliotecas de secuenciación. Se confirmaron el enriquecimiento, la complejidad y la calidad de cada biblioteca, y todas las bibliotecas se sometieron a secuenciación de lectura de extremo emparejado ultraprofunda (archivo adicional 1: Tabla S1). Primero verificamos que el perfil de accesibilidad de la cromatina se genera independientemente del procedimiento de reticulación suave, como se observa por la reproducibilidad de la densidad de fragmentos de ADNasa-seq en muestras de diversas condiciones de reticulación (Fig. 1b, c). Este fue un primer punto de control importante, porque el entrecruzamiento excesivo puede inducir la captura de demasiados factores no específicos en la cromatina [2] y obstaculizar el muestreo de cromatina por la nucleasa (DNasa). La generación de un pico de secuencia de ADNasa se basa en la capacidad de la enzima para acceder al sitio hipersensible preferentemente en relación con la región flanqueante. Nuestro procedimiento de entrecruzamiento fue probablemente lo suficientemente suave como para permitir un muestreo suficientemente diferencial de cromatina que se refleja en los perfiles de accesibilidad bien conservados (Fig. 1b, c).

El número total de huellas putativas dependió del procedimiento de reticulación (Figs. 1d, 2a). Si bien el número exacto de huellas detectadas difiere entre los resultados de los diferentes métodos para corregir el sesgo de ADNasa (dímeros, tetrámeros, etc.), el orden de clasificación de varias muestras de entrecruzamiento fue invariante. Las huellas de 0,1% 30 s XL-DNase-seq produjeron el mayor conjunto de huellas, mientras que la DNasa-seq nativa produjo el menor número de huellas en ambos conjuntos de réplicas biológicas. La reticulación generalmente conservó las huellas observadas en la DNasa-seq nativa y reveló huellas adicionales (archivo adicional 2: Fig. S2A). Dado que el número de huellas puede cambiar como resultado neto de la detección y la falta de huellas verdaderas, se puede obtener más información examinando las huellas de TF específicas frente a un conjunto de sitios de unión conocidos. Debido a que es difícil asignar la mayoría de las huellas a TF específicos basándose puramente en motivos de secuencia de ADN [33], los análisis posteriores se centraron en motivos y huellas de TF bien caracterizados en los sitios genómicos de sus ocurrencias. Las diversas muestras de XL-DNase-seq no solo generaron diferentes números de huellas, sino que la fuerza y ​​la detectabilidad de las huellas también dependieron del procedimiento de entrecruzamiento (Fig. 2b, archivo adicional 2: Fig. S2).

Número total de huellas detectadas en las condiciones de reticulación. a El número total de huellas putativas de FDR 1% llamadas por DNase2TF se promedió en cinco rondas de submuestreo. Se realizó un submuestreo de lecturas para mantener el mismo número de lecturas mapeadas de forma única en todas las condiciones para una comparación justa (ver “Métodos”). B Comparación de la puntuación z de la huella en las condiciones en los sitios con motivos CTCF en cromatina abierta. Ver también archivo adicional 2: Fig. S2

XL-DNase-seq captura más huellas de TF con una precisión mejorada

Analizamos los efectos de la reticulación en la huella de NF-κB / RelA, un TF que se sabe que tiene un tiempo de residencia de unión de ADN corto sobre elementos de ADN afines [3]. Evaluamos las profundidades de su huella en sitios de motivos κB individuales a través de la cromatina abierta en macrófagos activados por LPS, utilizando picos de RelA ChIP-seq que coinciden con el estado celular como estándar de oro para la unión de TF. Se realizó un análisis de la Característica del Operador del Receptor (ROC) para cuantificar la predictibilidad de las huellas putativas de cada recuento de corte de la secuencia de ADNasa de enlace cruzado (Fig. 3a). La comparación estadística de las curvas ROC reveló que las huellas de NF-κB obtenidas a partir de la reticulación de 30 s de formaldehído al 0,1% (curva verde) eran más predictivas de la unión real de NF-κB en comparación con las huellas del protocolo nativo DNase-seq (Fig. 3b, izquierda). Esta mejora no fue evidente cuando se evaluó mediante los perfiles de recuento de cortes agregados (archivo adicional 2: Fig. S3), lo que subraya la necesidad de evaluar sitios individuales en lugar de señales promedio en sitios heterogéneos [8, 29]. Formaldehído al 1% La reticulación de 30 s (curva violeta) afectó negativamente las predicciones de unión. Curiosamente, cuando examinamos otro TF Ikaros (que carece de datos microscópicos sobre los tiempos de residencia de unión al ADN), todos los XL-DNasa-seq, pero la muestra de formaldehído al 1% mostró predicciones mejoradas sobre la DNasa-seq nativa (Fig. 3b, derecha). Si bien la mejora observada en la precisión parece pequeña en los gráficos ROC, se basa en la obtención de varios miles de sitios de unión predichos con precisión entre 10 4-10 5 sitios de motivos encontrados dentro de la cromatina abierta, por lo tanto, una mejora sustancial.

El entrecruzamiento mejora la predicción basada en la huella de DNasa-seq de la unión de TF. a Procedimiento de evaluación en análisis ROC. B Las curvas ROC para todas las muestras de reticulación-DNasa-seq se trazan usando datos de recuento de cortes ajustados por dímero. Los valores del área bajo la curva ROC (auROC) se muestran junto con los valores p calculados por el paquete "pROC" de R Bioconductor. El conjunto de unión de referencia se obtuvo a partir de los datos de ChIP-seq de macrófagos activados con LPS. El análisis ROC se realizó para NF-κB (izquierda: n = 99.089) e Ikaros (derecha: n = 165.392). Véase también archivo adicional 2: Figs. S3, S4

En todos los análisis ROC, el ajuste por el sesgo de secuencia de la escisión de DNasa no mejoró los valores de auROC ni cambió los resultados generales (archivo adicional 2: Fig. S4). Algunos estudios han informado de una mejora en la predicción de la unión de TF al corregir el sesgo de secuencia de DNasa [8], mientras que otros no observaron ninguna mejora [14, 34]. Los resultados discrepantes surgen probablemente porque estos estudios utilizaron diferentes métodos de detección computacional para llamar huellas putativas. Algunos métodos de detección se basan en firmas de escisión propensas al sesgo (forma del perfil de recuento de cortes) y pueden ver una mejora significativa después de eliminar el sesgo de secuencia. Nuestro método DNase2TF no utiliza las firmas de escisión directamente en la detección de huellas putativas y, por lo tanto, es posible que no tenga más mejoras a partir de la corrección de sesgo.

XL-ATAC-seq no mejora la huella de TF en comparación con ATAC-seq nativo

Dado que el ampliamente utilizado ATAC-seq también puede generar datos de huellas de alta resolución [4], examinamos si el entrecruzamiento puede tener efectos similares a los descritos anteriormente para DNase-seq. Mientras que el efecto de tiempos cortos de residencia de unión al ADN se mostró en los datos de la secuencia de ADNasa, es probable que produzca problemas similares para la secuencia de ATAC. Esto se debe a que los TF dinámicos permiten duraciones relativamente largas de disociación del ADN diana que luego sería vulnerable a los ataques enzimáticos. Generamos un panel de bibliotecas de ATAC-seq a partir de reticulación de formaldehído suave (XL-ATAC-seq) usando el mismo material biológico, células RAW264.7 activadas con LPS (Fig. 4a). Nuevamente, primero comparamos los perfiles de densidad de fragmentos de ATAC-seq obtenidos de todas las muestras de XL-ATAC-seq y confirmamos que la introducción de un paso de reticulación no afecta negativamente el ensayo de accesibilidad a la cromatina, con solo una ligera reducción en la intensidad de la señal de las muestras reticuladas con formaldehído al 1% (archivo adicional 2: Fig. S5A). Sin embargo, a diferencia de XL-DNase-seq, el análisis de los datos del recuento de inserciones reveló que la mayor cantidad de huellas putativas se detectó en las muestras nativas de ATAC-seq, y las cifras disminuyeron con la duración y la concentración de formaldehído utilizado para la reticulación ( Figura 4b). Este patrón se observa independientemente de si ajustamos el sesgo de la secuencia de ADN de la transposasa Tn5 (utilizada en ATAC-seq). De manera similar a XL-DNase-seq, los análisis de recuento de inserción agregado no revelaron grandes diferencias en la profundidad de la huella (archivo adicional 2: Fig. S6A), y la detectabilidad y la fuerza de la huella variaron entre las muestras de XL-ATAC-seq (archivo adicional 2: Fig. S6B).

Cross-linking hinders ATAC-seq footprint-based prediction of dynamic TF binding. a A browser shot of cross-linked raw insertion count tracks. The top track shows the locations of TF binding motif elements obtained by FIMO. Reference genome: mm 9. B Total number of FDR 1% putative footprints called by ATAC2TF (DNase2TF modified for ATAC-seq) was averaged over five rounds of subsampling. Subsampling of reads was performed to keep the number of uniquely mapped reads the same across conditions for fair comparison (see “Methods”). C ROC curves for all the cross-link-ATAC-seq samples are plotted using unadjusted insertion count data for RelA and Ikaros. Adjusting for the sequence bias of Tn5 insertion did not improve the predictions. The area under the ROC curve (auROC) values are shown along with the p values calculated by the ‘pROC’ package of R Bioconductor. Reference binding set was obtained from RelA ChIP-seq data of primary macrophages. See also Additional file 2: Figs. S5, S6

To gain a more detailed insight, we performed an ROC analysis for NF-κB/RelA and Ikaros with XL-ATAC-seq footprints, in the same manner as for XL-DNase-seq footprints. The prediction accuracy, as indicated by the shape of ROC curves and quantified by auROCs, generally declined with the duration and concentration of formaldehyde (Fig. 4a, Additional file 2: Fig. S6C). Putative footprints detected in the native ATAC-seq data (red curves) produced the most accurate predictions of NF-κB and Ikaros binding to their cognate motif elements in open chromatin. The best-performing ATAC-seq (native) nevertheless had lower auROC values compared to the XL-DNase-seq data (Additional file 2: Fig. S7A). Consistent with this observation, several studies indicated that TF footprinting based on ATAC-seq performs poorly in comparison to DNase-seq [15, 28, 29]. The cross-linking-dependent pattern of poor predictions from XL-ATAC-seq footprints was highly reproducible in technical and biological replicates. These results indicate that even the mild cross-linking conditions may interfere with the ability of Tn5 to sample the nucleotide base pairs with high insertion efficiency.

We chose ROC as our main measure of comparison, because of its wide usage for evaluating predictions from footprints and the simple representation of a random baseline as the diagonal. Another measure, precision-recall (PR) curves may also be useful especially for unbalanced binary outcome data. The PR curves generally preserved the top-performing samples (0.1% 30 s XL-DNase-seq among DNase samples and native among ATAC-seq samples), with the intermediate rankings varying somewhat over different recall ranges (Additional file 2: Fig. S7B).

Construction of TF regulatory networks and reproducibility

An ultimate goal of TF footprinting is to discover novel mechanisms in TF regulatory networks. A large-scale study in constructing such networks solely based on TF footprints and TF binding motif databases revealed intriguing findings [22, 32], but lack of footprints for many TFs and other technical issues raised questions about the significance of such efforts [8, 9, 33, 34]. Given the remaining technical challenges (including assignment of TF identity to motifs), we chose a conservative approach aiming to construct higher-confidence TF regulatory networks. To this end, we generated TF regulatory networks using stringent criteria on TF motifs and footprint detection thresholds. We also focused only on a select set of TFs for footprinting and limited the analysis on TF-encoding genes which have footprints of the select TFs. Each TF network was constructed by compiling putative regulatory edges (Fig. 5a, A → B, i.e., TF A regulates TF B). A regulatory edge indicates that one or more footprints of A were detected within 5 kb of transcription start site of B, from the given XL-DNase-seq sample.

TF regulatory networks from XL-DNase-seq have reproducible connections as well as new connections. a De novo construction of transcriptional regulatory networks. FDR 1% footprints within 5 kb of TSSs were used to obtain regulatory relationships. B TF regulatory network derived from 0.1% formaldehyde 10 min XL-DNase-seq data (MS5 and MS11, merged) after correcting for the dimer bias of DNase. Regulatory connections which were also detected in the network from native DNase-seq are marked in blue. See also Additional file 2: Fig. S8

Comparison of six TF networks from the cross-linking conditions revealed a substantial set of shared regulatory edges (Fig. 5b, Additional file 2: Fig. S8). Such reproducibility in regulatory relationships was surprising, given the variability observed in the footprint Z score profiles and the differential detectability of footprints across the XL-DNase-seq samples (Fig. 3, Additional file 2: Fig. S2). A closer look provided a reason for this robust consensus among the independently constructed TF networks: a shared edge is often supported by multiple redundant footprints and detection of at least one is sufficient for reproducing the edge in a network derived from a given XL-DNase-seq sample. For example, we found reproducible regulatory connections from PU.1 to many macrophage/immune-relevant genes: Ncoa3 (a.k.a. Src-3, involved in defense against bacteria) [5], Hcst (a.k.a. DAP10, which induces osteoclastogenic signaling in myeloid cells) [12], Atrx (a heterochromatin silencer), Mier1 (a HDAC-binding transcriptional corepressor), Arid1a (a.k.a. BAF250a, a component of SWI/SNF). In addition, well-known regulatory targets of RelA/NF-κB such as Nfkbia (a negative feedback gene), Rel (an immune-specific subunit of NF-κB), and Nfkb2 (an alternative dimer subunit of NF-κB) were robustly detected. RelA was also a putative regulator of Tfe3 (involved in macrophage autophagy and cytokine response, also detected as a putative target of PU.1 in multiple networks) [25] and Tal2 (a known target of PU.1) [6]. These regulatory connections were based on footprints detectable in both native and XL-DNase-seq data.

For an overall comparison of all the TF networks constructed separately, we generated a pairwise similarity matrix and found that XL-DNase-seq-derived networks have a stronger consensus, i.e., more regulatory edges were repeatedly detected in multiple cross-linking conditions, than XL-ATAC-seq-derived networks (Fig. 6). Despite the lower consensus among XL-ATAC-seq-derived networks, XL-ATAC-seq networks were still more similar to each other than to TF networks derived from XL-DNase-seq (Fig. 6, lower right square block). Notably, there were recurrent regulatory edges that are reproduced in multiple cross-linking conditions and even between DNase-seq and ATAC-seq protocols, which probably represent highest-confidence TF regulatory events.

Comparison of TF regulatory networks derived from TF footprints in XL-DNase-seq and XL-ATAC-seq data. The similarity between all the pairs of TF regulatory networks was quantified using Jaccard Index (ranging from 0 to 1), and the results are represented in a heatmap. The number in each component indicates the Jaccard Index of the given pair

Importantly, networks derived from footprints in cross-linked samples had more uniquely detected edges (Fig. 5b, black edges) than that from the native DNase-seq (Additional file 2: Fig. S8, black edges), suggesting that cross-linking helps capture novel binding events. Among the connections identified as novel regulatory relationships were: Tln1 (a.k.a. Talin, involved in mechanical responses and EMT) has a Nfkb1 footprint only from XL-DNase. Nfkbie, a known target of NF-κB in a negative feedback loop, has RelA footprint only from XL-DNase. Etv3, induced during macrophage differentiation [31] had RelA and Nfkb1 footprints only in XL-DNase. We note that Tln1, Nfkbie, and Etv3 are all likely direct targets of NF-κB/RelA because their transcripts are immediately induced by LPS treatment in macrophages [24]. Gene ontology analysis indicated that shared as well as distinct functional categories were enriched among the genes found in newly detected regulatory relationships (Additional file 2: Fig. S9). These results suggest that TF regulatory networks constructed from XL-DNase-seq contain both robust regulatory relationships and novel network wiring involving dynamic TFs whose footprints are missed in native DNase-seq.


DNase footprinting assay

A DNase footprinting assay [1] is a DNA footprinting technique from molecular biology/biochemistry that detects DNA-protein interaction using the fact that a protein bound to DNA will often protect that DNA from enzymatic cleavage. This makes it possible to locate a protein binding site on a particular DNA molecule. The method uses an enzyme, deoxyribonuclease (DNase, for short), to cut the radioactively end-labeled DNA, followed by gel electrophoresis to detect the resulting cleavage pattern.

For example, the DNA fragment of interest may be PCR amplified using a 32 P 5' labeled primer, with the result being many DNA molecules with a radioactive label on one end of one strand of each double stranded molecule. Cleavage by DNase will produce fragments. The fragments which are smaller with respect to the 32 P-labelled end will appear further on the gel than the longer fragments. The gel is then used to expose a special photographic film.

The cleavage pattern of the DNA in the absence of a DNA binding protein, typically referred to as free DNA, is compared to the cleavage pattern of DNA in the presence of a DNA binding protein. If the protein binds DNA, the binding site is protected from enzymatic cleavage. This protection will result in a clear area on the gel which is referred to as the "footprint".

By varying the concentration of the DNA-binding protein, the binding affinity of the protein can be estimated according to the minimum concentration of protein at which a footprint is observed.

This technique was developed by David Galas and Albert Schmitz at Geneva in 1977 [2]


Scientist George Church Is Auctioning Off His Genome as an NFT

You’ve probably heard the acronym NFT over the last couple months. Non-fungible tokens have been all over the news, seeming to become a sensation—one worth a ton of money—almost overnight. Soon a new NFT will hit the market, and it’s a little different than any that came before it, because it contains the entire genetic sequence of a famous scientist—one who’s famous for genomics, specifically.

Who’s George Church?

George Church. Image Credit: Wyss Institute

In case you’re not familiar with George Church, here’s a list of some of his credentials and contributions to the field. He teaches genetics at Harvard Medical School and MIT, leads synthetic biology at Harvard’s Wyss Institute for Biologically Inspired Engineering, is the director of the US Department of Energy Technology Center and of the National Institutes of Health Center of Excellence in Genomic Science. He developed the first direct genomic sequencing method in 1984 and helped initiate the Human Genome Project that same year, and was among the first people to have his whole genome sequenced. Almost 20 years later, in 2005, Church helped launch the Personal Genome Project and became the first person to publicly release his genomic data and medical records for research purposes.

Church also founded San Francisco-based Nebula Genomics, a company that does whole-genome sequencing, and DigiD8, a dating service that matches users based on their genetic data to minimize the odds of passing genetic disorders on to their offspring.

In short, genomics as a field likely wouldn’t have advanced nearly as quickly as it has without Church. For the record, “genetics” is slightly different than “genomics” the former refers to the study of single genes, including how traits are passed on from one generation to the next. The latter is the study of todos of an organism’s genes taken as a whole, and the way they impact the organism.

What’s an NFT?

NFTs, or non-fungible tokens, are unique virtual tags that are stored on a blockchain and tied to digital files, certifying them as being authentic and one-of-a-kind.

Most digital files sold as NFTs can be downloaded by anyone, but the purchaser of the tag or token owns the work. Some recent NFTs that made headlines include Grimes’ “Death of the Old,” which was one of 10 pieces that sold for a total of $6 million Beeple’s Everydays: the First 5000 Days, which was the first NFT to be offered by a major auction house (Christie’s) and sold for $69.3 million and LeBron James’ “Cosmic Dunk,” a video clip of the basketball player dunking—among many other NFTs that have traded hands recently.

Selling a Genome

The NFT for Church’s genome will encode the digital location of his genomic data, which is hosted on a decentralized server, and will also include an artistic representation of his genome and likeness.

The project’s web page points out the logic behind its idea to sell a human genome as an NFT, saying “The human genome is a unique encoding of an individual. Each human’s genome is a non-changing representation of their most fundamental and personal data, which is inherently non-fungible.” You can’t argue with that.

“The NFT was not my idea, but hopefully it is a good idea,” Church told El Científico, “both for the winner of the auction and as an event that increases conversations about the revolution happening in reading and writing DNA.”

It’s hard to say what’s wackier (in terms of feeling like we’re living in a semi-dystopian future): the fact that we can sequence our entire genome for cheap, or that wealthy people are stepping over each other to pay millions for digital “art,” or that highly advanced genetic science, cryptocurrency, and art are now all being rolled into one. It remains to be seen whether Church’s genome will be the first of many auctioned off as an NFT, or if this will be a unique occurrence—but it seems we can’t rule out any possibilities!

The date of the auction hasn’t been set yet, but it will be announced this Sunday, which just happens to be National DNA Day.


Ver el vídeo: The ENCODE Encyclopedia and Variant Annotation Using RegulomeDB and HaploReg - Jill E. Moore (Noviembre 2022).