Información

Búsqueda de interacciones proteína-proteína

Búsqueda de interacciones proteína-proteína


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Usé STRING db para encontrar todas las interacciones de la proteína precursora APP. Lo que necesito específicamente es una confirmación (respaldada por algún artículo y experimentos en él). Pero una cantidad significativa de interactores solo tiene confirmación de "Base de datos" (en su mayoría transmitiendo datos de Reactome y KEGG). La búsqueda en estas bases de datos no me da ningún artículo ni siquiera la presencia de estas proteínas en una vía (lo que es extraño). ¿Cómo puedo obtener los datos? ¡Gracias por adelantado!


Puede intentar utilizar la base de datos de interacción molecular IntAct. Los datos de esta base de datos se basan en:

  • datos de la literatura o de deposiciones directas de datos por curadores expertos
  • <300k interacciones binarias en 2011 desarrolladas por el Equipo de Servicios de Proteómica de EBI
  • referencia reciente: Aranda et al. '10

Esto también se menciona en el resumen del artículo de Aranda et al. '10:

IntAct es una base de datos y un conjunto de herramientas de interacción molecular de datos abiertos y de código abierto. Los datos se extraen de la literatura o de las deposiciones directas de datos por curadores expertos siguiendo un modelo de anotación profunda que proporciona un alto nivel de detalle. En septiembre de 2009, IntAct contiene más de 200.000 evidencias de interacción binaria seleccionadas. En respuesta al creciente volumen de datos y las solicitudes de los usuarios, IntAct ahora proporciona una vista de dos niveles de los datos de interacción. La interfaz de búsqueda permite al usuario desarrollar consultas complejas de forma iterativa, explotando la anotación detallada con vocabularios controlados jerárquicamente. Los resultados se proporcionan en cualquier etapa en una vista tabular simplificada. Las vistas especializadas permiten entonces "hacer zoom" en la anotación completa de las interacciones, los interactuadores y sus propiedades. El código fuente y los datos de IntAct están disponibles gratuitamente

Además, puede utilizar elEvidenciapestaña en String (Supongo que ya lo ha intentado, pero en el caso de que no lo haya hecho):

Luego puede hacer clic enExperimentos, entonces aparecerá algo como esto:
Puedes ver cómo (p. ej., ensayo de complejo reconstituido) y puede ver en cuales artículo del que proviene esta interacción si hace clic en un elemento de la tabla:


La base de datos STRING muestra la red de interacción proteína-proteína y las puntuaciones de acuerdo con la presencia y ausencia de verificación experimental que puede ser ensayo de proteasa, coinmunoprecipitación de cebo, ensayo occidental, etc.

Si necesita más confirmación, debe leer tantos artículos relacionados como sea posible relacionados con la APLICACIÓN.


Mapeo a gran escala de interacciones proteína-proteína humana mediante espectrometría de masas

*Autor correspondiente. El Instituto de Biología de Sistemas de Ottawa, Universidad de Ottawa, BMI, 451 Smyth Road, Ottawa, Ontario, Canadá K1H 8M5. Tel .: +1613562 5800 ext 8674 Fax: +1613562 5655 Correo electrónico: [email & # 160protected]

El mapeo de las interacciones proteína-proteína es una herramienta invaluable para comprender la función de las proteínas. A continuación, presentamos el primer estudio a gran escala de interacciones proteína-proteína en células humanas utilizando un enfoque basado en espectrometría de masas. El estudio mapea las interacciones de proteínas para 338 proteínas de cebo que se seleccionaron en función de enfermedades conocidas o sospechadas y asociaciones funcionales. La inmunoprecipitación a gran escala de versiones etiquetadas con Flag de estas proteínas seguida de análisis LC-ESI-MS / MS dio como resultado la identificación de 24 540 interacciones proteicas potenciales. Los falsos positivos y los resultados redundantes se filtraron utilizando criterios empíricos y una puntuación de confianza de interacción calculada, lo que produjo un conjunto de datos de 6463 interacciones entre 2235 proteínas distintas. Este conjunto de datos se validó de forma cruzada utilizando interacciones de proteínas humanas previamente publicadas y predichas. La extracción en profundidad del conjunto de datos muestra que representa una fuente valiosa de nuevas interacciones proteína-proteína con relevancia para las enfermedades humanas. Además, a través de nuestro análisis preliminar, informamos de muchas interacciones de proteínas novedosas y asociaciones de vías.


Interacciones entre proteínas y proteínas

Las proteínas interactúan continuamente entre sí para determinar el destino celular. En consecuencia, un examen de cuándo ocurren estas interacciones proteína-proteína y cómo se controlan es esencial para comprender el mecanismo molecular de los procesos biológicos, dilucidar las bases moleculares de las enfermedades e identificar los posibles objetivos de las intervenciones terapéuticas. En Interacciones proteína-proteína: métodos y aplicaciones, los principales expertos describen en detalle sus técnicas bioquímicas, biofísicas, genéticas y computacionales de gran éxito para estudiar estas interacciones. Sus métodos fácilmente reproducibles demuestran cómo identificar parejas de interacción de proteínas, medir cualitativa o cuantitativamente las interacciones proteína-proteína, monitorear las interacciones proteína-proteína a medida que ocurren en células vivas y determinar interfaces de interacción. Las técnicas descritas utilizan una variedad de tecnologías de vanguardia, que incluyen resonancia de plasmón de superficie (SRP), transferencia de energía de resonancia de fluorescencia (FRET), polarización de fluorescencia (FP), calorimetría de titulación isotérmica (ITC), dicroísmo circular (CD), complementación de fragmentos de proteínas. ensayos (PCA), varios sistemas de dos híbridos y enfoques basados ​​en proteómica y bioinformática, como el programa Scansite para análisis computacional. Cada protocolo probado en el tiempo incluye una introducción de antecedentes que describe el principio detrás de la técnica, listas de equipos y reactivos, y consejos para solucionar problemas y evitar problemas conocidos.
Interacciones proteína-proteína autorizada y altamente práctica: métodos y aplicaciones ofrece a los investigadores principiantes y experimentados una gama completa de herramientas poderosas necesarias para descifrar cómo las proteínas interactúan para formar redes biológicas, así como para desentrañar las interacciones proteína-proteína en enfermedades en el mundo. búsqueda de nuevos objetivos terapéuticos.

"Este libro es completo y está repleto de información. El volumen es de gran valor práctico y está totalmente recomendado para todos los bioquímicos". - Bioquímica y función celular

"El libro está bien equilibrado y es fácil de usar. Vale la pena el costo de compra". - ChemBioChem

"Este ... volumen describe exhaustivamente una variedad de enfoques biofísicos, biológicos celulares y biológicos moleculares para el análisis de interacciones proteína-proteína ... Este volumen se recomienda como una presentación sólida sobre los fundamentos del análisis de interacciones proteicas, adecuado para graduados cursos de química biofísica y para aquellos investigadores nuevos en el campo que deseen obtener una base sólida… ". (Wayne F. Patton, Proteomics, Número 6, 2006)


Notas al pie

Resumen de una oración: Una herramienta basada en la deslocalización dependiente de rapamicina permite visualizar y cuantificar las interacciones proteína-proteína en el interior Nicotiana benthamiana células epidérmicas foliares.

El autor responsable de la distribución de materiales integrales a los hallazgos presentados en este artículo de acuerdo con la política descrita en las Instrucciones para los autores (www.plantcell.org) es: Daniël Van Damme (daniel.vandammepsb.vib-ugent.be).

Ésta es una versión actualizada del manuscrito que ahora se acepta en The Plant Cell.


Fondo

Las interacciones físicas proteína-proteína se han estudiado ampliamente debido a su papel crucial en el control de procesos biológicos centrales como la división celular y sus implicaciones en una variedad de enfermedades humanas, incluido el cáncer. Se dispone de una colección de técnicas experimentales para caracterizar las interacciones proteína-proteína, algunas de ellas son más adecuadas para determinar complejos estables, mientras que otras generalmente se consideran mejores para detectar interacciones transitorias. El uso de enfoques proteómicos a gran escala para obtener experimentalmente información de interacción de proteínas ha dado como resultado una fuente adicional de datos de interacción. Además, se han diseñado técnicas de bioinformática basadas en información secuencial, estructural o evolutiva para predecir interacciones de proteínas binarias.

Para capturar y proporcionar un acceso eficiente a la información subyacente, se han almacenado anotaciones de interacción estructuradas en bases de datos públicas. Estas bases de datos varían en la profundidad de las anotaciones y el tipo de interacciones, pero una característica común es que las anotaciones son extraídas principalmente por curadores humanos de publicaciones relevantes. Algunas bases de datos de interacción como la base de datos de interacción proteína-proteína humana HPRD (Base de datos de referencia de proteínas humanas) [1], HomoMINT (red humana inferida) [2] y MIPS (Centro de información de Munich para secuencias de proteínas) [3] se centran en ciertos taxones y almacenar principalmente información para proteínas humanas o de mamíferos. También hay bases de datos de interacción más especializadas como PDZBase [4], que está restringida a proteínas con un dominio PDZ, o Reactome [5], que se centra en interacciones relacionadas con vías biológicas. Las bases de datos de interacciones MINT (Molecular Interactions Database) [6] e IntAct [7] contienen el mayor número de interacciones proteína-proteína humanas directas no redundantes, superadas en número sólo por HPRD. También proporcionan referencias bibliográficas relevantes para las interacciones individuales, junto con el método de detección de interacciones experimentales utilizado como evidencia de apoyo [8].

Aunque la mayoría de las bases de datos de interacción proporcionan enlaces a identificadores SwissProt para sus proteínas interactor, para comparar anotaciones derivadas de diferentes bases de datos, así como para compartir el esfuerzo de anotación, tanto un formato de anotación estándar como términos de vocabulario controlado que describen el contexto experimental son cruciales. El estándar Proteomics Standards Initiative Molecular Interaction (PSI-MI) se ha desarrollado para facilitar un esfuerzo de anotación coordinado para interacciones de proteínas utilizando términos de vocabulario controlado y proporcionando un formato común como marco [9]. Los sistemas de recuperación más eficientes de interacciones biológicas contenidas en artículos científicos están en demanda no solo para usuarios especializados, como curadores de bases de datos biológicas, sino también para la comunidad de biología en general. Con el fin de mejorar la eficiencia de la localización de artículos relevantes para la curación por parte de los curadores de la Base de Datos Biomolecular Interaction Network (BIND), se ha desarrollado un sistema de extracción llamado PreBIND basado en clasificadores de máquinas de vectores de soporte (SVM) para detectar artículos relevantes para la interacción [10].

Se ha propuesto una variedad de métodos para extraer asociaciones biológicas de la literatura. Algunos de ellos obtienen asociaciones generales, mientras que otros se centran en ciertas categorías de asociación biológicamente relevantes (por ejemplo, interacciones de proteínas, interacciones genéticas [regulación génica] o asociación de palabras clave funcional-producto génico [anotaciones funcionales]) [11, 12].

En general, se pueden identificar dos enfoques básicos para extraer relaciones biológicas, aunque muchos de los sistemas publicados anteriormente son en realidad estrategias híbridas que combinan características de ambos. Los enfoques se denominan análisis de asociación local y análisis de asociación global.

El análisis de asociación local o enfoque centrado en el artículo intenta extraer interacciones binarias para proteínas que concurren en un contexto textual predefinido, que a menudo corresponden a oraciones o pasajes de texto. Para determinar si las entidades concurrentes exhiben una relación de interacción, se consideran características contextuales adicionales. Algunos de ellos se basan, por ejemplo, en el uso de palabras clave de interacción, verbos o marcos semánticos, o en técnicas de aprendizaje automático para clasificar oraciones según su relevancia de interacción o incluso en la explotación de reglas sintácticas para detectar relaciones de interacción. Algunos de estos enfoques integran módulos que manejan la negación ('A [no] interactúa con B') que invierten el significado de un predicado. Otros enfoques pueden detectar enumeraciones de múltiples menciones de proteínas en una sola oración. La ventaja del enfoque centrado en el artículo es que a menudo proporciona oraciones relevantes para la interacción útiles para la interpretación humana y puede respaldar la detección de interacciones de proteínas nuevas con una sola evidencia de cita. Debido a que este tipo de enfoque extrae interacciones directas junto con la evidencia textual de apoyo, puede servir para mejorar la consistencia de las anotaciones, así como para facilitar la actualización de las anotaciones.

El análisis de asociación global, o extracción de interacción de múltiples documentos, intenta aprovechar la co-ocurrencia recurrente de proteínas dentro de una colección de documentos o pasajes para detectar pares de interacción de proteínas [13]. La fuerza o confiabilidad de los pares de interacción extraídos se puede calcular basándose en análisis estadístico de co-ocurrencia. Por lo tanto, se puede extraer una red de interacción que proporciona una visión general de la biología de sistemas globales que también captura las relaciones indirectas que van más allá de un solo documento. Esta estrategia es más adecuada para capturar interacciones de proteínas comúnmente conocidas, que se han estudiado ampliamente con una colección de citas de apoyo. Una desventaja de este enfoque es que no es sencillo para la interpretación humana.

La mayoría de los métodos implementados extraen información de interacción de los resúmenes y títulos de PubMed únicamente, y no de los correspondientes artículos a texto completo, obteniendo resultados que no son directamente comparables con la información contenida en las bases de datos de interacción, que acceden a la totalidad de los documentos. Otra limitación es que la mayoría de ellos abordan solo aspectos muy estrechos de la canalización de anotaciones de interacción, lo que da resultados algo artificiales que no se amplían para manejar aplicaciones reales. Entre los aspectos que a menudo se pasan por alto se encuentran las complejidades del proceso inicial de selección del artículo, así como la vinculación de las proteínas interactoras a su identificador de base de datos correspondiente, un paso que a menudo se denomina "normalización". Además, ninguna estrategia de extracción de texto informada anteriormente distingue entre interacciones verificadas experimentalmente y declaraciones de interacción que carecen de confirmación experimental. Este aspecto es crucial, porque la mayoría de las bases de datos de anotaciones biológicas proporcionan un calificador de evidencia para cada registro de anotación. Para BioCreative II, desarrollamos una tarea de minería de texto para la extracción de anotaciones de interacción proteína-proteína de la literatura, y evaluamos las presentaciones frente a un 'estándar de oro' curado manualmente realizado por anotadores de bases de datos expertos.

Los principales objetivos planteados al diseñar la tarea de interacción proteína-proteína (PPI) fueron los siguientes.

1. Determine el rendimiento de las herramientas de minería de texto de última generación en la extracción de PPI, en comparación con la curación manual.

2. Proporcionar a los sistemas participantes recursos útiles para entrenar y probar sistemas de extracción de interacción de proteínas.

3. Explore qué enfoques son exitosos y prácticos.

4. Analizar las principales dificultades y aspectos que influyen en el desempeño de los sistemas de extracción de IBP.

5. Promover el desarrollo de herramientas útiles para extraer interacciones proteína-proteína del texto.

Los sistemas de extracción de interacción de proteínas publicados anteriormente no tienen configuraciones de evaluación directamente comparables que permitan realizar estudios comparativos y de referencia consistentes, y también producen resultados que no son comparables con los resultados de los esfuerzos manuales de anotación de bases de datos (principalmente debido a la falta de interacción de proteínas normalización). La tarea BioCreative II PPI se llevó a cabo para permitir la comparación de varias estrategias en un conjunto de datos de referencia común basado en colecciones de datos preparadas por expertos en el dominio y en línea con el contenido y la estrategia de anotación de las bases de datos de interacción.

Tarea de interacción proteína-proteína

La tarea de PPI comprendía cuatro subtareas, cada una de las cuales estaba relacionada con un aspecto particular de la canalización de anotaciones de interacción.

1. Subtarea de artículo de interacción (IAS): clasificación y clasificación de los resúmenes de PubMed, en función de si son relevantes para la anotación de interacción de proteínas o no.

2. Subtarea de par de interacción (IPS): extracción de pares binarios de interacción proteína-proteína de artículos de texto completo. Las proteínas se anotan con su correspondiente identificador único SwissProt.

3. Subtarea del método de interacción (IMS): extracción del método de detección de interacción utilizado para caracterizar las interacciones de proteínas descritas en artículos de texto completo. Los métodos de detección de interacciones deben caracterizarse en términos de identificadores de ontología MI correspondientes. Constituyen la evidencia experimental de la interacción.

4. Subtarea de oraciones de interacción (ISS): recuperación de los pasajes de evidencia textual que describen / resumen la interacción.

Los equipos participantes recibieron una recopilación de datos de capacitación para cada subtarea para construir y capacitar sus sistemas de extracción de literatura durante el período de junio a octubre de 2006. Luego, durante la fase de prueba, los participantes tuvieron que proporcionar presentaciones para al menos uno de los PPI subtareas dentro de un corto período de tiempo predefinido (& lt2 semanas, para minimizar la posibilidad de un intento de anotación manual). La Figura 1 proporciona un diagrama de flujo comparativo del proceso manual de anotación de interacción proteína-proteína con la extracción automática basada en texto dentro del contexto de la tarea PPI de BioCreative II.

Anotación de interacción proteína-proteína manual versus automatizada. Se presenta una comparación entre el proceso de anotación manual de interacción proteína-proteína (PPI) y la extracción automática de interacciones proteicas en el contexto de la tarea PPI de BioCreative II.


Proyecto Human Interactome

Uno de los objetivos a largo plazo de CCSB es generar un primer mapa de referencia de la red del interactoma proteína-proteína humana. Para alcanzar este objetivo, estamos mapeando interacciones proteína-proteína binarias interrogando sistemáticamente todas las combinaciones por pares de productos génicos predichos en espacios de búsqueda definidos utilizando tecnologías a escala de proteomas. Nuestro enfoque es mapear interacciones proteína-proteína binarias de alta calidad utilizando un ensayo de dos híbridos de levadura primaria (Y2H) seguido de validación ortogonal por ensayos binarios alternativos. Actualmente, hemos completado dos esfuerzos a escala de proteomas (HI-I-05 y HI-II-14) basados ​​en las colecciones de ORF clonadas con Gateway disponibles en el momento de estos experimentos (http://horfdb.dfci.harvard.edu ). Otros esfuerzos para optimizar nuestra canalización y comparar la calidad de nuestros mapas también han llevado a la producción de mapas sistemáticos, aunque de tamaño relativamente más pequeño (Venkatesan-09 y Yu-11). En 2013, hemos extraído, filtrado y comparado datos de interacción de 7 bases de datos públicas para extraer un conjunto de datos de literatura binaria de alta calidad (Lit-BM-13) que comprende todas las interacciones proteína-proteína que son binarias y están respaldadas por al menos dos piezas rastreables. de evidencia (publicaciones y / o métodos).

Todos los conjuntos de datos individuales se describen con más detalle a continuación y están disponibles gratuitamente para la comunidad de investigadores a través del motor de búsqueda o mediante descarga. También se describen los datos preliminares de los proyectos en curso, pero solo están disponibles para que los usuarios registrados los descarguen aquí.

HI-I-05: Nuestra primera iteración en el mapeo del interactoma humano (Rual et al Naturaleza 2005) proyectó un espacio (Espacio I) de

8.000 ORF correspondientes a

7.000 genes e identificados

2.700 interacciones binarias de alta calidad. Este espacio de búsqueda representa

12% del espacio de búsqueda completo, asumiendo un total de

20.000 genes que codifican proteínas y se limita el alcance a una variante por gen. Este conjunto de datos está disponible gratuitamente para la comunidad de investigación a través del motor de búsqueda o mediante descarga.

HI-II-14: La segunda fase del proyecto del interactoma humano (Rolland et al Cell 2014) generó un conjunto de datos de

14.000 interacciones binarias siguiendo dos pantallas de una matriz de

13.000 x 13.000 proteínas (Espacio II). Este espacio de búsqueda cubre

42% del espacio de búsqueda completo, más de 3 veces más con respecto a nuestro primer intento. Este conjunto de datos está disponible gratuitamente para la comunidad de investigadores a través del motor de búsqueda o mediante descarga.

HI-III: La siguiente fase del proyecto del interactoma humano está en marcha. La colección de ORF humana que se analiza se ha ampliado para

17,500 genes únicos (Space III) y cubiertas

77% del espacio de búsqueda completo. Aquí se proporciona la lista de genes que se examinan. Los datos preliminares producidos por este esfuerzo continuo se proporcionan prepublicación para usuarios registrados aquí.

Venkatesan-09: Para estimar la cobertura y el tamaño del interactoma humano (Venkatesan et al Métodos Nat 2009), se realizaron cuatro pantallas Y2H en un conjunto de

1.800 proteínas de fusión DB-X (o cebos, que representan

1.700 genes únicos) contra

1.800 proteínas AD-Y (o presas, que representan

1.800 genes únicos), correspondientes a

10% de los genes disponibles y

1% del espacio de búsqueda completo. Este conjunto de datos contiene

200 interacciones Y2H de alta calidad y está disponible gratuitamente para la comunidad de investigación a través del motor de búsqueda o mediante descarga.

Yu-11: Para desarrollar un protocolo de mapeo interactivo Stitch-seq novedoso, se llevó a cabo una pantalla Y2H dentro de Space II (Yu et al Métodos Nat 2011). Stitch-seq combina la unión por PCR con la secuenciación de próxima generación y aumenta la eficiencia y la rentabilidad del cribado Y2H. El conjunto de datos resultante contiene

1200 interacciones entre proteínas codificadas por

1.100 genes humanos. Este conjunto de datos está disponible gratuitamente para la comunidad de investigación a través del motor de búsqueda o mediante descarga.

Espacio de prueba: para desarrollar, optimizar y comparar mejoras en el proceso de mapeo utilizado para los esfuerzos en curso (HI-III), doce pantallas recíprocas independientes en un espacio de búsqueda de

Se completaron 1.800 genes, que constituyen

1% del espacio de búsqueda completo. Los datos preliminares producidos por este esfuerzo continuo se proporcionan prepublicación para usuarios registrados aquí.

Conjunto de datos de literatura no sistemática de alta calidad

Lit-BM-13: en 2013, extrajimos datos de interacción de BIND, BioGRID, DIP, HPRD, MINT, IntAct y PDB para generar un conjunto de datos de literatura binaria de alta calidad que comprende

11.000 interacciones proteína-proteína que son binarias y están respaldadas por al menos dos piezas de evidencia rastreables (publicaciones y / o métodos) (Rolland et al Cell 2014). Aunque este conjunto de datos no es el resultado de una investigación sistemática del espacio de búsqueda del interactoma y, por lo tanto, debe usarse con precaución para cualquier análisis de topología de red, representa interacciones valiosas para estudios específicos y está disponible gratuitamente para la comunidad de investigadores a través del motor de búsqueda o mediante descarga. .


Búsqueda de interacciones proteína-proteína - Biología

Las interacciones proteína-proteína (IBP) son cada vez más relevantes en la patología de muchas enfermedades, incluido el cáncer. Sin embargo, el problema es desarrollar una forma eficaz de abordarlos. Los últimos avances en métodos dirigidos a los IBP están diseñados para superar los desafíos que limitan los métodos convencionales.. TLos IBP ofrecen otro objetivo terapéutico potencial para enfermedades con perfiles biológicos complejos..

Importancia terapéutica de los IBP

Los IBP son una parte integral de la fisiología de los organismos vivos, como complejos que controlan las vías biológicas mediadas por proteínas. Los procesos celulares críticos, incluida la replicación y traducción del ADN, no pueden ocurrir sin proteínas funcionales específicas. La red de IBP, conocida como interactoma, es esencial para facilitar importantes mecanismos moleculares como la transducción de señales y la muerte celular.

Sin embargo, los IBP disfuncionales pueden crear problemas y se han identificado en la patología de una multitud de enfermedades. Comprender el mecanismo de los IBP y desarrollar métodos para atacar los aberrantes ha sido una estrategia clave en el desarrollo de fármacos. El fundamento de esta estrategia es que las dianas farmacológicas clásicas en enfermedades como el cáncer suelen ser enzimas y receptores, por lo que los IBP representan una diana terapéutica atractiva debido al hecho de que las dianas terapéuticas actuales suelen estar basadas en proteínas.

Desafíos actuales y enfoques convencionales en la focalización de los IBP

En comparación con el enfoque clásico de descubrimiento de fármacos de moléculas pequeñas, la modulación de los IBP es más desafiante. Mientras que los objetivos, como los receptores, contienen un sitio obvio de unión al ligando para que las moléculas del fármaco interactúen, los IBP comprenden una estructura más compleja. Los siguientes puntos resumen estos desafíos:

• Los PPI poseen una asociación de alta afinidad debido a la disposición de los residuos de aminoácidos. Esto hace que sea un desafío para las moléculas pequeñas inhibir la interacción fuerte.

• La superficie de los PPI, conocida como interfaz, suele ser plana con un número limitado de ranuras. Esto dificulta la unión de moléculas pequeñas diseñadas específicamente.

• La interfase es altamente hidrofóbica, por lo que cualquier compuesto que contenga agua sería repelido.

La interfaz plana sigue siendo el principal desafío al que se enfrenta el desarrollo de moduladores PPI. En comparación con proteínas como las enzimas, que poseen sitios de unión para ligandos complementarios, la interfaz resulta difícil de encontrar una molécula coincidente. Sin embargo, salpicando la interfaz hay áreas de residuos de aminoácidos que contribuyen a la energía libre de unión, conocidos como puntos calientes. Estas regiones son críticas para las interacciones óptimas entre proteínas. La importancia de los puntos calientes demuestra la necesidad de desarrollar métodos que diseñen moduladores PPI que sean complementarios a los puntos calientes de las interfaces PPI.

Un ejemplo de un método dirigido a los IBP es el cribado virtual. Uno de los principales problemas en el desarrollo de moduladores de PPI es identificar los PPI asociados con la enfermedad y si son & # 8216 'drogables' de los miles disponibles. El cribado virtual puede analizar las superficies de las proteínas para localizar el sitio de unión.

A partir de aquí, los sitios de unión se clasifican en dos categorías que determinan si se requiere un enfoque basado en estructura o ligando. Es un método popular en biología de sistemas, que requiere que se analicen menos compuestos en bioensayos, lo que reduce el tiempo y el costo. A pesar de estos beneficios, el cribado virtual informa altas tasas de falsos positivos al identificar IBP específicos, lo que limita su uso únicamente al cribado inicial.

Enfoques novedosos para optimizar los IBP: satisfacer una demanda clínica

La prevalencia de IBP aberrantes en enfermedades como el cáncer refuerza la necesidad de desarrollar estrategias para atacar mejor estos componentes biológicos. Un artículo de investigación clínica reciente destaca la importancia de apuntar a los IBP en las células madre del cáncer. Se construyó una red de PPI a partir de nueve marcadores de células madre del colon para identificar posibles objetivos genéticos en los pacientes. La combinación de la base de datos PPI y los "perfiles de genes de alto rendimiento" # 8217 reveló un grupo de genes relacionados con las células madre del cáncer de colon (CSC).

A partir del grupo, la proteína TMEM17 se identificó como un nuevo gen relacionado con CSC, cuyo agotamiento puede “suprimir la proliferación de células de cáncer colorrectal (CCR) y sensibilizar las células de CCR a la quimioterapia. La identificación del TMEM17 dentro de una red de PPI establece un objetivo terapéutico para el tratamiento del CCR, lo que destaca aún más el potencial de apuntar a los PPI como una estrategia eficaz en el cáncer.

Un método ampliamente utilizado para detectar IBP es la levadura-dos-híbrido (Y2H), que se ha optimizado recientemente para superar los desafíos de métodos como el cribado virtual. Según una publicación de 2021, “… los avances recientes han hecho posible generar y analizar redes PPI en todo el genoma en masa mediante el acoplamiento de Y2H con tecnología de secuenciación de próxima generación (NGS)”.

La combinación de NGS con Y2H es uno de los cambios innovadores recientes en el Y2H original. Este método innovador ahora acerca la tecnología al desarrollo de redes PPI en todo el genoma. A pesar de los cambios prometedores para optimizar estos métodos, todavía hay desafíos que deben abordarse. Uno de los principales problemas con Y2H, como el cribado virtual, es el número de falsos positivos que se producen con la autoactivación de genes informadores inducibles por Y2H. Esto surge cuando el dominio de activación o de unión al ADN activa la transcripción de "genes informadores Y2H, independientemente de la presencia de cualquier PPI".

Sin embargo, un estudio publicado recientemente pudo superar este problema al desarrollar un tipo de selección negativa condicional para detectar falsos positivos. Esto representa un paso significativo en la selección de los IBP: al eliminar el cambio de falsos positivos, Y2H puede identificar con mayor precisión los IBP en los estados patológicos.

La evolución de los métodos de focalización de los PPI destacan la necesidad de integrar la información estructural 3D en la biología de sistemas. En las redes PPI, las proteínas se definen como nodos que están conectados por bordes (interacciones), sin embargo, no hay referencia a la estructura de las proteínas ni al mecanismo de las interacciones involucradas. Sin embargo, la introducción de métodos computacionales podría utilizarse para "interrogar estas interacciones" que pueden complementar la "evidencia experimental disponible". La adición de información estructural permite una comprensión más informada sobre la funcionalidad de estas redes PPI.

¿Qué significa esto para la investigación clínica?

El desarrollo continuo de métodos dirigidos a los IBP permite a los investigadores obtener una mejor comprensión del impacto de los micro cambios de proteínas específicas y el impacto a escala macro con la manifestación de enfermedades. Especialmente en oncología, la selección de IBP abre la puerta al desarrollo de fármacos terapéuticos con mayor selectividad y especificidad para competir con el tratamiento convencional.

Para discutir estos temas más a fondo con los expertos del sector, y para asegurarse de mantenerse actualizado sobre lo último en desarrollo clínico, regístrese para el Director Senior de Química Medicinal Robert Hilgraf y la mesa redonda de PPI # 8217s en Reuniones de estrategia de química medicinal y biología de Proventa International, programadas para el 25 de mayo de 2021.

Charlotte Di Salvo, escritora médica junior
Proventa Internacional


Fondo

Las regulaciones genéticas describen las interacciones entre genes durante la actividad celular. A través de la regulación, los genes orquestan el nivel de ARNm sintetizado y, por lo tanto, controlan la expresión de otros genes y las velocidades a las que se producen las proteínas, lo que finalmente decide el estado de la célula. Los microarrays de expresión génica (GE) proporcionan datos cuantitativos o semicuantitativos sobre el estado celular en un momento y una condición específicos. Mediante la “ingeniería inversa” de los datos de GE, se pueden identificar las interacciones reguladoras entre genes y se puede cartografiar la red reguladora de genes utilizando métodos computacionales [1, 2].

La gran mayoría de los enfoques de análisis funcional para modelar datos de microarrays de GE asumen que los genes con perfiles de expresión similares tienen funciones celulares similares [3-5]. Una vía molecular es un conjunto de genes que se activan juntos para lograr una tarea específica y, por lo tanto, comparten perfiles de expresión similares. En este artículo, utilizamos un método basado en datos, el agrupamiento basado en modelos, para modelar genes en distintas vías. Específicamente, modelamos cada vía como un modelo gaussiano, ya que permite modelar correlaciones entre expresiones genéticas de una manera basada en datos. Es más adecuado para situaciones en las que se desconoce el conocimiento previo de las vías reguladoras. Además, debido a que los genes participan de forma natural en más de una vía reguladora, la agrupación suave se utiliza para permitir que los genes puedan pertenecer a múltiples vías. Por lo tanto, adoptamos el modelo de mezcla gaussiana (GMM) en datos de GE para que se puedan identificar diferentes vías reguladoras.

The rationale behind clustering is that co-expressed genes, i.e., genes in the same cluster are more likely to be functionally related and belong to the same cluster. However, regulatory processes of the genes in a cluster could not necessarily be direct as it could refer to an indirect regulation via proteins, metabolites, or ncRNAs. In cases where two interaction partners are transcription factors or where two proteins are in the same complex, the interactions are direct. In order to identify indirect regulations in GRN, evidences from multiple data sources should be used. For example, medical literature, protein-protein interaction (PPI) data, gene ontology, etc., have all been used to supplement wet lab data in the inference of GRN [6–9]. When more than one source are available, an essential step is to optimally combine evidences from multiple sources to derive a coherent GRN [10–12].

Since proteins are products of genes, protein interactions provide useful evidence for gene regulation. PPIN data have been fused with GE data for GRN inference in previous studies [13–17]. Most of these works considered only binary links of PPIN: if the link is consistent with the predicted edge from GE, the link is accepted as a true regulation. This approach throws away valuable information, so an accurate quantitative scoring scheme is needed to evaluate consistency between PPIN and gene regulation. On the other hand, existing PPINs are sparse and many real protein interactions are missing in current PPIN databases. Suggested by previous PPI prediction works [18, 19], there exist a large number of interactions between proteins in complexes, which have not yet been observed or recorded in current PPIN. We therefore propose a heuristic to quantitatively extend sparse PPIN by using transitive linkages. We then propose a novel way to score protein interactions by combining topological properties of extended PPIN and correlations of GE. Our experiments demonstrate that transitive protein interactions indeed play an important role in predicting protein interactions. We fuse the extended PPIN scores with GE data, using a Gaussian hidden Markov model (GHMM) to identify gene regulatory pathways, which are found to more consistent with PPIN than those produced by GMM. We further refine PPIN confidence scores by including gene interaction scores from GHMM, which makes the PPIN score more consistent with the existing GRN.

Since there exists no widely accepted model that universally fits GE data well [20–23], and different models capture different GE properties leading to different or complementary GRN structures [21], fusion of different models should lead to better GRN. The GHMM identifies regulatory pathways and obtain possible interacting genes by considering linear correlations between genes but misses conditional dependencies, i.e., non-linear relations, among genes in the same regulatory pathway. The Bayesian network (BN) model is good at capturing these conditional dependences but suffers from poor computational efficiency. We thus propose a systematic probabilistic framework that fuse these two models and derive coherent GRN closer to biological reality. Specifically, our framework takes a coarse-to-fine approach: GHMM generates regulatory pathways (i.e., a coarse GRN having high coverage) and obtains refined interaction scores, both of which are then used to constrain the GRN structure of a BN model (i.e., the Bayesian Gaussian mixture model). This generates GRN that are of good coverage and high precision. Furthermore, GRN structural constrains help greatly reduce the search space for BGM model, thereby reducing the overall computational complexity. Figure 1 shows the flow chart of our GRN inference process.

Overall Model. Step 1: A Gaussian mixture model (GMM) is used to soft-cluster gene expression (GE) data. Step 2: A heuristic is proposed to quantitatively extend the sparse protein-protein interactions by using transitive linkages. A novel way is then proposed to score protein interactions by combining topological properties of extended protein-protein interaction network (PPIN) and GE correlations. Step 3: A Gaussian Hidden Markov Model (GHMM) is used to identify gene regulatory pathways and refine interaction scores, both of which are then used as structural priors to constrain the model of GRN. Step 4: Lastly, the GRN from GE is refined using a Bayesian Gaussian Mixture (BGM) model by including the structural priors derived from Step 3


Abstracto

Protein–protein interactions (PPIs) are important in all aspects of cellular function, and there is interest in finding inhibitors of these contacts. However, PPIs with weak affinities and/or large interfaces have traditionally been more resistant to the discovery of inhibitors, partly because it is more challenging to develop high-throughput screening (HTS) methods that permit direct measurements of these physical interactions. Here, we explored whether the functional consequences of a weak PPI might be used as a surrogate for binding. As a model, we used the bacterial ATPase DnaK and its partners DnaJ and GrpE. Both DnaJ and GrpE bind DnaK and catalytically accelerate its ATP cycling, so we used stimulated nucleotide turnover to indirectly report on these PPIs. In pilot screens, we identified compounds that block activation of DnaK by either DnaJ or GrpE. Interestingly, at least one of these molecules blocked binding of DnaK to DnaJ, while another compound disrupted allostery between DnaK and GrpE without altering the physical interaction. These findings suggest that the activity of a reconstituted multiprotein complex might be used in some cases to identify allosteric inhibitors of challenging PPIs.


Abstracto

Protein complexes are fundamental for understanding principles of cellular organizations. As the sizes of protein–protein interaction (PPI) networks are increasing, accurate and fast protein complex prediction from these PPI networks can serve as a guide for biological experiments to discover novel protein complexes. However, it is not easy to predict protein complexes from PPI networks, especially in situations where the PPI network is noisy and still incomplete. Here, we study the use of indirect interactions between level-2 neighbors (level-2 interactions) for protein complex prediction. We know from previous work that proteins which do not interact but share interaction partners (level-2 neighbors) often share biological functions. We have proposed a method in which all direct and indirect interactions are first weighted using topological weight (FS-Weight), which estimates the strength of functional association. Interactions with low weight are removed from the network, while level-2 interactions with high weight are introduced into the interaction network. Existing clustering algorithms can then be applied to this modified network. We have also proposed a novel algorithm that searches for cliques in the modified network, and merge cliques to form clusters using a "partial clique merging" method. Experiments show that (1) the use of indirect interactions and topological weight to augment protein–protein interactions can be used to improve the precision of clusters predicted by various existing clustering algorithms and (2) our complex-finding algorithm performs very well on interaction networks modified in this way. Since no other information except the original PPI network is used, our approach would be very useful for protein complex prediction, especially for prediction of novel protein complexes.


Ver el vídeo: Búsqueda de interacciones entre la proteína PRAME y el ácido retinoico: estudio computacional. (Mayo 2022).