Información

Biología Computacional - Biología

Biología Computacional - Biología


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

La biología computacional, que incluye muchos aspectos de la bioinformática, es la ciencia del uso de datos biológicos para desarrollar algoritmos o modelos con el fin de comprender los sistemas y relaciones biológicos. Los investigadores pudieron desarrollar métodos analíticos para interpretar información biológica, pero no pudieron compartirlos rápidamente entre colegas.

  • Libro: Biología computacional: genomas, redes y evolución (Kellis et al.)
    Este texto cubre los fundamentos algorítmicos y de aprendizaje automático de la biología computacional que combina la teoría con la práctica. Cubrimos tanto los temas fundamentales de la biología computacional como las fronteras de la investigación actual. Estudiamos técnicas fundamentales, avances recientes en el campo y trabajamos directamente con conjuntos de datos biológicos actuales a gran escala.
    • Materia delantera
    • 1: Introducción al curso
    • 2: Alineación de secuencia y programación dinámica
    • 3: Alineación rápida de secuencias y búsqueda en bases de datos
    • 4: Genómica comparada I- Anotación del genoma
    • 5: Ensamblaje del genoma y alineación del genoma completo
    • 6: Genómica bacteriana - Evolución molecular a nivel de ecosistemas
    • 7: Modelos ocultos de Markov I
    • 8: Modelos de Markov ocultos II: decodificación y aprendizaje posteriores
    • 9: Identificación de genes: estructura de genes, Semi-Markov, CRFS
    • 10: ARN plegable
    • 11: Modificaciones de ARN
    • 12: ARN no codificantes intergénicos grandes
    • 13: ARN pequeño
    • 14: Secuenciación de ARNm para análisis de expresión y descubrimiento de transcripciones
    • 15: Regulación genética I - Agrupación de expresión genética
    • 16: Regulación genética II - Clasificación
    • 17: Motivos regulatorios, muestreo de Gibbs y EM
    • 18: Genómica reguladora
    • 19: Epigenómica / Estados de cromatina
    • 20: Redes I- Inferencia, estructura, métodos espectrales
    • 21: Redes reguladoras: inferencia, análisis, aplicación
    • 22: Interacciones de cromatina
    • 23: Introducción al modelado metabólico en estado estacionario
    • 24: El proyecto Encode: experimentación sistemática y genómica integradora
    • 25: Biología sintética
    • 26: Evolución molecular y filogenética
    • 27: Filogenómica II
    • 28: Historia de la población
    • 29: Variación genética poblacional
    • 30: Genética médica: del pasado al presente
    • 31: Variación 2- Mapeo de rasgos cuantitativos, eQTLS, Variación de rasgos moleculares
    • 32: Genomas personales, genomas sintéticos, computación en C vs.Si
    • 33: Genómica personal
    • 34: Genómica del cáncer
    • 35: Edición del genoma
    • Materia trasera
  • Libro: Introducción a la biología computacional (O'Neil)
    A Primer for Computational Biology tiene como objetivo proporcionar a los científicos y estudiantes de la vida las habilidades necesarias para la investigación en un mundo rico en datos. El texto cubre el acceso y el uso de servidores remotos a través de la línea de comandos, programas de escritura y canalizaciones para el análisis de datos, y proporciona un vocabulario útil para el trabajo interdisciplinario.

Doctorado en Biología Computacional

El objetivo principal del doctorado en Biología Computacional es capacitar a la próxima generación de científicos apasionados por explorar la interfaz de la computación y la biología y comprometidos con el funcionamiento a un alto nivel en los campos biológico y computacional.

El programa enfatiza la competencia multidisciplinaria, la colaboración interdisciplinaria y la investigación transdisciplinaria, y ofrece un plan de estudios integrado y personalizable que consta de dos semestres de cursos didácticos adaptados a los antecedentes e intereses de cada estudiante, rotaciones de investigación con mentores docentes que abarcan las disciplinas centrales de la biología computacional y disertación. investigación supervisada conjuntamente por mentores de la facultad de computación y biología.

El Grupo de Graduados en Biología Computacional facilita la inmersión de los estudiantes en la vibrante comunidad de investigación en biología computacional de UC Berkeley. Actualmente, el grupo incluye más de 46 profesores de 14 departamentos de la Facultad de Letras y Ciencias, la Facultad de Ingeniería, la Facultad de Recursos Naturales y la Escuela de Salud Pública. Muchos de estos profesores están disponibles como posibles asesores de investigación de tesis para estudiantes de doctorado en Biología Computacional, y hay más disponibles para participar en comités de doctorado.

Plan de estudios

El primer año

El tiempo hasta la titulación (tiempo normativo) del doctorado en Biología Computacional es de cinco años. El primer año del programa enfatiza la adquisición de competencia en biología computacional, ciencias biológicas y ciencias computacionales (interpretadas de manera amplia). Dado que los antecedentes de los estudiantes variarán ampliamente, cada estudiante trabajará con la facultad y los comités asesores de estudiantes para desarrollar un programa de estudio adaptado a sus antecedentes e intereses. Específicamente, todos los estudiantes de primer año deben:

  • Realizar tres rotaciones con profesores centrales (una rotación con profesores no centrales es aceptable con aprobación previa)
  • Completar los requisitos de trabajo del curso (ver más abajo)
  • Completar un curso en la realización responsable de la investigación
  • Asista a la serie de seminarios de biología computacional
  • Entrenamiento experimental completo (ver más abajo)

Rotaciones de laboratorio

Los estudiantes que ingresan deben completar tres rotaciones de laboratorio durante su primer año en el programa para buscar un asesor de tesis bajo cuya supervisión se llevará a cabo la investigación de tesis. Los estudiantes deben rotar con al menos un miembro de la facultad del Core computacional y un miembro del profesorado del Core experimental. Haga clic aquí para ver la política de rotación.

Trabajo del curso y requisitos adicionales de amplificador

Los estudiantes deben completar los siguientes cursos en los primeros tres (hasta cuatro) semestres:

  • Semestre de otoño y primavera de CMPBIO 293, Seminario de Doctorado en Biología Computacional
  • Un curso de Conducta Responsable de la Investigación, probablemente a través del Departamento de Biología Celular y Molecular.
  • Seis cursos adicionales que constan de:
    • STAT 201A &erio STAT 201B: Introducción a la probabilidad y la estadística en un nivel avanzado.
      Nota: Los estudiantes a los que se les ofrezca admisión y no estén preparados para completar STAT 201A y 201B deberán completar primero STAT 134 o PH 142.
    • CS61A: Estructura e interpretación de programas informáticos
    • 3 cursos electivos relevantes para el campo de la biología computacional, uno de los cuales debe estar en el nivel de posgrado (consulte los detalles a continuación)
    • Asista a la serie de seminarios de oradores invitados sobre biología computacional. Se distribuye un horario a todos los estudiantes por correo electrónico y está disponible en el sitio web del Centro.
    • Inscríbase en al menos dos semestres de CMPBIO 275: Seminario de Biología Computacional / Club de Revistas, que incluye y complementa esta serie de seminarios.
    • Completa un componente de entrenamiento experimental. Esto se satisface de una de estas tres formas:

    1) finalización de un curso de laboratorio en Berkeley con una calificación mínima de B, 2) finalización de una rotación en un laboratorio experimental (con un proyecto experimental), con una evaluación positiva del IP, 3) demostración de capacitación previa, como como:

      • una licenciatura en ciencias biológicas con al menos dos cursos de laboratorio de la división superior,
      • un semestre o equivalente de investigación supervisada de pregrado basada en laboratorio experimental en una universidad,
      • o trabajo previo remunerado o voluntario / de pasantía en un laboratorio experimental basado en la industria.

      Los estudiantes proporcionarán un breve resumen de esta experiencia al Asesor Principal de Graduados para su aprobación antes de tomar el QE.

      Se espera que los estudiantes desarrollen un plan de cursos para los requisitos de su programa y consulten con el Asesor Principal de Graduados antes del semestre de primavera de su primer año para una aprobación formal (se requiere firma). El plan del curso tendrá en cuenta las áreas de formación de pregrado del estudiante y los objetivos para las áreas de investigación de doctorado.

      La finalización satisfactoria de los requisitos del primer año se evaluará al final del semestre de primavera del primer año. Si se satisfacen los requisitos, los estudiantes elegirán formalmente un asesor de tesis de entre el cuerpo docente principal con el que rotaron y comenzarán la investigación de tesis.

      Exenciones: Los estudiantes pueden solicitar exenciones para los cursos específicos STAT 201A, STAT 201B y CS61A. En todos los casos de exenciones, el estudiante debe tomar cursos alternativos en áreas relacionadas para tener seis cursos adicionales, como se describe anteriormente. Para renunciar a STAT 201A / B, los estudiantes pueden demostrar que han completado el equivalente al aprobar un examen de evaluación supervisado en el campus. Para renunciar a CS61A, el Asesor Principal de Graduados evaluará el trabajo de curso anterior del estudiante en función del plan de estudios del curso anterior y otros materiales del curso para determinar la equivalencia.

      Electivas: De las tres asignaturas optativas, los estudiantes deben elegir un curso en cada una de las dos áreas de grupo siguientes:

      • Grupo A (Ciencias Biológicas): Estos cursos se definen como aquellos cuyos objetivos de aprendizaje están relacionados principalmente con la biología. Esto incluye cursos que cubren temas de biología molecular, genética, evolución, ciencias ambientales, métodos experimentales y salud humana. Esta categoría también puede cubrir cursos cuyo enfoque sea aprender a usar herramientas bioinformáticas para comprender datos experimentales.
      • Grupo B (Ciencias Computacionales): Estos cursos se definen como aquellos para los que las metas de aprendizaje involucran computación, inferencia o modelado matemático, ampliamente definido. Esto incluye cursos sobre algoritmos, lenguajes o estructuras informáticas, conceptos matemáticos o probabilísticos y estadística. Esta categoría incluiría cursos cuyo enfoque esté en las aplicaciones biológicas de dichos temas.

      En el enlace a continuación, brindamos algunos de estos cursos relevantes, pero los estudiantes pueden tomar cursos más allá de esta lista para los cursos que no están en esta lista, el Asesor Principal de Graduados determinará a qué grupo se puede acreditar un curso. Para las clases que tienen una superposición significativa entre estos dos grupos, el departamento que ofrece el curso puede influir en la decisión del HGA sobre si el curso debe asignarse al grupo A o al B.

      Vea a continuación algunos cursos sugeridos en estas categorías:

      Segundo año y más allá

      Al comienzo del otoño del segundo año, los estudiantes comienzan la investigación de tesis de tiempo completo en serio bajo la supervisión de su asesor de tesis. Se anticipa que los estudiantes necesitarán tres (hasta cuatro) semestres para completar el requisito de 6 cursos. Se requiere que los estudiantes continúen participando anualmente en la serie de seminarios de biología computacional.

      Examen de cualificación

      Se espera que los estudiantes tomen y aprueben un Examen de Calificación (QE) oral al final del semestre de primavera (15 de junio) de su segundo año de estudios de posgrado. Los estudiantes deben presentar una propuesta de disertación por escrito al comité de QE no menos de cuatro semanas antes de la QE oral. La redacción debe seguir el formato de una propuesta de subvención al estilo de los NIH (es decir, debe incluir un resumen, antecedentes y significado, objetivos específicos que deben abordarse (

      Ascenso a la candidatura

      Después de completar con éxito el QE, los estudiantes avanzarán a la candidatura. En este momento, los estudiantes seleccionan a los miembros de su comité de disertación y envían este comité para su aprobación a la División de Graduados. Los estudiantes deben esforzarse por incluir un miembro cuya investigación represente un área complementaria pero distinta de la del asesor de disertación (es decir, biológica versus computacional, experimental versus teórica) y que se integrará en la investigación de disertación del estudiante.
      Haga clic aquí para ver las reglas para la composición del comité y el formulario para declarar su comité.

      Reuniones con el Comité de Disertación

      Después de avanzar a la candidatura, se espera que los estudiantes se reúnan con su Comité de Disertación al menos una vez al año.

      Requisitos de enseñanza

      Los estudiantes de doctorado en Biología Computacional deben enseñar al menos dos semestres (comenzando con la clase de otoño de 2014), pero pueden enseñar más. El requisito puede modificarse si el alumno tiene financiación que no permite la docencia. Comenzando con la clase de otoño de 2019: al menos uno de esos cursos debe requerir que enseñe una sección. Berkeley Connect o CMPBIO 293 puede contar para uno de los semestres requeridos.

      La disertación

      Los proyectos de tesis representarán una investigación académica, independiente y novedosa que contribuya con nuevos conocimientos a la biología computacional mediante la integración de conocimientos y metodologías de las ciencias biológicas y computacionales. Los estudiantes deben presentar su disertación antes de la fecha límite de presentación de la División de Graduados de mayo (consulte la fecha en la División de Graduados) de su quinto y último año.

      Requisitos especiales

      Los estudiantes deberán presentar su investigación oralmente o mediante un póster en el retiro anual que comienza en su segundo año.

      Soporte financiero

      El Grupo de Graduados en Biología Computacional proporciona un estipendio competitivo (el estipendio para 2021-22 es de $ 38,500), así como el pago total de las tarifas y la matrícula para no residentes (que incluye atención médica). Los estudiantes que mantienen un progreso académico satisfactorio reciben fondos completos durante cinco a cinco años y medio. El programa apoya a los estudiantes en el primer año, mientras que el PI / mentor brinda apoyo a partir del segundo año. Una parte de este apoyo es en forma de salario proveniente de la asistencia docente como Instructor de estudiantes graduados (GSI) en departamentos relacionados, como Biología Molecular y Celular, Biología Integrativa, Biología Vegetal y Microbiana, Matemáticas, Estadística o Ciencias de la Computación. La enseñanza es parte de la capacitación del programa y la mayoría de los estudiantes no enseñarán más de dos semestres, a menos que lo decidan.

      Debido a las limitaciones de costos, el programa admite pocos estudiantes internacionales, el promedio es de dos por año. Los admitidos también reciben apoyo financiero completo (como se señaló anteriormente): estipendio, tarifas y matrícula.

      Los estudiantes también son fuertemente alentado para solicitar becas extramuros para la experiencia de redacción de propuestas. Hay una serie de becas extramuros que los estudiantes de Berkeley solicitan y que los solicitantes actuales pueden encontrar atractivas. Tenga en cuenta que la NSF ahora solo permite dos presentaciones: una como estudiante y otra en la escuela de posgrado. La NSF financia a los estudiantes con potencial, a diferencia de los proyectos de investigación específicos, así que no se preocupe si todavía no conoce sus planes para la escuela de posgrado, ¡simplemente elabore una buena propuesta! Aunque hacemos ofertas de admisión antes de que se publiquen los resultados de las becas, todos los estudiantes elegibles deben aprovechar ambas oportunidades para postularse, ya que es una gran oportunidad y una gran adición a un CV.

      Admisiones

      ACTUALIZACIÓN, 6/10/21: CCB ya no requiere el GRE para la admisión (ni general, ni asignatura). El GRE no será visto por el comité de revisión, incluso si se envía a Berkeley.

      TENGA EN CUENTA: La fecha límite de solicitud es Martes 30 de noviembre, 8:59 PST / 11:59 EST

      Invitamos solicitudes de estudiantes con expedientes académicos distinguidos, bases sólidas en las ciencias biológicas, físicas y computacionales básicas, así como con una experiencia significativa en programación e investigación de computadoras. La admisión para el doctorado en Biología Computacional es solo para el semestre de otoño y la Biología Computacional no ofrece una maestría.

      Estaremos encantados de responder cualquier pregunta que pueda tener, pero asegúrese de leer esto. completo la página primero, ya que muchas de sus preguntas se responderán a continuación o en la pestaña Sugerencias.

      IMPORTANTE: Tenga en cuenta que no es posible seleccionar un asesor de doctorado específico hasta el final del primer año en el programa, por lo que ponerse en contacto con profesores individuales sobre las vacantes en sus laboratorios no aumentará sus posibilidades de ser aceptado en el programa. Tendrá la oportunidad de discutir sus intereses con el profesorado relevante si lo invitan a una entrevista en febrero.

      Preparación de pregrado

      Requisitos mínimos para la admisión a estudios de posgrado:

      • Una licenciatura o equivalente reconocido de una institución acreditada.
      • GPA mínimo de 3.0.
      • Preparación de pregrado que refleja un equilibrio de formación en las disciplinas centrales de la biología computacional (biología, ciencias de la computación, estadística / matemáticas), por ejemplo, una única especialización interdisciplinaria, como biología computacional o bioinformática, una especialización en una disciplina central y una combinación de cursos interdisciplinarios. y experiencias de investigación o una doble especialización en disciplinas básicas.
      • La experiencia y la aptitud de investigación básica son consideraciones clave para la admisión, por lo que la evidencia de la experiencia de investigación y las cartas de recomendación de los mentores de la facultad que atestiguan la experiencia de investigación del solicitante son de particular interés.
      • GRE & # 8211 NO se requiere ni se usa para revisión .
      • Puntajes de TOEFL para estudiantes internacionales (consulte los detalles a continuación).

      Requerimientos de aplicacion

      TODOS los materiales, incluidas las cartas, deben entregarse el 30 de noviembre de 2021 (8:59 PST). Se proporciona y requiere más información como parte de la solicitud en línea, así que cree una cuenta y revise la solicitud antes de enviar un correo electrónico con preguntas (y configure una cuenta mucho antes de la fecha límite):

        Una solicitud de posgrado completa: la solicitud en línea se abre a principios de septiembre (

      La prueba general GRE es no requerido. Las pruebas de materias GRE son no requerido. Los puntajes de GRE no serán un factor determinante para la revisión de la solicitud y la admisión, y NO serán revisados ​​por el comité de admisiones de CCB. Si bien no alentamos a nadie a tomar el examen, en caso de que decida postularse a un programa diferente en Berkeley que los requiera: el código escolar de UC Berkeley es 4833, los códigos de departamento son innecesarios. Siempre que los puntajes se envíen a UC Berkeley, serán recibidos por cualquier programa al que solicite en el campus.

      TOEFL / IELTS

      Los solicitantes de países donde el inglés no es el idioma oficial deben demostrar un dominio adecuado del inglés. Hay dos exámenes estandarizados que puede tomar: el Examen de inglés como lengua extranjera (TOEFL) y el Sistema internacional de exámenes del idioma inglés (IELTS). Los puntajes mínimos para aprobar el TOEFL son 90 Para el Prueba basada en Internet (IBT), y 570 Para el formato en papel (PBT). Se puede renunciar al TOEFL si un estudiante internacional ha completado al menos un año de trabajo académico de tiempo completo con calificaciones de B o mejor mientras reside en una universidad de los EE. UU. (Se requerirá una transcripción). Haga clic aquí para obtener más información.

      Fechas límites para la Aplicación

      La fecha límite para la solicitud es a las 8:59 p.m., hora estándar del Pacífico, 30 de noviembre de 2021. La aplicación se bloqueará a las 9 p.m. PST, precisamente. Todos los materiales debe recibirse antes de la fecha límite.Si bien las cartas de recomendación pueden continuar enviándose y recibiéndose después de la fecha límite, el comité se reúne a principios de diciembre y revisará las solicitudes incompletas. Los exámenes TOEFL deben tomarse antes de la fecha límite o antes, pero las calificaciones autoinformadas son aceptables para su revisión mientras se procesan las calificaciones oficiales.

      Es tu responsabilidad para garantizar y verificar que los materiales de su solicitud se envíen de manera oportuna. Asegúrese de presionar el botón Enviar cuando haya completado la solicitud y de monitorear el estado de sus cartas de recomendación (enviando indicaciones, según sea necesario). Incluya la declaración de propósito y la declaración personal en la solicitud en línea. Si bien puede cargar un CV, NO cargar publicaciones o artículos completos. Por favor NO envíe currículums en papel, carpetas separadas de información o artículos por correo. Se descartarán sin leer.

      Entrevistas

      La visita de reclutamiento de Biología Computacional la fecha se publicará aquí.

      Se invitará a los mejores solicitantes que estén siendo considerados para la admisión a visitar el campus para entrevistas con los profesores. Las invitaciones se harán a mediados de enero. Se espera que los estudiantes se queden durante todo el evento, lleguen a Berkeley a las 5:30 pm el primer día y se vayan la noche del último día. En la solicitud, debe proporcionar los nombres de entre 7 y 10 profesores del sitio web de Biología Computacional con los que está interesado en realizar investigaciones o realizar rotaciones. Esto ayuda a enviar su solicitud a nuestros revisores y facilita el proceso de programación de entrevistas. Una invitación no es garantía de admisión.

      Los estudiantes internacionales pueden ser entrevistados virtualmente, ya que los vuelos suelen ser prohibitivamente caros.

      Consejos para el proceso de solicitud

      Documentos cargados: Asegúrate de poner tu nombre y tipo de ensayo. sobre sus ensayos (Declaración de propósito [2-3 páginas], Declaración personal [1-2 páginas]) como encabezado o antes del texto, ya sea que use el cuadro de texto o cargue un documento PDF o Word. No hay una extensión mínima en ninguno de los ensayos, pero se sugiere un máximo de 3 páginas. La Declaración de Propósito debe describir su investigación y antecedentes educativos y aspiraciones. La Declaración personal puede incluir logros personales no necesariamente relacionados con la investigación, barreras que ha tenido que superar, actividades de tutoría y voluntariado, cosas que lo hacen único y demuestran las cualidades que aportará al programa.

      Cartas de recomendación: debe ser de personas que hayan supervisado su investigación o trabajo académico y que puedan evaluar su capacidad intelectual, creatividad, potencial de liderazgo y promesa de becas productivas. Si la supervisión del laboratorio fue proporcionada por un estudiante de posdoctorado o posgrado, la carta debe llevar la firma o el respaldo del miembro de la facultad a cargo del proyecto de investigación. Nota: la solicitud se puede enviar antes de que todos los recomendadores hayan completado sus cartas. Es su responsabilidad realizar un seguimiento del progreso de su recomendante a través del sistema en línea. Asegúrese de enviar recordatorios si sus recomendadores no envían sus cartas.

      Becas extramuros: Es beneficioso para usted solicitar becas, ya que pueden facilitar el ingreso al laboratorio de su elección, son una gran adición a su CV y, a menudo, brindan estipendios más altos. No permita que las preocupaciones sobre la elaboración de una propuesta de investigación antes de unirse a un laboratorio le impidan postularse. Las becas buscan potencial de investigación y habilidades para redactar propuestas y no lo obligarán a participar en proyectos de investigación específicos una vez que haya comenzado la escuela de posgrado.

      Calcular el GPA: Las escuelas pueden diferir en la forma en que asignan las calificaciones y calculan los promedios de calificaciones, por lo que puede ser difícil para esta oficina ofrecer consejos. El mejor recurso para calcular el GPA de su escuela es consultar el reverso de las transcripciones oficiales donde a menudo se proporciona una guía o utilizar una herramienta en línea. Hay herramientas gratuitas de conversión de GPA en línea que se pueden encontrar a través de una búsqueda en Internet.

      Contacto / Intereses de la facultad: Asegúrese de enumerar los profesores que le interesan como parte de la solicitud en línea. No es necesario que se comunique con ninguna facultad con anticipación, ni le ayudará con la admisión, pero puede hacerlo si desea obtener más información sobre su investigación.

      Envío de la solicitud: Para evitar la posibilidad de problemas con la computadora en ambos lados, NO es aconsejable esperar hasta el último día para comenzar y / o enviar su solicitud. No es inusual que el sistema de aplicación tenga dificultades en momentos de mucho tráfico. Sin embargo, no es necesario enviar la solicitud demasiado pronto. No se revisará ninguna solicitud antes de la fecha límite.

      Visitas: Solo organizamos una visita al campus con fines de reclutamiento. Si está interesado en visitar el campus y reunirse con los profesores antes de la fecha límite de solicitud, puede hacerlo en su propio tiempo. * Tenga en cuenta que para el otoño de 2020, el campus estará cerrado a los visitantes.

      Nombre: En la solicitud en línea, escriba en mayúscula la primera letra de su nombre y apellido. NO use todo en mayúsculas o sin mayúsculas. Y verifique que haya ingresado su nombre y apellido en los campos correctos. Esta es nuestra primera impresión de ti como candidato, ¡así que quieres que tu nombre sea correcto! Asegúrese de poner su nombre en cualquier documento que cargue (Declaración de propósito, Declaración personal).

      Residencia de California: Debe haber vivido en California anteriormente y ser ciudadano estadounidense o residente permanente para ser residente. Usted está no considerado un residente si espera ingresar a nuestro programa en el otoño, pero nunca he vivido en California antes o están aquí con una visa. Por lo tanto, no marque “residente” en la solicitud antes de la admisión.


      Fundamentos de la biología computacional

      Los inicios de la biología computacional se remontan esencialmente a los orígenes de la informática. El matemático y lógico británico Alan Turing, a menudo llamado el padre de la informática, utilizó las primeras computadoras para implementar un modelo de morfogénesis biológica (el desarrollo de patrones y formas en los organismos vivos) a principios de la década de 1950, poco antes de su muerte. Aproximadamente al mismo tiempo, una computadora llamada MANIAC, construida en el Laboratorio Nacional de Los Alamos en Nuevo México para la investigación de armas, se aplicó con fines tales como modelar códigos genéticos hipotéticos. (Las computadoras pioneras se habían utilizado incluso antes en la década de 1950 para cálculos numéricos en genética de poblaciones, pero los primeros ejemplos de modelos computacionales auténticos en biología fueron el trabajo de Turing y del grupo de Los Alamos).

      En la década de 1960, las computadoras se habían utilizado para hacer frente a conjuntos de análisis mucho más variados, a saber, los que examinaban la estructura de las proteínas. Estos desarrollos marcaron el auge de la biología computacional como campo, y se originaron a partir de estudios centrados en la cristalografía de proteínas, en los que los científicos encontraron computadoras indispensables para realizar laboriosos análisis de Fourier para determinar la estructura tridimensional de las proteínas.

      A partir de la década de 1950, los taxónomos comenzaron a incorporar computadoras en su trabajo, utilizando las máquinas para ayudar en la clasificación de organismos al agruparlos en base a similitudes de conjuntos de rasgos. Estas taxonomías han sido especialmente útiles para la filogenética (el estudio de las relaciones evolutivas). En la década de 1960, cuando las técnicas existentes se extendieron al nivel de las secuencias de ADN y las secuencias de aminoácidos de las proteínas y se combinaron con un conocimiento creciente de los procesos celulares y las estructuras de las proteínas, se desarrolló un conjunto completamente nuevo de métodos computacionales en apoyo de la filogenética molecular. Estos métodos computacionales implicaron la creación de técnicas cada vez más sofisticadas para la comparación de cadenas de símbolos que se beneficiaron del estudio formal de algoritmos y, en particular, del estudio de la programación dinámica. De hecho, los algoritmos eficientes siempre han sido una preocupación primordial en biología computacional, dada la escala de datos disponibles, y la biología a su vez ha proporcionado ejemplos que han impulsado mucha investigación avanzada en informática. Los ejemplos incluyen algoritmos de gráficos para el mapeo del genoma (el proceso de localizar fragmentos de ADN en los cromosomas) y para ciertos tipos de métodos de secuenciación de péptidos y ADN, algoritmos de agrupamiento para el análisis de expresión génica y reconstrucción filogenética, y coincidencia de patrones para varios problemas de búsqueda de secuencias.

      A partir de la década de 1980, la biología computacional se basó en nuevos desarrollos en la informática, incluidos varios aspectos de la inteligencia artificial (IA). Entre estos se encuentran la representación del conocimiento, que contribuyó al desarrollo de ontologías (la representación de conceptos y sus relaciones) que codifican el conocimiento biológico en forma "legible por computadora", y el procesamiento del lenguaje natural, que proporcionó un medio tecnológico para extraer información del texto. en la literatura científica. Quizás lo más significativo es que el subcampo del aprendizaje automático encontró un amplio uso en biología, desde el modelado de secuencias con fines de reconocimiento de patrones hasta el análisis de datos de alta dimensión (complejos) de estudios de expresión génica a gran escala.


      Biología Computacional

      La biología computacional, ofrecida conjuntamente entre los Departamentos de Ciencias Biológicas (Escuela de Artes y Ciencias de Dietrich) y Ciencias de la Computación (Escuela de Computación e Información), preparará a los estudiantes para comprender los principios, modelos y teorías fundamentales en los campos de la biología y la informática. y utilizarlos estratégicamente para resolver problemas clave en Biología Computacional. Los graduados tendrán las habilidades y el conocimiento para realizar estudios de posgrado o carreras en la industria.

      Descargue el rastreador de progreso principal de biología computacional a continuación:

      Descargue un plan de muestra principal de biología computacional a continuación:

      Acceda a la Ficha principal de la Escuela de Artes y Ciencias de Dietrich aquí:Hoja de especialización en Biología Computacional de la Escuela Dietrich

      Utilice lo siguiente para ayudarle a comparar la elección entre Dietrich School y SCI:

      Requisitos de los cursos principales

      Lo mismo: consulte el rastreador de progreso principal más arriba.

      BIOSC 1640 Comp Bio Research

      Diseño de software CS 1640 Comp Bio

      ≥ ½ de los créditos de BIOSC y CS obtenidos en el campus de Pitt Pittsburgh

      ≥ ½ de todos los créditos obtenidos mientras era estudiante admitido en SCI

      Más fácil con otras especialidades A & ampS de doble titulación (se requieren 150 créditos) fuera de A & ampS

      Más fácil con otras especializaciones en SCI de doble titulación (se requieren 150 créditos) fuera de SCI

      Según la Oficina de Trabajo y Estadísticas, los campos en los que trabajan los biólogos computacionales, incluidos, entre otros, los científicos médicos y los científicos de investigación en informática e información, están creciendo más rápido que el promedio.


      Algoritmos de biología computacional

      Algunos ejemplos de algoritmos utilizados en biología computacional son:

      • Coincidencia global
      • Coincidencia de secuencia local
      • Modelos ocultos de Markov
      • Genética de poblaciones
      • Árboles evolutivos
      • Redes de regulación genética
      • Ecuaciones químicas

      Coincidencia global (también conocido como el problema Needleman-Wunsch) y Coincidencia de secuencia local (también conocido como el problema de Smith-Waterman) hace uso de nuestro conocimiento sobre las proteínas de un organismo para comprender más sobre las proteínas de otros organismos.

      Los modelos de Markov se utilizan para modelar secuencias. En estos tipos de modelos, la probabilidad de que ocurra un evento depende simplemente de su estado anterior (este tipo de modelo puede, por ejemplo, usarse para modelar una secuencia de ADN). Modelos ocultos de Markov (Figura 1) utiliza en cambio una máquina probabilística de estados finitos en la que, dependiendo de la probabilidad del estado en el que nos encontremos, emitimos una letra y luego pasamos al siguiente estado. El siguiente estado posiblemente sea igual al original.

      Genética de poblaciones intenta modelar la evolución. Para ello, suele utilizar el modelo de Fisher-Wright. Este modelo intenta simular lo que sucede en la ubicación de un gen en condiciones de selección, mutación y cruzamiento.

      Árboles evolutivos (Figura 2) se puede crear basándose en alguna forma de distancia evolutiva. Hay dos tipos principales de árboles evolutivos: árboles basados ​​en distancias y árboles basados ​​en secuencias. Los árboles evolutivos se utilizan para explicar las distancias entre diferentes especies.

      Redes de regulación genética se forman gracias a la interacción de diferentes proteínas en un organismo. Las diferentes proteínas se controlan entre sí y de acuerdo con la naturaleza de sus interacciones, se determina el tipo de célula.

      Ecuaciones químicas (Figura 3) finalmente se puede utilizar para describir la mecánica detrás de las redes de regulación de genes. Las velocidades de reacción dependen de la concentración de los elementos en las ecuaciones químicas.


      Transcripción

      Bienvenido a Expert Insights para la comunidad de capacitación en investigación: un podcast del Instituto Nacional de Ciencias Médicas Generales. Adaptado de nuestra serie de seminarios web, aquí es donde la comunidad de investigación biomédica puede conectarse con otros científicos para obtener información valiosa.

      Dr. Ming Lei:

      Buenas tardes. Y para aquellos de ustedes en la costa oeste, Alaska o Hawai, buenos días.

      Mi nombre es Ming Lei. Soy el director de la división de desarrollo de la capacidad de investigación en NIGMS y hoy soy su anfitrión. Es un placer darle la bienvenida al quinto seminario web de la serie de seminarios web de capacitación de NIGMS.

      Este es un momento difícil. La pandemia ha perturbado la vida de todos hasta cierto punto. NIGMS creó esta serie de seminarios web para ayudar a mantener unida a nuestra comunidad de capacitación con charlas y conversaciones útiles e interesantes, y espero que todos los estén disfrutando.

      Algunos recordatorios antes de comenzar la presentación. Todos los seminarios web de esta serie están grabados y algunos de ellos ya se han publicado y todos se publicarán en el sitio web de NIGMS, por lo que puede verlos, en realidad todos, en cualquier momento, y le animo a que pregunte a sus amigos. para verlos cuando tengan tiempo. En segundo lugar, habrá una sesión de preguntas y respuestas después de la presentación.

      Y nuestra oradora de hoy es la Dra. Susan Gregurick. Debido a que ella compartirá su viaje científico con usted, no voy a presentarla excepto para compartir con usted que, como directora asociada de NIH para ciencia de datos, es la líder en el centro de todas las actividades de ciencia de datos de NIH.

      Entonces, con eso, Susan, quítatelo.

      Dra. Susan Gregurick:

      Muchas gracias, Ming. Y para todos mis amigos de NIGMS, es un placer estar aquí hoy.

      He estado tan emocionado y ansioso por este viaje en particular y esta conversación contigo durante una semana. No es frecuente que les cuente a los jóvenes sobre mi propio viaje personal, y espero que se vean en un poco de mí y de lo que he hecho. Les voy a contar lo que he hecho en las ciencias computacionales, que es mi verdadero amor, y cómo esto ha ayudado a dar forma a la biomedicina y a mis propias elecciones profesionales personales.

      Permítanme comenzar contándoles el comienzo.

      Así que quiero darles una perspectiva histórica en el desarrollo de las computadoras, la informática, Internet; de hecho, vi el nacimiento de Internet más o menos, redes y análisis en mi propio viaje personal y cómo estos han cambiado mi vida profesional y han me ayudó a elegir mi carrera.

      Y luego quiero terminar con algo que es relevante para todos y cada uno de nosotros en todo el mundo: ¿Cómo hemos aplicado la informática, Internet, las tecnologías y la analítica para abordar el COVID-19? Y estamos apenas al comienzo de COVID-19, por lo que tenemos un largo camino por recorrer.

      Así que vamos a tener que retroceder en la máquina del camino de la década de 1980. Así que la canción principal de 1982 es "Physical" de Olivia Newton-John, que puede que hayas escuchado o no, pero estoy seguro de que has visto la película E.T. Fue la película más taquillera de 1982. Vivo en algún lugar de un pueblo de Michigan y soy bailarina. De hecho, tomo ballet y bailes de las tierras altas. Soy un tonto total. Probablemente entro y salgo de la escuela más que la mayoría. Soy DJ en la estación de radio de nuestra escuela secundaria local.

      Mi nombre es Susie en ese momento. Soy la reina del baile de bienvenida. Y soy un completo friki del armario. Nadie en mi escuela secundaria sabe que soy un ávido lector de ciencia ficción. Estoy leyendo Scientific American, que estaba a mi nivel en la escuela secundaria. Estoy tomando clases en la universidad comunitaria local, principalmente en genética y química. Estoy realmente fascinado con la ciencia, pero esa era mi vida secreta.

      Y así es como me veía la informática en 1980. Tan popular entonces era el Commodore 64. Venía de una comunidad y una ciudad donde las computadoras no eran muy comunes, por lo que incluso mi escuela secundaria no tenía computadoras, pero la universidad comunitaria local hizo. Esta es una típica sala de ciencias de la computación que nunca pude visitar cuando estaba en la escuela secundaria, pero estoy bastante familiarizada con estas.

      Y si nunca los ha visto antes, son tarjetas perforadas. Entonces, cuando escribes un programa de computadora en la década de 1980 y antes, tienes que traducirlos al sistema de tarjetas perforadas, y luego introduces esas tarjetas perforadas en una máquina que en realidad no es muy visible en mi imagen.

      Y la preocupación de todos los científicos de la computación en ese momento era que dejaras caer esas tarjetas perforadas porque & # 8217 son un programa y están en orden, y si dejas caer esas tarjetas perforadas, pasarás una cantidad significativa de tiempo y te preocupes tratando de vuelva a ponerlos en orden. Imagínese tratando de depurar su programa usando un sistema de tarjetas perforadas. Fue tan difícil de hacer, tanto trabajo.

      Y cuando estaba en la escuela secundaria, este fue uno de los aspectos más destacados de la biología computacional de 1982. Por cierto, 1982 es el año en que me gradué de la escuela secundaria. Esta es la historia de la dinámica de las proteínas de una pequeña proteína llamada BPTI, inhibidor de tripsina pancreática bovina. Tiene aproximadamente 60 aminoácidos de longitud y puede ver su estructura de cinta en la pantalla.

      Wilfred van Gunsteren y Martin Karplus hicieron trayectorias de dinámica molecular de esta pequeña proteína diminuta durante 25 picosegundos en el vacío, y luego la pusieron en una capa esférica de 2647 aguas no polares, y luego la fijaron en una estructura cristalina e intentaron Entender la dinámica del movimiento de esta proteína en estos tres escenarios, y ese artículo en particular y esa simulación en particular fue un tour de force de la biología computacional el año en que me gradué de la escuela secundaria.

      Y estaba totalmente sorprendido de que pudiéramos hacer cálculos de la dinámica de las proteínas en estos tres escenarios diferentes: en el vacío, en un disolvente no polar y en una imagen de cristal. Así que avanzando un poco a finales de la década de 1980, la canción principal es "Walk Like an Egyptian". Esa era la canción cuando estaba en la universidad como estudiante. La película más taquillera de 1987 es Tres hombres y un bebé, en realidad una película que nunca vi, no es del todo mi interés, y estoy en la Universidad de Michigan y soy un estudiante universitario. Y me gradué en el año 1987.

      Soy un estudiante de química y matemático.Probablemente no es raro que la mayoría de ustedes tenga dos carreras. Soy asistente de investigación. Soy asistente de investigación en matemáticas. Soy asistente de investigación en geología. Y también soy asistente de investigación en la facultad de medicina, donde desarrollo agentes de imagenología hepática a través de la química orgánica sintética, y ese no es mi punto fuerte.

      No hago más química orgánica sintética después de la licenciatura, pero en ese momento pensé que sería un tipo de investigación interesante para explorar. También paso mucho tiempo buscando errores en mi código.

      Solo quiero señalarles un punto, ya que muchos de ustedes son estudiantes universitarios. Una de las experiencias más valiosas que puedes obtener como estudiante es trabajar en un laboratorio. Trabajar en un laboratorio, trabajar con estudiantes graduados, trabajar con otros estudiantes graduados, trabajar con investigadores postdoctorales y su mentor, su mentor PI, le permitirá ver cómo es realmente la investigación. Ya sabes, es difícil.

      A veces pasas mucho tiempo trabajando en un proyecto y no te lleva a ninguna parte. Hay muchos comienzos en falso. Esta es una de las experiencias de aprendizaje de la vida real más valiosas que puede tener, y animo a todos a que tomen al menos un semestre e investiguen en un laboratorio. Y, obviamente, ya no soy un fanático del armario, soy un verdadero fanático de la Universidad de Michigan.

      Soy conocido principalmente en el departamento de química y matemáticas, pero también tengo mucho trabajo en codificación. ¿Y cómo son las computadoras para mí cuando soy estudiante? Esta es una de las computadoras en las que trabajé. No es mi computadora real porque no me la llevé. Esta es una IBM PC / 2, y puede ver que realmente puede jugar al ajedrez en esta computadora.

      Esta es la Universidad Estatal de Ohio, un gran competidor de Michigan, por cierto. Este es el centro de supercomputación en 1987. Son una potencia de supercomputación. No son los únicos, pero los conocía bien. Y este es el nacimiento de los lenguajes de programación. Aunque probablemente hayas oído hablar de Fortran, ese era mi idioma principal cuando codificaba a finales de la década de los 80. C ++, ciertamente, pero PERL y estos lenguajes más interpretativos y dinámicos realmente comienzan a desarrollarse a finales de los años & # 821780. ¿Cuál es el punto culminante computacional del año en que me gradué de la universidad, que fue 1987? Es otra simulación por computadora.

      Esta es la difusión de un sustrato en un sitio activo en una enzima. Y este sistema en particular es la superóxido dismutasa. Y lo que quería mostrarles es que a diferencia de la última simulación, que es la dinámica en una especie de trayectoria, estas son simulaciones dinámicas brownianas más estocásticas, y lo que fue realmente genial sobre el trabajo de Kim Sharp y Barry Honig y Robert Fine es que realmente ponen las cargas en el sitio activo de la enzima en el cálculo.

      Y tener la capacidad de hacer que las moléculas tengan una carga te da una electrostática [ininteligible] de lo que realmente está sucediendo en ese sitio activo. Y para mí esto fue solo una simulación genial. Amo el trabajo de Barry Honig. Lo he seguido durante años y he visto el campo de los cálculos electrostáticos pasar de cargas puntuales a cargas probables y todo tipo de trabajos realmente innovadores, por lo que solo quería compartir con ustedes ese punto destacado en particular.

      Pasando a una nueva década: los noventa. La canción principal en 1995 es "Gangsta's Paradise" de Coolio, con L.V., y la película principal, que sí vi, es Batman Forever. Todas esas películas de Batman son geniales. Y estoy en la Universidad de Maryland. Y, obviamente, nunca me he ido de esta zona. Todavía vivo en Silver Spring hoy.

      Estoy defendiendo mi tesis doctoral en 1995. Solo una nota al margen. Me tomé dos años de descanso entre mi licenciatura y mis estudios de posgrado, y trabajé en el Laboratorio de Investigación Naval, donde participé en la caracterización física de moléculas orgánicas utilizadas para sustitutos de la sangre. Y fue una experiencia realmente maravillosa porque pude ver cómo era trabajar en un equipo muy grande en el Laboratorio de Investigación Naval, y logré ser mucho más competente en espectroscopía de RMN y espectroscopía de IR y espectroscopía de Raman, y así Me encantó la espectroscopia de infrarrojos y Raman que verá aparecer en mi futuro.

      Ves este personaje aquí en los escalones gigantes. Ese es mi asesor de tesis doctoral. Ese es Millard Alexander. Todavía está en la Universidad de Maryland. Creo que podría ser emérito en este momento. Pero, ¿en qué trabajamos?

      Así que estudié el flujo en sistemas reactivos, sistemas como el hidruro de boro, y estudié lo que sucede en esos sistemas cuando la energía potencial que describe diferentes estados de excitación se cruza y ¿cómo se calcula realmente el cruce de curvas o las reacciones? Esa es realmente la historia del flujo.

      Desarrollé un nuevo algoritmo genético, que es un algoritmo bastante bueno, para la optimización de estructuras que tienen múltiples superficies de energía potencial, PSE, y obviamente no estoy en biología computacional. Soy un cervecero casero serio y me casé con mi colega en física.

      Y esta es una foto posterior, pero somos mi esposo y yo, Nicholas Phillips. Cuando era estudiante de posgrado, quería cambiar de carrera. Quería pensar de manera diferente sobre la computación y lo que podemos hacer con nuestras carreras, así que cambié de la física a la biología computacional.

      Así es como se veían las computadoras en la década de 1990. En realidad, esta es una computadora en la que hice la mayor parte de mi trabajo de doctorado. Es un Apple Macintosh. Tuve tanta suerte de ver el nacimiento de Mozilla, Netscape, y un poco borroso para ustedes es el lenguaje HTML en el que la mayoría de ustedes probablemente saben programar y son muy, muy eficientes. Pero cuando estaba en la escuela de posgrado esto era completamente nuevo, y esto también.

      En un momento, salió una lista todos los días, un nuevo sitio web y había una lista de los mejores sitios web que habían aparecido ese día. Y la primera cámara web, esa es la cafetera en Cambridge, donde de hecho visité e hice un trabajo como estudiante de posgrado. Ahí está.

      Podrías ver el nivel de la cafetera en cualquier momento en particular y sabrías cuándo podrías bajar y tomar un café nuevo. Y aquí voy a tocar para ustedes en la máquina del camino de regreso el sonido que nunca olvidaré [apretón de manos de acceso telefónico]. Ahí está. Y ese horrible sonido sigue y sigue. Así fue como tuvimos que conectarnos a Internet. Ese es mi módem de acceso telefónico.

      Así que tuve que sentarme en casa y compartir el tiempo de la computadora en la casa de nuestra escuela de posgrado, conectarme a Internet y hacer nuestro trabajo. Y la mayoría de nosotros jugamos juegos, y teníamos que tener mucho tiempo para hacer nuestro trabajo y jugar. Así que ustedes tienen una experiencia maravillosa, siempre conectados, siempre encendidos, pero para nosotros, ese fue el sonido que escuchamos hora tras hora durante toda la noche.

      Aquí & # 8217 hay algo que fue muy emocionante cuando estaba al principio de mis días de posgrado. Esta es BLAST, herramienta básica de búsqueda de alineación local, desarrollada por varios colegas, incluido David Lipman. David Lipman todavía está en NCBI y NLM aquí en NIH.

      Este fue un nuevo enfoque para realizar rápidamente una comparación de secuencias de diferentes secuencias haciendo una alineación básica. Y obtendría una puntuación, y eso le diría, por ejemplo, dónde estaban los huecos, dónde estaban las inserciones. Este algoritmo en particular ha revolucionado la forma en que hacemos la genómica comparativa, y ahora puede hacer slide BLAST y multi-PI BLAST, y ha sucedido mucho trabajo. Pero apuesto a que la mayoría de ustedes ha usado BLAST o uno de sus niños prodigios en su propia investigación, y fue simplemente extraordinario.

      Y esta es realmente una de las razones por las que me inspiré para pensar en bioinformática y ciencia de datos, porque comencé a darme cuenta cuando estaba en física que el mundo de los datos y el mundo de la biología y el mundo de la computación eran la próxima gran novedad. , y creo que podría estar de acuerdo en que eso es realmente cierto.

      En los años transcurridos desde 1995, he viajado a Israel para realizar una beca postdoctoral en biología computacional. Fui profesor de biología computacional en una universidad, la Universidad de Maryland, en el condado de Baltimore, durante varios años, y uno de los proyectos en los que trabajé fue este complejo de proteínas supergrande llamado GroEL-GroES, que es un complejo de proteínas acompañantes. y es enorme. Son 14 subunidades, pero no puedes verlas todas. Está todo junto como un gran complejo. Cada subunidad es de 58 kilodaltons. Ni siquiera podía cargar ese complejo en la memoria de mi computadora cuando estaba trabajando. Tuve que hacer un procesamiento paralelo muy grande en supercomputadoras para hacer los cálculos de cómo funcionan realmente el complejo chaperón GroEL-GroES y las proteínas que están en el interior que están en azul.

      Cambié. Me convertí en director de programa del Departamento de Energía y me concentré total y totalmente en datos (plataformas de datos, computación de datos) para la energía y el medio ambiente, muy particularmente en bioenergía, traduciendo álamos y otros tipos de plantas leñosas blandas en complejos bioenergéticos. Decidí hacer ese cambio de carrera porque quería tener un mayor impacto para una mayor cantidad de ciencia, y realmente me dedico a la ciencia de datos.

      Fui director de división en NIGMS y trabajé para el Dr. Jon Lorsch, y fui director de Biofísica, Tecnología Biomédica y Biociencias Computacionales, y realmente quería pensar en cómo podemos cambiar el panorama de la tecnología, incorporando mucho más tecnología nueva e innovadora, así como nuevas ideas para la ciencia en equipo.

      Y ahora soy el director asociado de ciencia de datos, donde trabajo en los NIH y en toda la comunidad para hacer que los datos, los recursos de datos sean fáciles de encontrar, accesibles, interoperables y reutilizables. Y también soy la madre de dos jóvenes adultos fantásticos, Andrew Phillips, quien es un estudiante de tercer año en la universidad que estudia, sobre todo, química orgánica, y mi hija, Abigail Phillips, que está terminando la escuela secundaria y espera algún día tener una carrera en danza.

      Y todavía hago cerveza. Casi todos los meses me preparo otra garrafa de cinco galones de cerveza.

      Tiene datos a su alcance y tiene plataformas maravillosas para acceder y usar esos datos. Siempre estás conectado y siempre conectado, y eso es algo maravilloso. Y tal vez también sea una maldición, pero es tan agradable no tener que escuchar nunca ese sonido de acceso telefónico. Tiene supercomputadoras como nunca antes habíamos visto que realmente pueden abordar problemas de gran complejidad.

      El problema que les mostré el complejo de acompañantes GroEL-GroES podría manejarse fácilmente hoy sin ninguna solución especial con la computación paralela masiva. Tiene R y es brillante, y escribe en codelets que puede combinar directamente en el metal desnudo con Kubernetes.

      Y puede empaquetar su código en ventanas acoplables y contenedores y moverlo a diferentes recursos en la nube. Y estás trabajando en una comunidad. Tienes GitHub. Compartes tu software.

      Este es solo un ejemplo de Jupyter, pero hay una gran comunidad de intercambio de software a su disposición. Entonces, ¿cómo podemos utilizar todas estas herramientas que tenemos hoy en nuestras manos para abordar una pandemia que es significativa? ¿Cómo podemos asociarnos con la industria para los flujos de trabajo, las herramientas y el análisis? ¿Y cómo podemos proporcionarle los recursos para que pueda realizar su trabajo?

      Solo quiero darles tres o cuatro casos de uso de lo que estamos haciendo en este momento en los NIH que pueden usar para estudiar COVID-19. Y esta es una historia asombrosa de dos investigadores intramuros, uno de ellos del NIDDK y el otro del NCI, por lo que el NCI es el Instituto Nacional del Cáncer y el NIDDK es el Instituto Nacional de Diabetes y Enfermedades Digestivas y Renales.

      Y ellos, en tres semanas, recolectaron muestras de patología, crearon las imágenes digitales de esas muestras, las desidentificaron, se asociaron con una compañía llamada HALO y colocaron esas imágenes de diapositivas completas para que las use como referencia para que pueda estudiar y comprender COVID-19.

      En este momento tenemos mucho más de ocho casos de referencia porque nuestros dos investigadores intramuros obtienen cada día más muestras de hospitales de diferentes países, así que creo que tenemos hasta 19 casos de referencia, pero cada día llegan más.

      Y vamos a integrar este recurso en particular en un recurso mucho más grande en un futuro cercano, pero ahora mismo puede ir y hacer un desarrollo limitado de algoritmos de inteligencia artificial en estos recursos. Y nos estamos asociando con la compañía de videojuegos y videojuegos para crear flujos de trabajo de procesamiento para imágenes de TC. La tomografía computarizada ha sido uno de los tipos de imágenes que puede usar para detectar COVID-19 en pacientes, por lo que estamos desarrollando esos flujos de trabajo mediante el uso y el aprovechamiento de las computadoras para juegos. Esta es una clasificación de inteligencia artificial muy buena.

      Y estamos proporcionando recursos informáticos de alto rendimiento al gobierno federal, a la industria, a los líderes académicos de todo el mundo para que pueda utilizar recursos de los laboratorios nacionales, recursos de IBM, de Google, de AWS. Hay más de 4 millones de núcleos de CPU disponibles. El consorcio acepta solicitudes todos los días. Entonces, si tiene una idea que cree que se beneficiaría de la informática de alto rendimiento, este consorcio está ahí. Los recursos son gratuitos para ti.

      Hemos recorrido un largo camino desde aquellos días de las tarjetas perforadas y las simulaciones dinámicas de 25 picosegundos de proteínas diminutas y diminutas, y me pregunto a dónde nos llevará en el futuro usted, nuestra nueva y más brillante generación de científicos.

      Y con eso, me encantaría escuchar sus preguntas, sus comentarios y sus pensamientos. Y se lo voy a devolver a Ming.

      Dr. Ming Lei:

      Gracias. Muchas gracias, Susan. Diré que con las computadoras, la cerveza y la encantadora familia es una vida muy emocionante. Entonces, como mencioné anteriormente, vamos a tener preguntas. Preguntaré al primero en nombre de nuestra audiencia. Entonces, para un estudiante de biología interesado en una carrera de investigación, ¿cuál sería la capacitación o las habilidades clave en computación y ciencia de datos que el estudiante debería adquirir mientras está en la escuela?

      Dra. Susan Gregurick:

      Esa es una gran pregunta, Ming. Yo diría que hay algunas formas comunes en las que la biología está comenzando a analizar datos y estudios en los que puede comenzar a tomar clases ahora, y eso incluiría familiarizarse con el lenguaje de programación R, porque bastantes software Las herramientas están escritas para y en R. Pero si eso es un poco una barrera, también hay herramientas como Galaxy, que son un poco más plug and play, por lo que al usar las herramientas disponibles en Galaxy o Jupyter, puede tener una muchos tipos diferentes de software computacional como Glass y otros.

      Por lo tanto, familiarizarse con esas plataformas y aprender a usar esas herramientas y comprender lo que significan los resultados para su investigación sería un gran paso adelante. Y Coursera ofrece muchos tipos diferentes de clases computacionales disponibles para los estudiantes.

      Y creo que los NIH tienen ofertas para hacer que las clases de ciencia de datos computacionales de Coursera estén disponibles gratuitamente para los estudiantes de los NIH, por lo que estaremos encantados de indicarle esos recursos.

      Dr. Ming Lei:

      Bien bien. De hecho, hay una pregunta de uno de los estudiantes. ¿A dónde acudiría para solicitar el acceso a los recursos informáticos?

      Dra. Susan Gregurick:

      Del Consorcio HPC. Existe un sitio web y la solicitud se procesa a través de NSF, a través de un programa llamado XSEDE. NSF enviará su solicitud al consorcio y la propuesta es muy liviana. Creo que son solo tres páginas, por lo que ciertamente puede solicitar esos recursos fácilmente, y luego coincidirán con las necesidades de recursos con la aplicación que instale, para que pueda tener acceso a muchos tipos diferentes de recursos.

      Dr. Ming Lei:

      En relación con eso, los NIH también tienen oportunidades de capacitación y recursos disponibles, ¿verdad?

      Dra. Susan Gregurick:

      Absolutamente. Hay varias oportunidades de capacitación diferentes que preparé como una diapositiva adicional, incluida nuestra nube de metadatos SRA, BigQuery y recursos de capacitación en bioinformática NIAID. Todos los recursos de los que les hablé hoy se pueden encontrar en nuestro sitio web, incluida la aplicación informática de alto rendimiento.

      Y luego hay una serie de oportunidades de capacitación que tendremos disponibles, incluso si realmente desea hacer computación en bare metal, hay un curso de dos días sobre el motor de Kubernetes a finales de este mes. Hay una serie de otras oportunidades en proceso que podrían ser trabajar con Google, GCP o AWS. Algunas nuevas oportunidades para el aprendizaje automático y la ingeniería de datos a finales de julio.

      Dr. Ming Lei:

      Excelente. Otra pregunta es más sobre su propio viaje científico. ¿Cómo decidió cambiar su campo y cómo se actualizó con el nuevo campo?

      Dra. Susan Gregurick:

      Esa es una buena pregunta. Y es una especie de historia divertida. Estaba estudiando física, principalmente en física de superficies y de gases. Y la financiación estaba empezando a cambiar cuando yo era un estudiante graduado de ese tipo de financiación de física / Silicon Valley mucho más en bioinformática, y mi asesor de tesis doctoral dijo: "Hay algunas oportunidades en tu vida en las que puedes hacer un cambio de carrera , y desde la escuela de posgrado hasta el posdoctorado es uno de ellos. Si quiere hacer un cambio a la biología computacional ”, porque vio todos los artículos que estaba leyendo,“ ahora es el momento de hacerlo ”.

      Así que escribí a varias personas para que recibieran capacitación específica de personas que eran físicos anteriores que se habían pasado a la biología computacional, y así es como elegí mi posdoctorado trabajando con alguien que también había sido físico para que tuviéramos algunos lenguaje común. Fue un cambio difícil.

      Había tomado muy, muy pocas clases de biología cuando era estudiante y obviamente ninguna clase de biología cuando era estudiante de posgrado, así que tuve un gran impulso para volver a capacitarme. Tuve la suerte de que mi asesor postdoctoral fuera muy paciente conmigo, ya que tuve que realizar una formación adicional y cursos de biología en particular.

      Y seré el primero en admitir que no tengo la fuerza y ​​la experiencia que muchos de mis colegas en NIGMS tienen en biología, y a menudo tengo que buscarlos para comprender el significado de los sistemas que estoy tratando de entender. estudio con mucho más detalle que el mío.

      La biología es muy complicada, pero también fascinante.

      Dr. Ming Lei:

      Excelente. Esta pregunta de seguimiento es desde un ángulo diferente. ¿Tiene algún consejo para los postdoctorados que no tienen una formación clásica en ciencia computacional de datos que quieran hacer la transición al campo?

      Dra. Susan Gregurick:

      Si, absolutamente. Yo pensaría de manera similar que trabajar con un asesor o hacer un año sabático como profesor asistente junior con un colega que tiene esa capacitación en experimentación de laboratorio húmedo, pero que también ha hecho una transición a la computación, te ayudará mucho.

      Por lo tanto, es posible que deba tomar un año adicional de postdoctorado o un año sabático para capacitarse en ciencias computacionales, pero trabajar en el laboratorio con otras personas en el campo de la computación le dará mucha información. También desmonté mucho código para aprender cómo funcionaba, y esa es una buena manera de aprender cómo funciona algo es desarmarlo y luego tratar de aprender cómo volver a armarlo.

      Dr. Ming Lei:

      Bien, este es uno muy relacionado. ¿Cuáles son las oportunidades de bioinformática computacional como posdoctorado prospectivo en los NIH?

      Dra. Susan Gregurick:

      Hay una serie de becas computacionales que se pueden solicitar. También hay una gran cantidad de fondos para nuevos investigadores en ciencia de datos computacionales, y resulta que está buscando en el instituto que tiene, yo diría, la mayor cantidad de oportunidades de financiamiento de ciencia de datos y computacionales, NIGMS, y por lo tanto trabajar con ellos para Obtener financiación en uno de sus programas es una oportunidad absolutamente maravillosa.

      Dr. Ming Lei:

      Otro relacionado con esto, qué nivel de matemáticas y estadísticas necesitarías para poder aprovechar las herramientas bioinformáticas que mencionaste anteriormente.

      Dra. Susan Gregurick:

      Yo diría que tener un buen conocimiento básico de matemáticas y estadística siempre te ayudará. De hecho, cuando estaba estudiando especializaciones cuando estaba en la universidad, estaba pensando en hacer una doble especialización en ciencias de la computación y uno de mis colegas me dijo que es mucho mejor especializarse en matemáticas porque las matemáticas son la base de la mayoría de las ciencias de la computación. Y eso es cierto, lo veo ahora.

      Por lo tanto, tener una sólida formación en matemáticas nunca puede hacerte mal. Pero si hay una pequeña barrera, entonces tener una buena base para las estadísticas definitivamente será una herramienta muy importante para tener en su caja de herramientas.

      Dr. Ming Lei:

      Otro, ¿qué lenguaje de programación será adecuado para comprender la biología computacional?

      Dra. Susan Gregurick:

      Tengo tantos favoritos, pero probablemente ahora estén un poco viejos y desactualizados, y lo que veo es que la gente encuentra que R y R Shiny son muy útiles, y muchos de nuestros IP profesionales están escribiendo sus programas en R. Entonces, si Tuve que elegir uno, sería R, pero si me preguntas cuál es mi lenguaje de programación favorito, en realidad es PERL. Amaba tanto a PERL. No me gustó mucho Java y ciertamente no me gustaron muchos de los lenguajes enhebrados, pero me encantó PERL, pero no creo que eso sea muy útil. Creo que probablemente R será tu mejor apuesta.

      Dr. Ming Lei:

      Excelente. ¿Cuál sería su consejo para adquirir habilidades computacionales que desea incorporar a la investigación en lugar de ingresar al campo como un todo? ¿Cuál sería la mejor manera para que un estudiante se acerque a un mentor potencial?

      Dra. Susan Gregurick:

      Entonces, ¿quieres acercarte a un mentor y ganar experiencia? Estoy tratando de entender cómo analizar eso.

      Dr. Ming Lei:

      La primera parte es que existen formas de adquirir habilidades computacionales que desea incorporar a la investigación pero que realmente no desea convertirse en un científico de datos con tarjetas.

      Dra. Susan Gregurick:

      Yo diría que aprender algunas de las herramientas de software más populares, como BLAST, por ejemplo, es una gran herramienta. El simple hecho de aprender a usarlo y lo que esos resultados significan para su propia investigación probablemente le hará muy bien. Por lo tanto, nunca tendría que escribir mucho código utilizando el software existente, pero realmente lo ayudará si conoce los conceptos básicos y los resultados y conoce la base de algunas de esas herramientas más populares.

      Dr. Ming Lei:

      Bien, aquí hay uno específico, ¿qué herramientas recomendaría para el procesamiento de imágenes crio-EM para determinar las estructuras de proteínas?

      Dra. Susan Gregurick:

      No soy un experto en eso, pero creo que hay algunas herramientas, algo como Cryolan es una herramienta que he escuchado, y creo que se ha enviado a la nube y, de hecho, creo que NVIDIA funcionó en eso también para cryo -EM. Probablemente hay otras herramientas mejores y más populares que conozco gracias a la asociación con NVIDIA.

      Dr. Ming Lei:

      De acuerdo, también hay una pregunta bastante específica: ¿los NIH tienen recursos abiertos para servicios como la secuenciación de muestras de pacientes?

      Dra. Susan Gregurick:

      Absolutamente. Y esto puede o no estar disponible para la comunidad abierta, pero nuestro instituto NHGRI, nuestro Instituto Nacional de Investigación del Genoma Humano, realiza la secuenciación en pacientes, particularmente también ahora para COVID-19, así como también tenemos un laboratorio nacional en Frederick, Maryland — Frederick National Lab — que está realizando la secuenciación en pacientes con COVID-19, además de desarrollar pruebas serológicas y analizar esos datos. Veo que CryoSPARC es otra popular herramienta de procesamiento de datos cryo-EM.

      Muchas gracias. Debe ser Mary Ann Wu quien ha mencionado eso. Así que muchas gracias. CryoSPARC se está convirtiendo en otra herramienta popular.

      Dr. Ming Lei:

      Así que vamos a & # 8217s para otra pregunta. Dado que sectores como la banca, los seguros, a menudo ofrecen salarios mucho más altos a un estudiante con ese tipo de capacitación en ciencia de datos computacionales, ¿qué les diría a esos estudiantes para que consideren la investigación biomédica como una opción profesional gratificante y viable?

      Dra. Susan Gregurick:

      Esa es una gran pregunta porque siempre está en mi mente también. Yo diría que ser investigador e investigador en biología computacional y estudiar y comprender la biología es gratificante por varias razones.

      La flexibilidad que tiene en su carrera y sus opciones de carrera y los tipos de trabajo que hace, eso depende de usted. Tú tomas las decisiones y eres el capitán de tu barco, y haces las contribuciones a la ciencia, a diferencia de la industria privada, donde el capitán del barco es el CEO y la junta directiva, y ellos toman muchas de las decisiones y que está implementando.

      Aquí, cuando eres un investigador en un entorno académico, eres tú quien está descubriendo y empujando el campo hacia adelante. Y si esa pasión por comprender, abordar preguntas, usar sus habilidades en informática o en el laboratorio húmedo lo impulsa, permanecerá despierto día y noche para hacerlo. Descubrirá que la pasión que tiene por la investigación no se apagará por la falta de dinero que no tenga por no haberse mudado a la industria.

      Dr. Ming Lei:

      ¿Cuáles son algunos de los grandes problemas en los que está trabajando como director asociado de ciencia de datos de los NIH?

      Dra. Susan Gregurick:

      En este momento, el mayor problema en el que estamos trabajando es con respecto a COVID-19, y es que tenemos que crear y mover muy rápidamente una infraestructura para llevar los datos y la información a los científicos de tal manera que puedan usar su algoritmos para responder preguntas realmente importantes.

      La ciencia de datos requiere datos, pero requiere que los datos estén bien formateados, bien seleccionados, con anotaciones, que estén en un modelo común para que podamos analizar muchas organizaciones diferentes, y eso es en lo que estamos trabajando en este momento. Y pasamos todos nuestros días, la mayor parte de nuestras noches e incluso los fines de semana, y no solo yo, muchas personas de los NIH, para mover los datos de una manera que los investigadores puedan usarlos ahora mismo.

      Dr. Ming Lei:

      ¿Qué idioma crees que es mejor para comenzar a aprender si ella no tiene ningún conocimiento de lenguaje de programación antes de eso?

      Dra. Susan Gregurick:

      Creo que el mejor para empezar es probablemente trabajar en R. Aprendí Fortran, ya ni siquiera enseñan eso, en la universidad. C ++ es la base de muchos de los lenguajes de programación que se utilizan, por lo que siempre es un buen lenguaje para aprender, especialmente si quieres ser un experto en ciencias de la computación.

      Pero si está buscando aprender algo y ser bastante competente rápidamente, le recomiendo mirar R.

      Dr. Ming Lei:

      ¿Existe una plataforma específica que sea mejor para tomar cursos de informática en línea, como Coursera o Udemy? Lo siento si estropeé los nombres. No estoy familiarizado con ellos. ¿Es uno mejor que el otro?

      Dra. Susan Gregurick:

      Estoy mucho más familiarizado con Coursera, y hemos desarrollado una asociación con ellos para que podamos brindar capacitación a una gran cantidad de colegas, por lo que es el que personalmente conozco mejor y recomendaría, pero probablemente haya otros. . A mi hijo le gusta mucho Khan Academy y ha estado tomando muchos cursos, incluso cuando estaba en la escuela secundaria, a través de Khan Academy.

      Dr. Ming Lei:

      He aquí una pregunta que requiere cierta formación médica, Susan. Con la transición de lo presencial a lo online, ¿qué recomendaría para evitar que sus ojos se cansen por mirar la pantalla durante mucho tiempo?

      Dra. Susan Gregurick:

      No sé si estoy calificado para decirlo o no, pero mi estrategia es tomar muchos micro descansos, porque ciertamente puedo entender lo que estás diciendo en términos de fatiga visual. Y además, estar sentado todo el día tampoco es tan bueno, así que mi recomendación personal, y no soy médico en absoluto, soy un informático, me gusta hacer micro-descansos.

      Dr. Ming Lei:

      Creo que tienes que encargarte de un cervecero, ¿verdad?

      Dra. Susan Gregurick:

      Dr. Ming Lei:

      ¿Los NIH trabajan con las grandes empresas tecnológicas?

      Dra. Susan Gregurick:

      En efecto. Sí. Tenemos asociaciones a través de nuestro programa STRIDES con Google y AWS. Nos asociamos con Palantir, que es una plataforma de análisis muy grande. Nos asociamos con NVIDIA, que es una empresa de desarrollo de chips para juegos. Nos asociamos con empresas más pequeñas. No sé si Halo es muy pequeño, pero esa es la plataforma en la que montamos el sitio web. Por eso, nos asociamos con varias empresas de tecnología.

      Hemos hablado con varias personas que están en el espacio de la IA para analizar las asociaciones. Nos asociamos con los laboratorios nacionales y con otras agencias, como NSF. Buscamos asociarnos con agencias hermanas como VA. Así es como la ciencia avanza, es trabajar en conjunto. Cada asociación ofrece fortalezas y nosotros también tenemos una fortaleza. No duplicamos el trabajo de los demás, nos asociamos y juntos hacemos avanzar la ciencia.

      Dr. Ming Lei:

      ¿Recomienda algún campamento de entrenamiento de ciencia de datos para una capacitación más estructurada?

      Dra. Susan Gregurick:

      Debo decir que tengo una colega que está en mi oficina, su nombre es Allissa Dillman, y dirige una serie de codeathons y bootcamps, por lo que me encantaría animarlos a participar en uno de sus bootcamps. Y para ver cuál se está ejecutando, tienes que ir a mi sitio web, y acabo de ver que no lo pusimos allí. Pero si visita el sitio web de ciencia de datos NIH.gov, podrá encontrar los bootcamps que estamos ejecutando.

      He realizado una serie de jamborees y bootcamps en mi pasado, y siempre me gustaron los que se centraban en escribir herramientas analíticas para el análisis de secuencias y el análisis de vías metabólicas. Esos son mis favoritos personales, pero ella lleva a cabo campamentos de entrenamiento sobre el análisis de secuencias, ejecuta campamentos de entrenamiento para comprender los datos de los registros de salud electrónicos. Dirige tantos tipos muy diferentes de campamentos de entrenamiento. Pero diría que asistir a uno de sus bootcamps probablemente sería muy divertido. Es joven y está mucho más en sintonía con el rumbo de la informática que yo. No he codificado más de, no sé, 10 años, creo.

      Dr. Ming Lei:

      Está bien. Estoy interesado en aprender Python. ¿Tiene algún consejo sobre cómo debería aprender?

      Solo tengo algo de experiencia trabajando en R.

      Dra. Susan Gregurick:

      Sí, Python. Solo puedo decirles que mi estrategia sobre cómo aprendí fue obtener código, desarmarlo y luego trabajar con él. Ponga nuevas subrutinas, nuevos algoritmos y vea si puedo conseguir que haga algo nuevo. Así es como ayudé a mi hijo a aprender programación, por lo que sugeriría que si está interesado en Python, obtenga algunos códigos escritos en Python desde GitHub y vea si puede jugar con él.

      Hay excelentes libros de O'Reilly sobre cómo entender el código de computadora a un nivel un poco más fácil, y también obtendría uno de los libros de O'Reilly. El libro de Python es particularmente divertido. Lo tenemos en nuestra casa.

      Dr. Ming Lei:

      Me interesa la bioinformática con experiencia en biología. No tengo conocimientos de física. Si quiero saber más sobre física, ¿por dónde debo empezar?

      Dra. Susan Gregurick:

      Esa es una gran pregunta. Hay muchos cebadores que puede obtener para comprender parte de la física subyacente detrás de la bioinformática. A veces, es útil tomar un artículo que le interese y leer algunas de las referencias o parte de la metodología subyacente.

      Entonces, encuentra un artículo que le interesa y ve algo de metodología, luego vuelve a sus libros de texto y aprende un poco más de la metodología que está en el artículo. O siempre puede tomar una clase de física, aunque tienden a no ser completamente relevantes para el artículo que está leyendo. Entonces esa sería mi sugerencia.

      Dr. Ming Lei:

      Bien, aquí hay uno que es más actual. ¿Qué tipo de información está disponible en asociación con las muestras de NIH COVID-19? Por ejemplo, ¿hay información fenotípica específica, como síntomas gastrointestinales o cardiovasculares y la gravedad? ¿O medicamentos que tomaban los pacientes antes de la infección, como los inhibidores de la ECA? ¿Hay datos de secuencias proteómicas o de ARN asociados con las muestras histológicas que mencionó?

      Dra. Susan Gregurick:

      Esa es una gran pregunta, porque COVID-19 es una hidra de la enfermedad. Ha sido difícil para nosotros entenderlo, por lo que estamos buscando crear y comprender algunos de los datos de registros de salud electrónicos subyacentes muy básicos que le informarán sobre los medicamentos, sobre las condiciones previas disponibles, pero de una manera anónima. para que no pueda rastrearlo hasta un individuo en particular, pero podría ver las correlaciones de lo que se presenta en el paciente que tiene COVID-19 cuando ingresa al hospital con respecto a lo que ha tomado en términos de medicamentos o en términos de condiciones previas.

      En términos de proteómica y secuencias, tenemos muchos menos datos al respecto. Es difícil obtener esos datos. El sistema de salud tiende a estar un poco sobrecargado, por lo que en este momento obtener muestras proteómicas ha sido más desafiante y ahora estamos obteniendo muestras de secuenciación de pacientes con COVID-19.

      Reunir toda esa información es nuestro gran desafío en este momento. Creemos que podemos hacer que algunos de los datos estén disponibles. Como puede ver, viene por etapas porque tenemos las imágenes de patología disponibles en este momento.

      Ni siquiera tenemos las imágenes de TC disponibles para los investigadores. Están en la cola. Necesitan ser desidentificados. Deben estar asociados con los estándares y metadatos adecuados para que pueda utilizarlos. Así que incluso obtener esas imágenes de TC está llevando mucho tiempo.

      Desidentificar el resto de datos, como los datos de registros médicos electrónicos, esperamos poder hacerlo este verano, pero llevará algún tiempo. Y los datos de secuenciación, que podrían ser incluso más largos, para que pueda ver las luchas que tenemos solo para sacar los datos para que los usen los investigadores.

      Dr. Ming Lei:

      Excelente. ¿Qué opinas de la investigación actual y de vanguardia sobre la predicción estructural de proteínas?

      Dra. Susan Gregurick:

      Tengo un favorito y he estado involucrado en la estructura de las proteínas, la determinación de la predicción durante un tiempo. En términos de determinar las estructuras, ciertamente la dispersión de rayos X fue una forma popular de determinar la estructura durante muchos, muchos años. Ciertamente trabajé en la estructura de rayos X, así como en la dispersión de neutrones, que no es tan refinada como los rayos X.

      Ahora vemos que cryo-EM se está convirtiendo en una herramienta de investigación realmente seria para estructuras reales específicas de átomos. En comparación, también en la predicción de la estructura de las proteínas, estaba la competencia, no sé si está familiarizado con CASP, Evaluación crítica de la predicción de estructuras, que se realizaba cada dos años. Así que no sé qué número estamos hasta ahora, pero cuando estaba trabajando en eso, la gente estaba haciendo modelos de homología, por lo que tomaban un estándar y trataban de alinear una secuencia desconocida con ese estándar.

      Estaban trabajando en enhebrar. Hice mucho enhebrado. Hice muchos algoritmos genéticos, predicciones de estructuras de proteínas, algunas dinámicas moleculares. Y luego estaba el trabajo de David Baker que observó pequeñas ventanas diminutas de proteína y las mapeó en estructuras existentes. Y ese enfoque parece haber tenido bastante éxito.

      Creo que el campo todavía se está moviendo en esa dirección de microhilos. No puedo creer que me olvidé de Rosetta. Rosetta, ese era su programa. Creo que el campo realmente avanzó con su trabajo revolucionario en Rosetta, y ahora imagino que lo que está sucediendo es mucho más mirar a la inteligencia artificial para obtener información sobre estructuras superiores e incluso avanzar más en lo que podrían ser esas nuevas estructuras.

      Entonces, fuera de la predicción inicial de la estructura de la proteína, creo que la puerta realmente se abrió con el trabajo de David Baker, pero antes de eso había una gran cantidad de algoritmos basados ​​en BLAST.

      Dr. Ming Lei:

      A medida que nos acercamos al final de la hora, las preguntas se vuelven más futuristas. Acá hay uno. ¿Crees que escribir código físicamente será menos importante en 5 a 10 años cuando puedas usar plataformas como Galaxy para la investigación básica y la traducción de la investigación biológica?

      Dra. Susan Gregurick:

      De hecho, creo que tienes razón. Creo que la gente está produciendo codelets, pequeños micro bits de código que se pueden intercambiar de forma modular. Entonces, mi antigua forma de tomar un código gigante y tuve que trabajar en Charm, que es bastante grande, y tratar de agregarle subrutinas, cambiará a microcodificación de codelets en los que simplemente intercambias pequeños bits.

      Así que esa es la idea de Galaxy, y la codificación basada en plataformas probablemente será mucho más estándar para muchas personas en el futuro. Creo que las ciencias de la computación se están moviendo en direcciones realmente interesantes y divertidas, y espero ver lo que ustedes hacen.

      Dr. Ming Lei:

      Bueno. Aquí & # 8217s una pregunta. ¿Existen cursos de formación online que incluyan la rama de la biofísica de la bioinformática?

      Dra. Susan Gregurick:

      Yo creo que sí, pero en la parte superior de mi cabeza no tengo esos cursos en línea, aunque sé que a través de NIGMS hemos financiado una serie de cursos de capacitación en línea de big data, por lo que a través de las sociedades definitivamente hay cursos de capacitación, por lo que la Sociedad Biofísica sería un gran lugar para buscar esos cursos de capacitación en línea en biofísica.

      Dr. Ming Lei:

      ¿Hay más preguntas? Esperaré un poco. Yendo una vez y # 8230 yendo dos veces y # 8230 tres veces.

      Muchas gracias, Susan. Esta fue una hora fantástica. Espero que todos lo hayan disfrutado.

      Dra. Susan Gregurick:

      Muchas gracias. Ha sido un verdadero placer contarles sobre mi viaje personal y la ciencia de datos / ciencia computacional y dónde nos encontramos ahora con COVID-19.Y espero que aproveche la oportunidad para ver los recursos de capacitación en línea que están disponibles y también consulte nuestro sitio web, y participe en cualquiera de estas oportunidades de capacitación que se ofrecen a través de nuestras asociaciones STRIDES con AWS y Google, oa través de nuestro NCBI. cursos y seminarios web ya través de los recursos de formación en bioinformática del NIAID.


      Biología Computacional 2021

      Ahora está saliendo del sitio web de Cambridge University Press. Nuestro socio www.ebooks.com completará la compra y descarga de su eBook. Consulte la sección de permisos de la página del catálogo de www.ebooks.com para obtener detalles sobre los límites de impresión y copia de nuestros libros electrónicos.

      ¿Eliminar este título de su lista de notificaciones?

      ¿Activar las notificaciones de acciones?

      Ahorrar 20% de descuento en su próxima compra en línea con Cambridge Alerts

      Reciba alertas por correo electrónico sobre nuevos libros, ofertas y noticias.

      Encuentra contenido que se relacione contigo

      Únase a nosotros en línea

      • Accesibilidad
      • Privacidad y amp Legal
      • Nuestra ética
      • Declaración de esclavitud moderna
      • Derechos y permisos de amplificador
      • Realimentación
      • Medios de comunicación
      • Mapa del sitio
      • & copiar Cambridge University Press 2021

      La biología computacional convierte las ideas en hipótesis

      Finalmente, las computadoras remodelaron la biología al hacer que los conceptos difusos sean rigurosos y comprobables. Aquí hay un ejemplo de mi propia investigación: durante décadas, los investigadores del cáncer han discutido la idea de que la heterogeneidad genética entre las células del mismo tumor ayuda a que un cáncer sea resistente a la terapia [6]. Es una idea simple: cuanto más diversa es la población celular, más probable es que un subconjunto de las células sea resistente a la terapia y pueda volver a crecer el tumor después de que todas las demás células murieron.

      Pero, ¿cómo se puede medir exactamente la “heterogeneidad genética” y qué tan grande es su influencia en el desarrollo de la resistencia? Para responder a estas preguntas, tuvimos que convertir la idea en una hipótesis comprobable. Usamos enfoques genómicos para medir los cambios en los genomas del cáncer en diferentes sitios en un paciente y luego definimos medidas cuantitativas de heterogeneidad, que podrían compararse estadísticamente con la información clínica sobre la resistencia al tratamiento. Y de hecho, encontramos evidencia que apoya la idea inicial de que la heterogeneidad determina la resistencia [7].

      Este es solo uno de los muchos ejemplos en los que se necesitaba un enfoque computacional cuantitativo para convertir una idea borrosa en una hipótesis comprobable. La biología computacional sobresale en la destilación de grandes cantidades de datos complejos en algo que se puede probar en el laboratorio húmedo, dando así forma y dirección al seguimiento experimental.


      ¿En qué tipo de problemas trabajan los biólogos computacionales?

      Gran parte de la biología computacional se ocupa del análisis de datos moleculares, como biosecuencias (ADN, ARN o secuencias de proteínas), estructuras de proteínas tridimensionales, datos de expresión génica o redes de biología molecular (vías metabólicas, redes de interacción proteína-proteína, etc.). o redes reguladoras de genes). Se puede abordar una amplia variedad de problemas utilizando estos datos, como la identificación de genes que causan enfermedades, la reconstrucción de las historias evolutivas de las especies y el desbloqueo de los códigos reguladores complejos que activan y desactivan los genes. La biología computacional también puede ocuparse de datos no moleculares, como datos clínicos o ecológicos.

      ¿Tiene alguna pregunta que le gustaría responder?

      Si es así, envíenoslo a [email protected] y nos pondremos en contacto con usted.


      B.S. en Biología Computacional

      La biología computacional es el estudio de sistemas biológicos mediante modelos computacionales y estadísticos de grandes conjuntos de datos. A través de este programa, los estudiantes adquieren conocimientos en biología, informática y tecnología de la información.

      Rensselaer es una de las pocas universidades que ofrece un programa de pregrado en este campo emergente y emocionante. Este programa capacita a biólogos de próxima generación que pueden aprovechar el poder computacional y las herramientas en constante aumento para resolver problemas biológicos cruciales para cambiar el mundo.

      Hay dos concentraciones dentro del programa: sistemas biomoleculares y sistemas ecológicos. La concentración de sistemas biomoleculares se centra en la aplicación de métodos computacionales a escala microscópica a la estructura, dinámica e interacciones de proteínas, ácidos nucleicos, glucanos, biomembranas y descubrimiento de fármacos. La concentración de sistemas ecológicos se centra en la aplicación de métodos computacionales para estudiar y resolver problemas en sistemas ecológicos a gran escala, como cambios ambientales regionales a globales.

      Se anima a los graduados a que continúen sus estudios en uno de los programas de posgrado en biología computacional cada vez más numerosos en todo el mundo. Aquellos que ingresan a la fuerza laboral después de graduarse a menudo son contratados en sectores que incluyen la industria farmacéutica, la informática médica, la bioinformática agrícola, las agencias gubernamentales y los laboratorios nacionales, las empresas de administración de bases de datos o la industria de la biotecnología.

      Programa de estudios

      En esta especialidad, puede elegir una concentración en sistemas biomoleculares o en sistemas ecológicos.


      Ver el vídeo: Introduction to bioinformatics. Why is it important? (Enero 2023).