Información

11: Adaptación de modelos de nacimiento-muerte - Biología

11: Adaptación de modelos de nacimiento-muerte - Biología


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

En este capítulo, describo cómo estimar parámetros a partir de modelos de nacimiento-muerte usando datos sobre diversidad de especies y edades, y cómo usar patrones de equilibrio de árboles para probar hipótesis sobre cambios en las tasas de natalidad y muerte. También describo cómo calcular la probabilidad de modelos de nacimiento-muerte en árboles, lo que conduce directamente a los métodos ML y Bayesiano para estimar las tasas de natalidad y muerte. En el próximo capítulo, exploraremos elaboraciones sobre modelos de nacimiento-muerte y discutiremos modelos que van más allá de los modelos de tasas constantes de nacimiento-muerte para analizar la diversidad de la vida en la Tierra.

  • 11.1: Puntos críticos de diversidad
    Algunas partes del árbol de la vida tienen más especies que otras. Este desequilibrio en la diversidad nos dice que la especiación es mucho más común en algunos linajes que en otros. Asimismo, numerosos estudios han argumentado que ciertos hábitats son "focos" de especiación.
  • 11.2: Edad y diversidad de clados
    Hay dos formas diferentes de medir la edad de un clado: la edad del tallo y la edad de la corona. La edad de la corona de un clado es la edad del ancestro común de todas las especies del clado. Por el contrario, la edad madre de un clado mide el tiempo que ese clado descendió de un ancestro común con su clado hermano. La edad del tallo de un clado es siempre al menos tan antigua, y generalmente más antigua, que la edad de la corona.
  • 11.3: Balance de árboles
    Los árboles de nacimiento-muerte tienen una cierta cantidad de "equilibrio", tal vez un poco menos de lo que su intuición podría sugerir. Podemos mirar árboles reales para ver si la cantidad de saldo coincide con lo que esperamos según los modelos de nacimiento-muerte. Un patrón menos equilibrado en árboles reales sugeriría que la tasa de especiación y / o extinción varía entre linajes más de lo que cabría esperar. Por el contrario, los árboles más equilibrados sugerirían una diversificación más uniforme y predecible a lo largo del árbol de la vida de lo esperado bajo los meses de nacimiento-muerte.
  • 11.4: Adaptación de los modelos de nacimiento-muerte a los tiempos de ramificación
    La mayoría de los enfoques modernos para ajustar modelos de nacimiento-muerte a árboles filogenéticos utilizan los intervalos entre eventos de especiación en un árbol - los "tiempos de espera" entre especiaciones sucesivas - para estimar los parámetros de los modelos de nacimiento-muerte. Con frecuencia, la información sobre el patrón de acumulación de especies en un árbol filogenético se resume en una gráfica de linaje a través del tiempo (LTT), que es una gráfica del número de linajes en un árbol en función del tiempo.
  • 11.5: Modelos de muestreo y nacimiento-muerte
    Es importante pensar en el muestreo al ajustar los modelos de nacimiento-muerte a árboles filogenéticos. Si falta alguna especie en su árbol filogenético, dará lugar a estimaciones de parámetros sesgadas. Esto se debe a que es desproporcionadamente probable que las especies que faltan se conecten al árbol en ramas cortas, en lugar de largas. Si tomamos muestras al azar de linajes de un árbol, terminaremos subestimando gravemente las tasas de especiación y extinción (e infiriendo desaceleraciones erróneamente).
  • 11.S: Adaptación de modelos de nacimiento-muerte (resumen)

El modelo Bayesiano de nacimiento-muerte localmente adaptativo detecta con éxito cambios de frecuencia lentos y rápidos

Conceptualización de roles, curación de datos, análisis formal, adquisición de fondos, investigación, metodología, administración de proyectos, software, visualización, redacción - borrador original, redacción - revisión y edición

Departamento de Biología de Afiliación, Universidad de Washington, Seattle, WA, 98195, EE. UU.

Roles Análisis formal, adquisición de fondos, software, visualización, redacción: revisión y edición

Afiliaciones GeoBio-Center, Ludwig-Maximilians-Universität München, 80333 Munich, Alemania, Departamento de Ciencias de la Tierra y del Medio Ambiente, Paleontología y Geobiología, Ludwig-Maximilians-Universität München, 80333 Munich, Alemania

Roles Análisis formal, adquisición de fondos, recursos, redacción: revisión y edición

Departamento de Afiliación de Zoología, Universidad de Oxford, Oxford, Reino Unido

Conceptualización de roles, adquisición de fondos, supervisión, redacción: revisión y edición

Departamento de Biología de Afiliación, Universidad de Washington, Seattle, WA, 98195, EE. UU.

Funciones Conceptualización, Análisis formal, Adquisición de fondos, Metodología, Administración de proyectos, Supervisión, Visualización, Redacción - borrador original, Redacción - revisión y edición

Departamento de Estadística de Afiliación, Universidad de California, Irvine, CA, 92697, EE. UU.


Fondo

La morfología proporciona la única fuente de datos para comprender las relaciones y los patrones evolutivos a gran escala en la gran mayoría de la vida que ha existido en este planeta [1]. Los caracteres morfológicos y los datos fósiles (tanto los especímenes como sus edades) también contribuyen a mejorar las estimaciones del tiempo de divergencia en las filogenias de evidencia total de organismos existentes [2, 3], proporcionando una reconstrucción más holística del árbol de la vida. Además, constituye la única fuente de datos para investigar la filogenia y la macroevolución de la mayoría de los linajes extintos. Por lo tanto, las mejoras en el análisis filogenético de los datos morfológicos y las estimaciones de tiempo de divergencia para los árboles evolutivos son esenciales para todo el campo de la biología evolutiva y comparativa.

Actualmente, uno de los métodos más extendidos para calibrar árboles en el tiempo y estimar parámetros macroevolutivos es la utilización de relojes moleculares relajados en inferencia filogenética bayesiana. Mediante el uso de una topología de árbol fija o mediante la coestimación de topologías de árboles (entre las relaciones de especies) con tiempos de divergencia y tasas de evolución, la inferencia bayesiana basada en relojes se ha convertido en el caballo de batalla de los árboles calibrados en el tiempo en biología evolutiva [4, 5]. . Es importante destacar que los avances en la última década también han permitido la utilización de datos morfológicos en el análisis de inferencia bayesiano de reloj relajado, especialmente a través del desarrollo de modelos de árboles (modelado de parámetros de diversificación) que tienen en cuenta las probabilidades de muestreo de fósiles: el nacimiento-muerte fosilizado (FBD) modelo de árbol [6, 7]. Desde entonces, ha habido un interés creciente por implementar análisis de inferencia bayesiana de reloj relajado con datos morfológicos (relojes morfológicos). Se han utilizado relojes morfológicos para estimar tiempos de divergencia para linajes completamente extintos [por ejemplo, [8,9,10]], o en combinación con datos moleculares ("relojes morfo-moleculares" en la datación de evidencia total) para estimar árboles evolutivos y divergencia veces para clados con representantes existentes [por ejemplo, [11,12,13,14,15]].

Casi todos los modelos de inferencia bayesiana de reloj relajado se desarrollaron inicialmente para que los datos de secuencia molecular reconstruyeran árboles epidemiológicos y / o filogenéticos [16, 17], y luego se utilizaron para aplicaciones con conjuntos de datos morfológicos. Como resultado, la mayoría de los estudios que evalúan el impacto de la elección del modelo en las relaciones de las especies y los parámetros macroevolutivos (tiempos de divergencia y tasas de evolución) solo se han realizado en conjuntos de datos moleculares (empíricos o simulados) (p. Ej., [18,19,20,21, 22]), con poca o ninguna evaluación de los modelos disponibles sobre datos morfológicos. Algunas excepciones incluyen estudios que han incluido datos morfológicos, pero combinados con datos moleculares en la datación de evidencia total, lo que crea diferentes problemas de inferencia filogenética dada la interacción entre señales morfológicas y moleculares (por ejemplo, [11, 12, 14, 15]). Es importante destacar que varias características de los conjuntos de datos morfológicos los hacen muy distintos de los conjuntos de datos moleculares. Dichas características incluyen las siguientes: la mayor influencia de la selección natural en el fenotipo y su impacto potencial en el desarrollo de modelos morfológicos realistas [23] la falta de comparabilidad directa de los estados de carácter entre diferentes caracteres (a diferencia de los nucleótidos en las secuencias moleculares), lo que dificulta el desarrollo de modelos de sustitución morfológica más complejos [24] y el tamaño mucho menor de la gran mayoría de los conjuntos de datos morfológicos en comparación con las secuencias moleculares. Por lo tanto, se espera que el impacto de la especificación del modelo en la topología de los árboles, los tiempos de divergencia y las tasas de evolución en los conjuntos de datos morfológicos puedan variar sustancialmente de los conjuntos de datos moleculares.

Recientemente, algunos estudios han comenzado a dirigir su atención al rendimiento de conjuntos de datos de morfología únicamente en un marco probabilístico, especialmente para comparar el rendimiento del software y los criterios de optimización en diversas condiciones utilizando inferencia bayesiana sin reloj, por ejemplo, [23, 25 , 26,27,28]. Sin embargo, muy pocos estudios han dirigido su atención al rendimiento de la elección del modelo utilizando relojes bayesianos relajados con solo datos morfológicos. Parte de este trabajo pionero evaluó el impacto de la incertidumbre en edades fósiles al calibrar el reloj morfológico [29, 30] diferentes software / paquetes en estimaciones de tiempo de divergencia (usando parámetros estándar) [31], muestreo de autapomorfías [32] y usando mecanismos árboles anteriores (p. ej., modelo de árbol fosilizado de nacimiento-muerte) en lugar del árbol uniforme anterior [33]. Sin embargo, varios parámetros disponibles para la evolución de los personajes, los modelos de árboles y los modelos de reloj nunca se han probado para evaluar su impacto individual o combinado en la topología de los árboles, los tiempos de divergencia y las tasas de evolución.

Aquí, seguimos el enfoque adoptado por estudios moleculares anteriores para evaluar el impacto de la elección del modelo (por ejemplo, [20,21,22]), pero aplicado a nuevos datos morfológicos empíricos de reptiles esfenodónticos. Los esfenodoncianos son un linaje único de reptiles diápsidos, con una historia evolutiva extremadamente larga que se remonta al menos al Triásico Medio en

230Mya [34], pero actualmente representado por una sola especie viviente, Sphenodon punctatus, habitando pequeñas islas frente a la costa de Nueva Zelanda [35]. En contraste, su clado hermano, los escamatos (lagartos y serpientes), está representado actualmente por

10.650 especies existentes [36], lo que indica que ambos linajes tenían historias evolutivas muy diferentes después de su separación de un ancestro común en aproximadamente 260-270 Mya [13, 37]. A pesar de los considerables esfuerzos para comprender las relaciones filogenéticas a gran escala, los tiempos de divergencia y los patrones evolutivos entre las diversas familias de escamatos (por ejemplo, [13, 38,39,40,41]), ha habido comparativamente menos esfuerzo para comprender las relaciones a nivel de especie y Patrones macroevolutivos en esfenodoncianos. Por ejemplo, Sphenodon punctatus se ha caracterizado durante mucho tiempo como un "fósil viviente" [42], lo que implica una morfología relativamente conservada y bajas tasas de evolución de su linaje durante varios millones de años [43]. Sin embargo, sólo recientemente se han utilizado herramientas cuantitativas para evaluar tales suposiciones, aunque limitadas a estudiar la evolución de la forma del cráneo o mandibular, y encontrar resultados contrastantes [42, 43]. Además, no se ha intentado proporcionar una evaluación detallada de los tiempos de divergencia para los principales clados esfenodoncianos utilizando modelos de reloj relajado y el modelo FBD. Finalmente, nunca ha habido una evaluación de las tasas de evolución dentro de los esfenodoncianos teniendo en cuenta la información de todas las regiones del cuerpo, ni tasas de evolución contrastantes entre las diferentes subdivisiones de su fenotipo.

Nuestro estudio proporciona una nueva matriz de datos filogenéticos morfológicos de reptiles esfenodoncianos, construida bajo criterios estrictos para evitar posibles fuentes de sesgos en los conjuntos de datos morfológicos, tales como dependencias lógicas o biológicas entre caracteres, inherentes a construcciones de caracteres problemáticas [44,45,46]. Usando este nuevo conjunto de datos empíricos (ver Archivos adicionales 1, 2, 3, 4) y teniendo en cuenta los avances recientes en la implementación de relojes morfológicos (por ejemplo, los beneficios de tener en cuenta la incertidumbre de la edad fósil, muestrear autapomorfías y usar modelos de árboles mecanicistas [ 29, 32, 33]), investigamos el impacto de varias opciones de modelos anteriores disponibles adicionales (Fig.1) sobre los datos morfológicos para responder a las siguientes preguntas: (1) ¿Cuál es el impacto de las estrategias previas de muestreo de taxones distintos para el modelo FBD? con datos morfológicos solamente? (2) Bajo el supuesto correcto de muestreo de taxón, ¿cuál es el impacto de diferentes modelos de reloj en los tiempos de divergencia y las tasas de evolución? (3) ¿Cuál es el impacto de permitir que los parámetros del modelo FBD varíen a lo largo del tiempo? (4) ¿Cuál es el impacto de los relojes morfológicos divididos en los tiempos de divergencia y las tasas de evolución? y (5) ¿Hasta qué punto las limitaciones de los datos morfológicos (es decir, un número reducido de caracteres) impiden la implementación de modelos complejos? Discutimos sesgos importantes derivados de varias elecciones de modelos que pueden conducir a tiempos de divergencia y tasas de evolución poco fiables utilizando relojes morfológicos. También comparamos nuestros resultados con evaluaciones previas del comportamiento de esos mismos parámetros del modelo en conjuntos de datos de evidencia molecular o combinada. Finalmente, proporcionamos posibles fuentes de corrección para aliviar algunos de los sesgos introducidos por el modelado inadecuado de conjuntos de datos morfológicos, junto con una nueva hipótesis de relaciones esfenodoncianas y patrones macroevolutivos.

Resumen de modelos y parámetros disponibles para caracteres morfológicos que fueron probados e implementados aquí. ACRV, entre variación de la tasa de caracteres Asimétrico, frecuencias de estado asimétricas BI, inferencia bayesiana FBD, modelo fosilizado de nacimiento-muerte GA o ga, distribución gamma IGR (modelo de reloj no correlacionado de tasas gamma independientes) LN o En, distribución logarítmica normal MML (SS), verosimilitudes del modelo marginal (utilizando el procedimiento de escalón) NoSA, sin muestreo de antepasados ​​PMF, función de masa de probabilidad SA, muestreo de antepasados ​​SFBD, modelo de nacimiento-muerte fosilizado de horizonte Sym, frecuencias de estado simétricas TK02 (Modelo de reloj autocorrelacionado continuo de Thorne y Kishino). Consulte la sección "Métodos" para obtener detalles adicionales y una explicación de los diferentes modelos.


Resultados y discusión

Teoría y modelo matemático

Definiciones y supuestos fundamentales

Un genoma se trata como una "bolsa" de secuencia codificante para dominios de proteínas, que simplemente llamamos dominios para ser breve. Los dominios se tratan como unidades que evolucionan independientemente sin tener en cuenta la dependencia entre dominios que tienden a pertenecer a la misma proteína multidominio. Cada dominio se considera miembro de un familia (incluidas las familias de un solo miembro). Consideramos tres tipos de eventos evolutivos elementales: i) dominio nacimiento, que genera un nuevo miembro dentro de una familia, el principal mecanismo de nacimiento es la duplicación con divergencia, pero se pueden considerar mecanismos adicionales, incluida la adquisición de un miembro de la familia de una especie diferente a través de la transferencia horizontal de genes [32], ii) dominio muerte, que resulta de la inactivación y / o eliminación del dominio, yc) dominio innovación, lo que genera una nueva familia con un miembro. La innovación puede ocurrir a través de la transferencia horizontal de genes de otra especie, a través de la evolución de un dominio a partir de una secuencia no codificante o una secuencia de una proteína no globular, o mediante un cambio importante de un dominio de una familia preexistente después de una duplicación, lo que hace que el relación entre el dominio dado y su familia de origen indetectable (este último proceso combina formalmente el nacimiento del dominio, la muerte y la innovación en un solo evento). La tasa de innovación (& # x003bd) se considera constante para un genoma dado. Las tasas de eventos elementales se consideran independientes del tiempo (es decir, solo se consideran modelos homogéneos) y de la naturaleza (estructura, función biológica, etc.) de las familias individuales.

En un genoma finito, el número máximo de dominios en una familia no puede exceder el número total de dominios y, en realidad, es probablemente mucho menor que norte sea ​​el número máximo posible de miembros de la familia del dominio. Consideramos clases de familias de dominios, que tienen solo una característica común, a saber, el número de miembros (Fig. & # X200B (Fig.1). 1). Dejar FI sea ​​el número de familias de dominio en I-th clase, es decir, familias que están representadas exactamente por I dominios en el genoma dado, I = 1,2. norte. Nacimiento de un dominio en una familia de clase I resulta en la reubicación de esta familia de la clase I a clase I+1 (disminución de FI y aumento de FI+1 por 1). Por el contrario, la muerte de un dominio en una familia de clase I traslada a la familia a clase I-1 La muerte de un dominio en la clase 1 resulta en la eliminación de la familia correspondiente del genoma dado, siendo este el único mecanismo considerado de muerte familiar. Consideramos que el tiempo es continuo y suponemos que es muy poco probable que ocurra formalmente más de un evento elemental durante un intervalo de tiempo corto, la probabilidad de que ocurra más de un evento durante un intervalo & # x00394t& # x000a0is & # x000a0o (& # x00394t).

Dinámica de dominio y eventos evolutivos elementales bajo BDIM.

La formulación del modelo

El BDIM simple

Formulemos lo siguiente suposición de independencia: i) todos los eventos elementales son independientes entre sí ii) las tasas de nacimiento de dominio individual (& # x003bb) y muerte (& # x003b4) no dependen de I (número de dominios en una familia). Bajo este supuesto, la tasa instantánea a la que una familia de dominio abandona la clase I, es proporcional a I y el siguiente BDIM simple describe la evolución de dicho sistema de clases de familias de dominio:

Modelos similares se han considerado previamente en varios contextos diferentes [33 v. 1, cap. 17, 34]. Veremos en 3.2 que la solución del modelo (2.1) evoluciona hacia el equilibrio, con una distribución única de tamaños de familias de dominio, FI

1/I. Por lo tanto, bajo el BDIM simple, si la tasa de natalidad es igual a la tasa de mortalidad, la abundancia de una clase de dominio es inversamente proporcional al tamaño de las familias en esta clase. Cuando las observaciones no se ajustan a esta asintótica en particular (como se observa en varios estudios sobre distribuciones de tamaños de familias de proteínas), es necesario desarrollar un modelo diferente y más general.

El maestro BDIM

Un BDIM más general surge cuando se abandona el supuesto de independencia.En lugar de construir hipótesis específicas con respecto a la dependencia entre los eventos elementales, supongamos simplemente que las tasas de natalidad y muerte del dominio para una familia de clase I no necesariamente muestran proporcionalidad a I. Para el caso general, designamos estas tarifas, respectivamente, & # x003bbI y & # x003b4I en el caso específico del BDIM simple (2.1), & # x003bbI = & # x003bbI y & # x003b4I = & # x003b4I. Luego tenemos lo siguiente maestro BDIM:

Dejar F(t)= FI(t) ser el número total de familias de dominios al instante t se sigue de (2.2) que

El sistema (2.2) tiene una solución de equilibrio F1. Fnorte definido por la igualdad dFI(t)/Dt = 0 para todos I esta solución se describe a continuación en la Proposición 1. En consecuencia, existe una solución de equilibrio de la ecuación (2.3), que designaremos Feq (el número total de familias de dominios en equilibrio). En equilibrio, & # x003bd = & # x003b41F1, es decir, los procesos de innovación y muerte de soltero Los dominios (más precisamente, la muerte de familias de dominios de clase 1, es decir, singletons) están equilibrados.

Aplicando esta identidad a pagI(t) y reescribiendo la ecuación (2.3) en la forma

obtenemos el siguiente modelo para las frecuencias de la familia de dominios (master BDIM para frecuencias), que es equivalente a (2.2):

El sistema (2.4) debe resolverse junto con la ecuación (2.3).

Los procesos Master BDIM y Markov

Observemos que el sistema (2.4) para frecuencias es no lineal, por lo que no es un sistema de ecuaciones de Kolmogorov para probabilidades de estado de cualquier proceso de Markov homogéneo. Supongamos además que un genoma tuvo tiempo suficiente para llegar a un equilibrio con respecto al número total de familias de dominios, de modo que F(t) = Feq. Esto no implica dpagI(t)/Dt = 0 o dFI(t)/Dt = 0 en otras palabras, el sistema podría reorganizar las frecuencias de familias individuales, aunque el número total de familias permanece estable. Si F(t) = Feq, el sistema maestro (2.4) se convierte en

El sistema (2.5) se puede reescribir como una ecuación matricial

Es fácil ver que la suma de elementos de cada fila (excepto la primera) de la matriz Q es igual a & # x003bd /Feq & # x0003e 0. Por lo tanto, la matriz Q no puede ser una matriz de tasas de transición para ningún proceso de Markov (la suma de elementos de cada fila de una matriz de tasas de transición para el proceso de Markov con tiempo continuo debe ser no positiva [33 v. 1, cap.17, s. 8, 35 v. 2, cap. 3, s. 2] en otras palabras, no existe un proceso de Markov con tiempo continuo y espacio de estados <1,2. norte> cuyas probabilidades de estado satisfacen el sistema (2.5).

Por tanto, ni los BDIM iniciales (2.1) o (2.2) ni el modelo de equilibrio (2.5) pueden describirse mediante ningún proceso de Markov con tiempo continuo.

Observación. Si, en el sistema (2.5), & # x003bd = 0, entonces este sistema se convierte en un sistema de probabilidades de estado para un proceso de nacimiento y muerte de Markov con tiempo continuo.

Equilibrio en BDIM

Tamaños de equilibrio y frecuencias del sistema de familias de dominios

Supongamos que el genoma tuvo tiempo suficiente para llegar a un estado de equilibrio completo, en el que no sólo dF(t)/Dt = 0, pero también dFI(t)/Dt = 0 para todos I. Por tanto, los tamaños de equilibrio de las familias de dominios FI satisfacer el sistema

Cabe destacar que el modelo maestro no asigna a priori El valor de Feq este valor debe calcularse en función de los parámetros del modelo.

La siguiente declaración es fundamental para un análisis más detallado.

Proposición 1. El BDIM maestro (2.2) tiene un estado de equilibrio único (F1. Fnorte), cual es la unica solucion de sistema (3.1):

El estado de equilibrio único (3.2) es globalmente asintóticamente estable.

Esta proposición comprueba que todas las trayectorias evolutivas del sistema (2.2) se acercan exponencialmente (con respecto al tiempo) al estado de equilibrio (3.2). La prueba se da en el Apéndice matemático.

Observación. Denotemos la razón entre la tasa de natalidad y la tasa de innovación.

y la relación entre la tasa de mortalidad y la tasa de innovación

Entonces, de acuerdo con la Proposición 1, para cualquier BDIM en equilibrio,

El objetivo principal del tratamiento que sigue es el análisis del comportamiento asintótico de frecuencias de equilibrio y tamaños de familias de dominios (F1. Fnorte) en general norte. Diferenciaremos dos casos de comportamiento asintótico según lo siguiente

Frecuencias de equilibrio para el BDIM simple

Definición. Un BDIM simple es equilibrado if & # x003b8 = & # x003bb / & # x003b4 = 1, es decir, si las tasas de nacimiento y muerte de dominios individuales son iguales.

Recordemos que una variable discreta aleatoria & # x003be tiene la logarítmico distribución con parámetro & # x003b8 & # x0003c 1 si

Una variable aleatoria & # x003be tiene el logarítmico truncado distribución con parámetro & # x003b8 si

es decir, las frecuencias de equilibrio tienen la distribución logarítmica truncada si & # x003b8 & # x0003c 1.

2) Si un BDIM simple está equilibrado, entonces

La prueba se da en el Apéndice matemático.

Por lo tanto, un BDIM simple puede tener frecuencias de equilibrio solo de la forma pagI = C& # x003b8 I /I, dónde C = constante y & # x003b8 es el parámetro de distribución. En particular, las frecuencias de equilibrio para un BDIM simple equilibrado tienen la distribución de potencia con el grado igual a -1.

Existen métodos simples para la estimación gráfica preliminar del parámetro de distribución única & # x003b8 [36 ch. 7, s. 7]. Demostraremos en la siguiente sección que, si observamos una potencia asintótica para las frecuencias de equilibrio observadas empíricamente, entonces (asumiendo que el sistema puede ser descrito por un BDIM), las tasas & # x003bbI y & # x003b4I debe ser asintóticamente igual en general I. Si, además, el grado de asintótica es no es igual a -1, entonces la dinámica del sistema no poder ser descrito por un sencillo BDIM. En este caso, es necesario considerar modelos más generales, como el Master BDIM (2.2).

Comportamiento asintótico de las frecuencias de equilibrio de un BDIM maestro: Teoremas principales

Consideremos el BDIM maestro (2.2) que mostramos en 3.1 que sus frecuencias de equilibrio son la solución del sistema

El siguiente teorema da todos los tipos posibles de comportamiento asintótico de las frecuencias de equilibrio y define las conexiones entre estos asintóticos dependiendo de los parámetros del modelo. En particular, si no hay información sobre la forma exacta de dependencia de las tasas de nacimiento y muerte de los dominios en el tamaño de una familia de dominios, el teorema puede usarse para describir cualitativamente la dinámica del comportamiento asintótico de las frecuencias de equilibrio.

Demostraremos que el comportamiento asintótico de una solución del sistema (3.9) está completamente definido por la relación asintótica entre & # x003bbI y & # x003b4I. Más precisamente, definamos una función & # x003c7 (I) = & # x003bbI-1/ & # x003b4I consideramos solo funciones de crecimiento de potencia, es decir, & # x003c7 (I)

I s a I& # x02192 & # x0221e de verdad s. Veremos que esta no es una restricción seria porque las situaciones más realistas corresponden al caso de s = 0. Entonces, supongamos que, para grandes I, la siguiente expansión es válida:

dónde s, a son números reales y & # x003b8 & # x0003e 0. Evidentemente, si s & # x02260 0, & # x003c7 (I) tiende a 0 (s & # x0003c 0) o a & # x0221e (s & # x0003e 0) con el aumento de I.

Definición. Hagamos referencia a un BDIM (2.2), (3.10) como

ii. equilibrado de primer orden, si s = 0 y & # x003b8 & # x02260 1, es decir

iii. equilibrado de segundo orden, si s = 0, & # x003b8 = 1 y a & # x02260 0, es decir

iv. equilibrado de orden superior, si s = 0, & # x003b8 = 1 y a = 0, es decir

Demostraremos que los primeros tres coeficientes, s, & # x003b8 y a, de expansión asintótica (3.10) para & # x003c7 (I) = & # x003bbI-1/ & # x003b4I especificar exactamente todos los posibles comportamientos asintóticos de las frecuencias de equilibrio BDIM.

Teorema 1. Las frecuencias de equilibrio pI de BDIM (2.2) tienen las siguientes asintóticas

I. si el modelo no está equilibrado, entonces

ii. si el modelo es equilibrado de primer orden, entonces

iii. si el modelo es equilibrado de segundo orden, entonces

iv. si el modelo es equilibrado de orden superior, entonces

La prueba se da en el Apéndice matemático. La clasificación de BDIM según el orden de equilibrio se ilustra en la Fig. & # X200B Fig.2 2 y las asintóticas para diferentes tipos de BDIM se muestran en Fig. & # X200B Fig.3 3.

Diferentes órdenes de saldo en BDIM.

Asintóticas de distribuciones de equilibrio para BDIM equilibrados de diferentes órdenes.

De este teorema se deduce que, si un BDIM no está equilibrado, entonces sus frecuencias de equilibrio pagI (y tamaños de familia de equilibrio FI) aumentan o disminuyen extremadamente rápido (hiper-exponencialmente) con el aumento de I. Por el contrario, si un BDIM tiene un orden de equilibrio distinto de cero, se observa un comportamiento asintótico.

Corolario 1.Para un BDIM equilibrado de primer orden con & # x003b8 & # x0003c 1,

I. si un & # x0003e -1, las frecuencias de equilibrio pI seguir la distribución de Pascal con parámetros (a+1, & # x003b8)

ii. si a = -1, las frecuencias de equilibrio siguen una distribución logarítmica truncada con parámetro & # x003b8

iii. si a = 0, las frecuencias de equilibrio siguen una distribución geométrica con el parámetro & # x003b8.

La siguiente implicación del Teorema 1 es de interés principal.

Corolario 2. Las frecuencias de equilibrio de un BDIM tienen un comportamiento asintótico de potencia si y solo si el BDIM está equilibrado de segundo orden.

Corolario 3. Para BDIM equilibrado de orden superior, si & # x003bbI-1/ & # x003b4I = 1 para todo i, la única distribución posible de frecuencias de equilibrio es uniforme, pI = constante para todo i. Además, incluso si & # x003bbI-1/ & # x003b4I = 1 + O(1/I 2 ), las frecuencias de equilibrio tienden asintóticamente a la distribución uniforme.

BDIM racional

Racional Los modelos comprenden una clase general de BDIM (Fig. & # x200B (Fig. 4), 4), para los cuales se puede investigar completamente el comportamiento asintótico de las frecuencias de equilibrio y los tamaños de equilibrio de las familias de dominios.

La jerarquía de tipos de BDIM.

Supongamos que las tasas de natalidad y muerte son de la forma

Nos referiremos a BDIM (2.2.), (4.1) como racional BDIM.

Se sabe que una amplia clase de funciones matemáticas puede aproximarse bien mediante funciones racionales de la forma (4.1) (ver, por ejemplo, [37]).

El siguiente teorema describe todos los posibles comportamientos asintóticos de las frecuencias de equilibrio de un BDIM racional. Denotemos

Teorema 2. Los tamaños de equilibrio de las familias de dominios de un BDIM racional tienen las siguientes asintóticas

La prueba se da en el Apéndice matemático.

Corolario 1. Si & # x003b7 = 0, entonces el BDIM racional es balanceado de primer orden y la secuencia de números de equilibrio de familias de dominio <FI> tiene una asintótica exponencial de potencia

En particular, si & # x003c1 - & # x003b2 & # x0003e -1, las frecuencias de equilibrio pI sigue la distribución de Pascal con parámetros (& # x003c1 - & # x003b2 + 1, & # x003b8)

si & # x003c1 - & # x003b2 = -1, luego frecuencias pI sigue la distribución logarítmica truncada

Corolario 2. Los tamaños de equilibrio de las familias de dominios fI y frecuencias de equilibrio pI para un BMID racional tenga las asintóticas de potencia si y solo si & # x003b7 = 0 y & # x003bb = & # x003b4, es decir, el BDIM es de segundo orden equilibrado, en cuyo caso

La fórmula (4.4) da las asintóticas para los tamaños de equilibrio de las familias de dominios FI y, en consecuencia, para el número total de familias Feq. Las expresiones exactas para estas cantidades se dan en las demostraciones del Teorema 2 y el Lema (vea el Apéndice matemático).

Proposición 3.

I. Los tamaños de equilibrio de las familias de dominios fI de un BDIM racional equilibrado (de primer orden o superior)

ii. El número total de familias de dominios en equilibrio es

Para el BDIM equilibrado racional de segundo orden, la relación entre la tasa de natalidad y la tasa de innovación es

Las fórmulas asintóticas para las frecuencias de equilibrio del BDIM racional podrían considerarse como casos particulares de las fórmulas correspondientes del teorema general 1. La proposición 3 permite calcular las constantes en las fórmulas asintóticas correspondientes para los tamaños de las familias de dominios para un BDIM racional. Si solo se analizan las frecuencias de equilibrio, los valores de estas constantes se vuelven irrelevantes porque se contraen. Sin embargo, si los valores reales de FI y Feq son de interés, se requieren los valores de las constantes.

Propiedades de los principales tipos de BDIM racionales

BDIM simple

Como se muestra arriba, un BDIM simple puede tener frecuencias de equilibrio solo de la forma pagI = C& # x003b8 I /I, C = constanteen particular, si el parámetro de distribución & # x003b8 & # x0003c 1, obtenemos la distribución logarítmica (truncada). Las distribuciones logarítmicas se observan en muchos contextos biológicos, por ejemplo, la distribución de especies por el número de individuos en las poblaciones o, lo que es más relevante, la distribución de pliegues de proteínas por el número de familias por pliegue [38]. Por lo tanto, un BDIM simple podría usarse potencialmente para modelar la dinámica de sistemas biológicos con una distribución logarítmica de densidades de equilibrio. Examinamos esta posibilidad con mayor detalle comenzando con el caso & # x003bb = & # x003b4 (BDIM simple balanceado de segundo orden).

Podemos extraer de la Proposición 2 alguna información adicional, que podría ser útil para estimar los parámetros del modelo. Se sabe que

Más precisamente, la aproximación 1 /I = lnnorte + Cmi + norte -1 /2 - norte -2 / 12 tiene un error menor que 10 -6 para norte & # x0003e 10. Así, de (3.7), obtenemos una fórmula interesante

Esto significa que, en el estado de equilibrio del sistema, el número total de familias de dominio crece solo lentamente (

en norte) con el aumento del número máximo (norte) de dominios en una familia (que es igual al número máximo posible de clases de tamaño de familia de dominio).

Además, según la ecuación (2.3), en el estado de equilibrio de un BDIM simple & # x003bd / & # x003b4 = F1, entonces tenemos

La fórmula (5.1) se puede utilizar para estimar los parámetros del modelo sobre la base de datos empíricos.

En el caso más general & # x003bb & # x02260 & # x003b4, también podemos obtener una estimación de la tasa de innovación & # x003bd. Si & # x003bb & # x0003c & # x003b4 (& # x003b8 & # x0003c 1), entonces la serie en la parte derecha de (3.5) converge rápidamente,

entonces -ln (1 - & # x003b8) / & # x003b8 es una buena aproximación para la suma & # x003b8 I-1 /I para grande norte. Luego

Teniendo en cuenta que & # x003bd / & # x003b4 = F1 (2.3), tenemos una relación

lo que permite estimar el parámetro & # x003b8 a partir de datos empíricos.

Si norte se puede estimar de forma independiente y no es muy grande, podemos utilizar relaciones más exactas:

Además, si (1 - & # x003b8)norte es pequeño (es decir, & # x003b8 está muy cerca de 1), entonces la aproximación

tiene un error menor que [norte(1 - & # x003b8)] 2/4 y, en este caso,

Para el BDIM simple, la relación entre la tasa de duplicaciones y la tasa de innovación es

Si el BDIM simple es el segundo orden equilibrado, & # x003b8 = 1, entonces GRAMO(norte) = norte - 1.

Por lo tanto, para el BDIM balanceado simple de segundo orden, el número de duplicaciones por unidad de tiempo es norte-1 veces mayor que el número de innovaciones.

El número total de dominios en el estado de equilibrio para el BDIM simple es

Si un BDIM simple es balanceado de segundo orden, entonces GRAMO(norte) = & # x003bd / & # x003bb norte.

BDIM lineal

Vimos que el supuesto de independencia de las tasas de natalidad y muerte de dominios individuales entre sí y sobre el tamaño de las familias de dominios es incompatible con cualquier distribución de poder de las frecuencias de equilibrio con el grado no igual a -1. El caso más simple de un BDIM, que puede tener, dependiendo de los parámetros, tres tipos de comportamiento asintótico descrito por el Teorema 1 (excluyendo el primero, hiperexponencial, que corresponde a un BDIM no balanceado, todos los BDIM lineales están balanceados) y , en particular, cualquier potencia asintótica, es un modelo con nacimiento y muerte lineales tarifas de la forma:

Los parametros a y B tener en cuenta, en la forma más simple posible, la desviación de las tasas de natalidad y mortalidad del dominio de las que se encuentran bajo el supuesto de independencia. Más precisamente, según (5.7), la tasa de natalidad promedio por dominio en una familia de tamaño I es & # x003bbI/I = & # x003bb + & # x003bba/I. Entonces, para pequeños I, la tasa de natalidad promedio es cercana a & # x003bb + & # x003bba, mientras que, para grandes I, tiende a & # x003bb. De manera similar, la tasa de mortalidad promedio cambia de & # x003b4 + & # x003b4B en una familia pequeña hasta el valor límite & # x003b4 en una familia numerosa. Por lo tanto, si a y B son positivos (que parece ser el caso para los datos disponibles, ver más abajo), tanto la tasa de natalidad como la tasa de mortalidad por dominio disminuyen con el aumento del número de clase (tamaño de las respectivas familias de dominio) a la inversa, si a y B son negativas, estas tarifas aumentan con el número de clase (Fig. & # x200B (Fig.5 5).

Dependencia de las tasas de natalidad y muerte por dominio del tamaño de la familia del dominio para el BDIM lineal equilibrado de segundo orden.

El corolario 1 del teorema 2 implica que las frecuencias de equilibrio pagI de un BDIM lineal tienen asintóticos

En particular, si & # x003bb & # x02260 & # x003b4 y a = B, el BDIM lineal está equilibrado de primer orden y las frecuencias de equilibrio pagI siguen la distribución logarítmica (en este caso, el BDIM lineal es asintóticamente equivalente al BDIM simple). Si & # x003bb = & # x003b4, el BDIM lineal es balanceado de segundo orden y las frecuencias de equilibrio pagI sigue la distribución de energía

Por lo tanto, la dependencia de la frecuencia del dominio del tamaño de la familia está realmente determinada por la diferencia a - B. Si a & # x0003eB, la tasa de natalidad disminuye más rápidamente que la tasa de mortalidad con el aumento del tamaño de la familia, i. mi. parece haber una "competencia" entre dominios en una familia en contraste, si a & # x0003cB, la tasa de mortalidad desciende más rápidamente, es decir, parece existir una "sinergia" entre dominios (Fig. & # x200B (Fig. 4 4).

Se puede obtener información más detallada utilizando la Proposición 4:

i) para un BDIM lineal equilibrado de primer orden, los tamaños de equilibrio fI de las familias de dominios son

y el número total de familias de dominios en equilibrio es

ii) para un BDIM lineal balanceado de segundo orden (& # x003b8 = 1),

Según (2.3), en el estado de equilibrio de un BDIM lineal, F1 = & # x003bd / & # x003b41 = & # x003bd / (& # x003b4 (1 + B)) y así, para un equilibrado de segundo orden BDIM lineal, tenemos la fórmula

Suponga que las frecuencias de equilibrio obtenidas a partir de datos empíricos siguen la distribución de potencia pagI

I - & # x003b3 en este caso, - & # x003b3 es la pendiente de la curva empírica (lnFI versus lnI) y se puede estimar a partir de los datos. Suponiendo que el sistema está bien descrito por un BDIM lineal, se sigue de (5.9) que a - B = 1 - & # x003b3 y & # x003bb = & # x003b4. Por lo tanto,

dónde a es el único parámetro libre.

Para el BDIM balanceado lineal de segundo orden, la relación entre la tasa de natalidad y la tasa de innovación es

El caso 1 + a - B = 0 (pendiente de la asíntota en coordenadas logarítmicas dobles igual a a - B - 1 = -2) es crítico.

El número total de dominios en el estado de equilibrio para un BDIM lineal balanceado de segundo orden es

Si la pendiente de la asíntota & # x003b3 = -1, el BDIM lineal de segundo orden muestra el mismo comportamiento asintótico que un BDIM simple (2.1), pero se comporta de manera diferente en pequeños I. Si & # x003b3 & # x02260 -1, el sistema no puede ser descrito por un sencillo BDIM incluso asintóticamente, pero puede describirse mediante un BDIM lineal. Como se indicó anteriormente, en este caso, las tasas promedio de natalidad y mortalidad por dominio dependen del tamaño de la familia del dominio y la diferencia a-B caracteriza esta dependencia.

BDIM cuadrático

El BDIM lineal tiene en cuenta la dependencia de las tasas de natalidad y muerte promedio de los dominios individuales del tamaño de la familia del dominio, pero no implica una forma específica de interacción entre dominios. Consideremos la interacción por pares más simple, que conduce a & # x003bbI

I 2, es decir, una o ambas tasas son polinomios en I del segundo grado. Si estos grados son diferentes (es decir, & # x003bbI

I 2), entonces el BDIM correspondiente no está equilibrado y las frecuencias de equilibrio tienen asintóticas hiperexponenciales. Por lo tanto, dejemos

De acuerdo con el teorema 3 y la Proposición 3, el BDIM cuadrático con tasas (5.13) tiene tamaños de equilibrio de familias de dominio

Tenga en cuenta que el comportamiento asintótico de las frecuencias pagI no depende de coeficientes libres r2, q2 en (5.13), pero solo en & # x003b8 y r1-q1 (como sigue de (5.14)), aunque los valores de FI son proporcionales a la constante C2, que podría depender de los coeficientes libres r2, q2. Consideremos el caso r2 = q2 = 0 con más detalle.

La fórmula (5.17) permite estimar el parámetro & # x003b8 a partir de datos empíricos si norte es lo suficientemente grande.

Más precisamente, Feq = & # x003bd / & # x003bb & # x003b8 j /j 2 = & # x003bd / & # x003bb (Polylog (2, & # x003b8) - & # x003b8 1+norte LerchPhi (& # x003b8,2,1 +norte)), donde LerchPhi es una función especial (estas y otras funciones especiales que se utilizan a continuación se pueden calcular utilizando los paquetes de programa Mathematika o Maple).

Si, además, & # x003b8 = 1 (el BDIM es balanceado de segundo orden), entonces

De las fórmulas (5.8), (5.15), podemos extraer alguna información adicional, que podría ser útil para estimar los parámetros del modelo en relativamente pequeños norte. Recordemos las definiciones de algunas funciones especiales.

La función PolyGamma (norte, z) es norte th derivado de & # x003c6 (z), PolyGamma (norte, z) = d norte & # x003c6 (z) / dz norte , tal que & # x003c6 (z) = PolyGamma (0, z).

que se puede utilizar para estimar parámetros desconocidos del modelo.

Los valores de PolyGamma (1,X) se tabulan y se pueden calcular utilizando paquetes de programas estándar para una estimación preliminar aproximada, PolyGamma (1,X) = 1/X+1/2X 2 + O (1 /X 4 ).

BDIM polinomiales

Los modelos cuadráticos tienen en cuenta la dependencia de las tasas de natalidad y muerte de los dominios individuales de las interacciones por pares más simples. Si se postulan interacciones de órdenes superiores, & # x003bbI

Qmetro(I), dónde PAGnorte(I), Qmetro(I) son polinomios en I de El norte-th y metro-ésimo grados. De nuevo, si los grados norte y metro son diferentes, entonces el BDIM no está balanceado y las frecuencias de equilibrio tienen asintóticas hiper-exponenciales. Por lo tanto, dejemos norte = metro,

Según el Teorema 3, el polinomio BDIM con tasas (5.21) tiene tamaños de equilibrio de familias de dominios con asintóticas exponenciales de potencia

En particular, si & # x003c1 - metro & # x0003e -1, las frecuencias de equilibrio pagI siga la distribución de Pascal con parámetros (& # x003c1 - metro + 1, & # x003b8)

si & # x003c1 - metro = -1, las frecuencias de equilibrio pagI sigue la distribución logarítmica (truncada)

si & # x003c1 - metro = 0, las frecuencias de equilibrio pagI sigue la distribución geométrica

si & # x003bb = & # x003b4, el polinomio BDIM es balanceado de segundo orden y las frecuencias de equilibrio pagI sigue la distribución de energía

Tenga en cuenta que el grado de distribución de energía (5.23) depende solo de metro, el grado común de los polinomios (5.21), y en & # x003c1, la diferencia entre los coeficientes r1 y q1y no depende de otros coeficientes. En particular, si r1 = q1, luego pagI

I -metro . Esta relación podría interpretarse de la siguiente manera: si los dos primeros coeficientes de tasas polinomiales & # x003bbI y & # x003b4I son iguales, entonces el grado de distribución de poder (5.19) es igual al "orden de interacciones" de los dominios.

Luego (vea la Proposición 3) los números de equilibrio de las familias de dominios FI del polinomio BDIM (5.18) son

Esta fórmula se puede utilizar para estimar los parámetros del modelo.

Para el polinomio BDIM equilibrado de segundo orden, la relación entre la tasa de mortalidad y la tasa de innovación es

Aproximación de las distribuciones de tamaño de familia de dominio observadas en genomas procariotas y eucariotas con diferentes BDIM

Habiendo desarrollado la teoría matemática de los BDIM, buscamos determinar cuál de estos modelos, si alguno, describía adecuadamente los datos empíricos sobre la distribución del tamaño de la familia del dominio. Para identificar los conjuntos de dominios codificados en cada uno de los genomas, se utilizó la biblioteca CDD de matrices de puntuación específicas de posición (PSSM), que incluye los dominios de las bases de datos Pfam y SMART, en búsquedas RPS-BLAST [12] contra el secuencias de proteínas de un conjunto de genomas eucariotas y procariotas completamente secuenciados http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Genome. La biblioteca de dominios CDD es parcialmente redundante, por lo que cuando los resultados obtenidos de los PSSM individuales mostraron una superposición significativa (más del 50% de las visitas se superpusieron en más del 50% de su longitud), los dominios correspondientes se examinaron caso por caso en busca de redundancia. Los PSSM que representan dominios estructuralmente similares y que producen listas superpuestas de resultados se unieron en "grupos de sinonimia".

Los resultados de las búsquedas de RPS-BLAST contra los conjuntos de secuencias de proteínas de genomas individuales se interpretaron de la siguiente manera: los aciertos no superpuestos a la misma proteína se trataron de forma independiente entre los aciertos superpuestos, solo el más fuerte (el más bajo mi-valor) se registró, todos los aciertos de un grupo de sinonimia se asignaron a una familia de dominio representativa. El número de aciertos que tuvo una familia de dominios en un genoma, con el corte de mi = 0,001, se registró como el número de dominios de la familia dada codificados en el genoma dado. La biblioteca de dominios CDD ciertamente no incluye todos los dominios existentes. En la práctica, los dominios de esta colección se detectaron en & # x0003e50% en cada una de las especies analizadas, con la única excepción de la humana, para la cual es probable que el conjunto de proteínas analizado contenga una fracción sustancial de predicciones falsas (Tabla & # x200B ( Tabla1 1).

Tabla 1

Familias de dominios en genomas secuenciados y parámetros del BDIM lineal equilibrado de segundo orden de mejor ajuste

a: F1(F'1), el número observado (previsto) de dominios en la clase 1 (representado solo una vez en el genoma) a, B, parámetros del BDIM lineal balanceado de segundo orden k, pendiente de la potencia asintótica & # x003bd / & # x003b4 = & # x003bd / & # x003bb, relación entre la tasa de innovación y la tasa de mortalidad (natalidad) por dominio GRAMO, relación entre la tasa de innovación y la tasa de natalidad total (por genoma). b: Abreviaturas de especies: Sce, Saccharomyces cerevisiae, Dme, Drosophila melanogaster, Cel, Caenorhabditis elegans, Ath, Arabidopsis thaliana, Hsa, Homo sapiens, Tma, Thermotoga maritima, Mth, Methanothermobacter thermoautotrophicum, Sso, Sulfolobus solfataricus, Bsu, Bacillus subtilis, Eco, Escherichia coli.

Para permitir el análisis estadístico utilizando el método & # x003c7 2 para todo el rango de datos, incluidas las clases escasamente distribuidas correspondientes a familias numerosas, era necesario combinar los datos. Para cada genoma, las frecuencias de familia de dominio observadas se agruparon en contenedores, cada uno con al menos 10 familias típicamente, los contenedores correspondientes a familias con un número pequeño de miembros incluyeron una clase de tamaño único (por ejemplo, todas las familias de un solo miembro, familias de dos miembros, etc.) , mientras que los contenedores correspondientes a familias numerosas pueden abarcar cientos de clases de tamaño, la mayoría vacías. Valores de distribución teórica para un contenedor que combina datos observados de metro-th a norte-th clase se calcularon como, donde F'I es el número previsto de familias en el I-th clase y depende de los parámetros del modelo. Dado que el modelo muestra solo una dependencia débil del número máximo de dominios en una familia (norte), en lugar de incluir norte como parámetro del modelo, la suma (donde Imax es el número de dominios en la más abundante de las familias detectadas), se normalizó para igualar el número total de familias detectadas en el genoma dado (un requisito para el análisis & # x003c7 2). & # x003c7 Se calcularon 2 valores para medir la calidad de ajuste entre las distribuciones observada y teórica. Los parámetros de distribución (& # x003b8 para BDIM simple, a y B para el BDIM lineal equilibrado de segundo orden) se ajustaron para minimizar el valor de & # x003c7 2.

El modelo más simple que resultó en un buen ajuste a las distribuciones de tamaño de familia de dominio observadas fue el BDIM lineal balanceado de segundo orden (Fig. & # X200B (Fig.6 6, & # x200B, 7 7, & # x200B, 8 8, & # x200B, 9 9, & # x200B, 10 10, & # x200B, 11 11, & # x200B, 12 12, & # x200B, 13 13, & # x200B, 14 14, & # x200B, 15). ). Para todos los genomas analizados, PAG(& # x003c7 2) para este modelo fue & # x0003e0.05, es decir, no se detectó una diferencia significativa entre las predicciones del modelo y los datos observados. Teniendo en cuenta el BDIM lineal equilibrado de primer orden, que implica variar el parámetro & # x003b8, no resultó en una mejora significativa del ajuste para ninguno de los genomas analizados (datos no mostrados). Por el contrario, un ajuste a una distribución logarítmica truncada (predicción de un BDIM simple) falló para todos los genomas (PAG(& # x003c7 2) & # x0003c 10-5 Fig. & # x200B Fig. 16, 16, & # x200B, 17, 17 y los datos no se muestran). Una distribución exacta de la ley de potencias, que a menudo se usa para aproximar las distribuciones de frecuencia de las familias de proteínas, tampoco logró ajustarse adecuadamente a los datos observados, incluso cuando se excluyeron las familias de clase 1 más desviadas (PAG(& # x003c7 2) = 0,0013 para T. maritima PAG(& # x003c7 2) & # x0003c 10 -5 para el resto de los genomas Fig. & # x200B Fig. 16, 16, & # x200B, 17 17 y datos no mostrados). En particular, el BDIM lineal equilibrado de segundo orden da como resultado una predicción correcta del número de familias muy grandes, mientras que el BDIM simple subestima sistemáticamente el número de familias en los contenedores más altos. Por el contrario, el ajuste de la ley de potencias subestima la pendiente de la línea de mejor ajuste (en coordenadas logarítmicas dobles) en comparación con la asíntota de la predicción BDIM lineal y, en consecuencia, sobreestima significativamente el número de familias en los intervalos más altos (Fig. & # x200B (Fig. 16, 16, & # x200B, 17). 17). Estos resultados son compatibles con la observación reciente de que las distribuciones de tamaño de las familias de dominios se describen mejor mediante la distribución de Pareto generalizada que mediante las leyes de potencia [31].

Ajuste de distribuciones de tamaño de familia de dominio empírico al BDIM lineal balanceado de segundo orden: la levadura Saccharomyces cerevisiae. A. Distribución del tamaño de las familias de dominios agrupadas en bins B. Distribución del tamaño de las familias de dominios en coordenadas logarítmicas dobles. Línea magenta: FI = 11521 & # x00393 (I+1,55) / & # x00393 (I+4.27) C.Función de distribución acumulativa del tamaño de la familia del dominio. La línea muestra la predicción del BDIM lineal equilibrado de segundo orden.

Ajuste de distribuciones de tamaño de familia de dominio empírico al BDIM lineal balanceado de segundo orden: la mosca de la fruta Drosophila melanogaster. Los paneles y las designaciones son como en la Fig. & # X200B Fig.6. 6. B. Línea magenta: FI = 5258 & # x00393 (I+1,62) / & # x00393 (I+3.79)

Ajuste de distribuciones de tamaño de familia de dominio empírico al BDIM lineal balanceado de segundo orden: el gusano nematodo Caenorhabditis elegans. Los paneles y las designaciones son como en la Fig. & # X200B Fig.6. 6. B. Línea magenta: FI = 2453 & # x00393 (I+1,13) / & # x00393 (I+3.03)

Ajuste de distribuciones de tamaño de familia de dominio empírico al BDIM lineal balanceado de segundo orden: el berro thale Arabidopsis thaliana. Los paneles y las designaciones son como en la Fig. & # X200B Fig.6. 6. B. Línea magenta: FI = 10750 & # x00393 (I+3,80) / & # x00393 (I+5.98)

Ajuste de distribuciones de tamaño de familia de dominio empírico al BDIM lineal balanceado de segundo orden: Homo sapiens. Los paneles y las designaciones son como en la Fig. & # X200B Fig.6. 6. B. Línea magenta: FI = 22030 & # x00393 (I+5,16) / & # x00393 (I+7.43)

Ajuste de distribuciones de tamaño de familia de dominio empírico al BDIM lineal equilibrado de segundo orden: la bacteria hipertermofílica Thermotoga maritima. Los paneles y las designaciones son como en la Fig. & # X200B Fig.6. 6. B. Línea magenta: FI = 4256 & # x00393 (I+0,14) / & # x00393 (I+3.22)

Ajuste de distribuciones de tamaño de familia de dominio empírico al BDIM lineal balanceado de segundo orden: la euriarqueona termófila Methanothermobacter thermautotrophicus. Los paneles y las designaciones son como en la Fig. & # X200B Fig.6. 6. B. Línea magenta: FI = 2753 & # x00393 (I+0,12) / & # x00393 (I+3.00)

Ajuste de distribuciones de tamaño de familia de dominio empírico al BDIM lineal balanceado de segundo orden: la crenarqueona hipertermofílica Sulfolobus solfataricus. Los paneles y las designaciones son como en la Fig. & # X200B Fig.6. 6. B. Línea magenta: FI = 2714 & # x00393 (I+0,36) / & # x00393 (I+3.04)

Ajuste de distribuciones de tamaño de familia de dominio empírico al BDIM lineal balanceado de segundo orden: la bacteria Bacillus subtilis. Los paneles y las designaciones son como en la Fig. & # X200B Fig.6. 6. B. Línea magenta: FI = 3489 & # x00393 (I+0,48) / & # x00393 (I+3.01)

Ajuste de distribuciones de tamaño de familia de dominio empírico al BDIM lineal balanceado de segundo orden: la bacteria Escherichia coli. Los paneles y las designaciones son como en la Fig. & # X200B Fig.6. 6. B. Línea magenta: FI = 6776 & # x00393 (I+0,84) / & # x00393 (I+3.54)

Comparación de diferentes aproximaciones de la distribución del tamaño de la familia del dominio empírico: Escherichia coli. Línea magenta: BDIM lineal equilibrado de segundo orden, FI = 6776 & # x00393 (I+0,84) / & # x00393 (I+3.54), línea roja: BDIM simple, FI = 528 & # x000d7 0,87 I /I, Línea cian: ley de potencia, FI = 602I -1.76 .

Comparación de diferentes aproximaciones de la distribución del tamaño de la familia del dominio empírico: Arabidopsis thaliana. Línea magenta: BDIM lineal equilibrado de segundo orden, FI = 10750 & # x00393 (I+3,80) / & # x00393 (I+5.98), línea roja: BDIM simple, FI = 344 & # x000d7 0,98 I /I, Línea cian: ley de potencia, FI = 516I -1.36 .

El ajuste de la distribución del tamaño de la familia del dominio observado con el BDIM lineal equilibrado de segundo orden dio como resultado valores positivos de los parámetros a y B, con a & # x0003cB, para todos los genomas analizados (Tabla & # x200B (Tabla1). 1). En consecuencia, las distribuciones de tamaño de familia de dominio en todos los casos tienden asintóticamente a la ley de potencia con la potencia k & # x0003c -1 y, para todas las especies con excepción de C. elegans, k & # x0003c -2 (Tabla & # x200B (Tabla1 1 y Fig. & # x200B Fig.8). 8). Como se discutió anteriormente, esto parece indicar la existencia de una "sinergia" entre dominios en una familia por lo que la probabilidad de supervivencia es mayor para un dominio que pertenece a una familia grande que para un dominio de una familia pequeña (Fig. & # X200B ( Figura 5). 5). Para todas las especies, encontramos que la tasa de innovación es aproximadamente tres órdenes de magnitud mayor que la tasa de nacimiento (muerte) por dominio. En consecuencia, la tasa total de nacimiento (duplicación) por genoma es comparable pero, por lo general, varias veces mayor que la tasa de innovación (Tabla & # x200B (Tabla1). 1). La relación entre la tasa de natalidad por genoma y la tasa de innovación aumenta con la cantidad de genes en un genoma o la cantidad de dominios detectados, con tasas casi idénticas observadas para los genomas procarióticos pequeños y valores tan altos como 20 para los genomas de plantas y animales más grandes. (Tabla & # x200B (Tabla1 1).

Los datos utilizados para ajustar el BDIM incluían típicamente el 50 & # x0201360% de las proteínas codificadas en un genoma dado (Tabla & # x200B (Tabla 1) 1) las proteínas restantes no estaban representadas por dominios suficientemente similares en la colección actual de CDD. No se puede descartar que el ajuste se vea afectado significativamente como resultado de incluir todas las proteínas codificadas en el genoma, en caso de que las proteínas actualmente no reconocidas en las búsquedas de CDD tengan una distribución de tamaño familiar sustancialmente diferente a la de las reconocidas. Sin embargo, el BDIM lineal equilibrado de segundo orden puede acomodar perturbaciones considerables de la distribución mediante el ajuste de los parámetros, por lo que creemos que es probable que este modelo también se aproxime bien a la distribución de tamaño de las familias de dominios para conjuntos completos de proteínas codificadas en un genoma.Un enfoque alternativo que elude al menos parcialmente el problema de muestreo implica el análisis de todas las familias de parálogos detectables usando agrupamiento por similitud de secuencia, con el empleo de una biblioteca predefinida de dominios, este análisis está más allá del alcance del presente trabajo, pero puede ser un tema de investigación adicional. .

Discusión general y conclusiones

Aquí, presentamos una descripción matemática completa de la distribución de tamaño de las familias de dominios de proteínas codificadas en genomas para modelos de evolución simples pero no poco realistas, que incluyen tres tipos de eventos: duplicación de dominios (nacimiento), eliminación de dominios (muerte) e innovación de dominios. . En términos biológicos, la innovación podría implicar la adquisición de genes a través de la transferencia horizontal de genes, la aparición de un nuevo dominio a partir de una secuencia no codificante o una secuencia de proteína no globular, o una modificación importante de un dominio que borre su conexión con una familia preexistente. La innovación a través de la transferencia horizontal de genes parece ser particularmente común en procariotas [32,39], lo que podría explicar la aparente mayor tasa de innovación relativa en los genomas procariotas observada en el presente análisis (Tabla & # x200B (Tabla1 1).

Demostramos que los modelos de innovación de nacimiento-muerte (BDIM) con diferentes niveles de complejidad conducen a predicciones fácilmente distinguibles con respecto a la distribución de los tamaños de las familias de dominios en los genomas. En particular, definimos las condiciones analíticas exactas que conducen, exacta o asintóticamente, a las distribuciones de la ley de potencia, que recientemente han recibido amplia atención, ya que fueron descubiertas en varios contextos biológicos y sociales [20,25]. En contraste con análisis previos [16,17,30] pero de acuerdo con los resultados de un reexamen reciente [31], mostramos que la ley de potencias solo se aproxima asintóticamente a las distribuciones de tamaño de familia de dominio.

Tres grupos de observaciones realizadas en este trabajo parecen tener el mayor potencial de mejorar nuestra comprensión de la evolución del genoma y, quizás, la evolución de otros sistemas complejos. Primero, probamos que, dentro del marco BDIM, existe un estado de equilibrio único del sistema, que se acerca exponencialmente, con respecto al tiempo, desde cualquier estado inicial. En este estado de equilibrio, el número de familias de dominio en cada clase de tamaño permanece constante y sigue una distribución única según el tipo y los parámetros del BDIM. En particular, las asintóticas de poder surgen cuando y solo cuando un BDIM está equilibrado de segundo orden, es decir, las tasas de nacimiento y muerte del dominio son asintóticamente iguales. Dado que mostramos que las distribuciones de tamaño observadas de las familias de dominios en todos los genomas analizados tienden a potenciar las asintóticas de la ley, los resultados son compatibles con la noción de que los genomas están cerca de un estado estable con respecto a la diversidad de dominios (Feq, el número de familias de dominios distintas en equilibrio, según el uso de la convención BDIM) y distribución (FI). Tomando una perspectiva biológica más amplia, este resultado podría indicar que los linajes en evolución pasan por largos períodos de estasis relativa cuando el nivel de complejidad genómica permanece más o menos igual. Bajo este punto de vista, las épocas de estasis están marcadas por períodos relativamente cortos de cambios dramáticos cuando la complejidad aumenta en gran medida (la aparición de eucariotas es el caso más obvio) o disminuye (por ejemplo, la evolución de los parásitos). Estas ráfagas de evolución podrían describirse como transiciones entre diferentes BDIM en el espacio de parámetros, con algunas de las trayectorias potencialmente involucrando BDIM no balanceados. La analogía entre esta imagen emergente de la evolución del genoma y el concepto de equilibrio puntuado de la evolución de las especies, que se ha desarrollado mediante el análisis del registro paleontológico [40], es obvia.

En segundo lugar, mostramos que el modelo más simple que describe adecuadamente las distribuciones de tamaño de familia de dominio observadas es el BDIM lineal equilibrado de segundo orden, en contraste, los BDIM simples no muestran un buen ajuste a las observaciones. Esto tiene implicaciones potencialmente importantes para el modo de evolución de la familia de dominios. Los BDIM simples se basan en la noción de que la probabilidad de duplicación (nacimiento) o eliminación (muerte) de un dominio es uniforme en todo el genoma y no depende del tamaño u otras características de las familias de dominios (el supuesto de independencia). Claramente, bajo el supuesto de independencia, una duplicación (nacimiento) así como una eliminación (muerte) de un dominio es más probable que ocurra en una familia grande que en una pequeña, pero solo porque la probabilidad general de tal evento es proporcional a el número de miembros de la familia, mientras que la tasa de nacimiento (muerte) por dominio sigue siendo el mismo. La observación clave de este trabajo, que las distribuciones de frecuencia del dominio real están bien descritas por un BDIM lineal pero no por un simple, sugiere que el supuesto de independencia es una simplificación excesiva. En cambio, el BDIM lineal incluye parámetros que describen la dependencia de la tasa de nacimiento (muerte) por dominio del tamaño de la familia. La asintótica de la distribución teórica que mejor se ajusta a los datos reales es una ley de potencia, con la potencia igual a a-B-1, donde a y B son los parámetros de un BDIM lineal. Observamos que, para todos los genomas analizados, a-B-1 & # x0003c -1 (a & # x0003cB), que corresponde a la "sinergia" entre los dominios de una familia. Tanto la tasa de natalidad del dominio como la tasa de mortalidad disminuyen con el aumento del tamaño de una familia de dominio, pero la tasa de mortalidad disminuye más rápidamente (Fig. & # X200B (Fig. 5). 5). En términos generales, esto sugiere que las familias pequeñas son más dinámicas durante la evolución que las familias numerosas. En particular, bajo el formalismo BDIM, la innovación contribuye solo a las familias de un solo miembro (clase 1), que tienen la mayor movilidad evolutiva, y proliferan rápidamente y se estabilizan o perecen. Una implicación de estas observaciones es que, en general, las familias numerosas son más antiguas que las pequeñas. Las excepciones a esta generalización, es decir, la existencia de pequeñas familias antiguas, probablemente apuntan a la selección para un tamaño de familia específico, por ejemplo, parece probable que la selección actúe contra la proliferación de ciertas proteínas esenciales, p. proteínas ribosomales, que típicamente forman familias de un solo miembro [41]. Otra observación pertinente es que el BDIM lineal parece acomodar adecuadamente incluso a la mayor de las familias de dominios identificadas. La expansión de linaje específico de familias parálogous parece ser uno de los principales modos de adaptación organísmica durante la evolución [13, 14, 42]. Por lo tanto, cuantitativamente, la expansión familiar adaptativa parece encajar dentro del marco BDIM, aunque estos modelos no incorporan explícitamente la noción de selección. Por supuesto, para los BDIM, es irrelevante qué familias se expanden, y esta elección está determinada por la selección.

En tercer lugar, la condición de equilibrio BDIM con respecto al número total de familias de dominio, & # x003bd = & # x003b41F1 (& # x003bd es la tasa de innovación, & # x003b41 es la tasa de mortalidad del dominio para familias de clase 1, y F1 es el número de familias de dominio en la clase 1) nos permite estimar la relación entre la tasa de innovación del dominio y las tasas de mortalidad y natalidad del dominio. De hecho, de acuerdo con lo anterior y la definición de un BDIM lineal de segundo orden, que es el que mejor se ajusta a los datos reales, & # x003bb = & # x003b4 = & # x003bd /F1(1+B). Dado que el número de familias de dominio en la clase 1 (familias con un solo miembro) es de cientos para cada genoma, esto se traduce en una tasa de innovación que es mucho mayor que la tasa de duplicación o eliminación. por dominio (Tabla & # x200B (Tabla1). 1). Estas tasas de innovación tan altas pueden parecer contrarias a la intuición, pero observemos que la tasa de duplicación en todas las familias de dominios es un número que tiende a ser casi idéntico a & # x003bd para genomas procariotas pequeños y varias veces mayor que & # x003bd para genomas grandes. genomas eucariotas (Tabla & # x200B (Tabla1). 1). Por lo tanto, bajo el BDIM lineal equilibrado de segundo orden, la probabilidad de aparición de un nuevo dominio en un genoma es cercana o varias veces menor que la probabilidad de una duplicación o eliminación de un dominio existente. Sin embargo, el hallazgo de que la tasa de innovación es comparable a la tasa general de duplicación / eliminación parece sorprendente. Si el BDIM lineal es de hecho un modelo evolutivo realista, esto enfatiza el papel crítico de la innovación en el mantenimiento del equilibrio (estado estable) en la evolución del genoma. En los procariotas, la innovación a través de la transferencia horizontal de genes parece ser particularmente extensa [32,39], lo que podría ser la base de la mayor tasa de innovación relativa en estos organismos (Tabla & # x200B (Tabla1 1).

Como ya se indicó, los BDIM no incorporan explícitamente la selección. Sin embargo, el presente análisis muestra que solo los modelos con tasas de nacimiento, muerte e innovación de dominios equilibradas con precisión pueden explicar la distribución observada del tamaño de la familia de dominios en cada uno de los genomas analizados. Parece probable que el equilibrio entre estos tipos sea en sí mismo producto de la selección. Hay pocas dudas de que los BDIM eventualmente serán reemplazados por formalismos más sofisticados que captarán de manera más realista los mecanismos de la evolución del genoma. Sin embargo, incluso el modelo crudo descrito aquí parece revelar varios aspectos potencialmente interesantes y no triviales del proceso evolutivo.

Apéndice matemático. Pruebas de algunas declaraciones.

Prueba de la propuesta 1

Cuando el sistema (3.1) se resuelve consecutivamente desde la última ecuación hasta la segunda, resulta obvio que la solución es única hasta un multiplicador constante.

Dado que el sistema (2.2) es lineal, el estado de equilibrio (F1. Fnorte) es asintóticamente estable si las partes reales de todos los valores característicos de la matriz

El siguiente teorema (ver [43]) da el criterio deseado: la parte real de todos los valores característicos de una matriz real C = |Cij|, yo, j = 1. norte con elementos no diagonales no negativos son negativos si y solo si (-1) k Dk & # x0003e 0 para todos k = 1. norte, dónde Dk es el menor principal de la matriz C de El k-ésimo orden.

Para aplicar este teorema, consideremos el norte & # x000d7 norte matriz, norte & # x02264 norte

Usando estas igualdades, podemos demostrar que para cualquier norte

Además, es fácil ver que para cualquier norte

Teniendo en cuenta que B1 = - (& # x003bb1 + & # x003b41) & # x0003c 0 y que el signo de det Anorte coincide con (-1) norte , es fácil demostrar que

Por lo tanto, el signo de det Bnorte coincide con el signo de det Anorte y entonces (-1) norte Bnorte & # x0003e 0 para todos norte = 1. norte. Según el teorema antes mencionado, las partes reales de todos los valores característicos de una matriz real Anorte son negativos y, por tanto, el equilibrio simple es asintóticamente estable, QED.


Contenido

los Modelo SIR [6] [7] [8] [9] es uno de los modelos compartimentales más simples, y muchos modelos son derivados de esta forma básica. El modelo consta de tres compartimentos: -

S: El número de sindividuos susceptibles. Cuando un individuo susceptible y uno infeccioso entran en "contacto infeccioso", el individuo susceptible contrae la enfermedad y pasa al compartimento infeccioso. I: El número de Iindividuos infecciosos. Estos son individuos que han sido infectados y son capaces de infectar a individuos susceptibles. R por el número de rindividuos emocionados (e inmunes) o fallecidos. Se trata de personas que han sido infectadas y se han recuperado de la enfermedad y han entrado en el compartimento extraído o han muerto. Se asume que el número de muertes es insignificante con respecto a la población total. Este compartimento también se puede llamar "rcubierto "o"resistant ".

Este modelo es razonablemente predictivo [10] para enfermedades infecciosas que se transmiten de persona a persona y en las que la recuperación confiere una resistencia duradera, como el sarampión, las paperas y la rubéola.

Estas variables (S, I, y R) representan el número de personas en cada compartimento en un momento determinado. Para representar que el número de individuos susceptibles, infecciosos y removidos puede variar con el tiempo (incluso si el tamaño total de la población permanece constante), hacemos que los números precisos sean una función de t (tiempo): S(t), I(t) y R(t). Para una enfermedad específica en una población específica, estas funciones pueden resolverse con el fin de predecir posibles brotes y controlarlos. [10]

Como lo implica la función variable de t, el modelo es dinámico en el sentido de que los números de cada compartimento pueden fluctuar con el tiempo. La importancia de este aspecto dinámico es más obvia en una enfermedad endémica con un período infeccioso corto, como el sarampión en el Reino Unido antes de la introducción de una vacuna en 1968. Estas enfermedades tienden a ocurrir en ciclos de brotes debido a la variación en el número de susceptibles (S (t)) tiempo extraordinario. Durante una epidemia, el número de individuos susceptibles disminuye rápidamente a medida que más de ellos se infectan y, por lo tanto, ingresan a los compartimentos infecciosos y eliminados. La enfermedad no puede volver a brotar hasta que el número de susceptibles se haya recuperado, p. Ej. como resultado del nacimiento de la descendencia en el compartimento susceptible.

Cada miembro de la población progresa típicamente de susceptible a infeccioso para recuperarse. Esto se puede mostrar como un diagrama de flujo en el que las cajas representan los diferentes compartimentos y las flechas la transición entre compartimentos, es decir.

Tasas de transición Editar

Para la especificación completa del modelo, las flechas deben estar etiquetadas con las tasas de transición entre compartimentos. Entre S y I, se supone que la tasa de transición es d (S / N) / dt = -βSI / N 2 , dónde norte es la población total, β es el número promedio de contactos por persona y por tiempo, multiplicado por la probabilidad de transmisión de la enfermedad en un contacto entre un sujeto susceptible y uno infeccioso, y SI / N 2 es la fracción de esos contactos entre un individuo infeccioso y susceptible que resulta en que la persona susceptible se infecte. (Esto es matemáticamente similar a la ley de acción de masas en química en la que las colisiones aleatorias entre moléculas dan como resultado una reacción química y la tasa fraccional es proporcional a la concentración de los dos reactivos).

Entre I y R, se supone que la tasa de transición es proporcional al número de individuos infecciosos que es γI. Esto equivale a suponer que la probabilidad de que un individuo infeccioso se recupere en cualquier intervalo de tiempo dt es simplemente γdt. Si una persona es infecciosa durante un período de tiempo promedio D, entonces γ = 1 /D. Esto también es equivalente a la suposición de que el tiempo que pasa un individuo en estado infeccioso es una variable aleatoria con una distribución exponencial. El modelo SIR "clásico" puede modificarse utilizando distribuciones más complejas y realistas para la tasa de transición I-R (por ejemplo, la distribución de Erlang [11]).

Para el caso especial en el que no hay remoción del compartimento infeccioso (γ = 0), el modelo SIR se reduce a un modelo SI muy simple, que tiene una solución logística, en el que cada individuo eventualmente se infecta.

El modelo SIR sin dinámicas vitales Editar

La dinámica de una epidemia, por ejemplo, la gripe, a menudo es mucho más rápida que la dinámica del nacimiento y la muerte, por lo tanto, el nacimiento y la muerte a menudo se omiten en modelos compartimentales simples. El sistema SIR sin la llamada dinámica vital (nacimiento y muerte, a veces llamada demografía) descrito anteriormente se puede expresar mediante el siguiente conjunto de ecuaciones diferenciales ordinarias: [7] [12]

Este modelo fue propuesto por primera vez por William Ogilvy Kermack y Anderson Gray McKendrick como un caso especial de lo que ahora llamamos teoría Kermack-McKendrick, y siguió al trabajo que McKendrick había hecho con Ronald Ross.

Este sistema no es lineal, sin embargo, es posible derivar su solución analítica en forma implícita. [6] En primer lugar, tenga en cuenta que de:

En segundo lugar, observamos que la dinámica de la clase infecciosa depende de la siguiente proporción:

el llamado número de reproducción básico (también llamado índice de reproducción básico). Esta relación se deriva como el número esperado de nuevas infecciones (estas nuevas infecciones a veces se denominan infecciones secundarias) de una sola infección en una población en la que todos los sujetos son susceptibles. [13] [14] Esta idea probablemente se pueda ver más fácilmente si decimos que el tiempo típico entre contactos es T c = β - 1 < displaystyle T_= beta ^ <-1>>, y el tiempo típico hasta la eliminación es T r = γ - 1 < displaystyle T_= gamma ^ <-1>>. De aquí se deduce que, en promedio, el número de contactos de un individuo contagioso con otros antes de lo infeccioso que se ha eliminado es: T r / T c. < Displaystyle T_/ T_.>

Dividiendo la primera ecuación diferencial por la tercera, separando las variables e integrando obtenemos

(tenga en cuenta que el compartimento infeccioso se vacía en este límite). Esta ecuación trascendental tiene una solución en términos de la función W de Lambert, [15] a saber

El papel tanto del número de reproducción básico como de la susceptibilidad inicial es extremadamente importante. De hecho, al reescribir la ecuación para individuos infecciosos de la siguiente manera:

es decir, habrá un brote epidémico adecuado con un aumento del número de infecciosos (que puede llegar a una fracción considerable de la población). Por el contrario, si

es decir, independientemente del tamaño inicial de la población susceptible, la enfermedad nunca puede causar un brote epidémico adecuado. Como consecuencia, está claro que tanto el número de reproducción básico como la susceptibilidad inicial son extremadamente importantes.

La fuerza de la infección Editar

Tenga en cuenta que en el modelo anterior la función:

modela la tasa de transición del compartimento de individuos susceptibles al compartimento de individuos infecciosos, por lo que se denomina fuerza de infección. Sin embargo, para grandes clases de enfermedades transmisibles es más realista considerar una fuerza de infección que no depende del número absoluto de sujetos infecciosos, sino de su fracción (con respecto a la población constante total N < displaystyle N>):

Capasso [16] y, posteriormente, otros autores han propuesto fuerzas de infección no lineales para modelar de forma más realista el proceso de contagio.

Soluciones analíticas exactas para el modelo SIR Editar

En 2014, Harko y sus coautores obtuvieron una llamada solución analítica exacta (que involucra una integral que solo se puede calcular numéricamente) para el modelo SIR. [6] En el caso sin configuración de dinámica vital, para S (u) = S (t) < displaystyle < mathcal > (u) = S (t)>, etc., corresponde a la siguiente parametrización de tiempo

Una solución analítica equivalente (que involucra una integral que solo se puede calcular numéricamente) encontrada por Miller [17] [18] produce

Efectivamente, el mismo resultado se puede encontrar en el trabajo original de Kermack y McKendrick. [4]

Una aproximación analítica de alta precisión del modelo SIR, así como expresiones analíticas exactas para los valores finales S ∞ < displaystyle S _ < infty >>, I ∞ < displaystyle I _ < infty >> y R ∞ < displaystyle R_ < infty >> fueron proporcionados por Kröger y Schlickeiser, [8] para que no sea necesario realizar una integración numérica para resolver el modelo SIR, obtener sus parámetros a partir de datos existentes o predecir la dinámica futura de una epidemia modelada por el modelo SIR. El aproximado involucra la función Lambert W, que es parte de todo el software básico de visualización de datos, como Microsoft Excel, MATLAB y Mathematica.

El modelo SIR con dinámica vital y población constante Editar

Considere una población caracterizada por una tasa de mortalidad μ < displaystyle mu> y una tasa de natalidad Λ < displaystyle Lambda>, y donde se está propagando una enfermedad transmisible. [7] El modelo con transmisión de acción masiva es:

para el cual el equilibrio libre de enfermedad (DFE) es:

En este caso, podemos derivar un número de reproducción básico:

que tiene propiedades de umbral. De hecho, independientemente de los valores iniciales biológicamente significativos, se puede demostrar que:


Inferencia de dinámica epidemiológica basada en filogenias simuladas utilizando modelos de nacimiento-muerte y coalescentes

La cuantificación de la dinámica epidemiológica es fundamental para comprender y predecir la propagación de una epidemia. El modelo coalescente y el de nacimiento-muerte se utilizan indistintamente para inferir parámetros epidemiológicos de las relaciones genealógicas de la población de patógenos en estudio, que a su vez se infieren de los datos de secuenciación genética del patógeno. Para comparar el desempeño de estos modelos ampliamente aplicados, realizamos un estudio de simulación. Simulamos árboles filogenéticos bajo el modelo de tasa constante de nacimiento-muerte y el modelo coalescente con una población infectada determinista que crece exponencialmente. Para cada árbol, volvimos a estimar los parámetros epidemiológicos utilizando un método basado en el nacimiento-muerte y un método coalescente, implementado como un procedimiento MCMC en BEAST v2.0. En nuestros análisis que estiman la tasa de crecimiento de una epidemia basados ​​en árboles simulados de nacimiento-muerte, las estimaciones puntuales, como las estimaciones de máxima probabilidad a posteriori / máxima, no son muy diferentes. Sin embargo, las estimaciones de incertidumbre son muy diferentes. El modelo de nacimiento-muerte tuvo una cobertura más alta que el modelo coalescente, es decir, contenía el valor verdadero en el intervalo de densidad posterior más alto (HPD) con mayor frecuencia (2-13% frente a 31-75% de error). La cobertura del coalescente disminuye con la disminución de la tasa de reproducción básica y el aumento de la probabilidad de muestreo de infectados. Presumimos que los sesgos en el coalescente se deben a la suposición de cambios en el tamaño de la población deterministas más que estocásticos. Ambos métodos funcionaron razonablemente bien al analizar árboles simulados bajo el coalescente. Los métodos también pueden identificar otros parámetros epidemiológicos clave siempre que uno de los parámetros se fije a su valor real. En resumen, cuando se utilizan datos genéticos para estimar la dinámica de la epidemia, nuestros resultados sugieren que el método de nacimiento-muerte será menos sensible a las fluctuaciones de población de los brotes tempranos que el método coalescente que asume una población infectada determinista que crece exponencialmente.

Declaracion de conflicto de interes

Los autores han declarado que no existen intereses en competencia.

Cifras

Figura 1. Comparación del modelo nacimiento-muerte ...

Figura 1. Comparación del modelo de nacimiento-muerte y el modelo coalescente en la estimación del crecimiento epidémico ...

Para cada parcela, 100 árboles simulados bajo el modelo de tasa constante de nacimiento-muerte (BD) con muestreo incompleto (subfigura A) o modelo coalescente (CE) con crecimiento exponencial de la población infectada (subfigura B) fueron analizados asumiendo un modelo de nacimiento-muerte. (barras azules) o un modelo coalescente con crecimiento poblacional exponencial determinista (barras rojas). Se muestran los intervalos de densidad posterior (HPD) del 95% más altos del parámetro de tasa de crecimiento (eje y). Los árboles están ordenados (eje x) por el valor mediano de la distribución posterior del parámetro de la tasa de crecimiento estimado por el coalescente (punto naranja dentro de la barra roja) de los árboles de nacimiento-muerte. La mediana de las estimaciones posteriores para el parámetro de la tasa de crecimiento estimado por el modelo de nacimiento-muerte se indica como un punto azul claro dentro de cada intervalo azul. El valor real del parámetro de la tasa de crecimiento, es decir, el valor bajo el cual se simularon los árboles, se muestra como una barra horizontal negra. Aquí usamos y (). Consulte la Figura S1 para ver los gráficos de otros ajustes de parámetros.

Figura 2. Influencia de la extensión de la longitud de la rama ...

Figura 2. Influencia de la extensión de la longitud de las ramas en varias partes del árbol en…

Para configurar y (), modificamos los 100 árboles de nacimiento-muerte (A) y los 100 árboles coalescentes (B) por extensión de rama. El árbol sin cambios se indica como "orig" en el eje x. Agregamos 48 unidades de tiempo, que corresponden aproximadamente a la longitud total de los árboles más largos, a las ramas. Extendimos las ramas que estaban presentes en el árbol al 10% del árbol (desde la raíz), al 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% (ver x -eje de izquierda a derecha). Luego, volvimos a estimar el parámetro de la tasa de crecimiento para cada uno de esos árboles. A diferencia de la gráfica anterior, aquí mostramos un resumen en forma de los valores medianos del inicio y el final de los intervalos HPD del 95%, y la mediana de las medianas de las estimaciones posteriores para los 100 árboles por configuración.

Figura 3. Influencia del esquema de muestreo en…

Figura 3. Influencia del esquema de muestreo en la estimación del parámetro de la tasa de crecimiento.

Para configurar (…

Para configurar (), modificamos las simulaciones del árbol de nacimiento-muerte para incluir períodos de mayor () y muestreo más bajo (ya sea , subfiguras A y B, o , subfiguras C y D). Simulamos 100 árboles de nacimiento-muerte (A y C) y los árboles coalescentes correspondientes (B y D) bajo varios esquemas de muestreo (ver la anotación del eje x). Mostramos un resumen en forma de los valores medianos del inicio y el final de los intervalos HPD del 95%, y la mediana de las medianas de las estimaciones posteriores para los 100 árboles por configuración. Para los entornos donde el método de tasa constante de nacimiento-muerte produjo sesgos muy severos, también analizamos los árboles con el modelo de horizonte de nacimiento-muerte con 10 intervalos para la probabilidad de muestreo (BDSKY, líneas celestes). El resumen de árboles simulados con muestreo constante a lo largo, está representado en el extremo izquierdo de cada figura ( en el eje x). A continuación, variamos el muestreo como p. Ej. muestra sin propinas) en las primeras fases ( Hasta que ) al avanzar en el tiempo y luego probar todas las puntas que mueren () de en adelante (correspondiente al ajuste indicado como “p = 0 desde t = 0 hasta t = 9”).

Figura 4. Error activado como función ...

Figura 4. Error en función de la probabilidad de muestreo para y fijo.

En (A) la relación entre el error en , es decir, estimado /cierto , y la probabilidad de muestreo se traza. Los valores y está arreglado. Para diferentes , , y y , calculamos y y graficar el impacto en error al cambiar durante la inferencia usando la Ecuación (3) en el Material Suplementario S1. En (B) mostramos cómo el error en depende de diferentes supuestos de durante la inferencia para , y y una matriz de probabilidad de muestreo verdadera utilizado para calcular y .

Figura 5. Efecto de la diferente información utilizada ...

Figura 5. Efecto de diferente información utilizada en la inferencia de parámetros.

Para configurar y (), estimamos el parámetro de los árboles de nacimiento-muerte (A) y los árboles coalescentes (B) utilizando cuatro métodos. Primero, usando las estimaciones posteriores coalescentes de la tasa de crecimiento y la verdad , obtuvimos (barras rojas). En segundo lugar, utilizamos las estimaciones posteriores de nacimiento-muerte de (árboles analizados bajo uniformes previos para , , y ), y el verdadero en el posprocesamiento (barras azules), similar al procedimiento utilizado para el coalescente. En tercer lugar, también analizamos los árboles fijando el anterior en la tasa de mortalidad. al verdadero valor, (barras verdes) o fijando el a priori en la probabilidad de muestreo al verdadero valor, (barras de color púrpura) durante el análisis MCMC. Tenga en cuenta que el eje y ahora muestra el 95% HPD del parámetro, y dentro de cada figura, los árboles (simulaciones) están ordenados (eje x) por la mediana de la estimación de la tasa de crecimiento parámetro estimado por el coalescente en los árboles de nacimiento-muerte.

Figura 6. Comparación del modelo nacimiento-muerte ...

Figura 6. Comparación del modelo de nacimiento-muerte y el modelo coalescente en la estimación del crecimiento epidémico ...

Para árboles simulados en los que se muestrearon las 100 puntas en un momento determinado, estimamos el parámetro de la tasa de crecimiento asumiendo un modelo de nacimiento-muerte con probabilidad de muestreo fija. (barras azules) y el modelo coalescente con una población determinista en crecimiento exponencial (barras rojas). Aquí usamos y probabilidad de muestreo (). Consulte la Figura S15 para ver los gráficos de otros ajustes de parámetros.

Figura 7. Comparación del punto de la tasa de crecimiento ...

Figura 7. Comparación de las estimaciones puntuales de la tasa de crecimiento del modelo de nacimiento-muerte y el coalescente ...

Para configurar y (), mostramos las estimaciones de ML y MAP para los árboles de nacimiento-muerte (A) y los árboles coalescentes (B). Como comparación, también se muestran los valores medianos del inicio y el final de los intervalos HPD del 95%, y la mediana de las medianas de las estimaciones posteriores para los 100 árboles por configuración. El valor real del parámetro de la tasa de crecimiento, es decir, el valor bajo el cual se simularon los árboles, se muestra como una barra horizontal negra. Consulte las Figuras S17 y S18 para ver los gráficos de otros ajustes de parámetros.

Contenido

Para la recurrencia y la fugacidad en los procesos de Markov, consulte la Sección 5.3 de la cadena de Markov.

Condiciones de recurrencia y fugacidad Editar

Samuel Karlin y James McGregor establecieron las condiciones para la recurrencia y la fugacidad. [1]

Mediante el uso Prueba de Bertrand ampliada (ver Sección 4.1.4 de la prueba de razón) las condiciones para la recurrencia, la fugacidad, la ergodicidad y la nula recurrencia se pueden derivar de una forma más explícita. [2]

Entonces, las condiciones para la recurrencia y la fugacidad de un proceso de nacimiento y muerte son las siguientes.

Aplicación Editar

La caminata aleatoria que se describe aquí es un análogo de tiempo discreto del proceso de nacimiento y muerte (ver cadena de Markov) con las tasas de natalidad

Entonces, la recurrencia o fugacidad de la caminata aleatoria se asocia con la recurrencia o fugacidad del proceso de nacimiento y muerte. [2]

Estas probabilidades limitantes se obtienen del sistema infinito de ecuaciones diferenciales para p k (t): < displaystyle p_(t):>

A proceso de muerte pura es un proceso de nacimiento-muerte donde λ i = 0 < displaystyle lambda _= 0> para todo i ≥ 0 < displaystyle i geq 0>.

Modelo M / M / 1 y Modelo M / M / c, ambos utilizados en la teoría de las colas, son procesos de nacimiento-muerte que se utilizan para describir a los clientes en una cola infinita.

Los procesos de nacimiento-muerte se encuentran en la filodinámica como un modelo generativo de filogenias, es decir, un árbol binario en el que los eventos de nacimiento corresponden a las ramas del árbol y los eventos de muerte a los nodos de las hojas. [3] En particular, se utilizan en filodinámica viral [4] para comprender el proceso de transmisión.

En la teoría de las colas, el proceso de nacimiento-muerte es el ejemplo más fundamental de un modelo de colas, el M / M / C / K / ∞ < displaystyle infty> / FIFO (en la notación completa de Kendall) cola. Esta es una cola con llegadas de Poisson, extraídas de una población infinita, y C servidores con tiempos de servicio distribuidos exponencialmente con K lugares en la cola. A pesar de la suposición de una población infinita, este modelo es un buen modelo para varios sistemas de telecomunicaciones.

Cola M / M / 1 Editar

los M / M / 1 es una cola de servidor único con un tamaño de búfer infinito. En un entorno no aleatorio, el proceso de nacimiento-muerte en los modelos de cola tienden a ser promedios a largo plazo, por lo que la tasa promedio de llegada se da como λ < displaystyle lambda> y el tiempo de servicio promedio como 1 / μ < displaystyle 1 / mu>. El proceso de nacimiento y muerte es una cola M / M / 1 cuando,

Las ecuaciones diferenciales para la probabilidad de que el sistema esté en estado k en el momento t están

Proceso de nacimiento puro asociado con una cola M / M / 1 Editar

Es decir, un proceso de Poisson (homogéneo) es un proceso de nacimiento puro.

Editar cola M / M / c

El M / M / C es una cola de varios servidores con C servidores y un búfer infinito. Se caracteriza por los siguientes parámetros de nacimiento y muerte:

El sistema de ecuaciones diferenciales en este caso tiene la forma:

Proceso de muerte pura asociado con una cola M / M / C Editar

que presenta la versión de la distribución binomial en función del parámetro de tiempo t < displaystyle t> (ver Proceso binomial).

Editar cola M / M / 1 / K

La cola M / M / 1 / K es una cola de servidor único con un búfer de tamaño K. Esta cola tiene aplicaciones en telecomunicaciones, así como en biología cuando una población tiene un límite de capacidad. En telecomunicaciones, usamos nuevamente los parámetros de la cola M / M / 1 con,

En biología, particularmente en el crecimiento de bacterias, cuando la población es cero, no hay capacidad para crecer, por lo que,

Además, si la capacidad representa un límite donde el individuo muere por sobrepoblación,

Las ecuaciones diferenciales para la probabilidad de que el sistema esté en estado k en el momento t están


Referencias

Nickerson DP, Hunter PJ: Los modelos de electrofisiología ventricular cardíaca de Noble en CellML. Prog Biophys Mol Biol. 2006, 90: 346-359.

Smith NP, Crampin EJ, Niederer SA, Bassingthwaighte JB, Beard DA: Biología computacional de miocitos cardíacos: estándares propuestos para el fisioma. J Exp Biol. 2007, 210 (Parte 9): 1576-1583.

Niederer SA, Fink M, Noble D, Smith NP: un metanálisis de modelos computacionales de electrofisiología cardíaca. Exp Physiol. 2009, 94: 486-495.

Hunter PJ, Borg TK: Integración de proteínas a órganos: el Proyecto Physiome. Nat Rev Mol Cell Biol. 2003, 4: 237-243.

Tøndel K, Indahl UG, Gjuvsland AB, Omholt SW, Martens H: El metamodelado multidireccional facilita la comprensión de los complejos mapas de entrada y salida de los modelos dinámicos no lineales. BMC Syst Biol. 2012, 6: 88-

Tøndel K, Indahl UG, Gjuvsland AB, Vik JO, Hunter P, Omholt SW, Martens H: La regresión de mínimos cuadrados parciales basada en clústeres jerárquicos es una herramienta eficaz para el metamodelado de modelos dinámicos no lineales. BMC Syst Biol. 2011, 5: 90-

Isaeva J, Martens M, Sæbø S, Wyller JA, Martens H: El modelo de curvatura lineal: muchos modelos no lineales aproximados por un único metamodelo bilineal con perfiles verbales. Fenómeno físico no lineal. 2012, 241: 877-889.

Isaeva J, Sæbo S, Wyller JA, Nhek S, Martens H: Ajuste rápido y completo de modelos matemáticos complejos a cantidades masivas de datos empíricos. Laboratorio Chemometr Intell. 2012, 117: 13-21.

Isaeva J, Sæbø S, Wyller JA, Wolkenhauer O, Martens H: Modelado no lineal de curvatura mediante metamodelado bi-lineal. Laboratorio Chemometr Intell. 2012, 117: 2-12.

Pearson K: En líneas y planos de ajuste más cercano a sistemas de puntos en el espacio. Philos Mag. 1901, 2: 559-572.

Jolliffe IT: Una nota sobre el uso de componentes principales en regresión. J R Stat Soc: Ser C: Appl Stat. 1982, 31: 300-303.

Murty KG: Programación lineal. 1983, Nueva York, Estados Unidos: John Wiley & amp Sons, Inc

Kirkpatrick S, Gelatt CD, Vecchi MP: Optimización mediante recocido simulado. Ciencias. 1983, 220: 671-680.

Marquardt DW: un algoritmo para la estimación por mínimos cuadrados de parámetros no lineales. J Soc Ind Appl Math. 1963, 11: 431-441.

Niederer SA, Hunter PJ, Smith NP: Un análisis cuantitativo de la relajación de los miocitos cardíacos: un estudio de simulación. Biophys J. 2006, 90: 1697-1722.

Land S, Niederer SA, Aronsen JM, Espe EKS, Zhang L, Louch WE, Sjaastad I, Sejersted OM, Smith NP: un análisis del acoplamiento electromecánico dependiente de la deformación en el corazón del ratón. J Physiol. 2012, 590 (Parte 18): 4553-4569.

Land S: un marco integrador para el modelado computacional de la electromecánica cardíaca en el ratón. 2013, Reino Unido: Tesis Doctoral, Universidad de Oxford,

Gordon AM, Homsher E, Regnier M: Regulación de la contracción en el músculo estriado. Physiol Rev. 2000, 80: 853-924.

Rice JJ, Wang F, Bers DM, de Tombe PP: Modelo aproximado de activación cooperativa y ciclismo de puente cruzado en el músculo cardíaco utilizando ecuaciones diferenciales ordinarias. Biophys J. 2008, 95: 2368-2390.

Hunter PJ, McCulloch AD, ter Keurs HE: Modelado de las propiedades mecánicas del músculo cardíaco. Prog Biophys Mol Biol. 1998, 69: 289-331.

McKay MD, Los ASL, Beckman RJ, Conover WJ: Comparación de los tres métodos para seleccionar valores de variable de entrada en el análisis de salida de un código de computadora. Tecnometría. 1979, 21: 239-245.

Land S, Louch WE, Niederer SA, Aronsen JM, Christensen G, Sjaastad I, Sejersted OM, Smith NP: La estimulación beta-adrenérgica mantiene la función cardíaca en ratones knockout para Serca2. Biophys J. 2013, 104: 1349-1356.

MATLAB®. 2012, Natick, Massachusetts, EE.UU .: The MathWorks, Inc

Lawson CL, Hanson RJ: Resolver problemas de mínimos cuadrados. 1974, Nueva Jersey, EE. UU .: Sociedad de Matemáticas Industriales y Aplicadas, Prentice-Hall, Inc.

Martens M, Martens H: regresión de mínimos cuadrados parciales. Stat Proced Food Res JR Piggott Ed. 1986, Londres: Elsevier Applied Sciences, 293-360.

Martens H, Næs T: Calibración multivariante. 1989, Chichester, Reino Unido: John Wiley and Sons

Martens H, Martens M: Análisis multivariado de la calidad: una introducción. 2001, Chichester, Reino Unido: John Wiley & amp Sons Ltd, 1

Wold S, Martens H, Wold H: El método de calibración multivariante en química resuelto por el método PLS. Lect Notes Math Matrix Pencils. 1983, Heidelberg: Springer-Verlag, 286-293.

Tøndel K, Vik JO, Martens H, Indahl UG, Smith N, Omholt SW: El análisis de sensibilidad jerárquico multivariante basado en regresión revela patrones complejos de interacción de parámetros en modelos dinámicos. Laboratorio Chemometr Intell. 2013, 120: 25-41.

Tøndel K, Gjuvsland AB, Måge I, Martens H: Diseño de cribado para experimentos informáticos: Metamodelado de un modelo matemático determinista del reloj circadiano de los mamíferos. J Chemometr. 2010, 24: 738-747.

Bezdek JC: Reconocimiento de patrones con algoritmos de función objetiva difusa. 1981, Norwell, EE. UU .: Kluwer Academic Publishers

Berget I, Mevik B-H, Næs T: Nuevas modificaciones y aplicaciones de la metodología difusa de C-medias. Análisis de datos estadísticos informáticos. 2008, 52: 2403-2418.

Næs T, Kubberød E, Sivertsen H: Identificación e interpretación de segmentos de mercado mediante análisis conjunto. Preferencia de calidad de alimentos. 2001, 12: 133-143.

Næs T, Isaksson T: División de datos de calibración por análisis de conglomerados. J Chemometr. 1991, 5: 49-65.

Gutenkunst RN, Waterfall JJ, Casey FP, Brown KS, Myers CR, Sethna JP: Sensibilidades de parámetros universalmente descuidadas en modelos de biología de sistemas. PLoS Comput Biol. 2007, 3: e189-

Cacuci DG, Ionescu-Bujor M, Navon IM: Análisis de sensibilidad e incertidumbre: Aplicaciones a sistemas a gran escala Vol 2. 2005, Boca Raton, EE. UU .: CRC Press, 1

Kleijnen JPC: Diseño y análisis de experimentos de simulación. 2007, Nueva York, EE.UU .: Springer, 1

Vik JO, Gjuvsland AB, Li L, Tøndel K, Niederer SA, Smith N, Hunter PJ, Omholt SW: Características del mapa de genotipo-fenotipo de una célula cardíaca in silico. Frente Physiol. 2011, 2: 106-

Sobol IM: Índices de sensibilidad global para modelos matemáticos no lineales y sus estimaciones de Monte Carlo. Math Comput Simul. 2001, 55: 271-280.

Nelder JA, Mead R: Un método simplex para la minimización de funciones. Comput J. 1965, 7: 308-313.

El Tabach E, Lancelot L, Shahrour I, Najjar Y: Uso de metamodelado de simulación de redes neuronales artificiales para evaluar la contaminación del agua subterránea en un proyecto de carretera. Modelo de cálculo matemático. 2007, 45: 766-776.

Hamilton J: El filtro de Kalman. Time Ser Anal. 1994, Nueva Jersey, EE.UU .: Princeton University Press, 13:

Sarkar AX, Sobie EA: análisis de regresión para restringir parámetros libres en modelos electrofisiológicos de células cardíacas. PLoS Comput Biol. 2010, 6:

Radulescu O, Gorban AN, Zinovyev A, Noel V: Reducción de redes de reacciones bioquímicas dinámicas en biología computacional. Front Gene. 2012, 3: 131-


6. El problema de la selección

A lo largo de lo anterior, hemos aludido a los problemas que la selección sistemática de uno o más tipos de ADNmt puede causar en estos análisis. Se ha establecido la teoría que describe la influencia de la selección, pero es complicada (Johnston et al., 2015). En particular, si se utilizan enfoques que asumen la ausencia de selección cuando de hecho está presente, pueden surgir errores en las estimaciones de las propiedades genéticas y los mecanismos físicos. Como se señaló anteriormente, estos problemas pueden llevar a una subestimación dramática del & # x0201C tamaño del cuello de botella & # x0201D y no se puede suponer que & # x0201C cancele. & # X0201D

Varios de los resultados anteriores son válidos solo en ausencia de selección: cuando ningún tipo de ADNmt experimenta una ventaja sobre cualquier otro. Se sabe que esto es falso para muchos pares de ADNmt en muchos tejidos somáticos, donde a menudo se observa la selección de un tipo de ADNmt sobre otro (revisado en Burgstaller et al., 2014). La selección en la línea germinal ha sido más debatida, pero la evidencia está aumentando. En varios estudios, la transmisión de mutaciones patológicas parece estar sujeta a una presión selectiva. El nivel máximo de transmisión de la mutación 3243 en humanos parece ser limitado (Monnot et al., 2011 Otten et al., 2018), y se ha observado selección contra mutaciones severas del mtDNA en ratones (Fan et al., 2008). . Observaciones recientes en ratones (Burgstaller et al., 2018 Latorre-Pellicer et al., 2019) y humanos (Wei et al., 2019) han observado selección en diferentes loci. Burgstaller y col. (2018) sugieren que la selección puede actuar en diferentes direcciones en diferentes etapas de desarrollo (respaldado muy recientemente por Latorre-Pellicer et al., 2019), y que estas direcciones pueden cancelar o proporcionar un cambio selectivo neto. La teoría matemática del comportamiento de la difusión de la proporción mutante cuando la selección está presente sigue estando menos desarrollada y representa un importante objetivo teórico futuro. El enfoque de partición nacimiento-muerte en las referencias (Johnston et al., 2015 Johnston y Jones, 2016) puede explicar la selección, pero es matemáticamente complicado. Otten y col. (2018) han propuesto una distribución de Kimura truncada para describir un régimen selectivo donde las proporciones de mutantes por encima de un cierto valor están prohibidas, y encontraron que está respaldada por observaciones de la mutación 3243.

La comparación con la distribución de Kimura se utiliza a menudo para defender la ausencia de selección. Sin embargo, este enfoque debe interpretarse con cautela. Dependiendo del mecanismo de selección, las muestras distribuidas por Kimura pueden observarse incluso cuando se ha producido la selección. En particular, dado que los enfoques que utilizan la distribución de Kimura a veces utilizan varias mediciones de & # x0201Cafter & # x0201D pero no & # x0201Cbefore & # x0201D, es posible que no se detecte un cambio temprano en la proporción de mutantes.


Modelos de caminata aleatoria en biología

La modelización matemática del movimiento de animales, microorganismos y células es de gran relevancia en los campos de la biología, la ecología y la medicina. Los modelos de movimiento pueden tomar muchas formas diferentes, pero los más utilizados se basan en las extensiones de procesos simples de caminata aleatoria. En este artículo de revisión, nuestro objetivo es doble: introducir las matemáticas detrás de los paseos aleatorios de una manera sencilla y explicar cómo se pueden utilizar estos modelos para ayudar a comprender los procesos biológicos. Introducimos la teoría matemática detrás de la caminata aleatoria simple y explicamos cómo esto se relaciona con el movimiento browniano y los procesos de difusión en general. Demostramos cómo estos modelos simples pueden extenderse para incluir tiempos de deriva y de espera o usarse para calcular los tiempos de primer paso. Analizamos los paseos aleatorios sesgados y mostramos cómo se pueden utilizar modelos hiperbólicos para generar paseos aleatorios correlacionados. Cubrimos dos aplicaciones principales del modelo de caminata aleatoria. En primer lugar, revisamos modelos y resultados relacionados con el movimiento, la dispersión y la redistribución de la población de animales y microorganismos. Esto incluye el cálculo directo del desplazamiento cuadrático medio, la distancia de dispersión media, las medidas de tortuosidad, así como las posibles limitaciones de estos enfoques de modelo. En segundo lugar, se revisan los modelos de quimiotaxis y movimiento orientado. Se introducen modelos hiperbólicos generales basados ​​en la ecuación de transporte lineal y mostramos cómo un paseo aleatorio reforzado se puede utilizar para modelar el movimiento donde el individuo cambia su entorno. Discutimos las aplicaciones de estos modelos en el contexto de la migración celular que conduce al crecimiento de los vasos sanguíneos (angiogénesis). Finalmente, discutimos cómo se relacionan los diversos modelos y enfoques de caminatas aleatorias y las conexiones que sustentan muchos de los procesos clave involucrados.

1. Introducción

La base de la teoría de la caminata aleatoria se remonta al movimiento irregular de las partículas de polen individuales, famoso estudiado por el botánico Brown (1828), ahora conocido como movimiento browniano. Las obras clásicas sobre probabilidad existen desde hace siglos, por lo que es algo sorprendente que solo a principios del siglo XX se describiera en la literatura un paseo aleatorio, cuando la revista Naturaleza publicó una discusión entre Pearson (1905) y Rayleigh (1905). Los físicos, como Einstein (1905, 1906) y Smoluchowski (1916), se sintieron atraídos por el tema y muchos campos importantes, como los procesos aleatorios, el ruido aleatorio, el análisis espectral y las ecuaciones estocásticas, se desarrollaron durante el curso de la investigación sobre el azar. camina. La teoría del paseo aleatorio se desarrolló aún más con el proceso de reversión a la media (Uhlenbeck & amp Ornstein 1930).

Los primeros modelos simples de movimiento que utilizan caminatas aleatorias no están correlacionados ni son imparciales. En este contexto, no correlacionado significa que la dirección del movimiento es completamente independiente de las direcciones anteriores movidas: la ubicación después de cada paso dado en la caminata aleatoria depende solo de la ubicación en el paso anterior y el proceso es markoviano con respecto a la ubicación ( Weiss 1994). No sesgado significa que no hay una dirección preferida: la dirección que se mueve en cada paso es completamente aleatoria. Suponiendo que se permite el movimiento en cualquier dirección, este proceso es esencialmente un movimiento browniano y se puede demostrar que tales modelos producen la ecuación estándar de difusión (o calor).

Los paseos aleatorios correlacionados (CRW) implican una correlación entre las orientaciones de pasos sucesivos, lo que se denomina "persistencia" (Patlak 1953). Esto produce un sesgo direccional local: cada paso tiende a apuntar en la misma dirección que el anterior, aunque la influencia de la dirección inicial del movimiento disminuye progresivamente con el tiempo y las orientaciones de los pasos se distribuyen uniformemente a largo plazo (Benhamou 2006). Dado que la mayoría de los animales tienen una tendencia a avanzar (persistencia), los CRW se han utilizado con frecuencia para modelar las rutas de los animales en varios contextos (por ejemplo, Siniff & amp Jessen 1969 Skellam 1973 Kareiva & amp Shigesada 1983 Bovet & amp Benhamou 1988 Turchin 1998).

Se puede introducir un sesgo direccional global haciendo que la probabilidad de moverse en una determinada dirección sea mayor, lo que lleva a la ecuación deriva-difusión (o advección-difusión). Las rutas que contienen un sesgo constante en la dirección preferida o hacia un objetivo determinado se denominan caminatas aleatorias sesgadas (BRW) o sesgadas y CRW (BCRW) si también se observa persistencia. El sesgo puede deberse a factores ambientales externos fijos (por ejemplo, microorganismos pesados ​​en el fondo que se mueven hacia arriba bajo la girotaxis Hill & amp Häder 1997), a factores que varían espacialmente, como gradientes químicos (Alt 1980 Othmer et al. 1988), a los mecanismos de reversión a la media, como el movimiento dentro de un área de distribución (Blackwell 1997), oa la elección de la dirección por parte de los individuos en cada paso (Benhamou 2003). La dirección del objetivo y la fuerza del sesgo no están necesariamente fijas en todo el camino y pueden variar con la ubicación y el tiempo (por ejemplo, larvas de peces que apuntan a un arrecife et al. 2004). Cuando la dirección objetivo se fija para todos los individuos de la población, es posible cuantificar la dirección, la forma funcional y la magnitud del sesgo introducido (Hill & amp Häder 1997 Codling & amp Hill 2005a). Sin embargo, debido al sesgo direccional localizado (persistencia) en CRW, es un problema no trivial distinguir entre CRW y BCRW cuando los individuos tienen diferentes direcciones de destino (Benhamou 2006).

En el contexto de la redistribución de la población, los paseos aleatorios no correlacionados se clasifican como procesos de salto de posición (Othmer et al. 1988). En general, son válidos solo para grandes escalas de tiempo y pueden considerarse como una aproximación asintótica a las verdaderas ecuaciones que gobiernan el movimiento que incluyen efectos de correlación. A su vez, el CRW y el BCRW a menudo se denominan procesos de salto de velocidad (ya que el proceso implica cambios aleatorios en la velocidad) y se han estudiado extensamente conduciendo a un marco general para describir estos procesos (Othmer et al. 1988 Hillen & amp Othmer 2000 Hillen 2002 Othmer & amp Hillen 2002).

Los paseos aleatorios discutidos en este documento pueden tener una longitud de paso fija o variable. En el caso de una longitud de paso variable, solo se consideran los paseos donde la distribución de la longitud de los pasos tiene una varianza finita (por ejemplo, la distribución exponencial). Según el teorema del límite central, esto significa que, después de un período de tiempo suficiente, la coordenada de ubicación de un caminante individual en cualquier eje converge a una distribución gaussiana. Un tipo diferente de caminata aleatoria que ha generado mucho interés recientemente es el Paseo de Lévy, en el que la distribución de las longitudes de los pasos tiene una cola pesada, es decir, tiene una varianza infinita. En este caso, la caminata exhibe características invariantes de escala (es decir, fractales). Varios estudios recientes (Viswanathan et al. 1996, 2000) han afirmado que los paseos de Lévy proporcionan un modelo adecuado para los movimientos de los animales, aunque esto sigue siendo objeto de cierta controversia (Benhamou 2007 Edwards et al. 2007 James & amp Plank 2007) y es posible que no sean tan aplicables en general como se pensaba. De hecho, muchos de los patrones observados que se atribuyen a los procesos de Lévy pueden generarse mediante un proceso de caminata aleatoria compuesta más simple donde el comportamiento de giro es espacialmente dependiente (Benichou et al. 2006 Benhamou 2007). Una revisión completa de los paseos de Lévy está fuera del alcance de este artículo.

Nuestro objetivo en este artículo de revisión es producir una referencia completa que pueda ser utilizada tanto por matemáticos como por biólogos. Otros libros y artículos de revisión están disponibles en este campo (por ejemplo, Weiss 1994 Turchin 1998 Okubo & amp Levin 2001 Hillen 2002), pero todavía tenemos que encontrar un artículo que incluya todos los resultados clave y que también explique cómo se relacionan los modelos utilizados en diferentes contextos biológicos. a otro. La teoría del paseo aleatorio se aplica generalmente en dos contextos biológicos principales (aunque estos de ninguna manera son exclusivos y hay muchos otros contextos relevantes): el movimiento y la dispersión de animales y microorganismos, y los modelos de quimiotaxis de señalización y movimiento celular. Como pretendemos demostrar en esta revisión, la mayoría de los enfoques de modelado utilizados en estos diferentes contextos se basan en los mismos modelos subyacentes. El documento se divide en dos secciones principales. En §2, se presentan la teoría fundamental y las ecuaciones de los paseos aleatorios, y se desarrollan con cierto detalle las ideas centrales de sesgo y persistencia. La Sección 3 revisa el uso de caminatas aleatorias en relación con los movimientos de animales y células, mostrando cómo la teoría puede usarse para predecir información sobre tasas de propagación y tortuosidad, y movimientos que están gobernados por agentes químicos de señalización (u otros estímulos). Discutimos los beneficios y las limitaciones de los diferentes enfoques utilizados y las conexiones que sustentan los modelos y los resultados. Explicamos brevemente algunos de los modelos más complejos disponibles en la literatura, cuando sea relevante. Nuestro objetivo es ser comprensivo pero no exhaustivo. Se remite al lector a los artículos clave para obtener más detalles y extensiones de las ideas básicas.

2. Fundamentos de los paseos aleatorios

El modelo de paseo aleatorio isotrópico simple (SRW) es la base de la mayor parte de la teoría de los procesos de difusión. La caminata es isotrópica o no sesgada, lo que significa que es igualmente probable que el caminante se mueva en cada dirección posible y no esté correlacionada en la dirección, lo que significa que la dirección tomada en un momento dado es independiente de la dirección en todos los momentos anteriores. Usando este modelo, es sencillo derivar una ecuación para la función de densidad de probabilidad (PDF) para la ubicación del caminante en una dimensión, ya sea considerando el límite a medida que el número de pasos se vuelve muy grande o usando una ecuación en diferencia (nosotros ilustre estos enfoques en §§2.1 y 2.2). En §§2.3 y 2.4, mostramos cómo el SRW se extiende a dimensiones más altas y, en §2.5, discutimos las propiedades generales de los procesos de difusión y algunas limitaciones de los modelos que utilizan este enfoque. En §2.6, damos un ejemplo simple de un paseo aleatorio hasta una barrera para demostrar cómo el SRW puede formar la base de modelos de movimiento más complejos.

Una extensión importante del SRW es el CRW, en el que hay una persistencia en la dirección de movimiento del caminante. En §2.7, se deriva una ecuación, conocida como ecuación telegráfica, que describe el CRW unidimensional más simple y, en §2.8, se analiza su relación con el proceso de difusión estándar. En §2.9, demostramos cómo este análisis puede extenderse para incluir sesgos en la dirección global del movimiento. Sin embargo, en dos (o más) dimensiones, un análisis similar (tanto para los casos insesgados como sesgados) no conduce a una ecuación de forma cerrada para la densidad de probabilidad en el espacio y el tiempo. Discutimos este problema y sus implicaciones en §2.10.

2.1 La caminata aleatoria isotrópica simple

Considere un caminante que se mueve sobre un entramado uniforme unidimensional infinito (es decir, una línea dividida en puntos discretos). Suponga que el caminante comienza en el origen (X= 0) y luego se mueve una distancia corta δ ya sea hacia la izquierda o hacia la derecha en poco tiempo τ. Se supone que el movimiento es completamente aleatorio, por lo que las probabilidades de moverse tanto a la izquierda como a la derecha son 1/2. Después de un paso de tiempo, el caminante puede estar a distancia δ a la izquierda o derecha del origen, con probabilidad 1/2 cada uno. Después del siguiente paso de tiempo, el caminante estará a una distancia 2δ a la izquierda o derecha del origen (con probabilidad 1/4 cada uno) o habrán regresado al origen (con probabilidad 1/2). Tenga en cuenta que, después de un número par (impar) de pasos, el caminante solo puede estar a una distancia par (impar) del origen. Continuando de esta manera, la probabilidad de que un caminante esté a distancia a la derecha del origen después norte pasos de tiempo (donde metro y norte son pares) viene dado por

Las estadísticas útiles dependientes del tiempo de este proceso son la ubicación media mi(Xt) y el desplazamiento cuadrático medio (MSD), definido como

2.2 Un BRW con tiempos de espera

También es un procedimiento estándar (Lin & amp Segel 1974 Okubo & amp Levin 2001) para derivar la ecuación gobernante para un SRW usando una ecuación en diferencias, y posteriormente resolver para encontrar soluciones de la forma (2.2). Este método también permite modelar procesos más complejos como parte de la caminata aleatoria y lo ilustramos en el siguiente ejemplo al incluir tanto una dirección preferida (o sesgo) como un posible tiempo de espera entre pasos de movimiento.

Considere un andador que se mueve sobre una celosía unidimensional, donde, en cada paso de tiempo τ, el caminante se mueve una distancia δ a la izquierda o derecha con probabilidades l y r, respectivamente, o permanece en la misma ubicación ("espera"), con probabilidad 1−lr (la caminata aleatoria isotrópica en §2.1 tiene r=l= 1/2 y no hay tiempo de espera). Ahora, si el andador está en la ubicación X en el momento t+τ, entonces hay tres posibilidades para su ubicación en el momento t: (i) fue en Xδ y luego se movió hacia la derecha, (ii) estaba en X+δ y luego se movió hacia la izquierda, y (iii) estaba en X y no se movió en absoluto. Así tenemos

Cabe señalar que, debido al tiempo de espera entre movimientos, el valor de la constante de difusión D es más pequeño (k=l+r& lt1 en este caso) que en §2.1 y, por tanto, como era de esperar, la difusión es menos rápida. Tenga en cuenta también que, debido a la forma en que se toman los límites en (2.6), el término ϵ=rl debe tender a cero para obtener una tasa de deriva finita tu.

La solución de (2.7) sometida a la condición inicial pag(X, 0)=δD(X) (la función delta de Dirac), lo que significa que el caminante está en X= 0 en el momento t= 0, es (Montroll & amp Shlesinger 1984 Grimmett & amp Stirzaker 2001)

La ubicación media y el MSD se pueden calcular fácilmente sustituyendo (2.8) en (2.3). Alternativamente, es posible calcular los momentos directamente desde el PDE gobernante (2.7). Esta es una técnica que es particularmente útil en modelos más complejos cuando se conoce la ecuación diferencial gobernante, pero la solución para pag(X, t) puede ser difícil o imposible de encontrar (ver §3.5). Primero, multiplicamos la ecuación (2.7) por X (encontrar la ubicación media) o por X 2 (para encontrar MSD) e integrar por partes. Luego, usando las definiciones en (2.3), el hecho de que

2.3 El BRW en mayores dimensiones

Una derivación similar a la del §2.2 se puede completar utilizando un norte-rejilla dimensional para dar la ecuación estándar de deriva-difusión

con Rt=|Xt| y, para (2.12), está dado por

Figura 1 (a,C,mi) PDF y (B,D,F) caminos de muestra de diferentes paseos aleatorios. (a,B) Una celosía BRW con probabilidades de moverse una distancia δ derecha o izquierda de τ(D/δ 2 ±tu/(2δ)) y arriba o abajo de τD/δ 2 . (C,D) Un CRW sin celosía con probabilidades de girar en ángulo δθ en sentido horario o antihorario de. (mi,F) Un BCRW sin celosía con probabilidades de girar en sentido horario o antihorario de (véase el modelo de reorientación lineal de §3.4). En BRW y BCRW, la dirección global preferida es θ0= 0 en CRW y BCRW, la dirección inicial es θ=π/ 2 y el andador se mueve con rapidez constante v. En todos los casos, el caminante comienza en (X, y) = (0, 0) en t= 0 y se le permite moverse hasta t= 10. Los PDF pag(X, y, t= 10) se calcularon a partir de 10 6 realizaciones de la caminata. En (a), las líneas blancas muestran los contornos del PDF teórico correspondiente (2.12). En las rutas de muestra para el BRW, en cada paso, el caminante permanece quieto o se mueve hacia la derecha, izquierda, arriba o abajo una distancia. δ. En CRW y BCRW, en cada paso la dirección de movimiento del caminante θ o permanece igual o gira en sentido horario o antihorario en un ángulo δθ, y el movimiento del caminante viene dado por el vector (porque θ, pecado θ). Valores paramétricos: D=0.2, tu=0.5, , B=2.5, v=0.5.

Es interesante notar que, si el movimiento bidimensional no está restringido a una celosía (recuadro 1), entonces la difusión en la dirección del sesgo es menor que en la dirección perpendicular (ver cap. 2 de Codling 2003 Coscoy et al. 2007). Este resultado no siempre se considera adecuadamente en los modelos de dinámica de población espacial, donde la difusión generalmente se supone que es la misma en todas las direcciones, incluso cuando hay una deriva promedio en una dirección particular.

Recuadro 1. Salir de la celosía.

La distribución de von Mises

La distribución normal envuelta

La distribución envuelta de Cauchy

2.4 La ecuación de Fokker-Planck

También es posible extender el SRW en dos (o más) dimensiones para incluir probabilidades de movimiento que dependen espacialmente. Esto da como resultado la ecuación de Fokker-Planck para pag(X, y, t) (Okubo y Levin 2001). Suponga que un individuo se mueve sobre una red bidimensional. En cada paso de tiempo τ, un individuo puede moverse una distancia δ ya sea arriba, abajo, izquierda o derecha con probabilidades que dependen de la ubicación, dadas por tu(X, y), D(X, y), l(X, y) y r(X, y), respectivamente (con tu+D+l+r≤1), o permanecer en la misma ubicación con probabilidad 1−tu(X, y)−l(X, y)−D(X, y)−r(X, y). Ahora usamos una ecuación en diferencias como en §2.2, expandimos como una serie de Taylor y definimos los siguientes parámetros:

2.5 Propiedades de difusión generales y limitaciones del modelo

Una inspección más detallada de las soluciones de la ecuación de difusión (2.2) y (2.8) muestra que se cumple la siguiente propiedad importante: pag(X, t) & gt0 para todas las ubicaciones X y todos los tiempos positivos t. Por lo tanto, para cualquier tiempo positivo (no importa cuán pequeño sea), existe una probabilidad positiva de estar en alguna ubicación finita.

En la práctica, la probabilidad de estar a una distancia excepcionalmente grande del origen después de un intervalo de tiempo infinitesimal es extremadamente pequeña. Sin embargo, el hecho de que exista esta propiedad de "velocidad de propagación infinita" sugiere que el proceso de limitación involucrado en la derivación de la ecuación gobernante del modelo SRW tiene algunas limitaciones. Como se muestra en §2.2, para derivar la ecuación gobernante de un BRW simple, tomamos límites asumiendo que δ 2 /τ=2D es constante como δ, τ→ 0 (donde δ es la distancia recorrida en cada paso de tiempo τ). Claramente, si esta propiedad se mantiene, entonces, en el mismo límite, obtenemos δ/τ→ ∞, es decir, la velocidad instantánea efectiva es infinita (Okubo & amp Levin 2001). Por lo tanto, la solución de la ecuación de difusión debe considerarse solo como una aproximación asintótica, válida para tiempos grandes (tτ), de ecuaciones que describen con mayor precisión las correlaciones en movimiento y velocidades finitas que están presentes cuando se considera el movimiento en escalas de tiempo más cortas.

Una discusión más detallada de la velocidad de propagación infinita en los procesos de difusión se puede encontrar en Okubo & amp Levin (2001), mientras que en §2.7 presentamos un modelo simple basado en un proceso de salto de velocidad (en lugar de un proceso de salto de posición), que evita este problema.

2.6 Paseos aleatorios con barrera

Para modelar el movimiento en un dominio confinado, se puede introducir una barrera repelente o reflectante en la caminata aleatoria: un caminante que llegue a la barrera girará automáticamente y se alejará en la dirección opuesta. Del mismo modo, para modelar el movimiento en el que los caminantes abandonan el sistema al llegar a un punto determinado, se puede introducir una barrera absorbente. Modelos como estos no solo son apropiados para modelar el movimiento en el espacio, sino que también son adecuados para modelar el desarrollo y el crecimiento donde se alcanzan las etapas críticas de la vida (Pitchford & amp Brindley 2001 Pitchford et al. 2005 Mullowney & amp James 2007) y para "integrar y disparar" modelos de respuestas nerviosas (Iyengar 2000). Estos son ejemplos de tiempo de primer paso (o tiempo de primer golpe) problemas, en los que la distribución del tiempo necesario para alcanzar una barrera absorbente es de interés primordial (Condamin et al. 2007).

El ejemplo simple de una barrera absorbente que se da a continuación está adaptado de un ejemplo de Grimmett & amp Stirzaker (2001). Suponga que tenemos un proceso de caminata aleatoria unidimensional que satisface la ecuación de deriva-difusión (2.7) para X& gt0. Suponga que el caminante comienza en la ubicación X=X0& gt0, y hay una barrera absorbente en X= 0 tal que, si el caminante llega al punto X= 0, se elimina del sistema. Los límites y las condiciones iniciales adecuadas en este caso son

Un análisis similar es posible para una barrera reflectante (Grimmett & amp Stirzaker 2001) y el modelo SRW se puede ampliar o analizar de muchas otras formas. Montroll y Shlesinger (1984) ofrecen una buena revisión de la teoría general de los paseos aleatorios y discuten una amplia variedad de ideas y problemas.

2.7 CRW y la ecuación telegráfica

Un CRW tiene en cuenta las correlaciones a corto plazo en la dirección del movimiento. En la mayoría de los casos, esto significa que es más probable que el caminante se mueva en la misma dirección o en una dirección similar a su dirección de movimiento anterior. Esta tendencia a continuar en la misma dirección se conoce como persistencia (Patlak 1953 ver por ejemplo la figura 1D). Al incluir explícitamente la persistencia y una velocidad fija de movimiento en el proceso de caminata aleatoria, se evita el problema de la velocidad de propagación infinita discutido en §2.5 (ver también la discusión en Turchin 1998). La ubicación en cada paso de la caminata aleatoria ya no es un proceso de Markov (ya que depende de la secuencia de ubicaciones anteriores). Por lo tanto, el marco habitual para describir un CRW es un proceso de salto de velocidad, en el que la variable que sigue un proceso de Markov es la velocidad del caminante en lugar de la ubicación (Othmer et al. 1988).

Considere una población de individuos que se mueve hacia la izquierda o hacia la derecha a lo largo de una línea infinita a una velocidad constante. v. Denota la densidad de individuos que se mueven hacia la derecha y hacia la izquierda en la ubicación X y tiempo t por α(X, t) y β(X, t), respectivamente. La densidad de población total es pag(X, t)=α(X, t)+β(X, t). En cada paso de tiempo τ, cada individuo cambia de dirección y se mueve una distancia δ en esta nueva dirección (con probabilidad r=λτ), o se mueve una distancia δ en la dirección anterior (con probabilidad q=1−λτ). Por lo tanto, los eventos de giro ocurren como un proceso de Poisson con tasa λ. Si damos un paso de tiempo hacia adelante, entonces la densidad numérica de individuos en la ubicación X moverse hacia la derecha y hacia la izquierda, respectivamente, viene dado por

Tenga en cuenta que, aunque (2.27) describe un proceso de movimiento correlacionado, la caminata aleatoria es globalmente insesgada en el sentido de que no hay una dirección preferida general, simplemente una tendencia de los individuos a persistir en su dirección actual de movimiento (un sesgo localizado). Aunque el proceso original usa un paso de tiempo fijo τ, el tiempo medio entre eventos de giro`` es diferente ya que el proceso de telégrafo no tiene un evento de giro en cada paso de tiempo.

La ecuación (2.27) se puede resolver dadas las condiciones iniciales pag(X, 0) y (∂pag/∂t)(X, 0), pero la solución completa es bastante compleja (ver Morse & amp Feshbach 1953, para más detalles). Dado que hay una velocidad fija v, la solución no implica velocidades de propagación infinitas (como se encontró con las soluciones (2.2) y (2.8) de la ecuación de difusión).

Es posible usar un método similar al usado en §2.2 para derivar ecuaciones para los momentos de la solución: mi(Xt) = 0 y

Recuadro 2. Difusión anómala.

μ= 0. Esto corresponde a un proceso estacionario sin movimiento durante el período de observación.

0 & ltμ& lt1. Esta situación se conoce como sub-difusión ya que MSD aumenta a un ritmo más lento que en el caso de la difusión estándar. Tales situaciones suelen ocurrir cuando los tiempos de espera entre pasos se incluyen en los modelos de movimiento (por ejemplo, semanas et al. 1996, aunque un modelo con tiempos de espera no siempre puede ser subdifusivo, ver §2.2), o si el dominio espacial está restringido de alguna manera (Coscoy et al. 2007), p. Ej. con la presencia de una barrera (como en §2.6).

μ= 1. Ésta es la relación estándar entre MSD y el tiempo de movimiento difusivo.

1 & ltμ& lt2. Esta situación se conoce como superdifusión ya que MSD aumenta a un ritmo más rápido que en el caso de la difusión estándar (aunque no tan rápido como con el movimiento balístico). Tales situaciones ocurren típicamente cuando las longitudes de los pasos en la caminata se extraen de una distribución con varianza infinita. Este proceso se conoce como caminata de Lévy y ha sido ampliamente estudiado por físicos y, más recientemente, ecologistas (Viswanathan et al. 1996), aunque su aplicabilidad general al movimiento de animales todavía está abierta a debate (Benhamou 2007 Edwards et al. 2007).

μ= 2. En esta situación, el movimiento se describe como balístico o ondulante, y MSD aumenta cuadráticamente con t. Esto corresponde al desplazamiento absoluto (cf. MDD) que aumenta linealmente con el tiempo, que es una propiedad estándar de un proceso de ondas. En tales casos, el retroceso característico y el movimiento aleatorio asociados con los procesos de difusión no están presentes, y cada individuo se mueve efectivamente en línea recta (en una dirección aleatoria) alejándose del origen durante todo el período de tiempo. (Tenga en cuenta que, como se ve en §2.2, MSD escala con t 2 para grandes t en un BRW aquí, nos preocupamos solo por un proceso de movimiento imparcial).

2.8 Límite de difusión de la ecuación telegráfica

En §2.1, mostramos que el coeficiente de difusión de un SRW es D=δ 2 /(2τ), dónde δ es la distancia recorrida en cada salto y τ es el intervalo de tiempo entre saltos. Dado que el proceso de giro del telégrafo es un proceso de Poisson de intensidad λ, el tiempo medio entre eventos de giro es y la distancia promedio movida entre eventos de giro es. Por tanto, el coeficiente de difusión efectivo para el proceso telegráfico viene dado por

Recuadro 3. ¿Hiperbólico o parabólico?

2.9 La ecuación telegráfica sesgada

La derivación de la ecuación telegráfica unidimensional sesgada es similar al caso insesgado, excepto que usamos diferentes probabilidades de giro dependiendo de la dirección del movimiento. Denotando la probabilidad de girar por r1=λ1τ para las personas que se mueven a la derecha y r2=λ2τ para los individuos que se mueven a la izquierda, se puede demostrar que la ecuación gobernante, llamada ecuación telegráfica sesgada, es

Tenga en cuenta que, en este ejemplo, el sesgo se introduce a través de la diferente velocidad de giro en cada dirección, que es una forma de klinokinesis esto contrasta con el BRW no correlacionado en §2.2, donde el sesgo se produjo a través de la probabilidad de moverse en cada dirección, que es una forma de Taxis (ver §3.8).

2.10 La ecuación telegráfica en dimensiones superiores

En §2.5, se demostró que la solución al proceso de difusión bidimensional con o sin deriva es válida solo como una aproximación a largo plazo. Se puede introducir la correlación completando una derivación similar a la de §2.7, pero trabajando con un retículo bidimensional en lugar de una línea. Ahora hay cuatro direcciones posibles de movimiento: derecha, izquierda, arriba y abajo. Inicialmente, asumimos que la probabilidad de girar es independiente de la dirección del movimiento (por lo que no hay sesgo). Como antes, asumimos una velocidad constante v. Dividimos la población en individuos que se mueven en cada una de las cuatro direcciones. α1, …, α4. En cada paso de tiempo τ, un individuo puede convertir π/ 2 rad en sentido antihorario o en sentido horario (con probabilidades λ1τ y λ2τ, respectivamente), girar π rad (con probabilidad λ3τ), o continuar en la dirección anterior (con probabilidad 1− (λ1+λ1+λ3)τ).

Completar un análisis similar a §2.7 conduce a un conjunto de ecuaciones diferenciales para cada una de las subpoblaciones que se mueven en las cuatro direcciones. Una manipulación adicional similar a la de §2.7 conduce a

3. Caminatas aleatorias como modelos de movimiento animal y celular

En §2 se demostró cómo se pueden derivar expresiones para el PDF, pag(X, t), de un paseo aleatorio no correlacionado en una o más dimensiones donde el movimiento es un proceso de difusión puramente aleatorio o sesgado. Si pag(X, t) es conocido, es sencillo calcular los momentos tales como la ubicación media, mi(Xt) o MSD,. Los movimientos de animales y células a menudo se caracterizan por alguna correlación direccional (persistencia) y, desafortunadamente, con un CRW, generalmente no es posible calcular pag(X, t) directamente, o incluso para derivar un sistema de ecuaciones diferenciales para pag(X, t). Las variaciones de la ecuación telegráfica se pueden utilizar para modelar un CRW unidimensional y pag(X, t) (y momentos asociados) se pueden encontrar. Sin embargo, como se discutió en §2.10, todavía es un problema no trivial derivar una solución para pag(X, t) para un CRW en dimensiones superiores (Othmer et al. 1988 Hillen 2002 Keller 2004). Sin embargo, en muchos casos, todavía es posible calcular estadísticas del CRW directamente a través del análisis de trayectorias, como se discute en §§3.1 y 3.2. En §3.3, se introducen algunas medidas de la tortuosidad de un camino y se discute su relación con MSD.

La situación es un poco más compleja cuando el movimiento está correlacionado y sesgado en una dirección global preferida (es decir, un BCRW). En §3.4, discutimos cómo es posible detectar el sesgo en las rutas observadas cuando hay una dirección preferida global fija (como en la girotaxis donde el sesgo se debe a la gravedad) o cuando la dirección preferida depende del individuo (como en la navegación a un objetivo fijo en el espacio). También se discuten extensiones simples del modelo BRW. En §3.5, presentamos una ecuación de balance de masa generalizada (la ecuación de transporte) que describe el movimiento hiperbólico y discutimos cómo esto puede usarse como un marco general para modelar BCRW.

En general, para los organismos que se mueven en un entorno que varía espacial y / o temporalmente, las probabilidades de transición dependerán explícitamente del tiempo t y la ubicación del caminante X. Normalmente, esta dependencia se produce a través de alguna "señal de control", como una sustancia química, luz, calor, humedad u olor. Una señal de control puede estimular al organismo de cuatro formas principales: el estímulo puede ser un atrayente (o repelente), proporcionando un sesgo direccional que estimula a los organismos a migrar hacia arriba (o hacia abajo) un campo de gradiente de concentración, o puede ser un inductor (o inhibidor), lo que hace que aumente (o disminuya) la tasa de movimiento insesgado difusivo. Por supuesto, un estímulo específico puede combinar más de una de estas cuatro propiedades, y no siempre es sencillo distinguir entre los diferentes efectos, y los mecanismos subyacentes responsables de ellos, sobre la base de observaciones experimentales (Cai et al. 2006).

Como complicación adicional, es común que las células migratorias modifiquen su propio entorno químico produciendo o degradando la sustancia de control. Por ejemplo, el moho de limo Dictyostelium discoideum secreta monofosfato de adenosina cíclico (cAMP), que actúa como quimioatrayente, lo que lleva a la agregación de células de un área amplia (Höfer et al. 1995) ciertos tipos de bacterias secretan rastros de limo, que proporcionan una guía direccional para otras células (Othmer & amp Stevens 1997). En §3.6, se introduce la teoría básica de paseos aleatorios reforzados (RRW), junto con algunos modelos para las probabilidades de transición que se encuentran en el corazón de la descripción de RRW. Algunas aplicaciones del modelado RRW se revisan en §3.7.Finalmente, en §3.8, se discute el vínculo entre los paseos aleatorios sin celosía y los mecanismos de movimiento cinético y táctico.

3.1 Desplazamiento cuadrático medio de los CRW

El MSD, definido en norte dimensiones por (2.13), da una medida de la dispersión espacial de la población con el tiempo y, debido a su relación con el coeficiente de difusión D via, por ejemplo (2.14), es de gran importancia para aquellos que estudian la dispersión en sistemas biológicos (Okubo & amp Levin 2001). Curiosamente, sin embargo, muchos de los resultados discutidos en esta sección se obtuvieron por primera vez a través de estudios en química molecular. El crecimiento y las propiedades de llenado de espacio de las cadenas de polímeros y las moléculas más grandes han sido modeladas como un CRW, por ejemplo, por Tchen (1952) y Flory (1969), quienes derivaron ecuaciones para MSD. Tchen (1952) también demostró el importante resultado de que las coordenadas de ubicación después de un gran número de pasos de un CRW se distribuyen normalmente.

Taylor (1921) derivó la siguiente expresión para el MSD en una caminata correlacionada unidimensional (ver también Tchen 1952 Flory 1969 Hanneken & amp Franceschetti 1998 Okubo & amp Levin 2001). Supongamos que el caminante da una serie de pasos. yj (j=1, …, norte) de longitud constante (|yj|=δ). Se introduce explícitamente una correlación entre las direcciones de los pasos sucesivos (aunque esta correlación se propaga de forma gradualmente decreciente a través del proceso de Markov). Como el número de pasos norte se vuelve grande, el MSD para este proceso discreto tiende asintóticamente a

Kareiva & amp Shigesada (1983) fueron los primeros en establecer y analizar un modelo generalizado de un CRW bidimensional para el movimiento animal que incluía una longitud de paso variable y una distribución angular general para la dirección movida en cada paso (ver también Skellam 1973 Nossal & amp Weiss 1974 Lovely & amp Dahlquist 1975 Hall 1977 Dunn 1983 Marsh & amp Jones 1988). El CRW consta de una serie de pasos discretos de longitud Lj y dirección Θj. La longitud Lj de El jth movimiento y el ángulo de giro Φj=Θj+1Θj se supone que son variables aleatorias sin autocorrelación o correlación cruzada (y sin correlación entre la longitud del paso y la dirección del paso). Por tanto, el CRW consta de una serie de dibujos independientes del PDF de longitud de paso, pag(l) y el PDF de ángulo de giro, gramo(ϕ) (recuadro 1), para cada paso (es decir, el proceso es una cadena de Markov de primer orden, véase Grimmett & amp Stirzaker (2001)). Definimos el coseno medio C y seno medio s del ángulo de giro como (véase también el recuadro 1)

Usando este modelo, Kareiva & amp Shigesada (1983) derivaron la siguiente ecuación para el MSD después de norte pasos

El resultado general (3.3) se reduce a una forma mucho más simple en casos particulares. Por ejemplo, si no hay persistencia (es decir, la caminata no está correlacionada), entonces gramo(ϕ) tiene una densidad uniforme y tanto C y s son cero, y (3.3) se reduce a (cf. (2.14) sin deriva, tu=0 y con norte= 2). Como se mencionó, un caso más realista es cuando los organismos exhiben las mismas probabilidades de girar en sentido horario o antihorario, por lo que gramo(ϕ) es simétrico sobre ϕ0= 0 (aunque vale la pena señalar que este no es siempre el caso, por ejemplo, las bacterias pueden exhibir un sesgo rotacional inherente debido a la mano de su motor flagelar). En el caso de probabilidades de giro iguales, obtenemos s= 0 y (3.3) pueden escribirse en términos del coeficiente de variación B de la longitud del paso L (B2=mi(L 2 )/(mi(L)) 2 −1)

En el caso de paseos aleatorios con sesgo, puede ser más complicado derivar expresiones para MSD. Es posible escribir el MSD de un BRW no correlacionado utilizando un enfoque similar al anterior. Considere una caminata que consta de pasos de largo Lj y dirección Θj (tenga en cuenta la importante diferencia entre la dirección del movimiento Θj y el ángulo de giro Φj=Θj+1Θj), cuyo seno medio es cero y cuyo coseno medio es q. Después norte pasos, el MSD viene dado por (Marsh & amp Jones 1988 Benhamou 2006)

Se puede generar una ecuación para MSD en un proceso de salto de velocidad sesgado tanto para el caso unidimensional como para dimensiones superiores, utilizando una ecuación de transporte generalizada (ver §3.5). Sin embargo, estos son casos especiales de un BCRW donde los eventos de giro ocurren como un proceso de Poisson. En el caso de un BCRW con un paso de tiempo fijo entre eventos de giro (donde las longitudes de los pasos espaciales pueden ser fijas o variables), sigue siendo un problema abierto calcular una ecuación directa para MSD.

3.2 Distancia de dispersión media de CRW insesgados

El MSD, definido en (2.13), es de interés para ecólogos y biólogos debido a su relación con el coeficiente de difusión. D vía (2.14). El MSD también es una estadística que es razonablemente manejable matemáticamente, como se ilustra en §3.1. Sin embargo, debido a que el MSD se ocupa de la distancia de dispersión al cuadrado, se ha sugerido que una estadística más intuitiva es la distancia de dispersión media (MDD Bovet & amp Benhamou 1988 McCulloch & amp Cain 1989 Wu et al. 2000 Byers 2001). El TDM de una población en dispersión se define en norte dimensiones como

Considere un CRW bidimensional, sin sesgo, con una longitud de paso media mi(L), y una distribución de probabilidad simétrica alrededor de cero (es decir, seno medio cero) gramo(ϕ) para el ángulo de giro en cada paso. Después de un número suficientemente grande de pasos norte, las coordenadas de la ubicación Xnorte y Ynorte se distribuyen normalmente de forma independiente con igual varianza. Bovet & amp Benhamou (1988) usaron esto para derivar la siguiente relación aproximada entre MDD y MSD:

Como se discutió en §2.7, es posible derivar ecuaciones diferenciales para el MSD de un BCRW donde los tiempos entre eventos de giro se distribuyen como un proceso de Poisson pero, debido a la presencia de un valor absoluto en (3.6), este enfoque no puede ser utilizado para derivar una ecuación para el MDD de un BCRW. Esto sigue siendo un problema abierto pero, para casos particulares, puede ser posible utilizar el resultado de Bovet & amp Benhamou (1988), junto con una ecuación para el MSD derivada de un método de cierre de momento (ver Codling 2003).

3.3 Tortuosidad de CRW

los tortuosidad de un camino describe la cantidad de giro en un espacio o tiempo dado. Claramente, la tortuosidad está relacionada con el MSD y el MDD: los caminos muy tortuosos se extenderán lentamente en el espacio (MSD pequeño), mientras que los caminos rectos se extenderán en el espacio rápidamente (MSD alto). Por lo tanto, puede ser útil medir y estudiar la tortuosidad de los caminos observados para comprender los procesos involucrados, estimar el área buscada por un organismo y predecir la dispersión espacial. Se encuentran disponibles varias medidas de tortuosidad, pero la mayoría tiene algunas limitaciones.

los índice de rectitud (a veces llamado el relación de desplazamiento neto a bruto) es una medida relativa que compara el desplazamiento neto total GRAMO de un camino con la longitud total del camino T (Batschelet 1981). Por ejemplo, si una caminata aleatoria comienza en la ubicación (X0, y0) y después norte pasos con longitudes lj (j=1, …, norte), termina en (Xnorte, ynorte), entonces el índice de rectitud viene dado por

Desafortunadamente, el índice de rectitud no es una medida confiable de tortuosidad de un CRW, porque la media de GRAMO corresponde al MDD y por lo tanto aumenta con la raíz cuadrada de norte. En consecuencia, la relación GRAMO/T tiende a cero a medida que aumenta el número de pasos (Benhamou 2004). Por lo tanto, al observar un CRW y medir el índice de rectitud, se encontrará un resultado diferente dependiendo del número de pasos considerados (el tiempo total observado o la longitud total del camino utilizado). Por lo tanto, es muy difícil comparar la tortuosidad de diferentes CRW utilizando este método, a menos que todos consistan en un número similar de pasos.

La tortuosidad de un CRW corresponde a la cantidad de giro asociado con una longitud de trayectoria determinada y, de alguna manera, mide su potencial de difusión a largo plazo. Sobre esta base, Benhamou (2004) definió el camino sinuosidad en términos de longitud media del paso y MSD después de un gran número de pasos como. Utilizando la ecuación (3.4) simplificada eliminando el segundo término del lado derecho, que se vuelve insignificante a largo plazo, se obtiene

La ecuación (3.9) se puede aplicar directamente a caminos reales cuando los animales se mueven naturalmente de manera discreta (por ejemplo, una abeja que vuela de una flor a otra), siempre que se respeten los requisitos básicos de un CRW (independencia de la longitud de los pasos y los giros). Para los animales que se mueven de forma continua, el camino suele ser discretizado cuando se registran (es decir, los datos brutos consisten en un conjunto de ubicaciones en lugar de una pista continua), y se pueden rediscretizar para fines de análisis. Se ha demostrado que la (re) discretización altera el ángulo de giro y las distribuciones de la longitud del paso y, por lo tanto, implica el uso de fórmulas corregidas (Bovet & amp Benhamou 1988 Benhamou 2004 Codling & amp Hill 2005a). Tenga en cuenta que la rediscretización se puede realizar espacialmente (Bovet & amp Benhamou 1988), que es más fácil de ajustar con el análisis anterior, o temporalmente (Codling & amp Hill 2005a), lo que quizás sea más natural para los experimentos de campo.

También se ha propuesto medir la tortuosidad de los caminos de búsqueda aleatorios de los animales mediante una dimensión fractal. Esto sería útil para trayectos reales que se pueden representar de forma fiable mediante el movimiento browniano fraccionado, que es un modelo de movimiento fractal en el que la persistencia está relacionada con la dimensión fractal mediante el uso de un parámetro llamado coeficiente de Hurst. Hasta donde sabemos, sin embargo, aún no se ha demostrado que este tipo de modelo pueda proporcionar una mejor representación de las rutas de búsqueda aleatorias de los animales que CRW, cuya verdadera dimensión fractal es igual a 2 para movimientos bidimensionales (es decir, eventualmente llenarán todo el plano) para cualquier sinuosidad positiva (para S= 0, el CRW se reduce a una línea recta, con dimensión fractal igual a 1). Aplicando el método "divisor" clásico, desarrollado inicialmente para medir la dimensión fractal de las líneas fractales, el CRW proporciona valores de dimensión pseudo-fractal (Turchin 1998 Benhamou 2004), que corresponden a medidas indirectas del coseno medio de los giros. C (Nams 1996, 2005). Estos valores pseudo-fractales no pueden estimar de manera confiable la tortuosidad de la trayectoria de un CRW, que depende no solo del coseno medio de los giros. C, sino también en la longitud media del paso mi(L) y coeficiente de variación B.

3.4 Sesgo en trayectorias observadas

El siguiente paso en la complejidad del modelo de un CRW es un BCRW. Nos ocuparemos de los enfoques de modelado para BCRW en §§3.5 y 3.6, mientras que en esta sección consideraremos las formas en que se puede detectar el sesgo en una ruta observada (ver también Coscoy et al. 2007). Suponiendo el entorno y el comportamiento más simples posibles, hay dos formas principales en las que los individuos pueden responder a una señal y, por lo tanto, introducir sesgos en su movimiento. En primer lugar, puede haber un gradiente sensorial fijo de modo que la dirección preferida sea siempre la misma para todos los individuos en todos los lugares del espacio (por ejemplo, microorganismos que se mueven bajo la influencia de la gravedad). En segundo lugar, puede haber un objetivo o una fuente puntual fija en el espacio, de modo que la dirección preferida sea hacia un punto fijo (por ejemplo, animales que buscan una fuente de alimento). Tenga en cuenta que el primer escenario se puede considerar como un caso especial del segundo en el que el objetivo se fija en el infinito.

Con el fin de parametrizar modelos continuos de bioconvección en microorganismos (Kessler 1986 Hill & amp Pedley 2005), Hill & amp Häder (1997) analizaron las trayectorias de las algas nadadoras que atraviesan girotaxis (natación hacia arriba debido a un par gravitacional) o fototaxis (nadando hacia una fuente de luz). En ambas situaciones, se asumió que la dirección absoluta de movimiento preferida era independiente de la ubicación (es decir, un "objetivo en el infinito"), pero que el ángulo de giro dependía de la dirección de movimiento más reciente. Para ayudar a informar las observaciones experimentales, Hill & amp Häder (1997) establecieron una caminata aleatoria en el círculo unitario de la siguiente manera: en cada paso de tiempo τ, el caminante hace un pequeño giro δ en el sentido de las agujas del reloj con probabilidad a(θ) o en sentido antihorario con probabilidad B(θ), o continúa en la misma dirección con probabilidad 1−a(θ)−B(θ). Siguiendo un método similar al utilizado en §2.2 y tomando el límite δ, τ→ 0 tal que δ 2 /τ es constante produce la ecuación de Fokker-Planck para el PDF pag(θ, t) de viajar en dirección θ en el momento t

Al rediscretizar las trayectorias observadas y agrupar los datos, Hill & amp Häder (1997) estimaron utilizando un método similar al de Bovet & amp Benhamou (1988, ya que es esencialmente la misma medida que la sinuosidad, ver §3.3), y también la forma funcional de μ0. Para la girotaxis, se encontró que un modelo de reorientación sinusoidal encajaba bien: μ0(θ, t) = - pecado (θθ0(t))/B, dónde θ0(t) es la dirección preferida y B es el tiempo medio que se tarda en cambiar la orientación hacia la dirección preferida. Si ambos y θ0 se supone que son constantes, entonces el estado estacionario de la ecuación de Fokker-Planck (3.10) es una distribución de von Mises (recuadro 1). Esta respuesta sinusoidal fue predicha por Kessler (1986) y puede explicarse por el torque gravitacional que actúa sobre el alga individual: el torque es cero si el alga se mueve en la dirección preferida o en la dirección opuesta, y es mayor cuando el alga se mueve perpendicular a la fuerza gravitacional. Para la fototaxis, se obtuvo un mejor ajuste mediante una respuesta lineal simple: μ0(θ, t)=−(θθ0(t))/B. Este caso es de aplicación más general, ya que solo hay unas pocas situaciones físicas que probablemente den como resultado una respuesta sinusoidal. Sin embargo, si ambos y θ0 se permite que sean variables, entonces el estado estable de la ecuación de Fokker-Planck (3.10) es más complicado (Hill & amp Häder 1997).

Este método ad hoc utilizado por Hill & amp Häder (1997) fue probado usando simulaciones por Codling & amp Hill (2005).a) y resultó ser válido (permitiendo errores de suavizado no contabilizados por Hill & amp Häder (1997) y asumiendo que la sinuosidad es lo suficientemente baja como para evitar problemas de "envoltura" que conducen a una subestimación de (Bovet & amp Benhamou 1988 Benhamou 2004)). Tenga en cuenta que este método permite estimar tanto la forma funcional de la respuesta al sesgo como los parámetros relevantes (tiempo medio de reorientación y difusividad angular) que se cuantifican.

La situación es más difícil cuando la dirección preferida cambia con la ubicación espacial (y por lo tanto depende del individuo), un escenario común cuando los animales se mueven hacia un objetivo en el espacio. El principal problema en tal escenario es distinguir entre el sesgo localizado debido a la persistencia hacia adelante y el verdadero movimiento sesgado hacia un objetivo. Esto es particularmente cierto si hay más de un objetivo o si el objetivo se mueve en el espacio. Benhamou (2006) sugirió un nuevo procedimiento basado en la evolución hacia atrás de la distancia en línea recta desde el final del camino (la meta) hasta las ubicaciones anteriores de cada animal. Este procedimiento es eficiente, ya que solo requiere una pequeña muestra de trayectos cortos para detectar un posible componente de orientación, pero no es perfecto ya que existe una probabilidad relativamente alta (aproximadamente 30%) de identificar erróneamente un CRW verdadero como un BCRW. Este error de tipo I puede reducirse considerando en conjunto una serie de rutas que se supone que son del mismo tipo.

Los escenarios anteriores asumen que el sesgo se introduce mediante la reorientación hacia la dirección preferida. Sin embargo, hay muchas otras formas de modelar los mecanismos que producen una deriva direccional, incluido el caso en el que la velocidad media de giro es nula y el sesgo direccional se produce a través de variaciones en (ver Benhamou 2006 y §3.8). Por ejemplo, el clásico correr y caer El comportamiento observado en las bacterias quimiotácticas generalmente se modela a través de una baja velocidad de giro cuando se mueve en la dirección preferida (carreras) y una alta velocidad de giro (volteretas) en caso contrario (Berg 1983). Discutimos la relación entre estos diversos mecanismos en §3.8.

3.5 La ecuación de transporte y los modelos hiperbólicos generales de movimiento

En §2.7, se mostró cómo el proceso telegráfico podría usarse en una dimensión para modelar un CRW y cómo esto resultó en una ecuación gobernante hiperbólica (recuadro 3). Un proceso similar no produce una ecuación cerrada en dos o más dimensiones, pero aún es posible trabajar con una ecuación de gobierno hiperbólica generalizada para modelar el CRW y BCRW (procesos de salto de velocidad) en dimensiones más altas. Othmer et al. (1988) introdujeron la idea de una ecuación de balance de masa gobernante, la ecuación de transporte lineal, que se puede utilizar para describir el movimiento y la reorientación de las células (y los animales, véase también Alt 1980).

Dejar pag(X, v, t) ser la función de densidad para los individuos que se mueven en norte-espacio dimensional, donde Xnorte es la ubicación de un individuo y vnorte es su velocidad. La densidad numérica total de individuos en la ubicación. X, independientemente de la velocidad, se obtiene integrando pag sobre todas las velocidades posibles

En general, nos interesan los primeros momentos de velocidad (ya que a partir de estos podemos calcular las estadísticas de interés como mi(Xt) y mi(Rt 2)), incluida la densidad numérica norte(X, t) introducido en (3.11), y la velocidad media tu(X, t), que se define por

Integrando (3.12) sobre v da una ecuación de evolución para norte en términos de tu

Vale la pena señalar que la ecuación (3.12) describe un proceso general, del cual muchos de los modelos básicos de caminata aleatoria discutidos anteriormente son casos especiales. Por ejemplo, en una dimensión espacial, y bajo el supuesto de que los individuos se mueven con velocidad constante v, solo hay dos velocidades posibles: +v yv. Con el supuesto adicional de que la frecuencia de giro λ es constante, se puede demostrar que (3.13) y (3.14) se reducen a las ecuaciones (2.25) y (2.26) derivadas en §2.7, que conducen a la ecuación telegráfica unidimensional.

La ecuación de transporte también proporciona una extensión natural del proceso telegráfico básico a dos dimensiones, sin la necesidad de restringir la población a una red como en §2.10. Manteniendo los supuestos de frecuencia de giro constante λ y velocidad constante v, la velocidad de un individuo puede describirse simplemente por el ángulo θ entre su dirección de movimiento y la positiva X1-eje. La función de densidad apropiada ahora es pag(X, θ, t). La ecuación de transporte (3.12) se reduce a

Othmer et al. (1988) utilizaron el siguiente ejemplo para ilustrar cómo se puede modelar una caminata aleatoria en un campo externo usando (3.15). Suponga que las personas se mueven con un gradiente que induce a los taxis en la dirección θ0= 0 (es decir, el positivo X1-dirección), bajo el supuesto de que el gradiente influye solo en el kernel de reorientación T(θ, θ′). Supongamos también que el núcleo de reorientación T(θ, θ′) Es la suma de una distribución de probabilidad simétrica h(ϕ), dónde ϕ=θθ′, Y un término de sesgo k(θ) que resulta del gradiente inductor de taxis. Dado que el gradiente se dirige a lo largo de la X1eje, el término de sesgo toma su máximo en θ= 0 y es simétrico sobre θ= 0. Por lo tanto

Suponiendo que todos los individuos comienzan en el origen (0, 0), con direcciones iniciales distribuidas uniformemente alrededor del círculo unitario, se puede derivar un sistema de ecuaciones diferenciales, conocido como ecuaciones de momento, para las estadísticas de interés. Para la elección anterior de T(θ, θ′), Este sistema es sencillo de resolver (Othmer et al. 1988 Codling 2003). La velocidad media y la ubicación media están dadas por

La elección del núcleo de reorientación en (3.16) es crucial en el análisis anterior, ya que da como resultado un sistema cerrado de ecuaciones diferenciales para las estadísticas de interés. Codling y amp Hill (2005)B) utilizó un núcleo de reorientación posiblemente más realista basado en una única distribución simétrica con un ángulo de giro medio dependiente de la dirección del movimiento (ver §3.4). Sin embargo, esto da como resultado una "cascada" de ecuaciones de momentos más altos y es necesario hacer más suposiciones para cerrar el sistema.

En Hillen (2002) se ofrece una discusión general de las cuestiones relacionadas con el cierre de momento de los sistemas de ecuaciones de momento que resultan de las ecuaciones de transporte. La ecuación de transporte se puede desarrollar más para permitir modelar escenarios más complejos (parámetros espacialmente dependientes, etc.), aunque es probable que esto dificulte la búsqueda de una solución de forma cerrada. El modelo de movimiento hiperbólico se ha utilizado en lugar de modelos de difusión para crear reacción-transporte (Hillen 1996, 2002), que pueden utilizarse en lugar de los modelos clásicos de reacción-difusión (Turing 1952 Murray 1993) utilizados en la formación de patrones y la biología del desarrollo.

3.6 Caminatas aleatorias reforzadas

Los tipos de procesos mediante los cuales los caminantes modifican el entorno químico de ellos mismos y de otros individuos de la población han llevado a los modeladores de la locomoción celular a emplear la teoría de RRW, que permite al caminante modificar (reforzar) las probabilidades de transición asociadas con los puntos de la cuadrícula. o intervalo, atraviesa (Davis 1990). La forma más común de representar un RRW unidimensional es la llamada ecuación maestra

Hay muchos modelos posibles para las tasas de transición. T ± en términos de concentración w(X, t) de una sustancia de control, como el "modelo local", el "modelo de barrera" y el "modelo de barrera normalizado" propuesto por Othmer & amp Stevens (1997). Para una elección específica de tasas de transición, el límite continuo de la ecuación maestra (3.17) a menudo se puede encontrar mediante un método similar al utilizado para obtener la ecuación (2.5), y generalmente se puede escribir en la forma

En el modelo local de Othmer & amp Stevens (1997), las tasas de transición dependen sólo de la concentración local de la sustancia de control: para algunas constantes ρ y función positiva F, llamada función de probabilidad de transición. Tomando el limite δ→ 0 y ρ→ ∞, tal que D=ρδ 2 es una constante, conduce a una ecuación de límite continuo (3.18) con difusividad D(w)=DF(w) y sensibilidad quimiotáctica Χ(w)=−D(DF/Dw). Por tanto, además de modular la tasa de motilidad aleatoria, la sustancia de control proporciona un sesgo direccional porque es más probable que la célula se mueva de un área de alta motilidad a baja motilidad que viceversa.

En el modelo de barrera, las tasas de transición dependen de la concentración de la sustancia de control en el intervalo a atravesar:. Por lo tanto, la célula puede detectar concentraciones en X±δ/ 2 (así que δ es el rango sensorial efectivo de la célula) y los usa para decidir su dirección de movimiento. La ecuación de límite continuo es (3.18) con difusividad D(w)=(w) y sensibilidad quimiotáctica Χ(w) = 0. Por tanto, la sustancia de control tiene un efecto de motilidad aleatoria, como en el modelo local, pero no hay sesgo direccional. Esto se espera porque la probabilidad de transición de X para X+δ, determinada por la concentración de la sustancia de control a X+δ/ 2, es la misma que la probabilidad de transición de X+δ para X, por lo que no hay sesgo direccional.

En el modelo de barrera normalizado, las tasas de transición son como en el modelo de barrera, pero están normalizadas de modo que T + +T - es una constante,

Las acciones de la sustancia de control en cada uno de estos tres modelos se resumen en la tabla 1. Nótese que el modelo de barrera normalizado representa una sustancia de control que es un atrayente o repelente, mientras que el modelo de barrera representa un inductor o inhibidor. El modelo local permite variar tanto la motilidad como el sesgo direccional. Sin embargo, la restricción en la relación entre D(w) y Χ(w) en el modelo local significa que la sustancia debe ser inductora y repelente o inhibidora y atractora, lo que no siempre es realista. Motivado por esta limitación, el modelo de barrera normalizado puede generalizarse para permitir un tiempo medio de espera variable (VMWT). Esto se puede lograr de dos formas. En primer lugar, las tasas de transición adoptan la forma (3.19), pero ρ se permite que sea una función de la concentración de la sustancia de control w (Plank 2003). Esto da como resultado una difusividad de D(w)=(w) y una sensibilidad quimiotáctica de, lo que permite especificar de forma independiente tanto los efectos no direccionales (aleatorios) como los direccionales de la sustancia de control. Un segundo método posible es combinar los modelos de barrera normalizados y no normalizados tomando las tasas de transición como

Cuadro 1 Resumen de la interpretación biológica de diferentes modelos para las tasas de transición RRW, en términos de la no direccional (D(w)) y direccional (Χ(w)) efectos de la sustancia de control.

Las ecuaciones diferenciales parciales de la forma (3.18) se han estudiado analíticamente para ciertas elecciones de las funciones Χ(w) y D(w) y de la dinámica para w. Por ejemplo, Keller & amp Segel (1971) obtuvieron soluciones de ondas viajeras y Rascle & amp Ziti (1995) obtuvieron soluciones de similitud en el caso donde la sensibilidad quimiotáctica está inversamente relacionada con w, y la sustancia de control es consumida linealmente por las células. Othmer & amp Stevens (1997) consideraron tres casos principales de comportamiento celular, que denominaron 'agregación' (es decir, soluciones en las que la densidad celular se agrega a un valor positivo finito en ciertas regiones), 'explosión' (la densidad celular tiende al infinito). en tiempo finito) y 'colapso' (la densidad celular tiende a cero en todas partes). Davis (1990) mostró originalmente resultados análogos para el RRW discreto, y Plank (2003) los relacionó con los resultados de nivel continuo. Las condiciones analíticas para los casos de agregación, explosión y colapso fueron desarrolladas por Levine y Sleeman (1997) y Takase y Sleeman (2002) realizaron un trabajo teórico adicional sobre ecuaciones parabólico-hiperbólicas mixtas.

3.7 Aplicaciones de caminatas aleatorias reforzadas

La teoría de los RRW se ha presentado en términos de paseos unidimensionales por simplicidad, pero es fácil de extender a dimensiones superiores. Además, las acciones de múltiples sustancias de control (w1, …, wnorte) se puede modelar tomando la función de probabilidad de transición τ ser de la forma F(w)=F1(w1) … Fnorte(wnorte) (Levine et al. 2001). Bajo el modelo de barrera normalizado, esto conduce a una suma de norte términos quimiotácticos en la ecuación de límite continuo (3.18).

Los RRW se han utilizado para modelar el movimiento de mixobacterias (Othmer & amp Stevens 1997) y la migración de células endoteliales durante la angiogénesis inducida por tumores (crecimiento de nuevos vasos sanguíneos Levine et al. 2001 Sleeman & amp Wallis 2002 Plank & amp Sleeman 2003). Estos estudios adoptaron el modelo de barrera normalizada, principalmente porque modela una sustancia de control que ofrece un estímulo direccional (que es de primordial importancia para el éxito de la angiogénesis), pero no tiene efectos directos sobre la motilidad celular. Sin embargo, los factores de crecimiento que regulan la angiogénesis también influyen en la motilidad celular y Plank propuso una extensión a un modelo VMWT, que permite efectos tanto direccionales como no direccionales. et al. (2004). Posteriormente se utilizó un RRW sin celosía, similar al descrito en §3.4 (Plank 2003 Plank & amp; Sleeman 2004) para modelar la angiogénesis en dos y tres dimensiones. Además de elegir una forma funcional adecuada para la tasa de reorientación μ0(θ), se debe definir la dirección preferida θ0. En el caso de un quimioatrayente, la elección natural es definir θ0 estar en la dirección de aumentar la concentración química (es decir, en la misma dirección que ∇w), que puede ser una función de la ubicación de la celda. X y tiempo t.

En modelos como estos, se puede suponer que la (s) sustancia (s) de control están en un estado estable, o el modelo de caminata aleatoria para el movimiento celular puede acoplarse a una o más PDE dependientes del tiempo para la concentración de la sustancia de control (s) ). Si las células modulan su entorno químico produciendo o consumiendo sustancias de control, estas PDE contendrán términos fuente / sumidero según la densidad celular. En el caso de la angiogénesis, el movimiento celular básico que impulsa el crecimiento capilar se modela mediante una caminata aleatoria, pero se deben especificar reglas adicionales para permitir la ramificación y el bucle capilar (anastomosis). Además de las probabilidades de transición, cada célula tiene una probabilidad, que puede depender de la concentración de la sustancia de control local, de ramificarse para crear dos capilares secundarios. Si la punta de un capilar choca con un vaso existente, se forma una anastomosis y la célula en colisión deja de participar en la caminata aleatoria.

Una alternativa al enfoque RRW descrito anteriormente es tomar una ecuación continua de Fokker-Planck de la forma (3.18) como punto de partida. Esto se puede discretizar usando técnicas estándar para obtener una ecuación en diferencias finitas de la forma (2.4) (con la extensión obvia a dimensiones más altas), que se puede usar para identificar las probabilidades de transición relevantes de moverse hacia la izquierda y hacia la derecha y permanecer quieto. Este método fue desarrollado por Anderson et al. (1997) para modelar el movimiento de los nematodos y desde entonces se ha utilizado para estudiar la angiogénesis tumoral (Anderson & amp Chaplain 1998) y la invasión de células tumorales (Anderson et al. 2000), y para distinguir entre los efectos inhibidores y repelentes de una molécula de señalización llamada "Slit" en el trabajo experimental (Cai et al. 2006). El modelo de caminata aleatoria para la angiogénesis también se ha acoplado a un modelo de flujo para estudiar los efectos del flujo sanguíneo y la entrega de nutrientes en una red capilar naciente (McDougall et al. 2006).

Tanto el enfoque "de abajo hacia arriba" del RRW como el enfoque "de arriba hacia abajo" de discretizar un PDE tienen la misma ecuación gobernante (3.18) en el límite del continuo. Sin embargo, los dos métodos, en general, darán como resultado caminatas aleatorias con diferentes probabilidades de transición, lo que ilustra el hecho de que, por lo general, no existe un modelo de caminata aleatoria único que corresponda a una ecuación continua dada. El método RRW tiene la ventaja de que las probabilidades de transición se derivan mecánicamente de la biología subyacente, utilizando un modelo de probabilidad de transición del tipo resumido en la tabla 1, en lugar de mediante un procedimiento matemático de discretización y normalización (ver Plank & amp Sleeman 2004, para más detalles) .

3.8 Mecanismos de orientación biológica

Hay dos tipos principales de mecanismos de movimiento en respuesta a un estímulo. La kinesis se refiere a la situación en la que el organismo muestrea solo la intensidad del estímulo en un solo punto y modula su velocidad de movimiento (ortocinesis o O-kinesis) o su sinuosidad de la trayectoria (klinokinesis o K-kinesis) en consecuencia. Los términos O-quinesis y K-kinesis fue definida por primera vez por Gunn et al. (1937) en términos de velocidades lineales y angulares, pero la redefinición de K-kinesis en términos puramente espaciales (Benhamou & amp Bovet 1989), al usar la sinuosidad en lugar de la tasa de cambio de dirección, ha llevado a una visión mucho más clara de las propiedades de las kinesis. Por el contrario, en los taxis es donde el organismo es capaz de detectar una dirección preferencial de movimiento y sesgar sus giros en consecuencia, sin alterar necesariamente su velocidad general de movimiento o velocidad de giro.

Los paseos aleatorios descritos anteriormente se expresan en términos de tasas de transición, que se supone implícitamente que están bajo el control total del organismo migrante. Esto plantea interrogantes sobre la información que requiere el organismo para poder ejercer este control, y el probable realismo de asumir que dicha información está disponible. En el caso de los modelos de tipo barrera (ver §3.6), está claro que el caminante necesita al menos dos sensores para calcular las tasas de transición 'en el lugar' (es decir, sin moverse) este tipo de mecanismo se denomina como tropotaxis. Lo mismo también es cierto para la caminata aleatoria sin celosía (§3.5) si el caminante necesita resolver la dirección del objetivo. θ0, por ejemplo midiendo ∇w. Los mismos taxis también se pueden producir si el organismo tiene solo un sensor (o muchos sensores que están demasiado cerca entre sí para permitirle detectar diferencias de manera confiable), pero mueve su cuerpo en varias direcciones para muestrear las variaciones locales en el estímulo, esto se denomina klinotaxis. . En su forma más simple, los taxis no incorporan una correlación entre direcciones de pasos sucesivos y, por lo tanto, corresponde a un BRW: los individuos establecen directamente su dirección local con respecto a la dirección de destino. Se pueden obtener modelos de taxis más realistas en forma de BCRW introduciendo tal correlación direccional (Benhamou & amp Bovet 1992 Benhamou 1994). El resultado de los taxis se determina luego por los pesos relativos del sesgo direccional local (persistencia, que controla la motilidad) y el sesgo direccional global (atractivo objetivo, que controla la advección), y por el nivel de ruido aleatorio en el sistema. .

Por el contrario, el modelo local en §3.6 entra en la categoría de kinesis, a diferencia de los taxis, porque el caminante mide solo la intensidad del estímulo en un solo punto para calcular las tasas de transición. Aunque las probabilidades de moverse en diferentes direcciones son siempre iguales en un momento dado, este mecanismo da como resultado un sesgo direccional efectivo hacia áreas de baja motilidad, lo que ilustra el hecho de que un mecanismo cinético puede producir un sesgo direccional.

Hay dos modos de trabajo de la kinesis (Benhamou & amp Bovet 1989): absoluto (A) y diferencial (D). El movimiento se controla, en el modo A, con respecto a la intensidad del estímulo local experimentado en cualquier ubicación determinada o, en el modo D, con respecto al cambio en la intensidad del estímulo experimentado durante un paso (por ejemplo, a través de la adaptación sensorial). Tanto AO-kinesis como AK-kinesis son mecanismos de uso del espacio para explotar entornos irregulares, lo que permite al animal reducir localmente el coeficiente de difusión (D=v/S 2) de su movimiento (al disminuir la velocidad media v o aumentando la sinuosidad S) en las zonas más adecuadas (Benhamou & amp Bovet 1989). Sin embargo, a diferencia de la AO-kinesis, AK-kinesis puede, cuando se aplica a un campo de gradiente, generar una ligera desviación en la dirección del gradiente basada en diferencias simples en la difusividad angular, con una tasa de giro media nula (μ0= 0). Jamon y Bovet (1987) utilizaron esta propiedad para explicar el comportamiento de búsqueda de los ratones. Sin embargo, el componente de advección es muy débil (y, en consecuencia, la mayoría de los animales se pierden), por lo que la AK-kinesis no puede considerarse un mecanismo de orientación eficiente. Por el contrario, la DK-kinesis puede alcanzar el 90% de la eficiencia de un taxi puro (BRW, aunque los taxis con persistencia pueden superarlo en un entorno ruidoso porque la persistencia se puede utilizar para suavizar el ruido (Benhamou & amp Bovet 1992)). De hecho, la llamada quimiotaxis de las bacterias (Alt 1980 Berg 1983) es principalmente una DK-kinesis en la que la sinuosidad se modula a través de la longitud del paso en lugar de la variación del ángulo de giro (llamado mecanismo de carrera y caída). Finalmente, la DO-kinesis parece no tener aplicaciones biológicas.

4. Conclusión

El campo de las caminatas aleatorias es un área grande y creciente de las matemáticas aplicadas que se utiliza cada vez más para modelar sistemas biológicos, especialmente en ecología (movimientos animales) y fisiopatología (movimientos celulares en, por ejemplo, la formación de vasos sanguíneos y la invasión de células cancerosas). En este artículo de revisión, se ha desarrollado la teoría matemática fundamental detrás de los CRW insesgados y sesgados y no correlacionados. Se han discutido las limitaciones y extensiones de estos modelos básicos, y se han examinado los avances y las dificultades asociadas con la aplicación de modelos de caminatas aleatorias a escenarios biológicos. Una ventaja notable de los modelos de caminata aleatoria radica en su capacidad para distinguir, de manera sistemática, los mecanismos subyacentes (como la persistencia, kineses e impuestos) de los datos observados, de una manera que no sería posible sin la comprensión que proporcionan las matemáticas rigurosas. Como resultado de esto, se ha mejorado enormemente la comprensión de los diversos mecanismos de movimiento que ocurren en la naturaleza.

La investigación en el área de caminatas aleatorias está lejos de ser completa. Sigue habiendo una gran cantidad de problemas matemáticos relacionados con paseos aleatorios que aún no se han resuelto (por ejemplo, fórmulas para el MSD y MDD en un BCRW general) y, por supuesto, un suministro casi interminable de sistemas biológicos que son susceptibles de modelado utilizando técnicas de caminata al azar. Hemos discutido interacciones ambientales muy simples (relacionadas con cambios simples en las probabilidades de transición en un RRW) pero, en realidad, la mayoría de los animales (y muchos microorganismos) están altamente desarrollados y son capaces de interactuar ampliamente con su entorno para optimizar las estrategias de búsqueda. Además, la mayoría de los modelos simples discutidos aquí suponen implícitamente entornos homogéneos (o como mucho heterogéneos muy simples), mientras que la mayoría de los entornos reales son muy complicados con barreras y terreno diferencial en las tres dimensiones que afectarán el comportamiento del movimiento y la velocidad (Vuilleumier & amp Metzger 2006 ).Distinguir entre cambios en el comportamiento debido a interacciones ambientales o espaciales simplemente observando y analizando movimientos siempre será difícil sin más información biológica. En general, hemos considerado solo los movimientos a nivel individual, y los efectos a nivel de población se extrapolan posteriormente bajo el supuesto de que no hay interacciones entre individuos. Sin embargo, en realidad, estas interacciones pueden tener un efecto importante sobre el comportamiento general y la posterior dispersión u orientación de una población (Couzin et al. 2005 Codling et al. 2007). Las técnicas estadísticas para el análisis de CRW simples, por ejemplo midiendo su DME o su tortuosidad, están relativamente bien desarrolladas, pero hay poco trabajo en esta área para el caso más general de caminatas aleatorias reforzadas. Ésta es una vía potencial para futuras investigaciones.

Uno de los principales problemas que está causando muchos problemas notables en la literatura es la confusión entre los observados patrón y el subyacente proceso que lo generó. Por ejemplo, Benhamou (2006) ilustró la alta tasa de error al distinguir entre sesgos localizados y globales, mientras que Parrish et al. (2002) y Codling et al. (2007) mostraron que era muy difícil distinguir entre individuos que se orientaban independientemente hacia un objetivo común y un grupo que interactuaba. Otro ejemplo es la agregación, es decir, el aumento de la densidad animal en algunos lugares. Esto a menudo se ha considerado como un mecanismo, pero es solo un patrón que puede ser generado por dos tipos de mecanismos: mecanismos de explotación (p. Ej., AO- y AK-kinesis) por los cuales los animales pasan más tiempo en ciertos lugares y mecanismos direccionales (p. Ej. DK-kinesis y taxis) por los que los animales se orientan hacia estos lugares. Esta confusión entre patrón y proceso posiblemente ha llevado a muchos de los resultados en la literatura (por ejemplo, Viswanathan et al. 1996, 2000) interpretando el movimiento animal como un proceso de Lévy, una clase diferente de caminata aleatoria fuera del alcance de este artículo de revisión. Estudios recientes (Benhamou 2007 Edwards et al. 2007 Plank & amp James en prensa) han sugerido que el modelo de Lévy es menos aplicable de lo que se pensó en un principio y, por lo tanto, un mejor enfoque de modelado puede ser utilizar extensiones de los modelos de paseo aleatorio discutidos aquí.


Ver el vídeo: Modelo de Nacimientos y Muertes puras (Noviembre 2022).