matemáticas de la tasa r de covid-19 desde la demografía ... · demografía, disciplina en la que...

13
1 Matemáticas de la tasa R de Covid-19 desde la demografía (documento en revisión) Luis Rosero Bixby Profesor emérito, UCR Julio 24 de 2020. Sugerencia para citar: Rosero-Bixby, L. (2020). Matemáticas de la tasa R de Covid-19 desde la demografía (documento en revisión). Importado del sitio web "Tasa R Covid-19" [FECHA]: https://ccp.ucr.ac.cr/documentos/portal/tasa-r-covid-19/R-Mate.pdf Salubristas y líderes del mundo están hablando cada vez más de la tasa R o también R 0 o R- básica del COVID-19. Angela Merkel, un raro jefe de estado con formación científica, explicaba la situación de la pandemia de COVID-19 a mediados de Abril, de la siguiente manera: “Estamos ahora en un factor reproductivo de R = 1, es decir que una persona está infectando a únicamente otra. Si llegamos al punto donde cada quien infecta 1,1 personas, entonces para octubre alcanzaremos la capacidad máxima de atención de nuestro sistema de salud. Cuando un país tiene más enfermos graves que camas de cuidados intensivos, las tasas de mortalidad pueden dispararse dramáticamente. Y con un R de 1,2, Alemania cruzaría ese umbral en julio. Con un R de 1,3, esto sucedería en junio. De este modo pueden ustedes ver cuan pequeño es el margen”. (The Guardian News, 2020) Los epidemiólogos definen R como el número esperado de contagios (casos secundarios) que genera un típico individuo infectado. Si ello ocurre en una población en la que todos son susceptibles (o sea al inicio de una epidemia –de allí el subíndice cero) se tiene el R 0 o número reproductivo básico. Este indicador fue explícitamente definido por primera vez por el epidemiólogo Klauz Dietz en 1975 (Dietz, 1975). Se considera que R es el más importante indicador para el estudio y seguimiento de epidemias, particularmente en la valoración del efecto de estrategias de control que frecuentemente tienen altísimos costos sociales y económicos. Es tal el hambre de información sobre R que los fundadores de Instagram crearon un exitoso sitio web dedicado exclusivamente al seguimiento de R en los estados de la unión americana. Aunque el concepto de R es claro, la lógica para su cálculo en epidemiología es perversamente confusa, pues usualmente requiere del uso de modelos matemáticos y algoritmos complejos (Abbott et al., 2020; Dietz, 1993; Nikbakht, Baneshi, Bahrampour, & Hosseinnataj, 2019). De allí el hambre de estimaciones transparentes y razonables de R.

Upload: others

Post on 06-Aug-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Matemáticas de la tasa R de Covid-19 desde la demografía ... · demografía, disciplina en la que un R análogo denominado “Tasa Neta de Reproducción” se computa rutinariamente

1

Matemáticas de la tasa R de Covid-19 desde la demografía (documento en revisión) Luis Rosero Bixby Profesor emérito, UCR Julio 24 de 2020. Sugerencia para citar: Rosero-Bixby, L. (2020). Matemáticas de la tasa R de Covid-19 desde la demografía (documento en revisión). Importado del sitio web "Tasa R Covid-19" [FECHA]: https://ccp.ucr.ac.cr/documentos/portal/tasa-r-covid-19/R-Mate.pdf

Salubristas y líderes del mundo están hablando cada vez más de la tasa R o también R0 o R-básica del COVID-19. Angela Merkel, un raro jefe de estado con formación científica, explicaba la situación de la pandemia de COVID-19 a mediados de Abril, de la siguiente manera:

“Estamos ahora en un factor reproductivo de R = 1, es decir que una persona está infectando a únicamente otra. Si llegamos al punto donde cada quien infecta 1,1 personas, entonces para octubre alcanzaremos la capacidad máxima de atención de nuestro sistema de salud. Cuando un país tiene más enfermos graves que camas de cuidados intensivos, las tasas de mortalidad pueden dispararse dramáticamente. Y con un R de 1,2, Alemania cruzaría ese umbral en julio. Con un R de 1,3, esto sucedería en junio. De este modo pueden ustedes ver cuan pequeño es el margen”. (The Guardian News, 2020)

Los epidemiólogos definen R como el número esperado de contagios (casos secundarios) que genera un típico individuo infectado. Si ello ocurre en una población en la que todos son susceptibles (o sea al inicio de una epidemia –de allí el subíndice cero) se tiene el R0 o número reproductivo básico. Este indicador fue explícitamente definido por primera vez por el epidemiólogo Klauz Dietz en 1975 (Dietz, 1975). Se considera que R es el más importante indicador para el estudio y seguimiento de epidemias, particularmente en la valoración del efecto de estrategias de control que frecuentemente tienen altísimos costos sociales y económicos. Es tal el hambre de información sobre R que los fundadores de Instagram crearon un exitoso sitio web dedicado exclusivamente al seguimiento de R en los estados de la unión americana. Aunque el concepto de R es claro, la lógica para su cálculo en epidemiología es perversamente confusa, pues usualmente requiere del uso de modelos matemáticos y algoritmos complejos (Abbott et al., 2020; Dietz, 1993; Nikbakht, Baneshi, Bahrampour, & Hosseinnataj, 2019). De allí el hambre de estimaciones transparentes y razonables de R.

Page 2: Matemáticas de la tasa R de Covid-19 desde la demografía ... · demografía, disciplina en la que un R análogo denominado “Tasa Neta de Reproducción” se computa rutinariamente

2

A continuación se explica el procedimiento seguido para la estimación de R que aparece en la página web del CCP. Se busca con esta explicación desmitificar las complejidades de la estimación de este importante indicador, siguiendo procedimientos bien conocidos en demografía, disciplina en la que un R análogo denominado “Tasa Neta de Reproducción” se computa rutinariamente desde hace un siglo. Fórmulas simples (pero no útiles) En un mundo ideal con acceso a datos perfectos y a la medida, la tasa R podría calcularse para cada generación de infectados como el promedio simple del número de contagios generado por cada miembro de la cohorte. Por ejemplo la cohorte de los dos primeros infectados en Costa Rica (6 de marzo) tendría un R = 4,5, puesto que, según informaciones de prensa, un caso fue un turista que contagió a su conyugue y el otro fue un médico que contagió a 8 personas: R = (1 + 8) / 2 = 4,5. Este tipo de información, sin embargo, no está disponible para las cohortes de casos de los siguientes días. Ni tampoco es perfecta, pues bien podría ser que estos dos casos iniciales contagiaron a más personas que no fueron detectadas. Otro camino para estimar R es el usado en demografía y propuesto en 1925 por Alfred Lotka, el padre de la demografía matemática (Alfred J Lotka & Dublin, 1925):

𝑅 = 𝑏 𝑎 𝑝 𝑎 𝑑𝑎!

!

Donde b(a) es la tasa de fecundidad de mujeres en la edad a y p(a) es la probabilidad de llegar con vida a esa edad (ambas variables se refieren únicamente a la población femenina y a hijas mujeres) y los límites de la integral comprenden el tramo de edades reproductivas de la mujer, en la práctica desde u = 15 a v = 49 años. Por ejemplo, la R poblacional en Costa Rica 2018 es 0,83, es decir menor que 1. De hecho es menor que 1 desde 2001, lo que indica que desde hace dos décadas cada generación de costarricenses está siendo reemplazada por otra de menor tamaño. Si en vez de la población total, la fórmula se aplica a la reproducción de una epidemia, o sea a la población de personas infectadas que aún no se han recuperado: el número de días transcurridos desde que cada cohorte-diaria se contagió estaría representado por a (la “edad” en días de los infectados), b(a) pasaría a ser la tasa de transmisión de la infección en esa “edad” de a días y p(a) pasaría a ser la probabilidad de no haberse recuperado luego de a días de enfermedad. Los límites de la integral serían desde u –el primer día en que la carga viral es lo suficientemente alta como para producir contagio– al número máximo de días v en que una persona enferma es contagiosa. Y R pasa a ser la tasa de reproducción de la infección. Sin embargo, para usar esta fórmula como se acostumbra en demografía haría falta que las estadísticas diarias de nuevos casos y nuevas personas recuperadas se tabulen por duración de la infección, es decir, indicando el número de días desde que el caso madre (la persona que fue fuente del contagio) contrajo la enfermedad. Dado que esos tabulados no existen, es necesario hacer supuestos sobre la forma funcional de b(a) y p(a) para poder estimar la R de manera indirecta y sin necesidad de contar con datos desagregados por duración a. A continuación se formulan dos modelos alternativos para estimar la tasa R. Para facilitar la exposición en ambos se supone ausencia de cambio demográfico, es decir, que en este

Page 3: Matemáticas de la tasa R de Covid-19 desde la demografía ... · demografía, disciplina en la que un R análogo denominado “Tasa Neta de Reproducción” se computa rutinariamente

3

proceso no hay nacimientos, muertes ni migraciones. Este supuesto es razonable dado que la escala de la epidemia en el tiempo se cuenta en días y el ciclo completo en materia de pocos meses, lapso en el cual el cambio demográfico es negligible. Modelo de tasas constantes Dos supuestos que simplifican notablemente el proceso de estimación son que: (1) ni las tasas de infección (2) ni las tasas de recuperación varían durante la enfermedad de la persona, es decir, son invariantes con la “edad”. Si b(a) es invariante con a tenemos que b(a) = b , por lo que:

𝑅 = 𝑏 𝑝 𝑎 𝑑𝑎!

!

En donde b es la tasa diaria de transmisión o contagio. La probabilidad de no haberse recuperado (o función de sobrevivencia) está determinada por la tasa de recuperación g(a). Esta tasa es la "mortalidad" o "falla" en análisis de tiempo de sobrevivencia. La siguiente identidad relaciona la función de sobrevivencia con la tasa de fallo; identidad que se simplifica elegantemente en una función exponencial negativa cuando esta tasa es invariante con la duración de la enfermedad (Keyfitz, 1968):

𝑝 𝑎 = 𝑒! ! ! ! !!! 𝑝 𝑎 = 𝑒!! !

A su vez, la integral de la función –o área bajo la curva– de “sobrevivencia” p(a) es bien conocida por demógrafos y actuarios, pues mide la esperanza de vida o tiempo vivido en el intervalo entre u y v. En este caso “sobrevivir” significa continuar enfermo, por lo que resolviendo la integral definida se obtiene el tiempo que se espera una persona promedio permanezca en el estado contagioso en dicho intervalo. A este resultado hemos denominado E:

𝑝 𝑎 𝑑𝑎 = 𝑒!! ! 𝑑𝑎 =1𝑔

!

!

!

!

𝑒!! ! − 𝑒!! ! =1𝑔𝑝 𝑢 − 𝑝 𝑣 = 𝐿 𝑔 = 𝐸

Esta "esperanza de vida” o duración media del periodo contagioso es, por tanto, el producto de la duración media de la enfermedad (el inverso de g) multiplicada por el término en corchetes que mide la proporción de enfermos que se recuperan en el intervalo en que la enfermedad es contagiosa al que hemos denominado L = p(u) – p(v). Si las personas son contagiosas durante todo el periodo de enfermedad, esta proporción es L = 1 y E es simplemente el inverso de g. La tasa R se simplifica, entonces, en las siguiente relación:

R=bE

b es la tasa diaria de transmisión efectiva de la infección y E es la duración media del período contagioso.

Page 4: Matemáticas de la tasa R de Covid-19 desde la demografía ... · demografía, disciplina en la que un R análogo denominado “Tasa Neta de Reproducción” se computa rutinariamente

4

Esta simple identidad pone en evidencia que la tasa R tiene dos componentes: la tasa con que se transmite la infección y la duración media del período contagioso. Si, por ejemplo, la tasa de transmisión diaria es b = 0,2 y la duración media del periodo contagioso E = 10 días, la tasa de reproducción de la epidemia sería R = 2,0. Cada caso produciría dos contagios en promedio… bajo los dos supuestos de invariabilidad arriba anotados. Conviene subrayar que a la tasa b de transmisión le hemos agregado el adjetivo “efectiva”, para distinguirla de la tasa de transmisión beta de los textos de epidemiología. Esta última es una tasa teórica que no se observa en la realidad, excepto al inicio de la epidemia cuando toda la población es susceptible. Los modelos epidemiológicos con frecuencia asumen que la tasa beta es constante en el tiempo. La tasa de ”transmisión efectiva” b, en cambio, es la tasa que se observa en la realidad y que es cambiante en el tiempo; es la multiplicación de la tasa beta por la proporción de población susceptible que disminuye conforme avanza la epidemia. Fórmula para estimar R con datos disponibles La tasa g de recuperación de la enfermedad y la duración esperada del periodo contagioso E pueden razonablemente considerarse parámetros universales, determinados por la biología del agente infeccioso, los cuales, en la práctica, variarían poco en el tiempo y de una población a otra, al menos mientras no exista tratamiento que acelere la recuperación. Datos iniciales de COVID-19 sugieren una duración media de la enfermedad de entre 10 y 20 días (Anastassopoulou, Russo, Tsakris, & Siettos, 2020; WHO, 2020; You et al., 2020). La estimación de la tasa R de reproducción se reduce, entonces, a un problema de estimar la tasa de transmisión b específica de cada población y momento en el tiempo t. La tasa media de transmisión (con el supuesto antes citado de invariabilidad a lo largo de la enfermedad) puede estimarse con el cociente:

𝑏 𝑡 = ! !! !

y, por ende: 𝑅 𝑡 = !(!)!(!)

𝐸

c(t) es el número de casos nuevos en la fecha t A(t) es el número de casos activos (acumulados que no se han recuperado) en t. El número de casos nuevos en cada fecha es una estadística amplia y oportunamente disponible. El número de casos activos, en cambio, debe ser estimado, lo cual puede hacerse a partir de la serie de datos de casos nuevos en días previos. Tomando prestada una relación básica en demografía, que define el tamaño de una población a partir del número de nacimientos en el pasado y la función de sobrevivencia (A. J. Lotka, 1986), se puede estimar el número de casos activos con:

𝐴 𝑡 = 𝑐 𝑡 − 𝑎 𝑝 𝑎 𝑑𝑎!

!

𝑅(𝑡) =𝑐(𝑡)

𝑐(𝑡 − 𝑎) !(!)!(!)!

!𝑑𝑎!

!

El numerador de este cociente es el número de casos nuevos contabilizados el día t, mientras que en el denominador reconocemos al promedio ponderado de los casos reportados en días anteriores, desde hace u días y hasta hace v días. Los

Page 5: Matemáticas de la tasa R de Covid-19 desde la demografía ... · demografía, disciplina en la que un R análogo denominado “Tasa Neta de Reproducción” se computa rutinariamente

5

ponderadores para obtener el promedio están representados por el término en corchetes, al cual lo hemos denominado w(a). (Una estimación rudimentaria del denominador puede obtenerse calculando el promedio simple –sin ponderar– de los casos en al menos los 14 días previos). El término de ponderación no es otra cosa que la distribución de la función de “sobrevivencia” en el estado infeccioso en el intervalo de u a v. Hemos indicado antes que esta función es una sencilla distribución exponencial negativa cuando g es invariante. Dadas las fórmulas anteriores para p(a) y su integral, y suponiendo un rezago fijo de 6 días entre el contagio y el diagnóstico de “caso confirmado”, llegamos a la siguiente fórmula en el campo discreto para el cálculo de R con el modelo que hemos denominado de “tasas constantes":

𝑅 𝑡 − 6 = 𝑐(𝑡) 𝑐 𝑡− 𝑎 𝑤(𝑎)𝑎=𝑣

𝑎=𝑢

donde: 𝑤(𝑎) = 𝑔 𝑒−𝑔 𝑎 𝑒−𝑔 𝑢 − 𝑒−𝑔 𝑣 Los factores de ponderación w(a) en este modelo de tasas constantes son la distribución de la función de sobrevivencia en el periodo u - v. Parámetros plausibles para la estimación son:

• límites del período de contagio: u = 2 y v = 30 días, • tasa diaria de recuperación g = 1/15, lo que implica:

o duración media de la enfermedad 15 días y o duración media de contagiosidad E = 11.1 días.

Estos parámetros se eligieron con base en reportes de la epidemiología de COVID-19 observada en los primeros meses de la pandemia, principalmente en la provincia de Hubei en China (Anastassopoulou et al., 2020; Park, Cook, Lim, Sun, & Dickens, 2020; WHO, 2020). Más adelante se discute la sensibilidad de la estimación a cambios en estos parámetros. Modelo (más realista) con tasas exponenciales Aunque muchos modelos epidemiológicos de COVID-19 asumen que las tasas de infección y recuperación no varían a lo largo del período de enfermedad, conviene explorar supuestos alternativos del comportamiento de estas dos funciones, probablemente más apegados a lo observado en los primeros meses de esta pandemia. Con respecto a la tasa de infección b(a), los datos iniciales de la dinámica de la pandemia y mediciones de la carga viral a lo largo de la enfermedad sugieren una distribución con un pico temprano máximo y rápida disminución subsiguiente (He et al., 2020; Prakash, 2020). Para mantener las matemáticas simples, hemos asumido que g(a) sigue una función exponencial negativa que decrece rápidamente a partir del día pico de la infección que también se asume que es el primer día de contagiosidad u:

𝑏(𝑎) = 𝐵!𝑒!!!(!!!) B0 parámetro que representa la tasa máxima de infección en el día inicial u, B1 parámetro que indica la velocidad con que disminuye la tasa de infección.

Page 6: Matemáticas de la tasa R de Covid-19 desde la demografía ... · demografía, disciplina en la que un R análogo denominado “Tasa Neta de Reproducción” se computa rutinariamente

6

Con respecto a la tasa diaria de recuperación g(a), no encontramos literatura con estimaciones de su distribución para COVID-19, pero parece razonable asumir que sigue el comportamiento observado en la tasa de fallo de la gran mayoría de organismos, tanto vivos e como inertes. Esto es, una función de Gompertz que se acelera de manera constante con la edad (Keyfitz, 1968; Pollard, 1991):

𝑔(𝑎) = 𝐺!𝑒!!! G0 parámetro que representa la tasa de recuperación al inicio de la enfermedad, G1 parámetro que mide la rapidez con que aumenta la tasa de recuperación.

La proporción de personas que continúan enfermas el día a, o función de sobrevivencia, se obtiene resolviendo la siguiente integral, lo que resulta en una doble exponencial:

𝑝 𝑎 = 𝑒! ! ! ! !!! 𝑝 𝑎 = 𝑒 𝐺0 𝐺1 1−𝑒𝐺1𝑎

Determinar la tasa R(t) con las funciones b(a) y p(a) requeriría estimar directamente para cada momento t los parámetros que definen las funciones, especialmente los de la tasa de transmisión b(a), empresa difícil o imposible de lograr con los datos usualmente disponibles. En lugar de ello, proponemos usar el procedimiento común en demografía de la estandarización indirecta (Shryock & Siegel, 1976). Para ello, primero es necesario estimar el número esperado de casos nuevos de COVID-19 en el día t para distribuciones plausibles de b(a) y p(a) que producen un R=1, dada la composición por duración a de los casos activos en t. Los casos esperados para un R=1 se estiman con la relación:

𝑐(𝑡,𝑅 = 1) = 𝑐 𝑡 − 𝑎 𝑏 𝑎 𝑝 𝑎 𝑑𝑎!

!

En un segundo paso, la tasa R(t) se estima como el cociente entre los casos observados y los esperados.

𝑅(𝑡) ≈𝑐(𝑡)

𝑐 𝑡 − 𝑎 𝑏 𝑎 𝑝 𝑎 𝑑𝑎!!

El denominador para determinar R es, como en el modelo anterior de tasas constantes, el promedio ponderado de la serie de casos en días previos, con el término en corchetes como factor de ponderación, al que hemos denominado w(a). Dadas las fórmulas anteriores para las funciones b(a) y p(a), y suponiendo el rezago de 6 días entre el contagio y el diagnóstico, llegamos a la siguiente fórmula en el campo discreto para el cálculo de R con el modelo que hemos denominado de “tasas exponenciales":

𝑅 𝑡 − 6 = 𝑐(𝑡) 𝑐 𝑡− 𝑎 𝑤(𝑎)𝑎=𝑣

𝑎=𝑢

donde: 𝑤(𝑎) = 𝐵!𝑒 !!! !!! ! !! !! !!!!!!

Page 7: Matemáticas de la tasa R de Covid-19 desde la demografía ... · demografía, disciplina en la que un R análogo denominado “Tasa Neta de Reproducción” se computa rutinariamente

7

Los factores de ponderación w(a) en este modelo de tasas exponenciales son la distribución del producto de las funciones b(a) y p(a), a partir del día u de inicio de contagiosidad, que se supone es también el día pico o de máxima carga viral. Parámetros plausibles para la estimación son:

• límites del período de contagio: u = 2 y v = 30 días (el límite superior es, en realidad, irrelevante pues el factor de ponderación alcanza cero en el día 25),

• parámetros de la función de sobrevivencia p(a) elegidos de manera que reproducen convenientemente una duración media de la enfermedad de 15 días: G0 = 0,0048 G1 = 0,2236

• parámetros de la función de transmisión efectiva b(a) elegidos de manera que reproducen, en conjunto con p(a), una conveniente tasa R = 1: B0 = 0,12 B1 = 0,0665

Al igual que en el modelo de tasas constantes, los parámetros se eligieron con base en reportes de la epidemiología de COVID-19 observada en los primeros meses de la pandemia, principalmente en la provincia China de Hubei (Anastassopoulou et al., 2020; He et al., 2020; Park et al., 2020; Prakash, 2020; WHO, 2020). El gráfico 1 muestra las distribuciones b(a) p(a) que corresponden a estos parámetros y, en la parte B del gráfico, los factores de ponderación que resultan del producto de las dos distribuciones. Estas curvas se comparan con las correspondientes al modelo de tasas constantes descrito previamente.

Las curvas de los ponderadores informan que el modelo de tasas constantes otorga relativamente mayor ponderación a casos ocurridos más lejos en el pasado, mientras que el

b(a)

y p

(a)

0 5 10 15 20 25 30a días desde contagio

b(a): p(a):

Exponencial Constante

A. Distribuciones b(a) y p(a)

0

.02

.04

.06

.08

.1

.12

.14

w(a

)

0 5 10 15 20 25 30a días desde contagio

ExponencialConstante

Modelo:

B. Ponderadores w(a)

Gr 1. Funciones b(a), p(a) y w(a) bajo dos modelos

Page 8: Matemáticas de la tasa R de Covid-19 desde la demografía ... · demografía, disciplina en la que un R análogo denominado “Tasa Neta de Reproducción” se computa rutinariamente

8

de tasas exponenciales les da más importancia a los casos más recientes. Si la cantidad de casos nuevos ha variado poco en el tiempo, ambos modelos producirán estimaciones similares de R(t). Recordando que los ponderadores se usan en el cálculo del denominador de la tasa, cuando el número de casos diarios está en aumento, el modelo de tasas constantes producirá estimaciones más altas de R. Lo contrario ocurrirá en etapas de la epidemia en que está cayendo el número de casos: el modelo de tasas constante producirá estimaciones más bajas de R. Los dos modelos presentados son arquetipos de la escogencia de juegos de ponderadores que uno enfrenta en esta estimación indirecta de la tasa R: elegir un juego angosto de ponderadores que dan peso mayor a los casos más recientes, en contraste con un juego ancho en el que casos más antiguos reciben cierta importancia. El primer juego corresponde al modelo de tasas exponenciales y el segundo al de tasas constantes. Estos juegos de ponderadores están en gran medida determinados por la forma de la función de tasas de contagio g(a). Dos arquetipos en la literatura de brotes epidémicos recientes de infecciones respiratorias son: (1) la influenza estacional con una estrecha concentración del contagio en los primeros días de la enfermedad; y (2) el brote de SARS-2003 con una dispersión ancha que en cierta medida se asemeja al rectángulo de las tasas b(a) constantes del gráfico 1. Datos emergentes de COVID-19 sugieren que su tasa de transmisión se asemeja más a la curva de influenza estacional altamente concentrada en los primeros días (He et al., 2020) es decir a nuestro modelo exponencial. Aplicación de los dos modelos a la pandemia en Costa Rica El gráfico 1 compara las estimaciones de las tasas R(t) obtenidas en Costa Rica con los dos modelos arriba descritos.

0.5

0.7

1.0

1.5

2.0

3.0

Tasa

R

Marzo 15 Abril 1 Abril 15 Mayo 1 Mayo 15 Junio 1 Junio 15 Julio 1 Julio 15Fecha probable de contagio

Modelo:ConstanteExponencial

Gr 2. La tasa R del COVID-19 en Costa Rica según dos modelos

Page 9: Matemáticas de la tasa R de Covid-19 desde la demografía ... · demografía, disciplina en la que un R análogo denominado “Tasa Neta de Reproducción” se computa rutinariamente

9

Las dos estimaciones describen de manera similar a la tendencia general seguida por la tasa R: disminución inicial hasta llegar a un mínimo por debajo de 0,5 a mediados de abril; aumento en el mes y medio subsiguiente hasta alcanzar una R del orden de 2 a fin de mayo; oscilación en niveles elevados cercanos a R = 2 durante junio y descenso en julio. En su ascenso, la tasa R cruza le umbral de R = 1 a finales de abril con una diferencia de 4 días entre las dos estimaciones. Aunque la tendencia es semejante con las dos estimaciones, hay diferencias importantes en el nivel de la tasa según el modelo de estimación usado. El modelo de tasas constantes produce la mayoría del tiempo estimaciones de R más altas que el modelo con tasas exponenciales. Esta diferencia era de esperarse pues la mayoría del tiempo el número de casos ha estado en aumento. La excepción es el periodo del 6 de abril al 6 de mayo, en el cual se revirtió la situación y el modelo de tasas constantes produce estimaciones más bajas. Este periodo fue la única época en que el país registró una tendencia a disminuir el número de casos nuevos. En razón de que el modelo de tasas exponenciales refleja mejor la evidencia disponible de propagación de COVID-19 en el mundo, este es el modelo que hemos elegido para efectuar las estimaciones de R. La particularidad de este modelo, en comparación con el de las tasas constantes, es que el periodo de contagio se concentra en un intervalo más breve en los primeros días de la enfermedad a partir del tercero. Esto hace que en él tengan más importancia los casos recientes como generadores de contagio. El modelo de tasas constantes, en cambio, da relativamente más importancia a los casos más antiguos como generadores de contagios. Interpretación y subproductos de R(t) R(t) en epidemiología se conoce como la tasa efectiva de reproducción de una epidemia, para diferenciarla de la R0 que se conoce como la tasa básica de reproducción que mide la situación al inicio del brote cuando hay cero personas inmunes. Se interpreta como una tasa o factor de reemplazo o propagación de la infección. Desde una perspectiva individual, mide la cantidad de contagios que genera cada persona infectada. Desde una perspectiva poblacional, es el factor por el que se multiplica cada nueva cohorte de infectados que reemplaza a la anterior. El valor de R con respecto a la unidad es crucial para distinguir si la epidemia está propagándose (R > 1), si se está contrayendo (R < 1) o si está en una situación de equilibrio estable (R = 1). R indica el potencial de crecimiento o propagación de la infección. Variaciones aparentemente pequeñas en R hacen enormes diferencias en la velocidad con que se está propagando la epidemia. Por ejemplo, un R = 1,5 implica que la cantidad de casos se duplica en 14 días, mientras que un R = 1,2 implica duplicaciones cada 30 días, y con un R = 2 la cantidad de casos se duplicaría cada 8 días. La tasa R no es un predictor de lo que realmente ocurrirá en el futuro, sino que es un indicador de lo que podría ocurrir de mantenerse constante este potencial reproductivo una vez que cese el efecto de inercia que produce la acumulación de casos del pasado . Quien desee hacer proyecciones o predicciones del curso futuro de la epidemia, puede encontrar útil basarse en R, pero debe formular hipótesis sobre el curso futuro de R; es decir, no puede simplemente asumir que R se mantendrá constante.

Page 10: Matemáticas de la tasa R de Covid-19 desde la demografía ... · demografía, disciplina en la que un R análogo denominado “Tasa Neta de Reproducción” se computa rutinariamente

10

La tasa R definitivamente no informa de la severidad o los estragos que está causando una epidemia, sino solamente informa de su dinámica. Una población donde están ocurriendo gran cantidad de hospitalizaciones, muertes y nuevos casos, bien puede tener una tasa R baja, incluso menor que 1. Asimismo, en otra población pueden estar ocurriendo muy pocos casos pero con una R alta, la cual indicaría que de no tomarse medidas correctivas hay potencial de que en el futuro ocurra un crecimiento explosivo. Para interpretar o comunicar el significado de un determinado valor de R resulta útil la relación establecida en 1934 por Alfred Lotka en su libro “Teoría Analítica de las Asociaciones Biológicas”, lectura obligada en teorías de población y demografía matemática (A. J. Lotka, 1986):

𝑅 = 𝑒!" 𝜌 = !"!!

ρ es la tasa “intrínseca” de crecimiento de la población, o en el presente análisis, de la población de personas infectadas y también del crecimiento en el número de casos nuevos (Lotka demostró que tanto los nacimientos –casos nuevos en una epidemia– como la población –casos activos– crecen con la misma tasa en poblaciones estables).

T es el intervalo medio entre generaciones o, en el lingo de epidemiología, el "intervalo serial medio". Este intervalo suele estimarse en demografía calculando la edad promedio de las madres al tener sus hijas. En una brote epidémico se estimaría como la duración media de la enfermedad al momento de producirse los contagios. La relación matemática para este promedio es:

𝑇 =𝑎 𝑏 𝑎 𝑝 𝑎 𝑑𝑎!

!

𝑏 𝑎 𝑝 𝑎 𝑑𝑎!!

La solución analítica de esta ecuación puede ser compleja por lo que es preferible resolverla con integración numérica de las funciones correspondientes. El resultado obtenido para nuestros dos modelos es: T = 11,88 días en modelo de tasas constantes y T = 8,01 días en modelo de tasa exponenciales.

Otros dos derivados útiles de R son: 1) el tiempo D que demoraría en duplicarse la cantidad de afectados por la epidemia y 2) el llamado nivel de ”inmunidad de rebaño” I:

𝐷 = 𝑇 ln(2) ln(𝑅)

𝐼 = 1− 1 𝑅! El umbral de “inmunidad de rebaño” I es la proporción de población que debe adquirir inmunidad (por infección o vacunación) para que cese la proliferación de casos dado el número reproductivo básico R0. Esta inmunidad se alcanza cuando R(t) cruza el umbral de la unidad. A manera de ejemplo, la estimación de R para Costa Rica con la formula de estimación resaltada en el recuadro arriba y la serie de datos del número acumulado de casos a julio 19 de 2020 (la serie de casos acumulados fue, como primer paso, suavizada para eliminar el ruido aleatorio), produjo los siguientes resultados:

Page 11: Matemáticas de la tasa R de Covid-19 desde la demografía ... · demografía, disciplina en la que un R análogo denominado “Tasa Neta de Reproducción” se computa rutinariamente

11

• Tasa de reproducción R(julio 13) = 1,28 • Intervalo serial medio entre generaciones de casos T = 8,0 días. • Tasa intrínseca de crecimiento diario de infectados: ρ = 3,1% • Tiempo para duplicarse la cantidad de casos D = 22 días • Inmunidad de rebaño al 63% si el factor reproductivo básico R0 fuese 2,7 como lo

sugiere la gráfica 2.

Discusión La tasa R es posiblemente el indicador más importante para caracterizar la dinámica de la pandemia y evaluar el efecto de intervenciones de política. Lamentablemente, con las estadísticas disponibles no es posible calcular esta tasa de manera inequívoca. En su lugar se efectúan estimaciones que pueden producir resultados diferentes dependiendo de los supuestos efectuados y los modelos teóricos usados. Los procedimientos de estimación aquí propuestos descansan en métodos y modelos desarrollados desde hace un siglo en demografía para el estudio de poblaciones teóricas de humanos y otras especies. Una fortaleza de estos procedimientos es la transparencia de los supuestos detrás de la estimación. Otro tipo de estimaciones desarrolladas recientemente en epidemiología tienden a usar masivamente el músculo de las computadoras para producir miles de simulaciones de la estimación haciendo variar los diferentes supuestos. A menudo esas estimaciones no presentan un resultado puntual sino intervalos de posibles resultados. Hemos identificado una simple formulación para estimar la tasa R(t) como el cociente entre el número de casos del día dividido entre el promedio ponderado de los casos en días anteriores. El procedimiento requiere que se elija una amplitud del período de días anteriores y unos factores de ponderación con base en el conocimiento de la dinámica del COVID-19, el cual está en evolución. Consideramos razonable elegir un periodo de 2 a 30 días previos y unas ponderadores que se derivan de suponer que la tasa de contagio decrece durante la enfermedad siguiendo una función exponencial negativa y que la tasa de salida del estado infeccioso sigue la ley de Gompertz, es decir, aumenta en forma exponencial. Para la elección de los parámetros de entrada, hemos mostrado que una distribución más ancha de los factores de ponderación (el modelo de tasas constantes), que da mayor peso a casos ocurridos en días más distantes en el pasado, resulta en estimaciones más altas de R cuando la curva de la epidemia está creciendo y en estimaciones más bajas en la parte descendente de la curva; es decir estimaciones que amplifican los valores extremos, mínimos y máximos. Un indicador que resume la distribución de factores de ponderación es el intervalo medio entre generaciones o “intervalo serial”. Una revisión de la emergente literatura sobre COVID-19 ha identificado un rango de 4 a 8 días en estimaciones de este intervalo efectuadas principalmente con datos de la pandemia en China. En el modelo aquí elegido este intervalo es de 8,0 días. Hemos mostrado como estimación alternativa la correspondiente a un intervalo medio de 11 días (el modelo de tasas constantes). Un ejemplo de estimaciones de R con un intervalo serial más breve de 3,6 días es el del “Centre for the Mathematical Modelling of Infectious Diseases (CMMID) at the London

Page 12: Matemáticas de la tasa R de Covid-19 desde la demografía ... · demografía, disciplina en la que un R análogo denominado “Tasa Neta de Reproducción” se computa rutinariamente

12

School of Hygiene & Tropical Medicine” (Abbott et al., 2020), el cual resulta en valores extremos menores que nuestra estimación. Hemos supuesto en toda la presente exposición ausencia de cambio demográfico, es decir, que no hay nacimientos, muertes ni migraciones. Dado que los periodos de tiempo considerados en la estimación de R son breves (30 días o menos), la exclusión o inclusión del cambio demográfico no modificará los resultados. Las excepciones pueden ser la llegada de números considerables de casos de CPOVID-19 importados y la mortalidad causada por el mismo COVID-19. Los casos importados de COVID-19 deberían excluirse de la serie de casos nuevos si la información está disponible. Sin embargo, es solo al inicio del brote epidémico cuando los casos importados pueden representar una fracción importante como para alterar los resultados. La mortalidad causada por COVID-19 puede integrase al procedimiento de estimación ampliando el concepto de tasa de recuperación g(a) a “tasa de salida del estado infeccioso” en la que se agregan los fallecimientos a las razones de salida. Sin embargo, esta corrección probablemente tendrá muy poco impacto. La tasa de letalidad (también llamada infección/fatalidad) de COVID-19 parece ser de un orden de magnitud del 1% de fallecimientos por personas infectadas (Worldometer, 2020), lo que equivaldría a tasas diarias de mortalidad menores que 0,0007 si la duración media de la enfermedad es 15 días, comparadas con las tasas de recuperación de la enfermedad que son del orden de 0,07. Estas cantidades sugieren que tomar en cuenta la mortalidad de personas infectadas corregiría la estimación de R en menos del 1% hacia abajo. Una corrección tan pequeña bien puede ser omitida. Un problema en toda estimación basada en los números de casos reportados es que éstos muestran solamente la punta del iceberg de todos los casos de COVID-19. Pero esto no invalida los resultados. Los procedimientos propuestos tienen validez en la medida en que la parte conocida es representativa del todo. No importa la proporción de casos que es conocida y la proporción desconocida, lo importante es que la parte conocida refleje las características del todo y, especialmente, que esto no varíe a través del tiempo.

Page 13: Matemáticas de la tasa R de Covid-19 desde la demografía ... · demografía, disciplina en la que un R análogo denominado “Tasa Neta de Reproducción” se computa rutinariamente

13

Referencias bibliográficas

Abbott, S., Hellewell, J., Thompson, R. N., Sherratt, K., Gibbs, H. P., Bosse, N. I., . . . Chun, J. Y. (2020). Estimating the time-varying reproduction number of SARS-CoV-2 using national and subnational case counts. Wellcome Open Research, 5(112), 112.

Anastassopoulou, C., Russo, L., Tsakris, A., & Siettos, C. (2020). Data-based analysis, modelling and forecasting of the COVID-19 outbreak. PLoS One, 15(3), e0230405.

Dietz, K. (1975). Transmission and control of arbovirus diseases. Epidemiology, 104, 104-121.

Dietz, K. (1993). The estimation of the basic reproduction number for infectious diseases. Statistical methods in medical research, 2(1), 23-41.

He, X., Lau, E. H., Wu, P., Deng, X., Wang, J., Hao, X., . . . Tan, X. (2020). Temporal dynamics in viral shedding and transmissibility of COVID-19. Nature medicine, 26(5), 672-675.

Keyfitz, N. (1968). Introduction to the Mathematics of Population.

Lotka, A. J. (1986). Teoría Analítica de las Asociaciones Biológicas. Santiago: CELADE.

Lotka, A. J., & Dublin, L. (1925). On the true rate of natural increase. Journal of the American Statistical Association, 20(151), 305-339.

Nikbakht, R., Baneshi, M. R., Bahrampour, A., & Hosseinnataj, A. (2019). Comparison of methods to Estimate Basic Reproduction Number (R0) of influenza, Using Canada 2009 and 2017-18 A (H1N1) Data. Journal of research in medical sciences: the official journal of Isfahan University of Medical Sciences, 24.

Park, M., Cook, A. R., Lim, J. T., Sun, Y., & Dickens, B. L. (2020). A systematic review of COVID-19 epidemiology based on current evidence. Journal of Clinical Medicine, 9(4), 967.

Pollard, J. P. (1991). Fun with Gompertz. Genus, 47(1/2), 1-20.

Prakash, M. K. (2020). Quantitative COVID-19 infectiousness estimate correlating with viral shedding and culturability suggests 68% pre-symptomatic transmissions. medRxiv.

Shryock, H. S., & Siegel, J. S. (1976). The Methods and Materials of Demography. New York: Academic Press.

The Guardian News (Producer). (2020, April 16). Angela Merkel uses science background in coronavirus explainer. [Video] Retrieved from https://http://www.youtube.com/watch?v=22SQVZ4CeXA

WHO. (2020). Report of the WHO-China Joint Mission on coronavirus disease 2019 (COVID-19). 2020. World Health Organization: Geneva, Switzerland.

Worldometer. (2020). COVID-19 coronavirus / death rate. Retrieved July 23, 2020, from https://http://www.worldometers.info/coronavirus/coronavirus-death-rate/

You, C., Deng, Y., Hu, W., Sun, J., Lin, Q., Zhou, F., . . . Zhou, X.-H. (2020). Estimation of the time-varying reproduction number of COVID-19 outbreak in China. International Journal of Hygiene and Environmental Health, 113555.