Quise.
en mi anterior artículo, mostrar una forma matemática de mirar la
peligrosidad de la pandemia que enfrentamos y al terminar me quedaron
un montón de cosas en el tintero, así que nuevamente vuelvo al
tema.
Empecemos
con la matemática y el análisis de datos, si prestan atención en
la pagina de la universidad de Hopkins, pueden ver que en la parte
inferior derecha se muestra un gráfico, que varia entre el total de
casos detectados y la cantidad diaria de nuevos casos, y si llevan el
cursor del mouse sobre los puntos de la curva, les da el día y el
valor correspondiente. En los gráficos que siguen les muestro las
curvas de valor total y de incremento diario.
Para
acceder a los valores
Ahora,
si queremos hacer pruebas con datos reales tenemos la mejor fuente de
datos para alimentar nuestra planilla de cálculo. Pero antes,
debemos hacer unas aclaraciones sobre el comportamiento de los datos:
Los datos dependen de la fuente que los obtiene. En este caso la
información es suministrada por los gobiernos de cada país. Esto
puede sugerir que según algunos intereses particulares el número
puede diferir de la realidad.
Los datos dependen de la forma y circunstancias que se toman los
datos, por ejemplo si el sistema de salud de un país no dispone de
suficientes reactivos para la detección del virus en toda la
población que lo requiera, el número de casos que reporte será
una parte del total de infecciones en ese país.
Los datos deben ser muchos, ya que a mayor número de datos, mejor
descripción estadística de la situación real.
Por último, y mas importante, LAS SIMULACIONES MATEMÁTICAS PUEDEN
SER UNA DESCRIPCIÓN DE LA REALIDAD, PERO NO SON LA REALIDAD MISMA.
Dicho en forma simple, podemos ver que pasó y no que va a pasar,
las descripciones matemáticas ayudan a comprender mejor que pasó y
que podría pasar, no aseguran nada para el futuro.
Establecido
esto, podemos decir que un “modelo de propagación”, como
planteamos antes, no es lo mismo que un “modelo de evolución”.
En el artículo anterior plateamos solo como sería la propagación
en función de la tasa de contagio (1 a 2,5 ó 1 a 1,5), si tomamos
una población cerrada un modelo de evolución de infectados, como
habría que plantearse con el corona virus, requiere una descripción
matemática mas compleja. Para estos casos se utilizan las funciones
sigmoideas y sus derivadas matemáticas, que tienen la siguiente
forma (gracias Wikipedia):
Estas
funciones, están “normalizadas” (es decir que su valor máximo,
su velocidad de crecimiento, su desplazamiento, y otros son 1), para
adaptarlas a la realidad necesitamos ponerles un valor a todos ellos
y compararlas con curvas de la realidad. Las cuales podemos obtener,
para nuestro caso, como indicamos al comienzo, de la página de la
universidad de Hopkins. Si vemos el caso de China, podemos ver como
sería la forma de estas curvas.
La
primera corresponde a la función sigmoidea, la segunda a su
derivada, pero en realidad son la cantidad de casos acumulados y el
incremento diario de la primera. Si por ejemplo para un día dado
sumáramos todos los incrementos diarios en la segunda curva,
deberíamos obtener un valor igual para ese día en la primer curva
(total acumulado). También el valor de un día en la segunda curva
puede obtenerse restando el valor de ese día, del valor del día
anterior, en la primer curva. Con estos conceptos volvamos a nuestra
planilla de cálculo.
Para
expresar la formula de la función sigmoidea, primero definimos en
una columna, por ejemplo la B, a partir de la fila 5 la serie de
valores, que pueden ser los días (1,2,….,N), luego usamos la
siguiente formula en la celda C5
=$C$3*($D$3/(1+$E$3*EXP(($F$3-B5)/$G$3)))
$C$3
celda que contiene el valor que multiplica la sigmoidea, para llegar
al máximo de contagios (recordar que se supone que se contagiará el
30 o el 40% de la población bajo estudio, los signos $ nos servirán
para que la referencia no sea dinámica al copiar y pegar las
fórmulas).
$F$3
celda que contiene el valor en que hay que desplazar la sigmoidea,
para no usar valores negativos como argumentos (y los días no lo
son). Debe recordarse que en este valor el argumento de la
exponencial toma valor 0,5, o sea, la mitad del valor del total de
los contagiados y es el punto de inflexión del crecimiento
exponencial.
$G$3
celda de contiene un valor que puede aplanar o agudizar la pendiente
de la sigmoidea (si bien no hay alguna relación directa, se puede
pensar que este valor tiene relación con la tasa de contagio).
$E$3
celda que permite introducir una cierta “anomalía”, desplazando
la curva en forma no simétrica (solo para divertimento matemáticos,
lo aconsejable es dejarla en valor 1).
Con
esto copiamos la celda C5 y la pegamos a lo largo de la columna C
debajo de C5 hasta que coincida con valores dados a la columna B.
Ahora tenemos una función que puede describir el comportamiento
total de la propagación del virus. Si queremos obtener la derivada,
solo tenemos que ir a la columna D copiar C5 en D5 e ir a D6 y poner
la formula =C6-C5, y copiar D6 hasta que coincida con la extensión
de C. Si queremos verificar ponemos en la celda posterior a la final
la función SUMA y veremos que el valor obtenido debe ser igual al
valor de la última celda utilizada de la columna C.
Para
obtener la función descriptora debemos usar una columna con valores
reales, para ello vamos a la página de la universidad de Hopkins,
tomamos un país, y como indicamos antes cargamos por ejemplo, la
columna E con los valores de total de contagiados de forma que
coincidan con los valores de los días de la columna B.
Si
ahora queremos ver como obtener una función que describa los valores
de la columna E, podemos usar dos métodos, uno aproximado por
gráficos y otro por análisis de regresión. Por gráfica, bastaría
insertar una grafico de líneas con dos series de valores, uno con
los valores de la columna E y otro con los valores correspondientes
de la columna C (la cantidad de celdas que tome de la columna C debe
ser igual a la cantidad de celdas con datos de la columna E). Ahora
solo debemos cambiar los valores de las celdas C3, E3, F4 y F3 y
tratar que las dos curvas sean iguales. Cuando esto ocurra, tendremos
una descripción matemática de la evolución de los contagios.
Si
usamos el método de análisis por regresión calculamos R2
que es el cociente de las varianzas de las columnas C y E, podemos
directamente usar por ejemplo la celda H3 y poner la formula =
VAR(C5,Cn)/VAR(E5,En), con n el número de valores de las columnas E
y C; nuevamente vamos variando los valores de C3, E3, F4 y F3 y el
valor de H3 se aproxima a 1 y supera a 0,8 tenemos una buena
aproximación.
En
ambos casos, si ocurriera que para el valor igual a F3 en la columna
B no se correspondiera con un valor de la columna C de
aproximadamente la mitad de C3, debemos empezar de nuevo y volver a
obtener otra aproximación.
La
utilidad de esta aproximación es obtener una ideal del valor máximo
de contagios C3 y del momento en que se producirá el pico máximo de
contagios diarios F3. Esta es la utilidad de la aproximación. Los
sanitaristas en función de su conocimiento médico elaboran
distintas proyecciones de cantidad de gente contagiada y por eso
indican que para distintos resultados del aislamiento, puede
esperarse un pico de contagios en determinada fecha.
Para
dejarles un ejemplo construí una aproximación al caso China, ya que
muestra una evolución como la señalada (los datos los obtuve paso a
paso de la página de la universidad de Hopkins). Los valores para
una evolución de 41 días son los siguientes:
Las
gráficas que se obtenemos para C3=82000 ; D3=1 ; E3=40 ; F3 = 16 y
G3=30, muestran una aproximación razonable. Si queremos mas
precisión podemos a partir de esta aproximación usar un análisis
de regresión.
Lo
mas importante es que estas herramientas matemáticas DESCRIBEN
HECHOS, NO CONSTRUYEN EL FUTURO, somos nosotros, es este caso,
quienes podemos modificarlo con nuestra conducta: cumpliendo el
aislamiento, si salimos guardar la distancia de 2 metros, evitar
contactos con superficies que tengan mucho contacto con otras
personas (pasamanos, picaportes, etc,), evitar llevar la manos a la
cara, lavarnos las manos, y si lo hacemos lavarnos al regresar,
evitar usar en la casa la ropa que usamos en la calle, usar un lugar
seguro en la entrada de nuestra vivienda para dejar la ropa,
paquetes, etc. antes de higienizarlos, no tocar a nuestros familiares
sin lavarnos bien cuando volvemos de la calle, estas y otras medidas
no dependen del gobierno, es nuestra responsabilidad y debemos
asumirla. De no ser así nuestra conciencia, nuestros familiares,
nuestros vecinos y la sociedad nos lo reclamará.