jueves, 2 de abril de 2020

Corona-virus, matemática y política - Parte 2



Quise. en mi anterior artículo, mostrar una forma matemática de mirar la peligrosidad de la pandemia que enfrentamos y al terminar me quedaron un montón de cosas en el tintero, así que nuevamente vuelvo al tema.
Empecemos con la matemática y el análisis de datos, si prestan atención en la pagina de la universidad de Hopkins, pueden ver que en la parte inferior derecha se muestra un gráfico, que varia entre el total de casos detectados y la cantidad diaria de nuevos casos, y si llevan el cursor del mouse sobre los puntos de la curva, les da el día y el valor correspondiente. En los gráficos que siguen les muestro las curvas de valor total y de incremento diario.



Para acceder a los valores





Ahora, si queremos hacer pruebas con datos reales tenemos la mejor fuente de datos para alimentar nuestra planilla de cálculo. Pero antes, debemos hacer unas aclaraciones sobre el comportamiento de los datos:
  • Los datos dependen de la fuente que los obtiene. En este caso la información es suministrada por los gobiernos de cada país. Esto puede sugerir que según algunos intereses particulares el número puede diferir de la realidad.
  • Los datos dependen de la forma y circunstancias que se toman los datos, por ejemplo si el sistema de salud de un país no dispone de suficientes reactivos para la detección del virus en toda la población que lo requiera, el número de casos que reporte será una parte del total de infecciones en ese país.
  • Los datos deben ser muchos, ya que a mayor número de datos, mejor descripción estadística de la situación real.
  • Por último, y mas importante, LAS SIMULACIONES MATEMÁTICAS PUEDEN SER UNA DESCRIPCIÓN DE LA REALIDAD, PERO NO SON LA REALIDAD MISMA. Dicho en forma simple, podemos ver que pasó y no que va a pasar, las descripciones matemáticas ayudan a comprender mejor que pasó y que podría pasar, no aseguran nada para el futuro.

Establecido esto, podemos decir que un “modelo de propagación”, como planteamos antes, no es lo mismo que un “modelo de evolución”. En el artículo anterior plateamos solo como sería la propagación en función de la tasa de contagio (1 a 2,5 ó 1 a 1,5), si tomamos una población cerrada un modelo de evolución de infectados, como habría que plantearse con el corona virus, requiere una descripción matemática mas compleja. Para estos casos se utilizan las funciones sigmoideas y sus derivadas matemáticas, que tienen la siguiente forma (gracias Wikipedia):





Estas funciones, están “normalizadas” (es decir que su valor máximo, su velocidad de crecimiento, su desplazamiento, y otros son 1), para adaptarlas a la realidad necesitamos ponerles un valor a todos ellos y compararlas con curvas de la realidad. Las cuales podemos obtener, para nuestro caso, como indicamos al comienzo, de la página de la universidad de Hopkins. Si vemos el caso de China, podemos ver como sería la forma de estas curvas.





La primera corresponde a la función sigmoidea, la segunda a su derivada, pero en realidad son la cantidad de casos acumulados y el incremento diario de la primera. Si por ejemplo para un día dado sumáramos todos los incrementos diarios en la segunda curva, deberíamos obtener un valor igual para ese día en la primer curva (total acumulado). También el valor de un día en la segunda curva puede obtenerse restando el valor de ese día, del valor del día anterior, en la primer curva. Con estos conceptos volvamos a nuestra planilla de cálculo.
Para expresar la formula de la función sigmoidea, primero definimos en una columna, por ejemplo la B, a partir de la fila 5 la serie de valores, que pueden ser los días (1,2,….,N), luego usamos la siguiente formula en la celda C5

=$C$3*($D$3/(1+$E$3*EXP(($F$3-B5)/$G$3)))

$C$3 celda que contiene el valor que multiplica la sigmoidea, para llegar al máximo de contagios (recordar que se supone que se contagiará el 30 o el 40% de la población bajo estudio, los signos $ nos servirán para que la referencia no sea dinámica al copiar y pegar las fórmulas).

$F$3 celda que contiene el valor en que hay que desplazar la sigmoidea, para no usar valores negativos como argumentos (y los días no lo son). Debe recordarse que en este valor el argumento de la exponencial toma valor 0,5, o sea, la mitad del valor del total de los contagiados y es el punto de inflexión del crecimiento exponencial.

$G$3 celda de contiene un valor que puede aplanar o agudizar la pendiente de la sigmoidea (si bien no hay alguna relación directa, se puede pensar que este valor tiene relación con la tasa de contagio).

$E$3 celda que permite introducir una cierta “anomalía”, desplazando la curva en forma no simétrica (solo para divertimento matemáticos, lo aconsejable es dejarla en valor 1).
Con esto copiamos la celda C5 y la pegamos a lo largo de la columna C debajo de C5 hasta que coincida con valores dados a la columna B. Ahora tenemos una función que puede describir el comportamiento total de la propagación del virus. Si queremos obtener la derivada, solo tenemos que ir a la columna D copiar C5 en D5 e ir a D6 y poner la formula =C6-C5, y copiar D6 hasta que coincida con la extensión de C. Si queremos verificar ponemos en la celda posterior a la final la función SUMA y veremos que el valor obtenido debe ser igual al valor de la última celda utilizada de la columna C.
Para obtener la función descriptora debemos usar una columna con valores reales, para ello vamos a la página de la universidad de Hopkins, tomamos un país, y como indicamos antes cargamos por ejemplo, la columna E con los valores de total de contagiados de forma que coincidan con los valores de los días de la columna B.
Si ahora queremos ver como obtener una función que describa los valores de la columna E, podemos usar dos métodos, uno aproximado por gráficos y otro por análisis de regresión. Por gráfica, bastaría insertar una grafico de líneas con dos series de valores, uno con los valores de la columna E y otro con los valores correspondientes de la columna C (la cantidad de celdas que tome de la columna C debe ser igual a la cantidad de celdas con datos de la columna E). Ahora solo debemos cambiar los valores de las celdas C3, E3, F4 y F3 y tratar que las dos curvas sean iguales. Cuando esto ocurra, tendremos una descripción matemática de la evolución de los contagios.
Si usamos el método de análisis por regresión calculamos R2 que es el cociente de las varianzas de las columnas C y E, podemos directamente usar por ejemplo la celda H3 y poner la formula = VAR(C5,Cn)/VAR(E5,En), con n el número de valores de las columnas E y C; nuevamente vamos variando los valores de C3, E3, F4 y F3 y el valor de H3 se aproxima a 1 y supera a 0,8 tenemos una buena aproximación.
En ambos casos, si ocurriera que para el valor igual a F3 en la columna B no se correspondiera con un valor de la columna C de aproximadamente la mitad de C3, debemos empezar de nuevo y volver a obtener otra aproximación.
La utilidad de esta aproximación es obtener una ideal del valor máximo de contagios C3 y del momento en que se producirá el pico máximo de contagios diarios F3. Esta es la utilidad de la aproximación. Los sanitaristas en función de su conocimiento médico elaboran distintas proyecciones de cantidad de gente contagiada y por eso indican que para distintos resultados del aislamiento, puede esperarse un pico de contagios en determinada fecha.
Para dejarles un ejemplo construí una aproximación al caso China, ya que muestra una evolución como la señalada (los datos los obtuve paso a paso de la página de la universidad de Hopkins). Los valores para una evolución de 41 días son los siguientes:



Las gráficas que se obtenemos para C3=82000 ; D3=1 ; E3=40 ; F3 = 16 y G3=30, muestran una aproximación razonable. Si queremos mas precisión podemos a partir de esta aproximación usar un análisis de regresión.



Lo mas importante es que estas herramientas matemáticas DESCRIBEN HECHOS, NO CONSTRUYEN EL FUTURO, somos nosotros, es este caso, quienes podemos modificarlo con nuestra conducta: cumpliendo el aislamiento, si salimos guardar la distancia de 2 metros, evitar contactos con superficies que tengan mucho contacto con otras personas (pasamanos, picaportes, etc,), evitar llevar la manos a la cara, lavarnos las manos, y si lo hacemos lavarnos al regresar, evitar usar en la casa la ropa que usamos en la calle, usar un lugar seguro en la entrada de nuestra vivienda para dejar la ropa, paquetes, etc. antes de higienizarlos, no tocar a nuestros familiares sin lavarnos bien cuando volvemos de la calle, estas y otras medidas no dependen del gobierno, es nuestra responsabilidad y debemos asumirla. De no ser así nuestra conciencia, nuestros familiares, nuestros vecinos y la sociedad nos lo reclamará.

No hay comentarios: