A quien nos lee,
si quieres apoyar nuestro trabajo te invitamos a suscribirte a la edición impresa.

SUSCRÍBETE

Uno de los fenómenos sin precedentes en México durante la pandemia ha sido el acceso público a datos nominales de vigilancia epidemiológica de covid-19 y el entusiasmo con el que han sido usados. Por vigilancia epidemiológica nos referimos al registro, integración y análisis sistemático de información sobre los casos de esta enfermedad para la toma de decisión y diseminación a la población. El análisis de esta información ha sido la base de reportajes en medios de comunicación, discusiones en redes sociales y escalas de comparación internacional, y de cerca de 30 publicaciones de artículos científicos.1 Desde muy temprano en la pandemia, los epidemiólogos identificaron la necesidad de prevenir errores metodológicos y de interpretación en el uso de información proveniente de datos de vigilancia epidemiológica.2 Aquí revisamos la importancia de adherirse a principios epidemiológicos al usar los datos abiertos de covid-19 y de reconocer las limitaciones inherentes a estos datos.

Ilustración: Patricio Betteo

Uno de los indicadores más utilizados para comparar la respuesta de México ante la pandemia con otros países ha sido la tasa de letalidad.3 Este indicador resulta de dividir el número de muertes confirmadas por covid-19 (numerador) entre el número de personas confirmadas como infectadas por SARS-CoV-2 (denominador) en un periodo de tiempo determinado. En México, hemos seguido una estrategia en el uso de pruebas diagnósticas dándole prioridad a personas con síntomas graves. Esto significa que tenemos identificadas solamente una fracción de las personas infectadas por SARS-CoV-2.

En otras palabras, no conocemos la verdadera magnitud del denominador, ya que este debería incluir a las personas infectadas con prueba positiva, aquellas sin prueba pero con síntomas, las personas asintomáticas, y finalmente las que han muerto. Por lo tanto, la tasa de letalidad calculada a partir de estos datos esta inflada, y no refleja la tasa de letalidad real. Resaltar la tasa de letalidad en México con fines comparativos de respuesta a la pandemia sin tomar en cuenta que está calculada con base en casos graves de covid-19 es completamente inadecuado.4

Un importante grupo de indicadores de nuestro desempeño ante la pandemia serán los de calidad de atención hospitalaria. Hay interés público por conocer el riesgo de mortalidad en personas con complicaciones de covid-19 que reciben apoyo ventilatorio mecánico (intubados). Usando datos de abiertos de covid-19 se calculó que 3 de cada 4 personas intubadas por covid-19 en México mueren.5 Al igual que el ejemplo anterior, esto no es estimable con los datos públicos existentes porque no se cuenta con el denominador correcto (número de intubados con SARS-CoV-2).

En nuestro sistema de vigilancia las personas se clasifican como ambulatorios, hospitalizados, e intubados cuando se registran en el sistema. Sin embargo, su evolución no se actualiza de manera eficiente. Por esta razón, existen pacientes que fueron registrados como ambulatorios u hospitalizados y que acabaron siendo intubados que no podrán ser incluidos en el cálculo de riesgo de muerte. En comparación con los que fueron registrados como intubados desde un inicio, es probable que los pacientes excluidos del denominador tengan un menor riesgo de mortalidad, ya que tuvieron un contacto más temprano con el sistema de salud. Es por esto que reportar la mortalidad en pacientes intubados usando nuestros datos de vigilancia es inapropiado ya que probablemente sobre estima la proporción de personas intubadas que mueren. 

Además de describir la ocurrencia y distribución de enfermedades, en epidemiología buscamos identificar factores de riesgo de enfermedad con la finalidad de definir intervenciones en salud. Para covid-19, sería muy importante identificar factores de riesgo modificables para guiar recomendaciones que disminuyan el número de infecciones y de personas con complicaciones por esta enfermedad. Un análisis hecho con los datos abiertos reportó paradójicamente, aun tomando en cuenta otras variables disponibles en la base de datos, que fumar era un factor protector de infección por SARS-CoV-2.6

¿Debemos recomendar a las personas que empiecen a fumar para disminuir su riesgo de contagiarse por SARS-CoV-2? La respuesta es no. Recordemos que el sistema de vigilancia contiene información de personas que acuden a unidades del sistema de salud con síntomas importantes de enfermedades respiratorias agudas durante la pandemia y solamente una fracción pequeña, pero creciente, de personas con covid-19 leve o asintomáticos. Por lo tanto, los análisis basados en los datos abiertos de covid-19 están restringidos, en su gran mayoría, a personas con covid-19 con síntomas, generando muchas dificultades en la interpretación de los resultados (sesgo de selección, más jerga epidemiológica).7 Al hacer estos análisis es crítico hacer explicitas las implicaciones de esta y otras limitaciones en la interpretación de los resultados y reconocer que este tipo de análisis son únicamente de naturaleza exploratoria y para la generación de hipótesis.

Para lo que los datos de vigilancia epidemiológica de covid-19 han sido de gran utilidad es para describir la progresión de la pandemia. Sabemos que es imposible identificar todos los casos de enfermedad durante una pandemia, pero manteniendo una estrategia de toma de muestras relativamente constante en el tiempo,8 los datos permiten estimar cambios en la incidencia nacional y estatal, e identificar poblaciones en riesgo. De manera consistente con lo observado en otros países, estos datos permitieron identificar el papel preponderante de los adolescentes y adultos jóvenes en la propagación de SARS-CoV-2 durante el confinamiento de marzo a mayo.9 Además, el sistema de vigilancia epidemiológica ha informado las decisiones de nuestros salubristas y personal de salud sobre la asignación de infraestructura en salud. Y quizá, de forma más importante, es una de las herramientas fundamentales para la comunicación de riesgo que busca favorecer la adherencia a las medidas de mitigación en la población.

Como se ha dicho en estas páginas, nuestro sistema de vigilancia epidemiológica no es perfecto.10 No cabe duda que sería deseable disminuir el rezago en el registro, dar prioridad a documentar cambios en la recolección y gestión de datos y actualizar la evolución de los pacientes. Sin embargo, en una circunstancia altamente dinámica hay que reconocer el trabajo del personal de salud en hospitales y en laboratorios de salud pública, y el de epidemiólogos de las jurisdicciones sanitarias de todo el país que diariamente recolectan, revisan e integran información para asegurar que los casos de personas estudiadas por covid-19 sean debidamente documentados. Tener una actualización diaria y pública de una base de datos nominal durante una pandemia es inusual en el mundo y representa un gran logro. Aún si, como es común en la generación de cualquier base de datos, el proceso no esté libre de error y haya requerido y requerirá un gran esfuerzo para su corrección.

Necesitamos mejorar el sistema de vigilancia fortaleciendo la infraestructura existente y dotándolo con suficiente personal adecuadamente capacitado para asegurar un funcionamiento óptimo. El presupuesto para vigilancia epidemiológica, uno de los pilares de la preparación y respuesta pandémica, disminuyó paulatinamente de 1 354 millones de pesos en 2009 a 533 millones de pesos en 2020.11 Un cambio positivo post pandemia debería ser el reconocimiento público de la necesidad de invertir sustancialmente en sistemas de vigilancia epidemiológica en nuestro país que permitan identificar y describir la ocurrencia de enfermedades infecciosas y crónicas.

La epidemiología es una disciplina “engañosamente sencilla”. Todos entendemos qué es una enfermedad, sabemos contar y reconocemos en el lenguaje de los epidemiólogos términos e ideas que nos son familiares. Sin embargo, ahora que la epidemiología tiene un lugar prominente en la vida de tantos mexicanos es importante defenderla recordando a otros que detrás de una aparente simplicidad, existen marcos teóricos, métodos de observación, principios metodológicos, y una práctica científica que reconoce limitaciones de lo que se puede saber.

Los datos públicos de covid-19 han generado una oportunidad para que epidemiólogos, clínicos, estadísticos y expertos trabajemos más de cerca. El uso de estos datos requiere tomarse el tiempo para entender los mecanismos de generación de estos, apegarse a métodos epidemiológicos establecidos y buscar explicaciones alternativas a nuestras observaciones. Hay que reconocer que los datos de vigilancia epidemiológica nunca podrán darnos todas las respuestas. Será necesario apoyarnos en otros diseños de estudio, fuentes de información, y perspectivas para caracterizar este fenómeno sin precedentes.

 

Martín Lajous
Investigador del Instituto Nacional de Salud Pública.

Dalia Stern
Catedrática Conacyt e investigadora del Instituto Nacional de Salud Pública.


1 Usando criterio de búsqueda COVID Mexico en título/resumen se obtuvieron 30 registros. La revisión de resúmenes dió 27 publicaciones donde se usaron los datos abiertos. Actualizado al 8/12/2020

2 Pearce N. et al., “Accurate Statistics on COVID-19 Are Essential for Policy Guidance and Decisions”, Am J Public Health. 2020 Jul; 110(7):949-951. d.

3 The COVID Resilience Ranking: The Best and Worst Places to Be in the Coronavirus Era.

4 Lipsitch M. et al., “Potential Biases in Estimating Absolute and Relative Case-Fatality Risks during Outbreaks”, PLoS Negl Trop Dis. 2015 Jul 16;9(7).

5 Ñamendys-Silva SA, G et al., “Hospital mortality in mechanically ventilated COVID-19 patients in Mexico”, Intensive Care Med. 2020;46(11):2086-2088. 

6 Giannouchos T. V. et al., “Characteristics and risk factors for COVID-19 diagnosis and adverse outcomes in Mexico: an analysis of 89,756 laboratory-confirmed COVID-19 cases” Eur Respir J. 2020 Jul 30:2002144.

7 Griffith G. J. et al., Collider bias undermines our understanding of COVID-19 disease risk and severity. Nat Commun. 2020 Nov 12;11(1):5749. doi: 10.1038/s41467-020-19478-2. PMID: 33184277; PMCID: PMC7665028.

8 Lipsitch M et al., “How to maintain surveillance for novel influenza A H1N1 when there are too many cases to count”, Lancet. 2009 Oct 3;374(9696):1209-11.

9 Stern D. et al., El creciente papel de los adolescentes mayores y los adultos jóvenes durante la epidemia de SARS-CoV-2 en México Salud Pública de México (en prensa).

10 Rafael Lozano, “Sabemos que no sabemos todo”, nexos, 1 de noviembre de 2020.

11 Reflexiones sobre la respuesta de México ande la pandemia de COVID19 y sugerencias para enfrentar los próximos retos. Nota conceptual. Noviembre, 2020. Instituto Nacional de Salud Pública.

 

5 comentarios en “Sobre el uso y mal uso de los datos abiertos de covid-19

  1. En nuestro artículo que cita en la referencia 6 [Giannouchos T. V. et al] Ud solo menciona un resultado que surge de los datos analizados (que fumar “protege” de COVID-19). Esto fue solo un detalle de nuestro análisis de riesgo dentro un estudio extenso que abarcó todas las comorbilidades asociadas a COVID-19. La baja representación de fumadores ha sido reportada también en estudios en otros países (China, Francia, Israel, EEUU). Esto no implica que “fumar protege”, expresión que no utilizamos en el artículo (de hecho enfatizamos que nuestros resultados no dben inducir al tabaquismo). Una posible hipótesis consistente con esos datos es que el factor de protección sea la interferencia de la nicotina en la bioquímica de la infección viral o en inhibir la sobre reacción del sistema inmunológico (la tormenta de citoquinas). Esta hipótesis está en vias de ser verificada en un ensayo controlado aleatorizado que se lleva a cabo en Francia.

    • Muchas gracias por el interés. Efectivamente el resultado paradójico de la relación inversa entre tabaquismo y COVID-19 es solo uno de múltiples resultados que arroja su análisis. Sin embargo, es un buen ejemplo para ilustrar el problema que se generan al hacer análisis condicionados en un factor (síntomas respiratorios) que se ve afectado por la exposición (tabaquismo) y que comparte factores de riesgo con el desenlace (COVID-19).

      A través de los años se han publicado artículos que muestran que paradójicamente la obesidad se asocia con menor mortalidad en personas con enfermedad cardiovascular, diabetes, fracturas de cadera e inclusive enfermedad de Chagas. También es conocido que los fumadores con un infarto paradójicamente tienen menor riesgo de mortalidad que los no fumadores (Gupta T et al. JAHA 2015). Estas estrategias analíticas generan una restricción a la población de análisis (i.e. poblaciones enfermas u hospitalizadas). Es probable que estas paradojas (y la observada con tabaquismo en COVID-19) se expliquen en parte por la selección de pacientes basada en un factor basal que se ve afectado por la exposición. Parece menos probable que sean el resultado de mecanismos biológicos (para una descripción más detallada de la estructura de este sesgo sugiero la revisión de la referencia 7 y de Lajous M et al “Should Patients with Chronic Disease Be Told to Gain Weight? The Obesity Paradox and Selection Bias” Am J Med 2015).

      Por esta razón, análisis de factores de riesgo para COVID-19 y sus complicaciones usando datos donde existe una selección estructural no son recomendables ya que tendrán muchas dificultades de interpretación. Será necesario recurrir a otros diseños de estudio para responder a estas preguntas.

  2. Los datos abiertos de Covid 19 parecieran una broma increíble. Al 27 de junio de 2020 que dejé de analizarlos, les ofrezco algunas de muchas perlas:
    Se registraban 1809 ingresos por Covid del 01 de enero al 27 de febrero de 2020, cuando ese último día se registró el primer caso de Covid 19 en Torreón, Coah. para todo el país.
    De esos 1809 ingresos, 219 correspondían a personas mayores de 60 años.
    De esos 1809 ingresos, 21 de ellos habían fallecido en enero y febrero de 2020. El resto permanecían sin fecha de defunción al 27 de junio de 2020.
    De los 551,053 ingresos al 27 de junio de 2020, 129 personas eran mayores de 100 años, solo 16 habían fallecido, cinco de los ingresos eran de personas de 120 años de edad y de ninguna se reportaba fallecimiento después de cuatro meses de haber ingresado.
    ¿Con esa calidad de información se pretendía analizar, interpretar el comportamiento de la pandemia y tomar decisiones?
    Ese día dejé de prestar atención en los datos abiertos, seguramente las autoridades contaban con otros datos que no deseaban publicar.

    • Hay errores como en cualquier base de datos. Estos se corrigen en la medida de los posible. Entre más usuarios de los datos será mas fácil identificarlos y corregirlos. En nuestra experiencia los datos demuestran ser utiles para lo que fueron concebidos: darle seguimiento a la pandemia.

      • Agradezco su respuesta Sr. Lajous, me recuerda la postura de este gobierno en torno a la pandemia, que descarga en el ciudadano la responsabilidad de combatirla, en lugar de aceptar su impericia y falta de voluntad por cumplir con su responsabilidad.