Proyecciones
Comparamos nuestras tasas estimadas de mejora en la prevalencia de la FEB en los últimos 18 años con las mejoras necesarias entre 2017 y 2025 para cumplir con la GNT de la OMS (50% de prevalencia de la FEB)6 realizando un simple cálculo de proyección. En primer lugar, calculamos los AROC log-aditivos en cada celda de la cuadrícula (i) mediante la transformación logit de nuestros 18 años de prevalencia media posterior, \({\it{prev}_i,{\rm{year}}^l\) y calculamos los AROC entre cada par de años adyacentes empezando por 2001:
A continuación, calculamos un AROC ponderado para cada píxel tomando una media ponderada entre los años, donde los AROC más recientes tenían más peso en la media. Definimos las ponderaciones de la siguiente manera:
Por último, calculamos las proyecciones aplicando el AROC ponderado en cada celda de la cuadrícula a nuestra prevalencia media posterior de 2017:
Utilizamos el mismo proceso para proyectar los AROC a nivel de país y administrativo. Este esquema de proyección fue análogo a los métodos utilizados en la medición del progreso y el logro proyectado de los Objetivos de Desarrollo Sostenible relacionados con la salud de GBD 201756.
Limitaciones
Disponibilidad de datos
Este trabajo debe evaluarse reconociendo plenamente las limitaciones de datos y metodológicas. Lo más importante es que la exactitud de nuestras estimaciones depende fundamentalmente de la cantidad y la calidad de los datos subyacentes. La disponibilidad de datos relevantes varía tanto espacial como temporalmente a lo largo de África (Extended Data Fig. 4), y la falta de datos relevantes es una de las principales fuentes de incertidumbre en torno a nuestras estimaciones (como se ve en la Fig. 1f). Hemos construido una gran base de datos de prevalencia de FEB geolocalizada para los fines de este análisis; no obstante, siguen existiendo importantes lagunas en la cobertura de los datos, tanto espaciales como temporales. Se necesitan más datos locales para supervisar los resultados sanitarios y orientar los esfuerzos de mejora de la calidad, así como para aumentar la certeza de nuestros resultados. La recopilación de datos locales de todas las comunidades cada año sería una tarea insuperable para la mayoría de los países; este estudio ayuda a llenar el vacío de conocimiento actual mediante la producción de estimaciones para las áreas sin recopilación de datos sobre la base de los patrones aprendidos de las áreas bien encuestadas, utilizando los mismos métodos de estimación para todas las áreas para obtener resultados comparables entre las comunidades.
Exactitud de los datos
Además, hay varios factores relacionados con la calidad de los datos que deben ser reconocidos. Los datos de nuestros análisis se obtuvieron de los cuidadores de los bebés en cualquier momento entre el nacimiento y los 6 meses de edad. Aunque el estado de la alimentación líquida del lactante se basó en un único momento (las 24 horas anteriores a la entrevista de la encuesta), que se sabe que sobreestima la práctica de la alimentación líquida durante todo el periodo de 6 meses, ya que los lactantes pueden recibir otros alimentos y líquidos antes o después de la encuesta, esta estimación es una práctica estándar57,58. Siguiendo el enfoque estándar para estimar la FEB basado en las directrices internacionales57,58 , la proporción de lactantes que son alimentados exclusivamente con leche materna durante los 6 meses completos se calcula estimando la prevalencia de la FEB para todos los niños menores de 6 meses (aunque se sabe que la FEB disminuye con la edad)57. Debido al rango de edad (bebés de 0 a 5 meses) relevante para el propósito de estimar la prevalencia de la FEB, el tamaño de nuestras muestras es relativamente más pequeño que el de los esfuerzos anteriores de mapeo de las estimaciones localizadas para las condiciones de salud, los resultados y los indicadores socioeconómicos12,13,41,42, lo que contribuye aún más al grado relativamente grande de incertidumbre asociada con nuestras estimaciones.
La información de localización asociada con los datos compilados para estos análisis está sujeta a algunos errores. Para proteger la confidencialidad de los encuestados, la mayoría de las encuestas que recogen las coordenadas del GPS realizan algún tipo de desplazamiento aleatorio en esas coordenadas antes de liberar los datos para los análisis secundarios. Por ejemplo, las coordenadas del GPS para los datos de las encuestas de demografía y salud se desplazan hasta 2 km para los grupos urbanos, hasta 5 km para la mayoría de los grupos rurales y hasta 10 km en un 1% aleatorio de los grupos rurales59. Además, los datos asociados a los polígonos en lugar de las coordenadas del GPS se remuestrearon para poder incluirlos en el modelo geoestadístico, pero este proceso asume esencialmente que la prevalencia de la FEB es constante en el polígono. Actualmente se están investigando métodos escalables para una mejor integración de los datos de los polígonos en modelos geoestadísticos similares a los utilizados en este análisis.
Limitaciones de la modelización
Con respecto a la estrategia de modelización, la principal limitación es la dificultad para evaluar el rendimiento del modelo a nivel de celda de la cuadrícula. Utilizamos la validación cruzada para evaluar el rendimiento del modelo pero, debido al impacto sustancial del error de muestreo en las estimaciones derivadas de grupos de encuestas individuales, fue necesario agregar tanto los datos como las predicciones al evaluar el error. Además, aunque hemos intentado propagar la incertidumbre de varias fuentes a través de las diferentes etapas de modelización, hay algunas fuentes de incertidumbre que no se han propagado. En particular, no fue computacionalmente factible propagar la incertidumbre de los submodelos en el apilamiento a través del modelo geoestadístico. Del mismo modo, aunque el raster de población de WorldPop también se compone de estimaciones asociadas con cierta incertidumbre, esta incertidumbre es difícil de cuantificar y no se informa actualmente, por lo que no pudimos propagar esta incertidumbre en nuestras estimaciones de la prevalencia de la FEB para las subdivisiones administrativas que se crearon utilizando los promedios ponderados de la población de las estimaciones de las celdas de la cuadrícula.
El ajuste de los modelos se llevó a cabo utilizando una aproximación integrada anidada de Laplace a la distribución posterior, como se implementa en el paquete R-INLA49. La predicción de los modelos ajustados se llevó a cabo posteriormente utilizando la función inla.posterior.sample(), que genera muestras de la posterior aproximada del modelo ajustado. Por tanto, tanto el ajuste del modelo como la predicción requieren aproximaciones, y estas aproximaciones pueden introducir errores. Aunque es difícil evaluar el impacto de estas aproximaciones en este caso de uso particular, nuestros análisis de validación encontraron que nuestro modelo final tiene un sesgo bajo y una buena cobertura de los intervalos de predicción del 95%, lo que proporciona cierta seguridad de que el método de aproximación utilizado, así como otras fuentes potenciales de error, no están dando lugar a un sesgo apreciable o a una incertidumbre mal descrita en nuestras estimaciones informadas.
Además, nuestros métodos de proyección se derivan de las tendencias históricas espacio-temporales anteriores y se basan en la suposición de que las tendencias recientes continuarán; por lo tanto, no estamos proyectando los impulsores subyacentes (como el aumento de la urbanización o los cambios en la población)60.
Resumen del informe
Puede obtenerse más información sobre el diseño de la investigación en el resumen del informe de Nature Research vinculado a este artículo.