Projektionen
Wir verglichen unsere geschätzten Raten der Verbesserung der EBF-Prävalenz in den letzten 18 Jahren mit den Verbesserungen, die zwischen 2017 und 2025 erforderlich sind, um die GNT der WHO (50% EBF-Prävalenz)6 zu erreichen, indem wir eine einfache Projektionsberechnung durchführten. Zunächst berechneten wir den log-additiven AROC für jede Rasterzelle (i) durch Logit-Transformation der durchschnittlichen Prävalenz der letzten 18 Jahre, \({\it{prev}}_{i,{\rm{year}}}^l\), und berechneten den AROC zwischen jedem Paar benachbarter Jahre, beginnend mit 2001:
Dann berechneten wir einen gewichteten AROC für jedes Pixel, indem wir einen gewichteten Durchschnitt über die Jahre hinweg ermittelten, wobei den jüngeren AROC im Durchschnitt mehr Gewicht verliehen wurde. Die Gewichte wurden wie folgt definiert:
wobei γ so gewählt werden kann, dass die Jahre unterschiedlich stark gewichtet werden. Für diesen Satz von Projektionen haben wir γ = 1 gewählt, was zu einem linearen Gewichtungsschema führt, das für die Verwendung bei der Projektion des gesundheitsbezogenen Ziels für nachhaltige Entwicklung getestet und für gut befunden wurde)56. Für jede Gitterzelle berechneten wir dann den gewichteten AROC wie folgt:
Schließlich berechneten wir die Projektionen, indem wir die gewichtete AROC in jeder Rasterzelle auf unsere mittlere posteriore Prävalenz für 2017 anwandten:
Grenzwerte
Datenverfügbarkeit
Diese Arbeit sollte unter voller Anerkennung der Daten und methodischen Grenzen bewertet werden. Am wichtigsten ist, dass die Genauigkeit unserer Schätzungen entscheidend von der Quantität und Qualität der zugrunde liegenden Daten abhängt. Die Verfügbarkeit relevanter Daten variierte sowohl räumlich als auch zeitlich in Afrika (Erweiterte Daten, Abb. 4), und das Fehlen relevanter Daten ist eine der Hauptursachen für die Unsicherheit unserer Schätzungen (wie in Abb. 1f zu sehen). Für die Zwecke dieser Analyse haben wir eine große Datenbank mit geografisch verorteten EBF-Prävalenzdaten aufgebaut; dennoch bleiben große Lücken in der Datenerfassung – sowohl räumlich als auch zeitlich – bestehen. Es sind mehr lokale Daten erforderlich, um die Gesundheitsergebnisse zu überwachen und die Bemühungen zur Qualitätsverbesserung zu lenken sowie die Sicherheit unserer Ergebnisse zu erhöhen. Diese Studie trägt dazu bei, die derzeitige Wissenslücke zu schließen, indem sie Schätzungen für Gebiete ohne Datenerfassung erstellt, die auf gelernten Mustern aus gut erfassten Gebieten basieren, wobei für alle Gebiete dieselben Schätzmethoden angewandt werden, um vergleichbare Ergebnisse für alle Gemeinden zu erhalten.
Datengenauigkeit
Darüber hinaus gibt es mehrere Faktoren im Zusammenhang mit der Datenqualität, die berücksichtigt werden sollten. Die Daten in unseren Analysen wurden von den Betreuungspersonen der Säuglinge zu einem beliebigen Zeitpunkt zwischen der Geburt und dem Alter von 6 Monaten erhoben. Obwohl der EBF-Status eines Säuglings auf einem einzigen Zeitpunkt basierte (die 24 Stunden vor der Befragung), was bekanntermaßen die EBF-Praxis für den gesamten Sechsmonatszeitraum überschätzt, da Säuglinge entweder vor oder nach der Befragung mit anderen Nahrungsmitteln und Flüssigkeiten gefüttert werden können, ist diese Schätzung Standardpraxis57,58. Nach dem Standardansatz für die Schätzung der ausschließlichen Muttermilchernährung auf der Grundlage internationaler Richtlinien57,58 wird der Anteil der Säuglinge, die während der gesamten sechs Monate ausschließlich gestillt werden, berechnet, indem die Prävalenz der ausschließlichen Muttermilchernährung für alle Kinder unter sechs Monaten geschätzt wird (obwohl bekannt ist, dass die ausschließliche Muttermilchernährung mit dem Alter abnimmt)57. Aufgrund der Altersspanne (0 bis 5 Monate alte Säuglinge), die für den Zweck der Schätzung der EBF-Prävalenz relevant ist, sind unsere Stichprobengrößen relativ kleiner als frühere Versuche, lokalisierte Schätzungen für Gesundheitsbedingungen, Ergebnisse und sozioökonomische Indikatoren zu kartieren12,13,41,42, was weiter zu dem relativ großen Grad an Unsicherheit beiträgt, der mit unseren Schätzungen verbunden ist.
Die Standortinformationen, die mit den für diese Analysen zusammengestellten Daten verbunden sind, unterliegen einem gewissen Fehler. Um die Vertraulichkeit der Befragten zu schützen, führen die meisten Erhebungen, die GPS-Koordinaten erfassen, eine Art Zufallsverschiebung dieser Koordinaten durch, bevor die Daten für Sekundäranalysen freigegeben werden. So werden beispielsweise die GPS-Koordinaten für DHS-Daten bei städtischen Clustern um bis zu 2 km, bei den meisten ländlichen Clustern um bis zu 5 km und bei zufälligen 1% der ländlichen Cluster um bis zu 10 km verschoben59. Darüber hinaus wurden Daten, die nicht mit GPS-Koordinaten, sondern mit Polygonen verbunden waren, neu abgetastet, damit sie in das geostatistische Modell aufgenommen werden konnten, aber dieser Prozess setzt im Wesentlichen voraus, dass die EBF-Prävalenz über das Polygon hinweg konstant ist. Die Erforschung skalierbarer Methoden zur besseren Integration von Polygondaten in geostatistische Modelle, wie sie in dieser Analyse verwendet wurden, ist derzeit im Gange.
Modellierungseinschränkungen
Im Hinblick auf die Modellierungsstrategie besteht die wichtigste Einschränkung in der Schwierigkeit, die Modellleistung auf der Ebene der Gitterzellen zu bewerten. Wir haben zur Bewertung der Modellleistung die Kreuzvalidierung verwendet, aber aufgrund der erheblichen Auswirkungen des Stichprobenfehlers auf die aus einzelnen Erhebungsclustern abgeleiteten Schätzungen war es notwendig, sowohl die Daten als auch die Vorhersagen zu aggregieren, um den Fehler zu bewerten. Darüber hinaus haben wir zwar versucht, Unsicherheiten aus verschiedenen Quellen durch die verschiedenen Modellierungsphasen hindurch weiterzugeben, aber es gibt einige Unsicherheitsquellen, die nicht weitergegeben wurden. Insbesondere war es rechnerisch nicht machbar, die Unsicherheit aus den Teilmodellen beim Stacking durch das geostatistische Modell zu übertragen. Obwohl das WorldPop-Bevölkerungsraster ebenfalls aus Schätzungen besteht, die mit einer gewissen Unsicherheit verbunden sind, ist diese Unsicherheit schwer zu quantifizieren und wird derzeit nicht berichtet. Daher konnten wir diese Unsicherheit nicht in unsere Schätzungen der EBF-Prävalenz für administrative Unterteilungen einfließen lassen, die mit bevölkerungsgewichteten Durchschnitten von Rasterzellenschätzungen erstellt wurden.
Die Modellanpassung wurde mit einer integrierten verschachtelten Laplace-Näherung an die Posterior-Verteilung durchgeführt, wie sie im R-INLA-Paket49 implementiert ist. Die Vorhersage von angepassten Modellen wurde anschließend mit der Funktion inla.posterior.sample() durchgeführt, die Stichproben aus dem approximierten Posterior des angepassten Modells erzeugt. Sowohl die Modellanpassung als auch die Vorhersage erfordern also Annäherungen, und diese Annäherungen können zu Fehlern führen. Obwohl es schwierig ist, die Auswirkungen dieser Näherungen in diesem speziellen Anwendungsfall zu bewerten, haben unsere Validierungsanalysen ergeben, dass unser endgültiges Modell eine geringe Verzerrung und eine gute Abdeckung der 95 %-Vorhersageintervalle aufweist, was uns eine gewisse Sicherheit gibt, dass die verwendete Näherungsmethode sowie andere potenzielle Fehlerquellen nicht zu einer nennenswerten Verzerrung oder schlecht beschriebenen Unsicherheit in unseren gemeldeten Schätzungen führen.
Außerdem sind unsere Prognosemethoden von den früheren raum-zeitlichen historischen Trends abgeleitet und basieren auf der Annahme, dass sich die jüngsten Trends fortsetzen werden; wir projizieren also nicht die zugrunde liegenden Triebkräfte (wie z. B. die zunehmende Verstädterung oder Veränderungen in der Bevölkerung)60.
Zusammenfassung der Berichterstattung
Weitere Informationen zum Forschungsdesign finden Sie in der Nature Research Reporting Summary, die mit diesem Artikel verlinkt ist.