Projekcje
Porównaliśmy nasze szacowane wskaźniki poprawy częstości występowania EBF w ciągu ostatnich 18 lat z ulepszeniami potrzebnymi w latach 2017 i 2025 do spełnienia WHO GNT (50% częstości EBF)6 poprzez wykonanie prostego obliczenia projekcji. Po pierwsze, obliczyliśmy log-dodatni AROC w każdej komórce siatki (i) poprzez logit-transformację naszej 18-letniej średniej prewalencji, ^l}_{i,{rm{year}}} i obliczenie AROC między każdą parą sąsiednich lat, począwszy od 2001 roku:
Obliczyliśmy następnie ważony AROC dla każdego piksela, biorąc średnią ważoną z wszystkich lat, gdzie bardziej aktualne AROC miały większą wagę w średniej. Wagi zdefiniowaliśmy następująco:
gdzie γ może być wybrane w celu nadania różnej wagi w poszczególnych latach. Dla tego zestawu projekcji, wybraliśmy γ = 1, co skutkuje liniowym schematem ważenia, który został przetestowany i sprawdzony do użytku w projekcji Celu Zrównoważonego Rozwoju związanego ze zdrowiem)56. Dla każdej komórki siatki obliczaliśmy ważone AROC, które wynosiło {w_{{rm}}nolimit{year}}}}{rm{it{AROC}}}_{i,{{rm{year}}}^l}}$$
Ostatnio obliczyliśmy prognozy przez zastosowanie ważonego AROC w każdej komórce siatki do naszej średniej prewalencji 2017:
Tego samego procesu użyliśmy do projekcji AROC na poziomie krajowym i administracyjnym. Ten schemat projekcji był analogiczny do metod stosowanych w GBD 2017 pomiaru postępu i przewidywanego osiągnięcia Celów Zrównoważonego Rozwoju związanych ze zdrowiem56.
Ograniczenia
Dostępność danych
Ta praca powinna być oceniana w pełnym uznaniu danych i ograniczeń metodologicznych. Co najważniejsze, dokładność naszych szacunków jest krytycznie zależna od ilości i jakości danych bazowych. Dostępność odpowiednich danych różni się zarówno przestrzennie i czasowo w całej Afryce (Extended Data Fig. 4), a brak odpowiednich danych jest jednym z głównych źródeł niepewności wokół naszych szacunków (jak widać na Rys. 1f). Do celów niniejszej analizy stworzyliśmy dużą bazę danych dotyczących rozpowszechnienia EBF w różnych lokalizacjach geograficznych; niemniej jednak nadal istnieją istotne luki w pokryciu danych – zarówno przestrzenne, jak i czasowe. Więcej danych lokalnych jest niezbędnych do monitorowania wyników zdrowotnych i kierowania wysiłkami na rzecz poprawy jakości, a także do zwiększenia pewności naszych wyników. Zbieranie lokalnych danych ze wszystkich społeczności każdego roku byłoby zadaniem nie do pokonania dla większości krajów; to badanie pomaga w wypełnieniu obecnej luki w wiedzy poprzez tworzenie szacunków dla obszarów bez gromadzenia danych w oparciu o wyuczone wzorce z dobrze zbadanych obszarów, przy użyciu tych samych metod szacowania dla wszystkich obszarów w celu uzyskania porównywalnych wyników w różnych społecznościach.
Dokładność danych
W dodatku istnieje kilka czynników związanych z jakością danych, które powinny być uznane. Dane w naszych analizach uzyskano od opiekunów niemowląt w dowolnym punkcie czasowym między urodzeniem a 6 miesiącem życia. Chociaż status EBF niemowlęcia był oparty na jednym punkcie czasowym (24 godziny poprzedzające wywiad ankietowy), który jest znany z przeszacowania praktyki EBF dla pełnego okresu 6 miesięcy, ponieważ niemowlęta mogą być karmione innymi pokarmami i płynami zarówno przed jak i po badaniu, takie oszacowanie jest standardową praktyką57,58. Zgodnie ze standardowym podejściem do szacowania EBF opartym na międzynarodowych wytycznych57,58, odsetek niemowląt karmionych wyłącznie piersią przez pełne 6 miesięcy jest obliczany poprzez oszacowanie częstości występowania EBF dla wszystkich dzieci poniżej 6 miesiąca życia (choć wiadomo, że EBF spada wraz z wiekiem)57. Ze względu na zakres wiekowy (niemowlęta w wieku od 0 do 5 miesięcy) istotny dla celu oszacowania rozpowszechnienia EBF, nasze wielkości prób są stosunkowo mniejsze niż poprzednie wysiłki w zakresie mapowania lokalnych szacunków dla warunków zdrowotnych, wyników i wskaźników społeczno-ekonomicznych12,13,41,42, co dodatkowo przyczynia się do stosunkowo dużego stopnia niepewności związanego z naszymi szacunkami.
Informacje o lokalizacji związane z danymi zebranymi dla tych analiz są obarczone pewnym błędem. Aby chronić poufność respondentów, większość badań, które zbierają współrzędne GPS, wykonuje pewien rodzaj losowego przesunięcia tych współrzędnych przed udostępnieniem danych do analiz wtórnych. Na przykład współrzędne GPS dla danych DHS są przesunięte o maksymalnie 2 km dla klastrów miejskich, do 5 km dla większości klastrów wiejskich oraz do 10 km w losowo wybranym 1% klastrów wiejskich59. Co więcej, dane związane z wielokątami, a nie współrzędnymi GPS, były ponownie próbkowane, tak aby mogły być włączone do modelu geostatystycznego, ale proces ten zasadniczo zakłada, że prewalencja EBF jest stała w obrębie wielokąta. Badania nad skalowalnymi metodami lepszej integracji danych poligonowych w modelach geostatystycznych podobnych do tych użytych w tej analizie są obecnie w toku.
Ograniczenia modelowania
W odniesieniu do strategii modelowania, podstawowym ograniczeniem jest trudność w ocenie wydajności modelu na poziomie komórki siatki. Użyliśmy walidacji krzyżowej do oceny wydajności modelu, ale ze względu na znaczny wpływ błędu próbkowania na szacunki uzyskane z pojedynczych klastrów badań, konieczne było zagregowanie zarówno danych, jak i przewidywań przy ocenie błędu. Dodatkowo, chociaż staraliśmy się propagować niepewność z różnych źródeł poprzez różne etapy modelowania, istnieją pewne źródła niepewności, które nie zostały propagowane. W szczególności, nie było obliczeniowo wykonalne propagowanie niepewności z podmodeli w stosie poprzez model geostatystyczny. Podobnie, chociaż raster populacji WorldPop również składa się z szacunków związanych z pewną niepewnością, niepewność ta jest trudna do określenia ilościowego i nie jest obecnie zgłaszana, a zatem nie byliśmy w stanie propagować tej niepewności do naszych szacunków częstości występowania EBF dla podziałów administracyjnych, które zostały utworzone przy użyciu ważonych populacyjnie średnich szacunków komórek siatki.
Pasowanie modeli przeprowadzono przy użyciu zintegrowanego zagnieżdżonego przybliżenia Laplace’a do rozkładu potomnego, jak zaimplementowano w pakiecie R-INLA49. Przewidywanie na podstawie dopasowanych modeli przeprowadzono następnie przy użyciu funkcji inla.posterior.sample(), która generuje próbki z przybliżonego rozkładu potomnego dopasowanego modelu. Zarówno dopasowanie modelu, jak i predykcja wymagają zatem przybliżeń, a te przybliżenia mogą wprowadzać błąd. Chociaż trudno jest ocenić wpływ tych przybliżeń w tym konkretnym przypadku użycia, nasze analizy walidacyjne wykazały, że nasz ostateczny model ma niską tendencyjność i dobre pokrycie 95% przedziałów predykcji, co daje pewną pewność, że zastosowana metoda przybliżania, jak również inne potencjalne źródła błędu, nie powodują znacznej tendencyjności lub słabo opisanej niepewności w naszych zgłoszonych szacunkach.
Co więcej, nasze metody projekcji pochodzą z poprzednich przestrzenno-czasowych trendów historycznych i opierają się na założeniu, że ostatnie trendy będą kontynuowane; dlatego nie przewidujemy podstawowych czynników (takich jak rosnąca urbanizacja lub zmiany w populacji)60.
Reporting Summary
Dalsze informacje na temat projektu badań są dostępne w Nature Research Reporting Summary powiązanym z tym artykułem.