予測
過去18年間のEBF普及率の推定改善率を、簡単な予測計算を行ってWHO GNT(EBF普及率50%)6の達成に2017年から2025年までに必要な改善と比較しました。 まず、各グリッドセル(i)において、我々の18年間の事後平均有病率, \({it{prev}}_{i,{rm{year}}^l}) をロジット変換し、2001年から始まる隣り合う各年間のAROCを計算し、対数加法AROCを算出した。
次に、各ピクセルの加重AROCを、より最近のAROCが平均でより重みを与えられる、年全体の加重平均を取ることによって計算した。 重みは以下のように定義した:
ここで、γは年によって重みが変わるように選択することができる。 この予測セットでは、γ=1を選択し、その結果、健康関連の持続可能な開発目標の予測に使用するためにテストされ吟味された線形重み付けスキームとなった56)。 次に、任意のグリッドセルについて、加重AROCを次のように計算した:
最後に、各グリッドセルでの加重AROCを2017年の事後平均有病率に適用して予測を計算しました。
国レベルおよび行政レベルのAROCも同じプロセスで投影した。 この投影スキームは、GBD 2017の健康関連の持続可能な開発目標56の進捗と予測達成の測定で使用された方法に類似していた。
Limitations
Data availability
この仕事は、データと方法論の制限を十分に認めて評価されるべきものである。 最も重要なことは、我々の推定値の精度は、基礎となるデータの量と質に決定的に依存するということである。 関連データの利用可能性は、アフリカ全域で空間的・時間的に異なり(拡張データ図4)、関連データの欠如は、我々の推定値の不確実性の主な原因の一つである(図1fに見られるように)。 我々はこの分析のために地理的に位置づけられたEBF有病率データの大規模なデータベースを構築した。しかし、空間的にも時間的にもデータ範囲に重要なギャップが残っている。 健康上の成果をモニターし、質の向上努力を指導し、我々の結果の確実性を高めるためには、より多くの地域データが必要である。 すべての地域から毎年データを収集することは、ほとんどの国にとって乗り越えられない課題である。本研究は、よく調査された地域から学んだパターンに基づいてデータ収集のない地域の推定値を作成し、地域間で比較できるようにすべての地域で同じ推定方法を使用することによって、現在の知識のギャップを埋める一助となる。 我々の分析におけるデータは、出生から生後6ヶ月の間の任意の時点の乳児の養育者から得られたものである。 乳児のEBF状態は1つの時点(調査インタビュー前の24時間)に基づいており、調査前後に他の食物や水分を与えられる可能性があるため、6か月間のEBF実践を過大評価することが知られているが、この推定は標準的なやり方である57,58。 国際的なガイドライン57,58に基づくEBFの標準的な推定方法に従って、生後6ヶ月未満のすべての子ども(ただし、EBFは年齢とともに減少することが知られている)57のEBFの普及率を推定することによって、6ヶ月間完全母乳で育てられた子どもの比率を算出する。 EBFの有病率を推定する目的に関連する年齢範囲(0~5ヶ月の乳児)のため、我々のサンプルサイズは、健康状態、アウトカム、社会経済指標について地域別の推定値をマッピングした過去の取り組みよりも比較的小さく、さらに我々の推定値に関連する比較的大きな不確実性の程度に寄与している12、13、41、42。 回答者の秘密を守るため、GPS座標を収集するほとんどの調査では、二次分析用にデータを公開する前に、これらの座標に対して何らかのランダムな変位を行います。 例えば、DHSのデータのGPS座標は、都市部のクラスターでは最大2km、ほとんどの農村部のクラスターでは最大5km、農村部のクラスターの無作為1%では最大10kmずれている59。 さらに、GPS座標ではなくポリゴンに関連するデータは、地理統計モデルに含めることができるように再サンプリングされたが、このプロセスは本質的にEBF有病率がポリゴン上で一定であることを仮定している。
Modeling limitations
モデリング戦略に関して、主な制限はグリッドセルレベルでモデル性能を評価することが困難であることである。 我々はモデル性能を評価するためにクロスバリデーションを使用したが、単一の調査クラスタから得られた推定値に対するサンプリングエラーの大きな影響のために、エラーを評価する際にデータと予測値の両方を集約する必要があった。 さらに、我々は様々なモデル化段階を通じて様々なソースからの不確実性を伝播させようと試みたが、伝播されなかった不確実性のソースがいくつかある。 特に、積み重ねのサブモデルから地球統計学的モデルを通じて不確実性を伝播させることは、計算上実行不可能であった。 同様に、WorldPop人口ラスターもいくつかの不確実性を伴う推定値で構成されているが、この不確実性は定量化が難しく、現在報告されていないため、グリッドセル推定値の人口加重平均を用いて作成された行政区分のEBF有病率の推定値にこの不確実性を伝播させることができなかった
モデルのあてはめは、R-INLAパッケージ49で実装されている、事後分布に対する統合ネステッドラプラス近似を用いて行われた。 フィットしたモデルからの予測は、その後、フィットしたモデルの近似された事後からサンプルを生成するinla.posterior.sample()関数を使用して実施されました。 このように、モデルの適合と予測の両方が近似を必要とし、これらの近似は誤差をもたらす可能性がある。 このような近似の影響を評価することは困難ですが、私たちの検証分析では、最終モデルのバイアスは低く、95%予測区間をよくカバーしていることがわかりました。これは、他の潜在的なエラー源と同様に、使用した近似法が、私たちの報告した推定値に著しいバイアスや説明の不十分な不確実性をもたらしていないことをある程度保証しています。
さらに、我々の予測方法は、以前の時空間的な歴史的傾向から導き出され、最近の傾向が継続するという仮定に基づいている。したがって、我々は(都市化の増加や人口の変化などの)根本的なドライバーを予測していない60。
Reporting Summary
研究デザインに関するさらなる情報は、この記事とリンクしたNature Research Reporting Summaryで利用可能である
。