人は写真を記憶することが驚くほど上手である。 記憶された表象の性質や人の記憶の忠実度をさらに調べるためには、実験で提示された刺激の視覚的類似度を評価することが有用である。 ここでは、視覚的記憶研究に関して、視覚的シーンの知覚的または表現的類似性の尺度として畳み込みニューラルネットワーク(CNN)を用いる可能性を検討した。 実験1では、同じシーンカテゴリから9枚の画像セットを被験者に提示し、CNNで定義された画像空間において最も遠いシーンを検出できるかどうかをテストした。 実験2は、Deese-Roediger-McDermottパラダイムを視覚的に変化させたものである。 実験2は、Deese-Roediger-McDermottパラダイムを視覚的に変形したもので、同じシーンカテゴリに属する一連の写真を記憶してもらった。 このとき、写真は特定の視覚的プロトタイプ(画像空間のセントロイドとして定義)への距離に基づいて事前に選択された。 認識テストでは、この視覚的プロトタイプに近いシーンほど誤認識率が高いことが観察された。 この結果は、CNNによって測定された類似性が人間の行動に反映されることを示している。つまり、人は奇妙なシーンを検出したり、類似した刺激で誤報に誘われたりすることがあるのである。 この方法は、複雑な情景に対する視覚的記憶に関するさらなる研究に利用できる。