Menschen sind bemerkenswert gut darin, sich an Fotos zu erinnern. Um die Art der gespeicherten Repräsentationen und die Zuverlässigkeit des menschlichen Gedächtnisses weiter zu untersuchen, wäre es sinnvoll, die visuelle Ähnlichkeit der in Experimenten präsentierten Stimuli zu bewerten. In diesem Experiment untersuchten wir den möglichen Einsatz von Faltungsneuronalen Netzen (CNN) als Maß für die Wahrnehmungs- oder Darstellungsähnlichkeit von visuellen Szenen im Hinblick auf die visuelle Gedächtnisforschung. In Experiment 1 präsentierten wir den Teilnehmern Sätze von neun Bildern der gleichen Szenenkategorie und testeten, ob sie in der Lage waren, die am weitesten entfernte Szene in dem durch CNN definierten Bildraum zu erkennen. Versuch 2 war eine visuelle Variante des Deese-Roediger-McDermott-Paradigmas. Wir baten die Teilnehmer, sich eine Reihe von Fotos aus derselben Szenenkategorie zu merken. Die Fotos wurden anhand ihrer Entfernung zu einem bestimmten visuellen Prototyp (definiert als Schwerpunkt des Bildraums) vorausgewählt. Im Erkennungstest beobachteten wir höhere Fehlalarmraten für Szenen, die näher an diesem visuellen Prototyp lagen. Unsere Ergebnisse zeigen, dass sich die von CNN gemessene Ähnlichkeit im menschlichen Verhalten widerspiegelt: Menschen können ungerade Szenen erkennen oder durch ähnliche Stimuli zu Fehlalarmen verleitet werden. Diese Methode kann für weitere Studien zum visuellen Gedächtnis für komplexe Szenen verwendet werden.