Lidé si pozoruhodně dobře pamatují fotografie. Pro další zkoumání povahy uložených reprezentací a věrnosti lidských vzpomínek by bylo užitečné vyhodnotit vizuální podobnost podnětů prezentovaných v experimentech. Zde jsme zkoumali možné využití konvolučních neuronových sítí (CNN) jako měřítka percepční nebo reprezentační podobnosti vizuálních scén s ohledem na výzkum vizuální paměti. V experimentu 1 jsme účastníkům předložili sady devíti obrázků ze stejné kategorie scén a testovali jsme, zda jsou schopni detekovat nejvzdálenější scénu v obrazovém prostoru definovaném CNN. Experiment 2 byl vizuální variantou Deese-Roediger-McDermottova paradigmatu. Požádali jsme účastníky, aby si zapamatovali sadu fotografií ze stejné kategorie scén. Fotografie byly předem vybrány na základě jejich vzdálenosti od určitého vizuálního prototypu (definovaného jako centroid obrazového prostoru). V testu rozpoznávání jsme pozorovali vyšší míru falešných poplachů u scén bližších tomuto vizuálnímu prototypu. Naše zjištění ukazují, že podobnost měřená pomocí CNN se odráží v lidském chování: lidé mohou rozpoznat liché scény nebo se nechat zlákat k falešným poplachům podobnými podněty. Tuto metodu lze využít pro další studie týkající se vizuální paměti pro složité scény.