Az emberek figyelemre méltóan jól emlékeznek a fényképekre. A tárolt reprezentációk természetének és az emberi emlékezet hűségének további vizsgálatához hasznos lenne a kísérletekben bemutatott ingerek vizuális hasonlóságának értékelése. Itt a vizuális memóriakutatás szempontjából vizsgáltuk a konvolúciós neurális hálózatok (CNN) lehetséges használatát a vizuális jelenetek perceptuális vagy reprezentációs hasonlóságának mérésére. Az 1. kísérletben a résztvevőknek kilenc képből álló, azonos jelenetkategóriába tartozó képsorozatokat mutattunk be, és azt vizsgáltuk, hogy képesek-e felismerni a CNN által meghatározott képtérben a legtávolabbi jelenetet. A 2. kísérlet a Deese-Roediger-McDermott paradigma vizuális változata volt. Arra kértük a résztvevőket, hogy azonos jelenetkategóriából származó fényképek egy sorozatára emlékezzenek. A fényképeket előre kiválasztottuk egy adott vizuális prototípustól való távolságuk alapján (amelyet a képtér centroidjaként definiáltunk). A felismerési tesztben magasabb hamis riasztási arányt figyeltünk meg az ehhez a vizuális prototípushoz közelebbi jelenetek esetében. Eredményeink azt mutatják, hogy a CNN által mért hasonlóság tükröződik az emberi viselkedésben: az emberek képesek felismerni a páratlan jeleneteket, vagy hasonló ingerekkel téves riasztásra csábítani őket. Ez a módszer felhasználható az összetett jelenetek vizuális memóriájával kapcsolatos további vizsgálatokhoz.