Le réflexe d’orientation (RO) est une réponse complexe de l’organisme à un stimulus nouveau. Il a été découvert par Ivan Pavlov ( 1960) comme une interruption de l’activité en cours par la présentation d’un stimulus inattendu (inhibition externe). Cette inhibition de l’activité en cours, accompagnée de manifestations somatiques, végétatives, électroencéphalographiques, humorales et sensorielles, a été appelée le « réflexe du quoi ». Le RO est un ensemble de composantes contribuant à optimiser les conditions de perception du stimulus. Une séquence de RO dirigée vers de nouveaux aspects de l’environnement constitue un comportement exploratoire. Les composantes somatiques du RO sont représentées par les mouvements de ciblage des yeux et de la tête, le dressage des oreilles et le reniflement. La vasoconstriction des vaisseaux périphériques et la vasodilatation des vaisseaux de la tête, la décélération du rythme cardiaque et la réponse galvanique de la peau (SGR) constituent des composantes végétatives de la RO. La tomographie par émission de positons a démontré une augmentation de l’apport sanguin dans différentes zones du cerveau lors de la stimulation sensorielle. La manifestation électroencéphalographique de la RO est caractérisée par un décalage du potentiel permanent négatif qui correspond à une transition de l’activité cérébrale à ondes lentes vers des oscillations à haute fréquence, ce qui démontre une augmentation du niveau d’éveil (Lindsley, 1961). Les composantes humorales du RO sont représentées par la (-endorphine et l’acétylcholine libérées dans les tissus cérébraux. Les composantes sensorielles du RO s’expriment par un abaissement des seuils sensoriels et une augmentation de la fréquence de fusion.
La présentation répétée d’un stimulus entraîne une diminution progressive des composantes du RO, appelée habituation. Le processus d’habituation est sélectif par rapport au stimulus. Cette sélectivité peut être démontrée en ce qui concerne les caractéristiques élémentaires (intensité, fréquence, couleur, emplacement, durée) ainsi que les aspects complexes des stimuli (forme, accord, structure hétéromodale). L’habituation de la RO est également sémantiquement sélective, ce qui indique un haut niveau d’abstraction dans le contrôle de la RO. Dans le processus d’habituation de la RO, un modèle neuronal du stimulus présenté est élaboré dans le cerveau. Toute modification des paramètres du stimulus par rapport au modèle neuronal établi entraîne une élicitation de la RO. Après une réponse à un stimulus nouveau, on voit le RO se rétablir à un stimulus standard, un phénomène appelé déshabituation. La RO est provoquée par un signal d’inadéquation résultant de la comparaison du stimulus présenté avec le modèle neuronal établi. Si le stimulus coïncide avec le modèle neuronal, aucun RO n’est généré. Le modèle neuronal peut être considéré comme un filtre multidimensionnel, auto-ajustable, façonné par un stimulus présenté à plusieurs reprises. L’ampleur du RO dépend du degré de non-coïncidence du stimulus avec la forme du filtre multidimensionnel. En fonction du degré d’étalement de l’excitation, on distingue des formes locales et généralisées de RO. La durée courte et longue de l’excitation constitue une base pour la séparation des formes phasiques et toniques des RO. Dans le processus d’habituation, les formes toniques et généralisées des RO se transforment en formes phasiques et locales (Sokolov, 1963).
L’habituation des RO peut être étudiée à l’aide de potentiels liés aux événements (ERPs) représentés par une séquence d’ondes cérébrales positives (P1, P2, P3) et négatives (N1, N2) suscitées par l’apparition du stimulus.
L’isolement par ordinateur des ERP séparés évoqués par des stimuli rares démontre une habituation partielle du vertex N1 qui est parallèle à l’habituation du SGR. Un nouveau stimulus entraîne une augmentation de N1 et l’évocation du SGR. Ainsi, le stimulus qui s’écarte du modèle neuronal déclenche une négativité non spécifique à la modalité qui recouvre la partie stable de N1 (Verbaten, 1988). Les stimuli déviants qui se succèdent à intervalles courts parmi les stimuli standard génèrent une négativité d’inadéquation spécifique à la modalité qui chevauche les composantes N1-P2 (Näätänen, 1990). La RO évoquée par des stimuli non signalés est appelée RO involontaire. Elle diffère de la RO évoquée par des stimuli de signal, qui est appelée RO volontaire (Maltzman, 1985). Le RO habitué à un stimulus non signal est récupéré sous l’influence d’une instruction verbale annonçant que le stimulus est une cible de la réponse. Une telle amélioration d’un OR due à une instruction verbale fait défaut chez les patients présentant des lésions du lobe frontal, alors que leurs OR aux stimuli non signalés restent intacts (Luria, 1973).
L’instruction verbale actualise une trace mnésique du stimulus cible. Les stimuli présentés sont mis en correspondance avec la trace mnésique. Le signal de correspondance est évident dans les ERP cérébraux comme une négativité de traitement chevauchant N1-N2. La négativité de traitement est d’autant plus grande que le stimulus correspond étroitement à la trace mnésique, qui est activée par les instructions verbales (Näätänen, 1990). Un renforcement similaire de la RO peut être observé dans le processus d’élaboration des réflexes conditionnés. Le stimulus non signalétique n’évoquant pas de RO après l’habituation produit à nouveau un RO après son renforcement. Pendant la stabilisation du réflexe conditionné, le RO s’éteint progressivement, mais plus lentement qu’en réponse à un stimulus non-signal. Lorsqu’un nouveau stimulus différentiel non renforcé est introduit dans la procédure expérimentale, le RO est rétabli. Plus la différenciation des signaux est difficile, plus le RO est important. Ainsi, l’ampleur et la stabilité des RO dépendent de la nouveauté, de l’importance et de la difficulté de la tâche. Les RO involontaires et volontaires peuvent être intégrés dans un processus attentionnel commun : Un nouveau stimulus non signalant déclenchant une RO involontaire suivie d’une RO volontaire constitue une attention soutenue.
La RO a sa propre valeur de renforcement et peut être utilisée comme renforcement dans l’élaboration de RO conditionnées. La (-endorphine libérée par la présentation d’un stimulus nouveau joue un rôle de renforcement positif dans une recherche de nouveauté. La RO peut contribuer en tant que pulsion exploratoire dans la sélection de nouvelles combinaisons de traces mnésiques lors d’une activité créative.
La RO au niveau neuronal est représentée par plusieurs populations de cellules. Les plus importantes sont les détecteurs de nouveauté, représentés par des cellules hippocampiques pyramidales caractérisées par des champs réceptifs universellement étendus. Activées par de nouveaux stimuli, ces cellules font preuve d’une habituation sélective aux stimuli qui correspond à l’habituation de la RO au niveau macro. Tout changement de stimulus d’entrée entraîne une nouvelle activation de ces cellules. Ainsi, un modèle neuronal multidimensionnel d’un stimulus est formé au niveau d’un seul neurone pyramidal de l’hippocampe. La sélectivité du modèle neuronal est déterminée par des détecteurs de caractéristiques néocorticales spécifiques qui extraient en parallèle différentes propriétés du signal d’entrée. Les détecteurs de caractéristiques caractérisés par des réponses stables convergent vers les détecteurs de nouveauté par le biais de synapses plastiques (modifiables). La plasticité des synapses sur les détecteurs de nouveauté dépend des cellules granulaires dentées de l’hippocampe. Un ensemble d’excitations générées dans les détecteurs de caractéristiques sélectives atteint les cellules pyramidales et dentées en parallèle. Les cellules dentées ont des synapses sur les cellules pyramidales qui contrôlent le processus d’habituation. Les synapses des détecteurs de caractéristiques constituent une carte de caractéristiques sur un seul détecteur de nouveauté.
Le modèle neuronal est représenté sur une telle carte de caractéristiques par un motif spécifique de synapses déprimées par des présentations répétées de stimulus. Les signaux de sortie des détecteurs de nouveauté sont transmis aux neurones activateurs de la formation réticulaire du tronc cérébral, générant une réaction d’éveil. Le reste des neurones pyramidaux de l’hippocampe sont des détecteurs de similitude caractérisés par un tir de fond. Un nouveau stimulus entraîne une inhibition de leur stimulation. Cette réaction inhibitrice est habituée par la présentation répétée du stimulus. La réponse inhibitrice est évoquée à nouveau par tout changement de stimulus. Le taux d’excitation maximal est observé dans les neurones de similitude dans un environnement familier. Les signaux de sortie des détecteurs de similitude sont dirigés vers l’inactivation des neurones de la formation réticulaire, induisant la somnolence et le sommeil. L’habituation sélective des réponses des cellules pyramidales est basée sur la potentialisation des synapses des cellules dentées sur les neurones pyramidaux. Sous l’effet de cette potentialisation des synapses des cellules dentées, les cellules pyramidales cessent de répondre aux stimuli afférents. L’injection d’anticorps contre les cellules granuleuses de l’hippocampe entraîne l’élimination de l’habituation des cellules pyramidales (Vinogradova, 1970).
Tels sont les mécanismes neuronaux de l’habituation OR involontaire. Les mécanismes neuronaux de la RO volontaire sont plus complexes (voir figure 1). Les stimuli analysés par les détecteurs de caractéristiques sont enregistrés par les unités de mémoire du cortex d’association. L’instruction verbale, par l’intermédiaire d’unités sémantiques avec la participation des mécanismes du lobe frontal, sélectionne un ensemble d’unités de mémoire comme modèle. Le signal de correspondance généré par les unités de mémoire du modèle est enregistré comme négativité de traitement. Le signal de concordance est adressé aux détecteurs de nouveauté, ce qui entraîne un renforcement du RO aux stimuli significatifs. Grâce aux détecteurs de nouveauté et à la sensibilisation des unités d’activation, le nouveau stimulus entraîne une excitation électroencéphalographique corrélée à la sensibilisation des détecteurs de caractéristiques et à l’inhibition externe de l’activité en cours au niveau des neurones de commande. La présentation répétée d’un stimulus met en route les neurones de similitude qui, avec la participation des unités inactivatrices, induisent un abaissement du niveau d’éveil, qui s’exprime par la somnolence et le sommeil.
Bibliographie
Lindsley, D. B. (1961). Le système activateur réticulaire et l’intégration perceptive. Dans D. E. Sheer, éd., La stimulation électrique du cerveau. Austin : University of Texas Press.
Luria, A. R. (1973). Les lobes frontaux et la régulation du comportement. Dans K. H. Pribram et A. R. Luria, eds, Psychophysiology of the frontal lobes. New York : Academic Press.
Maltzman, I. (1985). Quelques caractéristiques des réflexes d’orientation. Psychiatry 2, 913-916.
Näätänen, R. (1990). Le rôle de l’attention dans le traitement de l’information auditive comme révélé par les potentiels liés aux événements et d’autres mesures cérébrales de la fonction cognitive. Behavioral and Brain Sciences 13, 201-288.
Pavlov, I. P. (1927 ; réimpression 1960). Réflexes conditionnés : Une enquête sur l’activité physiologique du cortex cérébral, trans. et éd. G. V. Anrep. New York : Dover.
Sokolov, E. N. (1963). Perception et réflexe conditionné. Oxford : Pergamon Press.
— (1975). Les mécanismes neuronaux du réflexe d’orientation. Dans E. N. Sokolov et O. S. Vinogradova, eds, Neuronal mechanisms of the orienting reflex. Hillsdale, NJ : Erlbaum.
Verbaten, M. N. (1988). Un modèle pour la réponse d’orientation et son habituation. Psychophysiologie 25, 487-488.
Vinogradova, O. S. (1970). L’enregistrement de l’information et le système limbique. Dans G. Horn et R. Hind, eds, Short-term changes in neuronal activity and behavior. Cambridge, UK : Cambridge University Press.
E. N.Sokolov