|
|
|
|
Vision
et perception du monde Les
recherches sur la vision sont peut-être la branche la plus «scientifique» (au
sens étroit) des sciences cognitives. C’est aussi celle dans laquelle les
neurosciences jouent le plus grand rôle. Le second fait n’explique qu’en
partie le premier: la vision présente par rapport à d’autres modalités
cognitives des particularités qui la rendent plus accessible à l’enquête
scientifique. Elle est aussi l’objet d’une fascination ancienne, et son étude
bénéficie d’une avance prise au cours des siècles, tout particulièrement
depuis une centaine d’années. Ce
qui distingue la vision, c’est d’abord le caractère fortement objectif et
reproductible de ses manifestations. Les illusions visuelles elles-mêmes
comptent parmi les phénomènes les plus robustes du monde naturel. Ces propriétés
sont rapportées aujourd’hui au caractère modulaire du système visuel. Fonctionnant de manière absolument
automatique (il est impossible de ne pas voir ce qu’on a sous les yeux, même s’il arrive qu’on ne le remarque
pas), prodigieusement sûr et rapide, ce système est dans une grande mesure isolé
des autres systèmes cognitifs, qui lui transmettent peu d’informations, sinon
aux stades ultimes de l’élaboration des images. En particulier, nos croyances
et nos attentes affectent rarement notre perception de l’environnement: nous
voyons le tigre s’élancer sur nous, si improbable et importune que sa présence
nous paraisse place de l’Opéra, et devant la cage vide du zoo nous écarquillons
nos yeux en vain, si probable et espérée qu’elle soit. Une
deuxième particularité de la vision est de se prêter à des séparations
nettes, sur le plan fonctionnel comme sur celui de l’analyse. Il est facile de
distinguer, par exemple, la perception des couleurs, celle des formes, celle du
relief et de la profondeur, celle des dimensions relatives, celle du mouvement;
les défaillances sélectives, permanentes ou occasionnelles, nous aident à
penser de telles distinctions. La cécité elle-même, dans la variété de ses
formes et de ses étiologies, nous renseigne, paradoxalement, sur les
composantes de la vision. De même, les niveaux d’analyse sont assez
facilement discernables, de la biochimie des cellules photosensibles à
l’optique physique, en passant par la neuroanatomie, la neurophysiologie du
cortex visuel, les problèmes topologiques de la transformation d’une image rétinienne
bidimensionnelle en un percept tridimensionnel, etc. Un
troisième privilège de la vision est d’être présente dans une grande variété
d’organismes autres que l’homme adulte, du nourrisson aux chats, aux oiseaux
et aux poissons, chez lesquels elle prend des formes variées, et de s’y
laisser interroger, du moins jusqu’à un certain point. Enfin,
les aires visuelles occupent chez les Primates un bon tiers du cortex, ce qui
fait de la vision la fonction cognitive majeure pour les neurosciences, et leur
sujet favori: ils lui consacrent plus d’efforts qu’à tout autre. Pourtant,
elle demeure profondément mystérieuse, et le contraste entre l’abondance
d’informations sûres dont nous disposons sur ses mécanismes et la perplexité
dans laquelle nous plongent ses énigmes est peut-être la plus frappante de ses
singularités. Nous
mentionnerons seulement quelques-uns des problèmes qui retiennent l’attention
des chercheurs, et semblent exiger une fois de plus la collaboration de
plusieurs disciplines. Si
l’on considère d’abord les images que nous avons conscience de percevoir,
nous constatons qu’elles sont stables et dépourvues de discontinuité. Or
l’examen des mouvements oculaires dans l’orbite révèle l’existence de
saccades régulières (se produisant deux à cinq fois par seconde),
d’amplitude non négligeable (entre 4H
et 150),
rapides (600/s).
À cela s’ajoutent les variations de l’image rétinienne lorsque nous nous déplaçons
tout en maintenant notre regard sur un objet fixé. Comment expliquer que
l’image perçue ne pivote ni ne varie au cours de ces mouvements? De même, la
«tache aveugle» correspondant à l’implantation dans la rétine du nerf
oculaire, dont nous savons qu’elle provoque un «trou» dans l’image rétinienne,
n’a pas d’homologue perceptif. De manière générale, tout un ensemble de mécanismes
«correctifs» semblent compenser les diverses imperfections du système optique
que constitue l’œil. Mais quel écart s’agit-il de corriger? Quel sens
donner à la notion d’une perception fidèle : à quoi le serait-elle? Autant de questions que posera le
philosophe avec non moins de curiosité que le neurophysiologiste et le
psychologue. La
reconnaissance invariante des formes donne naissance à une seconde série de
questions. Comment se fait-il que nous soyons capables de reconnaître un même
objet sous des angles, à des distances ou dans des contextes extrêmement
variables, sans être conscients (sauf effort particulier) que la sensation est
chaque fois différente? De même, comment classons-nous des objets très différents,
tels que des graphies différentes de la même lettre de l’alphabet, dans une
même catégorie, sans avoir conscience, ici encore, de devoir faire l’effort
d’assimiler une forme à une autre? Qu’il ne s’agisse pas là de problèmes
imaginaires est attesté par le fait que trente années de recherches intensives
en vision artificielle n’en sont pas venues à bout. Avec
la question de la segmentation d’une image même modérément complexe, nous
abordons les processus visuels «de haut niveau». C’est là qu’apparaît
pleinement la notion de représentation cognitive des signaux visuels, après
une première phase de traitement par les processus «de bas niveau». (La
question de l’ordre dans lequel les différents processus se déroulent, et de
la manière éventuelle dont ils coopèrent, se pose également; il n’est pas
nécessaire d’en préjuger ici pour formuler notre troisième problème.)
Comment le système visuel s’y prend-il pour constituer, à partir des pixels , ces «éléments d’image» définis par une intensité et un
couple de coordonnées dans un repère bidimensionnel associé à l’image rétinienne,
des formes connexes, à les situer les unes par rapport aux autres, à
distinguer le fond sans en faire une forme de plus? Comment passer, pour le dire
brièvement, d’une représentation locale à une représentation globale de
l’image? Immense problème qui, sans être complètement résolu, a fait néanmoins
l’objet d’avancées remarquables, notamment grâce aux efforts d’un
chercheur particulièrement respecté dans tout le domaine des sciences
cognitives, David Marr (1945-1980). Marr
a d’abord accompli un progrès méthodologique en considérant qu’il
s’agit d’un processus de traitement d’informations symboliques, et en
insistant sur la nécessité de le formuler d’abord au niveau formel, avant de
partir à la recherche d’un algorithme abstrait de traitement, puis d’une réalisation
de cet algorithme dans le tissu nerveux. Cette méthode s’étend, selon lui,
à tout phénomène cognitif complexe, et la leçon a été entendue bien au-delà
du domaine de la vision. En second lieu, Marr a montré comment le système
visuel pouvait extraire certaines primitives, tels les bords d’une forme, et les combiner en vue de formuler des hypothèses
sur l’étendue et la position respective des objets dans l’image, notamment
en profondeur. Ce processus se déroule presque entièrement au niveau
symbolique, et implique l’élaboration d’une suite de représentations
porteuses d’informations particulières. Il met en œuvre des principes
heuristiques d’allure kantienne, hypothèses générales sur l’impénétrabilité
des objets solides ou la continuité des bords, se démarquant ainsi des
approches empiristes qui ont longtemps dominé. Sans être à l’abri des
critiques, les thèses de Marr ont néanmoins profondément marqué le domaine,
et aux yeux d’une majorité de chercheurs indiquent la voie à suivre.
Cependant, les tenants du point de vue «écologique» de J. J. Gibson
mettent en cause l’approche symbolique cognitiviste de Marr; il en est de même,
aujourd’hui, de certains connexionnistes, malgré le caractère connexionniste
des mécanismes proposés par Marr pour prendre en compte le caractère
massivement parallèle, à certains stades, du traitement de l’information
visuelle. Notre
dernier exemple est celui de la compréhension des scènes. Le problème est
maintenant de dégager d’une image supposée convenablement segmentée une
hypothèse plausible sur la situation ou l’événement qu’elle (re)présente.
(Ici non plus il n’est pas en fait indispensable de supposer que ce processus
d’interprétation se place après le processus de segmentation, ou même
certains processus de bas niveau.) Comme la pragmatique dans le cas de la
communication linguistique, cette étape mêle les fonctions proprement
visuelles et les fonctions cognitives générales. Elle fait appel en effet à
de nombreuses informations sur l’organisation de l’environnement, sur la
manière dont les événements se regroupent, selon des probabilités variables,
sur les enchaînements causaux possibles et impossibles, sur les croyances et
les attentes des êtres humains, etc. Bref, il n’est aucune compétence
cognitive qui ne puisse à tout moment être mise à contribution dans ce
travail d’interprétation. Tout, jusqu’à la variété des solutions
acceptables et la possibilité d’erreurs, fait de ce travail une de ces tâches
cognitives centrales que Fodor assimile à la «fixation de la croyance». Or il
estime que – par
opposition aux processus modulaires (essentiellement les modalités sensorielles
et une grande partie du traitement du langage) dont, en raison de leur caractère
automatique, systématique et surtout autonome par rapport aux autres fonctions
cognitives, on peut espérer faire la théorie – les processus centraux ne seront probablement jamais
l’objet d’une science constituée. Il est vrai que les progrès, dans la
compréhension des scènes, comme dans celle des dialogues et des textes par
exemple, sont hésitants. Il a néanmoins été possible, en restreignant
fortement l’univers dont les images sont analysées (stratégie universelle
pour l’étude et la simulation des processus centraux), de proposer des mécanismes
fondés sur des schémas hiérarchisés de représentations. Comme toujours en
pareil cas, la question est de savoir dans quelle mesure ces solutions sont généralisables,
et on ne peut qu’hésiter entre l’espoir et le doute. Les
applications Les
sciences cognitives sont-elles applicables? Naturellement, et de multiples façons;
certaines sont du reste de plein droit des disciplines appliquées. La vraie
question serait donc celle des rapports entre sciences cognitives pures ou théoriques
et sciences cognitives appliquées. Renonçant à la traiter, nous nous
contenterons d’énumérer quelques-unes des principales applications, en les
classant selon les sphères d’activité auxquelles elles peuvent contribuer. Intelligence
artificielle, robotique, vision artificielle,therapeutique.. Tout
en étant dès l’origine, on l’a vu, l’une des composantes majeures du
projet des sciences cognitives, l’intelligence artificielle consiste
aujourd’hui en grande partie en une collection d’applications de ces
sciences – dans chacune des quatre grandes aires (perception, raisonnement,
langage, action), les recherches fondamentales sur l’homme ont leur pendant en
intelligence artificielle. Il arrive que les réalisations dans ce domaine ne
s’inspirent pas directement des travaux sur l’homme, ou bien que leurs
auteurs n’en aient pas conscience, ou encore que ce soient les applications
informatiques qui ont à l’inverse suscité les recherches fondamentales. (Il
y a là un problème complexe qu’on ne peut qu’effleurer; qu’on songe à
la définition qu’un Roger Schank donne de l’intelligence artificielle: la
science de l’intelligence humaine!) Il
n’empêche que dans l’ordre logique, et, malgré des exceptions, souvent
aussi dans l’ordre méthodologique, l’intelligence artificielle applique les
notions et les résultats des (autres) sciences cognitives. Mentionnons, pour la
perception, la vision artificielle et la reconnaissance des signaux acoustiques
ou de la parole; pour le raisonnement, les systèmes experts et tous les systèmes
d’aide à la décision, au diagnostic ou au contrôle, les bases de données
dites intelligentes, les jeux, etc.; pour le langage, la traduction automatique,
l’analyse automatique des textes, le traitement de texte, la classification et
l’indexation, etc.; pour l’action, la planification et la coordination
robotique... La
neuropharmacologie a d’ores et déjà obtenu des résultats spectaculaires
dans la thérapeutique palliative de certains désordres mentaux. Il est permis
de penser que les connaissances nouvelles acquises par la neurochimie et
d’autres neurosciences permettront d’affiner sensiblement ces traitements,
voire de compenser chez l’enfant un désordre métabolique et rétablir les
conditions d’un développement cognitif normal. La
neurophysiologie pathologique a dès à présent des applications cliniques,
fondées sur des progrès dans le diagnostic et la taxinomie des déficits
cognitifs. Dans des domaines tels que la rééducation des patients ayant subi
des lésions cérébrales partielles, la formation des enfants ayant des
difficultés d’apprentissage liées ou non à un handicap sensoriel, moteur,
ou cognitif, ou souffrant d’une déficience intellectuelle massive (syndromes
de Down et de Williams), de grands espoirs sont permis. Il
en est de même pour les prothèses sensorielles et motrices: l’intelligence
artificielle, l’informatique, la mécanique, la neuroanatomie et la
neurophysiologie coopèrent activement dans ce domaine, mettant à profit nos
connaissances toujours plus fines des connexions nerveuses, les techniques de
miniaturisation électronique et de micromécanique, les nouveaux matériaux,
etc. Continue .........
Please note: All above data are ©
Copyright of SOSPROCTOS Last edition of this page:11/10/05 Web Site is powered by Rollan.Net |