|
|
|
|
Le
connexionnisme S’il
se distingue du cognitivisme et sur certains points s’y oppose, le
connexionnisme n’est pas quant à lui une philosophie de la cognition – du
moins, ce n’est pas ce qu’il est d’abord. Il se présente en effet comme
un ensemble de méthodes de modélisation et de simulation de toute une variété
de processus cognitifs; et c’est en cherchant à dégager les traits communs
à ces méthodes, et les avantages qu’elles présentent sur les méthodes
classiques, que les connexionnistes ont commencé à élaborer une doctrine. À
cet égard, leur parcours n’est pas sans rappeler celui de l’intelligence
artificielle. Partie d’un outil (l’ordinateur) et de quelques idées très générales,
elle entreprit d’écrire des programmes simulant des tâches telles que le jeu
d’échecs et la résolution de problèmes de géométrie ou de calcul
propositionnel; puis, pariant que ces premières tentatives étaient autant de
premiers pas vers une solution générale, elle voulut formuler la conception de
l’intelligence, ou de la cognition, qui s’en dégageait et lui paraissait
devoir être confirmée. Les psychologues, les linguistes, les philosophes se
mirent alors de la partie, élargissant, complétant et précisant la théorie
– ainsi naquit le cognitivisme. Avec
un décalage d’une quinzaine d’années, le connexionnisme, renouant avec la
première cybernétique et certains de ses prolongements (principalement le célèbre
perceptron de Frank Rosenblatt), part d’un outil (le réseau de neurones
formels), entreprend de simuler des fonctions telles que la classification de
formes, la mémoire associative ou la prononciation de l’anglais; puis,
estimant, non sans audace, que ses premiers succès annoncent un progrès décisif,
part à la recherche de ses fondements. Cette fois, cependant, un milieu
scientifique constitué est en mesure de prendre la relève, ce qui explique la
«contagion» rapide des idées connexionnistes. Avant
de
présenter
rapidement
le connexionnisme, précisons qu’il existe, au sein de ce courant, plusieurs
écoles qui diffèrent autant par leurs options théoriques que par les mécanismes
particuliers auxquels ils attribuent un rôle privilégié dans l’explication
ou la simulation des phénomènes. Historiquement, le connexionnisme se définit,
on l’a vu, par la machine, fonctionnellement décrite, dont il conjecture
qu’elle est capable d’intelligence ou de cognition: cette machine, le réseau
de neurones formels (ou réseau neuromimétique , neural net en anglais), est au connexionnisme ce que la machine de von
Neumann est au cognitivisme et à l’intelligence artificielle traditionnelle.
S’il est vrai qu’il existe de nombreuses variantes de réseau (alors que la
machine de von Neumann est essentiellement unique), on peut cependant donner une
sorte de «portrait-robot» du réseau connexionniste. Il
s’agit d’un ensemble d’automates
très simples interconnectés L’identité
du réseau, au cours de ce calcul, est préservée sous la forme du vecteur w
des poids synaptiques. C’est de ce vecteur que dépend, à input égal, le comportement du réseau et le résultat de
son calcul – en ce sens il constitue sa «compétence»; on dit parfois que
les «connaissances» d’un réseau sont représentées ou emmagasinées dans
ses connexions. Quant à la manière dont cette compétence est acquise, elle
est actuellement au cœur des recherches: dans certaines conditions, un réseau
peut l’acquérir spontanément, à partir d’exemples fournis par
l’environnement. Cette capacité d’apprentissage «naturel» est l’une des
grandes qualités des réseaux: ils font ce qu’on leur demande sans qu’il
soit nécessaire de leur donner des instructions, de les programmer. Ce
n’est pas leur seule qualité. Leur comportement lui-même présente des
propriétés remarquables: un réseau est capable, moyennant des conditions
favorables, de généraliser, d’extraire la tendance moyenne ou de composer un
type caractéristique d’un échantillon, de restaurer des données fortement
altérées ou tronquées. Quand on l’éloigne de son domaine d’application,
ou quand on le surcharge d’exemples, ses performances ne se dégradent que
progressivement. Lésé, il continue de produire des résultats acceptables,
quoique moins bons, et, s’il est gravement abîmé, il réapprend vite. Ici
encore, ce sont des propriétés naturelles, qui ne résultent pas
d’instructions ad hoc, ce qui souligne la différence par rapport aux modèles
cognitivistes. Ce
n’est cependant qu’en examinant le fonctionnement des réseaux que l’on
prend la véritable mesure de cette différence. La plus frappante est le caractère
«massivement» parallèle des opérations: quoiqu’il puisse subsister une
horloge interne qui rythme l’évolution du système, c’est à chaque étape,
potentiellement ou de fait, autant d’opérations indépendantes qu’il y a
d’unités qui s’effectuent simultanément. Cela suffirait à distinguer le
sens que revêt ici «calcul» par rapport au sens canonique d’opération
turingienne. Mais de plus, dans certaines versions du connexionnisme, chaque opération
élémentaire peut être vue comme portant sur des quantités continues et non
discrètes. Enfin, il arrive que ces opérations soient aléatoires. L’analyse
de l’évolution d’un réseau passe par la mécanique statistique et la théorie
des systèmes dynamiques, non par la logique des programmes. Remarquons
d’ailleurs qu’il n’y a ni programme, au sens strict du mot, ni unité de
contrôle. Chaque unité est autonome, et ne propage que localement son
influence. Cette influence peut certes être interprétée comme une sorte
d’inférence, mais seulement plausible et non rigoureuse: elle est modulée et
peut être soit renforcée, soit bloquée par d’autres influences. L’état
stable est un équilibre ,
non un arrêt . Quant
au mode de représentation, il n’est pas moins original que le mode de calcul.
Un système d’intelligence artificielle classique stocke en mémoire des
expressions quasi linguistiques interprétables comme des descriptions
d’objets, de faits ou de règles, et selon les besoins du programme les
consulte, les reproduit ou les transforme selon les règles formelles. Un réseau
connexionniste ajuste ses poids synaptiques, et capte ainsi les régularités de
l’environnement, qui n’est donc pas décrit ,
mais reflété
avec une fidélité plus ou moins grande – précieuse souplesse! La «connaissance»
– si ce mot convient – semble être ici intégralement implicite; plutôt
que de connaissance, on serait tenté de parler d’adaptation: le système a
une capacité dispositionnelle à agir en conformité avec certains aspects
saillants de l’environnement. Enfin, dans les réseaux utilisant des représentations
dites distribuées, chaque concept correspond à l’activation non d’une,
mais d’un grand nombre d’unités; inversement, chaque unité contribue à la
représentation de plusieurs concepts: si les concepts sont ici ceux auxquels
l’esprit a naturellement affaire dans la tâche qui l’occupe, ceux dont le
modélisateur veut doter un système qu’il charge de cette tâche, alors ce
que représente une unité est d’un ordre différent – c’est un «micro-trait»,
un fragment de sens invisible à l’œil nu, un constituant proto-sémantique
destiné à entrer dans des assemblages variables, selon des règles non pas
formelles, mais sensibles au contexte et à la tâche du moment. Seuls ces
assemblages sont dotés d’une valeur sémantique au sens propre. Telle est du
moins l’interprétation encore controversée proposée par certains
connexionnistes: les réseaux d’aujourd’hui ne reflètent que très incomplètement
cette conception, dont le rôle est surtout programmatique. Quoi
qu’il en soit des propositions plus radicales du connexionnisme, on voit donc
que dans les réponses qu’il donne aux questions 1 à 5 formulées plus haut
il se distingue nettement du cognitivisme. En fait, rien de précis n’a encore
été dit de sa réponse à la question 4. Or beaucoup en dépend. En effet,
s’il se dit fonctionnaliste (ce qui est en général le cas), le
connexionniste doit préciser le niveau auquel selon lui se situe la description
fournie par le réseau. S’agit-il du même niveau fonctionnel que le
cognitivisme, ou bien d’un niveau inférieur? Dans le premier cas, il faut
justifier le caractère psychologiquement peu plausible de certains aspects du
fonctionnement des réseaux, mais surtout leur incapacité à modéliser directement les tâches impliquant des représentations structurées – en
premier lieu le langage et le raisonnement. Dans le second cas, il faut répondre
à une autre question: le niveau du réseau est-il identique à celui de l’«implémentation»
dans le schéma classique – les automates sont-ils des neurones idéalisés (lorsque
le réseau modélise), et des composants élémentaires (lorsqu’il simule)?
Une réponse positive à cette nouvelle question entraîne pour le réseau deux
risques: celui de l’invalidation pour insuffisance sur le plan biologique (les
réseaux ne seraient pas des modèles acceptables du système nerveux), celui de
la réduction au statut de hardware ,
de matériel (les réseaux ne seraient qu’une façon nouvelle, utile dans
certains cas, de réaliser les opérations cognitives dont la caractérisation
demeurerait du ressort du cognitivisme). Une réponse négative ramène le
connexionniste au point de départ: où donc se situe le réseau? Certains
chercheurs penchent en faveur d’une sorte de fonctionnalisme «quantique»: le
réseau se situerait à un niveau intermédiaire, au-dessus de la neurobiologie
et de l’implémentation, au-dessous du niveau psychologique et linguistique
ordinaire, le rapport avec celui-ci devant être pensé comme celui de la
micro-physique avec la physique newtonienne des objets de taille moyenne animés
de faibles vitesses. Il s’agirait donc d’un niveau fonctionnel fondamental,
le niveau supérieur ne fournissant qu’une description approximative parfois
utile. Continue .........
Please note: All above data are ©
Copyright of SOSPROCTOS Last edition of this page:11/10/05 Web Site is powered by Rollan.Net |