Home
Our Project
Research Support
Our Team
Colonic Metastases
Fractal
Gastroenerology
Enteromorphognosia
Reseaux Neuronaux
Reseaux Neuronaux 2
Reseaux Neuronaux 3
Reseaux Neuronaux 4
Reseaux Neuronaux 5
Reseaux Neuronaux 6
Reseaux Neuronaux 7
Reseaux Neuronaux 8
Neuronaux Epilogue

 

Le connexionnisme

S’il se distingue du cognitivisme et sur certains points s’y oppose, le connexionnisme n’est pas quant à lui une philosophie de la cognition – du moins, ce n’est pas ce qu’il est d’abord. Il se présente en effet comme un ensemble de méthodes de modélisation et de simulation de toute une variété de processus cognitifs; et c’est en cherchant à dégager les traits communs à ces méthodes, et les avantages qu’elles présentent sur les méthodes classiques, que les connexionnistes ont commencé à élaborer une doctrine. À cet égard, leur parcours n’est pas sans rappeler celui de l’intelligence artificielle. Partie d’un outil (l’ordinateur) et de quelques idées très générales, elle entreprit d’écrire des programmes simulant des tâches telles que le jeu d’échecs et la résolution de problèmes de géométrie ou de calcul propositionnel; puis, pariant que ces premières tentatives étaient autant de premiers pas vers une solution générale, elle voulut formuler la conception de l’intelligence, ou de la cognition, qui s’en dégageait et lui paraissait devoir être confirmée. Les psychologues, les linguistes, les philosophes se mirent alors de la partie, élargissant, complétant et précisant la théorie – ainsi naquit le cognitivisme.

Avec un décalage d’une quinzaine d’années, le connexionnisme, renouant avec la première cybernétique et certains de ses prolongements (principalement le célèbre perceptron de Frank Rosenblatt), part d’un outil (le réseau de neurones formels), entreprend de simuler des fonctions telles que la classification de formes, la mémoire associative ou la prononciation de l’anglais; puis, estimant, non sans audace, que ses premiers succès annoncent un progrès décisif, part à la recherche de ses fondements. Cette fois, cependant, un milieu scientifique constitué est en mesure de prendre la relève, ce qui explique la «contagion» rapide des idées connexionnistes.

Avant  de  présenter  rapidement  le connexionnisme, précisons qu’il existe, au sein de ce courant, plusieurs écoles qui diffèrent autant par leurs options théoriques que par les mécanismes particuliers auxquels ils attribuent un rôle privilégié dans l’explication ou la simulation des phénomènes. Historiquement, le connexionnisme se définit, on l’a vu, par la machine, fonctionnellement décrite, dont il conjecture qu’elle est capable d’intelligence ou de cognition: cette machine, le réseau de neurones formels (ou réseau neuromimétique , neural net  en anglais), est au connexionnisme ce que la machine de von Neumann est au cognitivisme et à l’intelligence artificielle traditionnelle. S’il est vrai qu’il existe de nombreuses variantes de réseau (alors que la machine de von Neumann est essentiellement unique), on peut cependant donner une sorte de «portrait-robot» du réseau connexionniste.

Il s’agit d’un ensemble d’automates  très simples interconnectés . Les connexions  permettent à un automate tel que i de transmettre à un automate j une simulation positive (excitatrice) ou négative (inhibitrice), déterminée par l’état d’activité u i  de i et modulée par un poids synaptique w ji  ne dépendant que du canal. Les automates (ou unités ) sont en général tous identiques – ce sont souvent des automates à seuil , capables de comparer la somme pondérée des simulations afférentes Si u i w ji  à un seuil S j  et à se mettre en état d’activité si ce seuil est dépassé, à s’éteindre sinon. Le système est donc caractérisé, à chaque étape de son évolution, qui est discrète, par un vecteur d’activation  u = (u 1, ...., u n ); la transition d’une étape à la suivante résulte d’une mise à jour, soit par tous les automates simultanément, soit par un seul, des valeurs d’activité. Le processus commence par l’imposition d’un certain vecteur d’activation u 0 qui peut être considéré comme la donnée ou input , se poursuit par itération de la règle de transition, et se termine lorsque le système atteint un équilibre caractérisé par un vecteur u N, résultat ou output  de ce qu’on peut appeler le calcul effectué par le réseau.

L’identité du réseau, au cours de ce calcul, est préservée sous la forme du vecteur w des poids synaptiques. C’est de ce vecteur que dépend, à input  égal, le comportement du réseau et le résultat de son calcul – en ce sens il constitue sa «compétence»; on dit parfois que les «connaissances» d’un réseau sont représentées ou emmagasinées dans ses connexions. Quant à la manière dont cette compétence est acquise, elle est actuellement au cœur des recherches: dans certaines conditions, un réseau peut l’acquérir spontanément, à partir d’exemples fournis par l’environnement. Cette capacité d’apprentissage «naturel» est l’une des grandes qualités des réseaux: ils font ce qu’on leur demande sans qu’il soit nécessaire de leur donner des instructions, de les programmer.

Ce n’est pas leur seule qualité. Leur comportement lui-même présente des propriétés remarquables: un réseau est capable, moyennant des conditions favorables, de généraliser, d’extraire la tendance moyenne ou de composer un type caractéristique d’un échantillon, de restaurer des données fortement altérées ou tronquées. Quand on l’éloigne de son domaine d’application, ou quand on le surcharge d’exemples, ses performances ne se dégradent que progressivement. Lésé, il continue de produire des résultats acceptables, quoique moins bons, et, s’il est gravement abîmé, il réapprend vite. Ici encore, ce sont des propriétés naturelles, qui ne résultent pas d’instructions ad hoc, ce qui souligne la différence par rapport aux modèles cognitivistes.

Ce n’est cependant qu’en examinant le fonctionnement des réseaux que l’on prend la véritable mesure de cette différence. La plus frappante est le caractère «massivement» parallèle des opérations: quoiqu’il puisse subsister une horloge interne qui rythme l’évolution du système, c’est à chaque étape, potentiellement ou de fait, autant d’opérations indépendantes qu’il y a d’unités qui s’effectuent simultanément. Cela suffirait à distinguer le sens que revêt ici «calcul» par rapport au sens canonique d’opération turingienne. Mais de plus, dans certaines versions du connexionnisme, chaque opération élémentaire peut être vue comme portant sur des quantités continues et non discrètes. Enfin, il arrive que ces opérations soient aléatoires.

L’analyse de l’évolution d’un réseau passe par la mécanique statistique et la théorie des systèmes dynamiques, non par la logique des programmes. Remarquons d’ailleurs qu’il n’y a ni programme, au sens strict du mot, ni unité de contrôle. Chaque unité est autonome, et ne propage que localement son influence. Cette influence peut certes être interprétée comme une sorte d’inférence, mais seulement plausible et non rigoureuse: elle est modulée et peut être soit renforcée, soit bloquée par d’autres influences. L’état stable est un équilibre , non un arrêt .

Quant au mode de représentation, il n’est pas moins original que le mode de calcul. Un système d’intelligence artificielle classique stocke en mémoire des expressions quasi linguistiques interprétables comme des descriptions d’objets, de faits ou de règles, et selon les besoins du programme les consulte, les reproduit ou les transforme selon les règles formelles. Un réseau connexionniste ajuste ses poids synaptiques, et capte ainsi les régularités de l’environnement, qui n’est donc pas décrit , mais reflété  avec une fidélité plus ou moins grande – précieuse souplesse! La «connaissance» – si ce mot convient – semble être ici intégralement implicite; plutôt que de connaissance, on serait tenté de parler d’adaptation: le système a une capacité dispositionnelle à agir en conformité avec certains aspects saillants de l’environnement. Enfin, dans les réseaux utilisant des représentations dites distribuées, chaque concept correspond à l’activation non d’une, mais d’un grand nombre d’unités; inversement, chaque unité contribue à la représentation de plusieurs concepts: si les concepts sont ici ceux auxquels l’esprit a naturellement affaire dans la tâche qui l’occupe, ceux dont le modélisateur veut doter un système qu’il charge de cette tâche, alors ce que représente une unité est d’un ordre différent – c’est un «micro-trait», un fragment de sens invisible à l’œil nu, un constituant proto-sémantique destiné à entrer dans des assemblages variables, selon des règles non pas formelles, mais sensibles au contexte et à la tâche du moment. Seuls ces assemblages sont dotés d’une valeur sémantique au sens propre. Telle est du moins l’interprétation encore controversée proposée par certains connexionnistes: les réseaux d’aujourd’hui ne reflètent que très incomplètement cette conception, dont le rôle est surtout programmatique.

Quoi qu’il en soit des propositions plus radicales du connexionnisme, on voit donc que dans les réponses qu’il donne aux questions 1 à 5 formulées plus haut il se distingue nettement du cognitivisme. En fait, rien de précis n’a encore été dit de sa réponse à la question 4. Or beaucoup en dépend. En effet, s’il se dit fonctionnaliste (ce qui est en général le cas), le connexionniste doit préciser le niveau auquel selon lui se situe la description fournie par le réseau. S’agit-il du même niveau fonctionnel que le cognitivisme, ou bien d’un niveau inférieur? Dans le premier cas, il faut justifier le caractère psychologiquement peu plausible de certains aspects du fonctionnement des réseaux, mais surtout leur incapacité à modéliser directement  les tâches impliquant des représentations structurées – en premier lieu le langage et le raisonnement. Dans le second cas, il faut répondre à une autre question: le niveau du réseau est-il identique à celui de l’«implémentation» dans le schéma classique – les automates sont-ils des neurones idéalisés (lorsque le réseau modélise), et des composants élémentaires (lorsqu’il simule)? Une réponse positive à cette nouvelle question entraîne pour le réseau deux risques: celui de l’invalidation pour insuffisance sur le plan biologique (les réseaux ne seraient pas des modèles acceptables du système nerveux), celui de la réduction au statut de hardware , de matériel (les réseaux ne seraient qu’une façon nouvelle, utile dans certains cas, de réaliser les opérations cognitives dont la caractérisation demeurerait du ressort du cognitivisme). Une réponse négative ramène le connexionniste au point de départ: où donc se situe le réseau? Certains chercheurs penchent en faveur d’une sorte de fonctionnalisme «quantique»: le réseau se situerait à un niveau intermédiaire, au-dessus de la neurobiologie et de l’implémentation, au-dessous du niveau psychologique et linguistique ordinaire, le rapport avec celui-ci devant être pensé comme celui de la micro-physique avec la physique newtonienne des objets de taille moyenne animés de faibles vitesses. Il s’agirait donc d’un niveau fonctionnel fondamental, le niveau supérieur ne fournissant qu’une description approximative parfois utile.

Dans l’impossibilité de conclure, terminons cet examen comparé des positions cognitivistes et connexionnistes par un dernier contraste. Il reste au cognitiviste à nous convaincre que tout, dans la cognition, est inférence formelle sur des représentations quasi linguistiques. Au connexionniste, que c’est exactement le contraire, et que tout est association, classification, compilation statistique de données quasi sensorielles. D’un côté, le paradigme de l’inférence formelle; de l’autre, celui de la perception. Nombreux sont les chercheurs qui rejettent l’alternative, et plaident pour une articulation des deux points de vue, convenablement modifiés. Il n’est guère douteux, en tout cas, qu’en peu d’années notre perspective sur cette opposition aura beaucoup évolué

                                          Continue .........

 

 Please note: All above data are © Copyright of SOSPROCTOS
          Unauthorized reprinting will be prosecuted

Last edition of this page:23/12/09