jeudi 25 février 2016

De la mémoire anachronique

Dans un billet précédent nous avons évoqué la place finalement assez réduite que semble tenir dans l'intelligence humaine le raisonnement logique formel conscient, par rapport à la reconnaissance de situations et la réponse par des comportements appropriés. Cette intelligence construite par apprentissage préexiste au langage, nous la partageons en grande partie avec les animaux, et maintenant avec les machines qui apprennent. Qu'elle soit naturelle ou artificielle, elle nécessite en arrière-plan une mémoire importante, le stockage d'un grand nombre de situations de référence. Mais de quel genre de mémoire s'agit-il, celle qui nous permet de reconnaître les chats, de ne pas nous perdre dans nos maisons, nos villes, nos jardins et nos campagnes, de prononcer un avis d'expert, ou de gagner (de temps en temps) une partie de Go?
On l'appellerait volontiers ici, pour respecter l'esprit des lieux, la mémoire des états de choses, mais il semble que l'expression employée dans la littérature pour ce type de mémoire soit mémoire situationnelle. Une recherche sur cette expression est d'ailleurs très instructive, les résultats mêlant discours philosophique, charabia technico-socio-commercial sur la captation de l'attention des internautes, et jusqu'à un brevet déposé par Google. On peut se demander d'ailleurs si tous ces auteurs connaissent l'étendue des emplois de cette expression en-dehors de leur domaine, ou si chacun l'a réinventée dans son jargon.
Mais qu'est-ce qu'une mémoire des situations, sinon avant tout une mémoire de territoires? Un territoire c'est bien sûr un espace, mais il ne se réduit pas à ses aspects géographiques ou cartographiques. Un territoire dans notre mémoire c'est un état de choses, un ensemble complexe et unique de sensations, de signes et de repères visuels, auditifs, olfactifs et même tactiles, que nous pouvons évoquer ou reconnaître sans avoir besoin de le nommer, et à y bien regarder indépendant du temps et de la chronologie. Nous connaissons tous cette sensation au retour en un lieu connu mais quitté depuis longtemps que le temps ne s'est pas écoulé, que l'état des choses n'a pas changé en dépit du temps, à quelques petits ajustements près. Et c'est là une caractéristique essentielle de cette mémoire des états de choses, des territoires, d'être fondamentalement anachronique au sens littéral, de traverser le temps, de se moquer de la chronologie.
L'autre mémoire, la mémoire historique, celle des événements et de leur logique doit se construire sur le langage, elle s'évanouit plus facilement, elle a besoin d'être racontée encore et encore, un récit toujours incomplet et sujet à controverses, car il nous faut sans cesse des preuves que tel événement était avant ou après celui-là, que telle personne ou chose pouvait ou non y être présente. Bien sûr la mémoire constituée en récit a l'avantage de pouvoir s'écrire, se conserver, se transmettre de génération en génération. Par la magie de l'écriture, du roman, de la poésie, elle permet même d'évoquer, et de laisser entrevoir les territoires de l'autre mémoire, sans pouvoir les capturer entièrement. Aussi chaque lecteur du récit les reconstruit et les incorpore à ceux de sa propre mémoire. Ainsi vit, grandit et se tisse en nous ce qu'il y a de plus fondamental, de plus profond, et qui résiste le mieux à l'oubli et à l'usure du temps. Cette mémoire anachronique est au bout du compte pour chacun de nous la seule preuve solide de la pérennité de son existence.

lundi 15 février 2016

Qu'est-il arrivé au Web sémantique?

Je m'étais promis de ne plus rien écrire directement à ce sujet, mais il m'est difficile de ne pas mettre en perspective les considérations des quelques billets précédents avec l'histoire du Web sémantique. En préalable à cette analyse, un petit aperçu de Google Tendances sur les termes de recherche "Semantic Web" et "Deep learning" depuis dix ans.


Cela ressemble à la chronique d'une mort lente. Bien sûr, ce n'est qu'un écho d'une rumeur, et il y a sans doute beaucoup à dire sur les algorithmes qui sous-tendent ce genre de comparaison, et la représentativité des données utilisées. Mais il n'y a pas de fumée sans feu. 
On pourra objecter que le Web sémantique et le Deep learning ne sont pas vraiment des technologies concurrentes, qu'elles n'ont pas vraiment les mêmes champs d'application. Je n'entrerai pas dans ce débat technique. Ce qui m'intéresse ici est de voir dans le déclin apparent des unes et l'essor des autres (au moins dans ce qui fait le buzz), les signes d'un important changement que nous avons commencé à évoquer dans le précédent billet, et que je résumerais de la façon suivante. Nous sommes en train de passer de systèmes utilisant une sémantique a priori, fixée par la logique formelle des axiomes et des règles, à des systèmes utilisant une sémantique a posteriori, plus fluctuante et basée sur un apprentissage utilisant l'analyse massive des données et des usages.
Si cette tendance se confirme, et on a de bonnes raisons de le croire, que restera-t-il des efforts de la communauté du Web sémantique pour construire une pile de standards, des vocabulaires et des ontologies, et tous les outils qui vont avec? Dans une discussion de novembre 2015 intitulée "What happened to the Semantic Web", Krzysztof Janowicz résume de façon assez réaliste la situation dans cette réponse dont je traduis en substance quelques extraits.
Le problème principal qui fait obstacle à une partie de notre travail est une incompréhension fondamentale de ce qu'est réellement la sémantique et comment elle émerge. Beaucoup d'entre nous semblent croire que ce qui définit un bon usage des technologies du Web sémantique (les "killer apps") implique des ontologies lourdes et compliquées qui sont axiomatisées en utilisant les plus puissants de nos langages de représentation des connaissances et qui font un plein usage de nos raisonneurs. Comme +Kingsley Idehen et d'autres l'argumentent, les "killer apps" sont déjà là. Elles utilisent les URI comme identifiants globaux, l'idée des données liées, les relations d'identité comme sameAs, et un soupçon de raisonnement (dans la majorité des cas une simple utilisation de propriétés transitives) pour enrichir et étendre les résultats de recherche. 
Le Web sémantique devrait être une couche, fine et idéalement transparente, de communication entre l'utilisateur (pas seulement humain) et les données, et c'est là que notre travail a le plus d'impact. [...] Notre succès sera mesuré par la capacité de nos technologies à réduire la probabilité de combiner des données incompatibles, à faciliter la recherche et la publication de données pertinentes, à supporter les scientifiques et les décideurs dans l'analyse de la signification (statistique et analytique) des données. Par contraste, essayer de fixer de façon précise, abstraite et non ambiguë la signification de toutes sortes de termes dans un cadre logique, est voué à l'échec.
Bref, si globalement nous n'avons pas travaillé pour rien, il est sans doute temps de trier les placards, d'archiver pour mémoire et l'instruction des générations futures nos belles, complexes, coûteuses et finalement inutilisables ontologies et les raisonneurs qui vont avec dans les musées de l'inventivité humaine. Conservons pour l'usage courant quelques-uns de nos chers vocabulaires, les plus légers, ceux qui flottent bien à la surface des choses et remontent bien au vent. Et tant pis pour ceux que le poids de leur cargaison logique a entraînés par le fond à la première tempête de vraies données. 

vendredi 12 février 2016

Le chat, AlphaGo et Zhuangzi

Cela ressemble au titre d'une fable, et à vrai dire ce pourrait en être une si je savais l'écrire sous cette forme. Mais n'est pas Monsieur de la Fontaine qui veut, donc vous ferez avec ma prose habituelle. Commençons donc par le chat. Vous savez ce qu'est un chat, bien sûr, en tout cas vous savez le reconnaître quand vous en croisez un, et agir en conséquence, le nourrir, le caresser puis le chasser parce qu'il est insupportable, photo en ligne à l'appui bien sûr comme tout le monde.


Vous pouvez décider de voir un chat dans cette photo parce qu'elle illustre mes propos sur le chat, et de fait cela ressemble à un gros chat, même si vous lui trouvez un air pas très orthodoxe, mais bon il y a tant de races de chat et puis on ne le voit que de dos. Si vous connaissez un tant soit peu les chats, quelque chose vous dit que cet animal n'en est pas un, mais tous les arguments logiques que vous allez trouver à l'appui de ce point de vue seront difficiles à tenir et peu probants. Et puis tout dépend de comment on définit un chat, mais est-ce qu'une définition va vraiment vous aider à trancher dans ce cas? Les définitions du chat vont concerner son squelette, sa dentition, son régime alimentaire et autres paramètres dont justement vous ne pouvez pas juger ici. Donc la logique de la définition ne vous servira à rien, et vous finirez par dire que ce n'est pas un chat parce qu'on voit bien que ce n'en est pas un, point final, et vous me demanderez de prouver le contraire si je ne suis pas d'accord, et je serai dans le même embarras.

Cet exemple pour dire que pour savoir reconnaître (ou pas) un chat (ou à peu près n'importe quoi d'autre) quand on en voit un, et savoir quoi faire avec, on a rarement besoin de définition. D'ailleurs un enfant de deux ans, voire moins, sait bien ce qu'est un chat, et sait quoi faire et surtout ne pas faire avec, bien avant l'acquisition du langage nécessaire à l'utilisation de définitions, et largement avant l'apprentissage du raisonnement logique via les incontournables règles de l'accord du participe passé des verbes pronominaux et autres cas d'égalité des triangles. Et cette connaissance pragmatique du chat est opérationnelle la plupart du temps, les coups de griffes résiduels étant souvent plus liés au caractère notoirement fantasque du dit félin qu'à une erreur sémantique de l'enfant.

Il y a là une leçon importante. On construit du savoir opérationnel, puis le langage pour nommer ce qu'on sait et pouvoir en parler, puis la logique et le méta-langage pour pouvoir argumenter avec ses petits camarades, quand ils ne comprennent pas les choses qui devraient pourtant la plupart du temps aller sans dire. L'intelligence humaine se construit dans cet ordre, la logique est construite sur le langage, le langage sur la compréhension des choses, et pas le contraire. Et, nous explique entre autres experts +Monica Anderson, par exemple dans cette présentation, 99,999% de l'activité de notre cerveau, y compris celle qui engage notre intelligence (comme la reconnaissance des chats) n'utilise pas la couche logique du raisonnement conscient à base de règles. Donc, si nous devons construire une véritable intelligence artificielle à l'image de l'intelligence humaine, elle doit fonctionner, et donc se construire de la même façon par apprentissage à partir de l'expérience, et non par des algorithmes posés a priori. C'est la voie suivie par les méthodes dites apprentissage profond, implémentées dans des architectures de type réseaux neuronaux. Parmi les succès remportés par ces méthodes, on peut noter la reconnaissance de formes, le classement automatique d'images, la génération de légendes pour les dites images, et bien sûr celui qui a fait l'actualité dernièrement, la victoire du système AlphaGo contre un joueur de Go professionnel. 

Une caractéristique importante de ces systèmes de nouvelle génération est qu'ils sont faillibles comme l'intelligence naturelle qu'ils cherchent à copier, contrairement aux systèmes à base de logique formelle. Par exemple un tel système classerait peut-être la photo ci-dessus parmi les photos de chat (ou pas). La qualité du système ne se mesure pas en tout ou rien. Il s'améliore avec l'apprentissage, il fait de moins en moins d'erreurs, comme l'enfant avec les chats. Un système intelligent est un système qui intègre ses erreurs dans sa base de connaissances.

Une autre caractéristique plus dérangeante est que le système ne peut en général pas communiquer sous une forme lisible par des humains la justification de ses décisions. Il dira comme vous devant la photo plus haut ceci est (ou n'est pas) un chat parce que depuis le temps que je vois des chats, j'ai appris à les reconnaître. Et pour le jeu de Go il répondra comme les maîtres à qui on demande pourquoi ils ont joué tel coup, parce que c'était un bon coup

Et c'est là que nous retrouvons Zhuangzi, qui dénonce cruellement la vanité des débats logiques de son temps, et nous dit qu'un chat est un chat (ou un cheval) parce que c'est comme ça, mais dès que les logiciens se mettent à en discuter, cela ne mène à rien qu'à un peu plus de discorde dans le monde. Zhuangzi a certes des positions assez radicales sur le langage et son usage, mais il partage avec l'ensemble de la pensée chinoise ancienne un point de vue pragmatique sur la connaissance. Savoir, ce n'est pas savoir des définitions et raisonner dessus, mais c'est savoir faire, savoir être et agir de façon correcte. L'explication, la justification par des arguments logiques est souvent une perte de temps. Dans son indispensable Histoire de la pensée chinoise, Anne Cheng met en parallèle la démarche philosophique et celle de la peinture, dont nous avons déjà parlé.
De la même façon qu'en peinture le regard est toujours "en situation", l'intellect qui tente de discerner des repères est lui aussi en situation, il décide et fait la part des choses au fur et à mesure qu'il progresse dans le discours, sans chercher à établir des règles absolues et définitives (tel le syllogisme). C'est peut-être l'une des raisons pour lesquelles la pensée logique chinoise ne s'est jamais dotée d'un dispositif systématique de règles formelles.
Les recherches les plus modernes en intelligence artificielle rejoindraient donc le pragmatisme de la philosophie chinoise, et nous libéreraient de deux millénaires de tyrannie du Logos? Voilà une perspective plutôt réjouissante. Mais sommes-nous prêts à l'accepter? C'est une révolution culturelle majeure de faire confiance aux machines comme nous faisons confiance aux humains, sans savoir exactement pourquoi et sans qu'elles puissent nous donner des explications lisibles. Un choix trop important pour le laisser se décider dans les états-majors de Google, IBM, Microsoft et Facebook, qui investissent déjà des fortunes dans ce secteur stratégique. Car le jeu de Go et la reconnaissance de chats sont juste une vitrine, les enjeux dans le monde réel de tels systèmes s'appellent aide à la décision, régulation des systèmes de transports ou des réseaux d'énergie, etc. C'est pourquoi on ne peut que saluer une initiative comme OpenAI, dont le but est de favoriser toute la transparence possible sur la recherche en ce domaine.

jeudi 11 février 2016

Circulation dans la zone de combat

En montagne, la limite supérieure de la forêt est appelée par les forestiers la zone de combat. On en trouvera de très belles évocations et illustrations chez les têtards arboricoles et autres amoureux des vieilles souches. C'est le domaine de ces arbres étonnants, souvent vénérables et toujours obstinés, survivants miraculeux du gel, des avalanches, de la dent des brebis, des canicules, de la foudre et des bourrasques. Des mélèzes ou des pins, noueux de partout, sans un pouce de droit fil, pas une branche sans cicatrice, les racines veinant le sol, agrippées à la roche, mises à nu par l'érosion. Comme leurs cousins d'Armorique chers au grand-père Alain Le Goff et que nous avons déjà évoqués ici, ce sont des travailleurs de l'extrême, des combattants de première ligne.


Pin cembro (arolle) dans la zone de combat
Source : Wikimedia Commons

Pour bien apprécier les lieux, il faut bien sûr y grimper par un sentier battu par des siècles de pas de troupeaux, de bergers et de randonneurs. Un sentier comme ces arbres, une corde noueuse avec ses torons qui s'enracinent dans la vallée à un bout et se déploient à l'autre en mille sentes éphémères aux abords des crêtes. Et sous l'un de ces arbres le marcheur fera probablement halte, car leurs ombres sont les dernières à la montée, et les premières à la descente. Cent pas plus haut s'ouvrent les vallons écrasés de soleil, jusqu'au bord minéral du ciel balayé par tous les vents qu'aucune frondaison ne retiendra jamais.

Le marcheur, comme tous ceux qui ont tracé le sentier et continuent à le faire vivre, tendu au matin vers les crêtes, ou revenant au soir vers le repos des vallées, participe comme la sève de l'arbre à la circulation qui noue le ciel à la terre. Et le sentier et l'arbre ne restent vivants que par ce qui les traverse au rythme des jours et des saisons. La vie transhume dans l'arbre, et le marcheur est la sève du sentier. D'ailleurs il ne manquera pas de faire tout au long de son parcours quelques gestes d'entretien, écartant une branche tombée ou recalant une pierre déchaussée. Si la circulation s'arrête, au fil des ans l'arbre se dessèche peu à peu et finit couché par la tempête, mangé par la terre, et le sentier disparaît sous la végétation et les chutes de pierre. Ainsi va la vie dans la zone de combat.

Nos mots sont de cette même texture que l'arbre et le sentier. Eux aussi ne vivent que par la circulation du sens, de la vallée obscure des origines de nos langues jusqu'au bord du ciel hanté par les poètes et les philosophes. Ils sont les marcheurs, les bergers et la sève du langage, poussant obstinément dans la zone de combat du texte leurs mots noueux et retors et leurs troupeaux d'intraduisibles.