jeudi 18 février 2021

À propos d'Un Monde Incertain (1)


On m’a posé, je me pose aussi, des questions sur mes finalités lorsque j’ai décidé de lancer le projet Un Monde Incertain le plaçant très délibérément sur le double terrain de la littérature générative et de la vidéo, donc de la mobilité. Je ne vais pas ici creuser toutes les questions qu’ont suscitées son « pourquoi » car dans tout projet il y a non seulement une part d’impondérable mais également une importante part d’inconscient. Cependant je me propose de laisser entrevoir ici quelques pistes qui ont guidé notre travail.

L’incertitude a toujours été au cœur de mes projets d’écriture « classique » dont elle constitue une constante thématique, que ce soit dans mes romans comme La Toile (http://devoirdevacance.canalblog.com/archives/2021/02/06/38800069.html) ou Un Monde Flou (http://unmondeflou.canalblog.com/ ) ou dans diverses de mes nombreuses nouvelles. Cette incertitude, d’abord pure question psychologique personnelle, a vite rencontré celle du monde où, bien que notre époque s’efforce avec ses technologies de tout maîtriser, elle se trouve au prise à de nombreux avènements qui la débordent. Ainsi, si Un Monde Incertain a été conçu avant l’apparition de la Covid, son approche s’est trouvée renforcée par l’invasion dans les médias du thème quasi obsessionnel de l’incertitude. Il n’est donc pas fortuit que je me sois, il y a maintenant, plus de cinquante ans, intéressé à la littérature générative qui, dans son principe même, s’appuyant très largement sur l’aléatoire, est la source productive d’une infinité de textes incertains.

En effet, si un auteur quelconque veut écrire quelque chose comme : « Aileen sortit son miroir : la vibration de l’avion le secouait si fortement qu’elle ne put voir si son nez avait besoin de poudre. » (Paul Bowles, L’écho), la génération automatique ne peut rien pour lui et il vaut mieux qu’il l’écrive lui-même. Un générateur automatique n’a ni d’intention clairement établie, ce n’est qu’un algorithme construit autour d’une part importante d’aléatoire, ni de conscience. Ce n’est qu’une machine à calculer plus ou moins sophistiquée et s’il donne l’impression que ce qu’il écrit à tel ou tel moment a « un sens », cette impression n’est qu’une illusion qui ne peut fonctionner que par la coopération d’un lecteur potentiel. Il y a donc, dans un projet de littérature générative, une provocation initiale : feindre l’écriture qui, dans nos sociétés, bénéficie d’un haut statut social est, d’une façon certaine, remettre ce statut en cause. Il y a là, pour le programmateur, une profonde satisfaction personnelle qui n’est pas sans interroger l’auteur que, par ailleurs, je suis. Mais là n’est pas le problème. Mon objectif étant davantage de voir comment créer une œuvre totalement originale, dans toutes ses modalités, qui resterait cependant une œuvre que l’on pourrait qualifier de « littéraire », c’est-à-dire confrontant ses mots à des lectures et, dans ce champ, ouvrant de nouvelles perspectives à ses lecteurs.

Les bases de ce projet de création étant ainsi posées, je me suis demandé comment obtenir une réalisation concrète qui dépasserait le seul fait de mettre des générateurs de texte accessibles en ligne, c’est-à-dire totalement abandonnés aux lectures de leurs lecteurs sans presque aucune possibilité de rétroaction. Comment concevoir une œuvre d’une certaine envergure et, dans son principe même infinie et éternelle, dont le principe moteur serait un équilibre entre sa cohérence (la certitude) et ses incohérences (l’incertitude).

Ayant créé diverses installations, j’avais pu constater comment un public donné pouvait réagir à de telles productions, mais, dans ce cadre, cela restait de l’ordre de l’infini éphémère. J’avais envie d’explorer une autre voie en fixant cet éphémère dans des créations à la fois temporairement fixes et généralement mobiles. D’où l’idée d’un ensemble de créations vidéo autour d’un certain nombre de textes produits par mes générateurs qui construiraient leur cohérence par les parcours dans leur totalité. En somme un hypertexte génératif. J’en ai parlé autour de moi et j’ai pu constater que plusieurs amis écrivains étaient tentés par une participation. Très vite je me suis trouvé avec 27 participants. Cette variété des participants a ainsi constitué une des données essentielles à l’œuvre, chacun apportant au projet sa diversité et introduisant des bifurcations sémantiques particulières. Mais il fallait que ces apports personnels ne fassent pas, faute de construire « une œuvre », éclater le projet d’ensemble. Nous avons donc réfléchi aux modalités de cette création pour donner un semblant d’unité au travail qui devait être collectif et risquait de s’éparpiller dans des directions multiples. Ayant depuis longtemps inscrit chacun de mes projets dans un surensemble que je désignais sous le titre de La Disparition du Général Proust, et dont ne reste accessible qu’un fragment (http://generalproust.canalblog.com/) j’ai imposé la première de ces règles : chaque auteur devait accepter de disparaître sous un pseudonyme emprunté à l’univers de Proust et proposer un portrait de préférence ancien qui le représenterait. D’où Pierre et Rachel Charlus, Albert Morel, Louis Ganançay, etc. Nous avons ensuite, ensemble établis quelques autres règles structurantes qui peuvent facilement être déduites si on parcourt méthodiquement l’ensemble :

La totalité d’Un Monde Incertain, dont une maquette peut-être trouvée en ligne (http://unmondeconfus.canalblog.com/) serait une somme spécifique parmi toutes les possibilités que contient la construction volontairement structurée en divers labyrinthes, appelés « dédales » de mon site personnel (www.balpe.name) : celui des vidéoséries (http://www.balpe.name/-Dedale-des-Videoseries-).

Chaque participant devait, en créant au moins une vidéo, lancer un thème que les autres participants étaient, ou non, libres d‘adopter. Par exemple, le thème Epitomé, initié par Rachel Charlus, a été complété par quatre vidéos d’Ysé Marmaduke, une de Ronald Cline (participants n’ayant pas respecté la règle du pseudonyme proustien), trois d’Antoine Bréauté, une de Françoise Palancy. Chacune de ces séries devait comporter au moins dix vidéos mais, les règles étant faites pour être contournées, si une seule n’en comporte que neuf, certaines en comportent davantage.

Cet ensemble dont tous les textes devaient obligatoirement être empruntés aux productions de mon générateur automatique, devait fonctionner comme un hypertexte reliant les thèmes et les personnages présents dans les vidéos de façon à ce que, de l’ensemble des parcours s’en dessine une autre image. Ainsi la vidéo saison 1, épisode 9 du thème Tryphena et Azaan, renvoie aux personnages Tryphena, Azaan et Agam. Ce dernier intervenant par exemple dans quinze vidéos différentes qu’il serait trop long de citer ici mais qu’il est facile de retrouver sur le site lui-même (http://www.balpe.name/+-Agam-+). Il devait de cette façon être possible de multiplier les parcours sans jamais les épuiser.

Lorsque l’ensemble des vidéos atteindrait le nombre de 863, chaque participant devait créer une vidéo différente dite de « style César », allusion à la compression dont ce sculpteur s’était fait une spécialité, de façon à créer une cohérence complémentaire, en reprenant pour celle-ci un nombre minimum de 20 vidéos déjà créées, libre à lui d’en faire une simple citation ou un ensemble original. Les dix vidéos restantes nécessaires pour atteindre le nombre total de neuf cent, m’étaient réservées pour une série particulière que j’ai nommée « Épilogue » et pour laquelle j’ai décidé qu’elle serait comme une « conclusion » donnant quelques clés sur l’ensemble de l’œuvre.

Toutes les vidéos devaient être soulignées par un apport musical original dont la plupart ont été créés par Pierre Charlus qui est ainsi intervenu dans 317 d’entre elles. Le numérique étant au cœur du projet, les voix et les musiques devaient être totalement numériques. De même, il s’agissait aussi d’utiliser, au gré de chacun, des traductions automatiques (le plus souvent Googeltrad) pour obtenir des vidéos bi ou multilingues.

Une autre règle non formulée au départ s’est progressivement imposée en observant les comportements des lecteurs, celle de la durée des vidéos qui peu à peu s’est établie autour de trois minutes.

Le cœur du projet est donc bien la littérature générative, qualification jusqu’alors totalement inédite qui fait que ce type de travail a du mal à  s’installer dans le champ déjà bien trop établi de la littérature ainsi que dans celui, plus jeune, de la vidéo, ou même de l’écriture numérique. Le premier s’étant, depuis des siècle installé dans la fixité, le définitif, l’intangible ; le second fluctuant encore entre le cinéma, le texte animé, l’hypertexte, l’installation ou la performance artistique. Dans la mobilité donc mais sans l’obligation totale du récit comme dans le cinéma non expérimental. Et il me semble que la littérature générative bien qu’ayant connu ses premières tentatives il y a maintenant plus de cinquante ans est, aujourd’hui encore, perturbante. En effet, pour la plupart des lecteurs un Texte est un texte et peut difficilement être appréhendé comme un Texte de Textes. C’est à dire une potentialité infinie et non une proposition définitive. En ce sens l’aspect volontairement labyrinthique de l’ensemble de mes projets, affirmé davantage encore dans Un Monde Incertain, n’a pas pour finalité de faire en sorte qu’un lecteur se perde ou soit frustré de ne pas retrouver immédiatement ses marques mais, au contraire, de faire en sorte qu’explorant l’ensemble il se construise, au travers des associations matérialisées, ou non, une vision, authentiquement personnelle et qui ne peut être reproduite à l’identique par n’importe qui d’autre, du Texte dont il est le seul lecteur possible et de la notion même d’écriture.

Par ailleurs j’ai moi-même assigné quelques règles à ce travail basé sur la génération automatique. Par exemple, quelques lecteurs m’ont souvent fait remarquer l’étrangeté des noms de personnages dans Un Monde Incertain. Elle provient à la fois d’une volonté personnelle et d’une contrainte technique. Un générateur de textes travaille de dictionnaires ou, plus précisément de listes formalisées. J’ai ainsi importé d’Internet la liste totale des plus de 33.000 communes françaises et laissé à cette liste la désignation des toponymes apparaissant dans les textes, ce qui ne laisse pas de mettre une distance certaine entre la réalité des lieux et l’usage qu’en fait le générateur de façon à introduire une petite déstabilisation du lecteur Un Monde Incertain lui renvoyant une image déformée de son monde (remarquons au passage que cela ne déstabilise en rien un lecteur canadien ou mexicain ou…). Mon générateur dispose donc également d’un dictionnaire de noms constitué selon deux critères. Le premier étant que ne voulant, en aucune façon, que les textes produits soient réalistes, contrairement par exemple à ce que j’avais programmé pour Un Roman inachevé (http://www.balpe.name/Un-Roman-Inacheve ). Désireux, au contraire, que les noms des personnages donnent d’emblée aux textes une tonalité atypique et transportent leurs lecteurs dans un univers étrange à tonalité réaliste mais à contenu irréaliste. J’ai, dans une volonté affirmée de produire le moins de données par moi-même, importé d’Internet des listes de prénoms n’appartenant pas au domaine français, et, pour Un Monde Incertain provenant en grande partie d’une liste de prénoms arabes parmi lesquels j’ai fait opérer un tri pour obtenir une majorité de noms contenant le plus grand nombre possible d’occurrences de la lettre a ce qui constituait finalement une liste d’une centaine de termes. Choix personnel relevant en grande partie de ce que cette lettre, première de l’alphabet français, symbolisait pour moi une origine et dont le son n’est pas si fréquent dans les prénoms français. De même, j’ai décidé que cette liste qui, dans sa langue d’importation ne désignait que des prénoms, constituerait, dans Un Monde Incertain, les noms des personnages. Libre au générateur d’en faire des personnages principaux ou secondaires. J’ai également enfin utilisé une liste de prénoms carolingiens créée pour une installation ultérieure à l’Abbaye de Saint-Riquier, Les Carolingiens. Liste qui ne sert que dans des cas très précis et ne concerne jamais les principaux protagonistes des actions engendrées par le générateur.

Cette première indication sur les listes structurées permet de commencer à percevoir comment fonctionne le générateur que j’ai programmé : un générateur n’est rien d’autre qu’une utilisation intelligente d’un vaste tableau de données. L’essentiel de ce qui le constitue est en effet un vaste ensemble de listes comprenant actuellement entre 500.000 et 1.000.000 d’occurrences, ensemble qui, de plus, est constamment enrichi sans remettre en cause les principes de fonctionnement de quelque œuvre que ce soit, la plupart du temps en important directement de nouvelles listes à partir d’Internet (par exemple, une liste des oiseaux de mer ou une liste des oiseaux de proie…). Le seul fait qu’un terme figure dans telle ou telle liste lui confère immédiatement une valeur sémantique. Ainsi une liste « oiseaux », sans autre qualification peut comprendre aussi bien les « oiseaux européens », les « oiseaux de mer » ou les « oiseau de proie » mais perd ainsi de sa précision sémantique. Ces listes, suivant leur nature, reçoivent ensuite des informations d’ordre syntaxique par exemple, est attribué au mot « pigeon » la marque masculin et un pluriel en s (pigeons) par contre pour un terme plus complexe comme le « pluvier guignard » qui reçoit également une marque masculin, le pluriel est également décrit comme plus complexe puisqu’il ne porte que sur le premier des deux termes « des pluviers guignard ». Je ne vais pas, dans cet article entrer dans tous les détails des marques sémantiques et ou syntaxiques car, même si elles sont nombreuses, elles sont assez faciles à établir d’autant que, en français du moins les marques sont largement ouvertes « grand » par exemple pouvant être un substantif « un grand » ou un adjectif « le grand homme », « savoir » peut-être un verbe ou un substantif. La définition des marques et de leurs modes de fonctionnement est donc reportées sur les contextes textuels qui se chargent de les fixer.

Les plus complexes de ces listes sont celles des représentations sémantiques. Pour faire vite, disons que le générateur est une mécanisme de « centonisation » au sens presque musical du terme. 

Mais un petit détour conceptuel s’impose.

Pour l’essentiel j’estime que :

La syntaxe n’est qu’un épiphénomène de la constitution des textes ou, plus exactement, qu’elle n’est qu’un effet de surface qui n’a, à l’oral, que très peu d’influence et ne prend toute son importance que dans les écrits et, essentiellement, dans les écrits à visée littéraire, et qu’il est donc possible d’établir une syntaxe supralangues. Ainsi, mon générateur peut fonctionner, avec les même règles, dans toutes les langues d’origine romane et en anglais. Je n’ai malheureusement pas songé, lorsque j’ai créé le logiciel à des langues à déclinaison comme l’allemand, le latin, le russe, etc… Elles pourraient cependant être intégrées au prix d’une restructuration automatique de l’ensemble des termes-dictionnaires. N’en ayant pas eu besoin, elles ne sont donc pas disponibles. De même ne connaissant pas les quelques autres 2000 langues disponibles sur terre, je ne me prononcerai pas sur ce point.

Or le sens ne résulte que d’un partage d’univers communs, comme l’a montré depuis longtemps la sémantique générale il s’établit à partir de connexions en réseau des univers propres à tel ou tel individu. Largement externe à la langue même, il n’est pas, en tant que tel programmable.

Ce qui construit un texte, c’est le sens. Car le sens, à bien des égards se crée hors du texte lui-même. À tous les niveaux il n’est rien d’autre qu’une représentation du monde dans lequel vivent ses producteurs et ses lecteurs. Or ce monde est totalement illogique, mouvant, contextuel. Il n’est donc ni logique ni formellement structurable. Toute compréhension du sens d’un texte est ce que j’appelle une opération de « coopérativité lectorielle » : un texte n’est rien sans le lecteur qui le lit. D’où ses multiples interprétations possibles. Un exemple élémentaire permet de comprendre. Une phrase comme « la table est vaste » n’est pas interprétable en dehors de ses contextes. D’abord de ses contextes immédiats : de quelle table s’agit-il ? D’une table sur laquelle on mange, d’une table au sens de tableau de données ou d’une table au sens géographique ? (définition du Larousse : 1. Se dit d'une structure géologique à laquelle correspond une topographie plane (plateau, haute plaine), limitée par des abrupts. 2. Se dit d'une roche dont les cristaux ont la forme d'une tablette. 3. Se dit de la différence entre deux valeurs successives d'une table numérique.) Ensuite de ses contextes d’usage. Dans de nombreux contextes géographiques culturels, par exemple, la notion de table où l’on mange n’est en rien opérante.

« Ils se mettent à table » n’a pas le même sens dans un contexte de haute aristocratie ou dans celui d’une famille de pêcheurs bretons, etc. Autre exemple, la notion de « date de naissance » n’a aucun sens dans un contexte touareg où elle est très théorique par rapport à une conception « rigoureuse » à l’occidentale. Une compréhension réelle exige donc l’apport de nouveaux contextes, soit par les connaissances propres au lecteur soit, dans bien des ouvrages, notamment en traduction, par des notes qui sont autant d’apports de contextes. Tout texte est à lui-même le premier niveau de contexte qui définit partiellement le sens des termes qu’il contient, mais un second niveau de contexte est nécessaire, celui des connaissances et des acceptations sémantiques de ses lecteurs.

Pour faire générer un texte, il suffit donc de maîtriser ou de paraître maîtriser les contextes qui le constituent. Plus ce texte reste non fonctionnel et travaille sur l’imaginaire, plus cette génération est facilitée car une grande partie de sa signification est ouverte. Faire générer un texte à contextes structurels forts, un rapport scientifique sur le Covid 19 par exemple, rend difficile, et même inopérante, sa génération car aucune de ses données contextuelles ne peut être ni approximative, ni imaginaire. Ce qui, à l’inverse, n’est pas le cas pour un texte littéraire qui porte son propre contexte et s’inscrit dans l’imaginaire. Autrement dit, de façon plus simple, dans un contexte littéraire, il est possible de faire écrire presque « n’importe quoi », comme le montrent à merveille la génération automatique de textes relevant du poétique pour lesquels le degré d’ouverture d’acceptation d’un lecteur est beaucoup moins contraint.

Cette ouverture de la génération automatique ne peut cependant être totale car du n’importe quoi ne produit que du n’importe quoi, même si les limites entre le n’importe quoi et le quelque chose sont floues car la coopérativité lectorielle fait que le lecteur tend toujours à chercher à comprendre. Ainsi, un texte comme : « — Une dernière fois, officier… mais il fut coupé par une autre voix sur la même fréquence:... Celui qui ne sera pas à bord à deux heures aura vingt coups de corde et huit jours de fers sur un parc à boulet. Tous les jours il marche presque tout le jour — comme d'habitude, les tournesols regardaient le soleil — le sentiment est quelque chose qui nous appartient, que vous ne comprenez pas bien, vous autres, car il vous obscurcit, tandis qu'il nous éclaire. Mais quand Botan se vit seul avec Adur, une sueur froide pointa à la racine de ses cheveux. Il y avait partout de la lumière, une luminosité immense — Botan et Amalaire lurent bien vite et côte à côte, l'Appel au peuple, la dissolution de la Chambre, l'emprisonnement des députés — la lueur montait de la mer. » généré sans aucun contrainte laisse penser à son lecteur, malgré quelques surprises évidentes, qu’il peut s’agir d’un texte même si il est gêné, dans sa lecture, par un certain nombre d’incohérences. Le principe est ainsi, volontairement, de solliciter au maximum l’imaginaire textuel du spectateur-lecteur, qui peut alors constituer sa propre cohérence, imaginaire qui conduit d’une vidéo à une autre dans Un Monde Incertain. C’est aussi ce qui fait que nous avons décidé que les rapports entre l’image vidéo et les textes qu’elle contient devaient rester très largement de l’ordre métaphorique. La vidéo ne devait en aucun cas, illustrer le ou les textes ou tenter un fil conducteur — ce qui constituerait une fermeture sémantique — mais créer entre eux un rapport de sollicitation imaginaire.

Dans un tel contexte, il suffit, d’obtenir des structures sémantiques de base, c’est-à-dire des fragments de texte pouvant signifier de façon relativement autonomes. Sur Internet elles sont en nombre illimitées, il est possible, la plupart du temps d’en importer des livres entiers et de les faire traiter pour maîtriser des contextes élémentaires : importer des dizaines de description de plantes permet de créer un herbier numérique (cf. l’herbier, par exemple : https://www.artabsolument.com/fr/product/index/detail/751/L-Herbier.html ) et des dizaines de descriptions d’animaux, un bestiaire fantastique (cf. Monstrueux Monstres : http://www.balpe.name/Monstrueux-Monstres-1 ). D’où la possibilité de centonisation. Ainsi, si l’on veut des contextes maritimes, il suffit d’importer des ouvrages parlant de la vie maritime, pour des contextes urbains, il suffit d’importer des ouvrages traitant de contextes urbains… Cette affirmation est tout de même un peu sommaire car, pour obtenir des résultats plus satisfaisants il est cependant nécessaire de doter automatiquement les données téléchargées de quelques informations supplémentaires.

Supposons que le texte téléchargé soit le suivant « emprunté » aux Misérables de Victor Hugo : « Le spectacle était épouvantable et charmant. Gavroche, fusillé, taquinait la fusillade. Il avait l'air de s'amuser beaucoup. C'était le moineau becquetant les chasseurs. Il répondait à chaque décharge par un couplet. On le visait sans cesse, on le manquait toujours. Les gardes nationaux et les soldats riaient en l'ajustant. Il se couchait, puis se redressait, s'effaçait dans un coin de porte, puis bondissait, disparaissait, reparaissait, se sauvait, revenait, ripostait à la mitraille par des pieds de nez, et cependant pillait les cartouches, vidait les gibernes et remplissait son panier. Les insurgés, haletants d'anxiété, le suivaient des yeux. La barricade tremblait ; lui, il chantait. Ce n'était pas un enfant, ce n'était pas un homme ; c'était un étrange gamin fée. On eût dit le nain invulnérable de la mêlée. Les balles couraient après lui, lui, il était plus leste qu'elles. Il jouait on ne sait quel effrayant jeu de cache-cache avec la mort ; chaque fois que la face camarde du spectre s'approchait, le gamin lui donnait une pichenette. »

Il n’est, dans son intégrité, pas exploitable, sinon sous forme de citation. Il faut donc, tout d’abord, le faire fragmenter, ce qui donne :

1. Le spectacle était épouvantable et charmant
2. Gavroche, fusillé, taquinait la fusillade
3. Il avait l'air de s'amuser beaucoup
4. C'était le moineau becquetant les chasseurs
5. Il répondait à chaque décharge par un couplet
6. On le visait sans cesse, on le manquait toujours
7. Les gardes nationaux et les soldats riaient en l'ajustant
8. Il se couchait, puis se redressait, s'effaçait dans un coin de porte, puis bondissait, disparaissait, reparaissait, se sauvait, revenait, ripostait à la mitraille par des pieds de nez, et cependant pillait les cartouches, vidait les gibernes et remplissait son panier
9. Les insurgés, haletants d'anxiété, le suivaient des yeux
10. La barricade tremblait
11. lui, il chantait
12. Ce n'était pas un enfant, ce n'était pas un homme ; c'était un étrange gamin fée
13. On eût dit le nain invulnérable de la mêlée
14. Les balles couraient après lui, lui, il était plus leste qu'elles
15. Il jouait on ne sait quel effrayant jeu de cache-cache avec la mort ; chaque fois que la face camarde du spectre s'approchait, le gamin lui donnait une pichenette

Fragments qui, comme on peut le constater, peuvent intervenir en de très nombreux contextes différents. Les phrases 1, 3, 10, 11, par exemple, sont, en ce sens, très ouverte. Les autres étant plus marquées dans un contexte « guerrier ». Le but est alors de les décontextualiser au maximum de façon à élargir les possibilités de centonisation, en supprimant par exemple tout ce qui peut fermer le contexte. Par exemple la phrase 2 devient alors : [personnage], fusillé, taquinait la fusillade, 10 : [personnage] chantait… et 13 : Les balles couraient après [personnage], [personnage], [personnage] était plus leste qu'elles. Ainsi un certain nombre de procédures de décontextualisation vont transformer les 14 phrases de la façon suivante :

1. le spectacle était épouvantable< et charmant>
2. [personnage]<, fusillé,> taquinait la fusillade
3. [personnage] avait l'air de s'amuser< beaucoup>
4. c'était le moineau becquetant les chasseurs
5. [personnage] répondait< à chaque décharge>< par un couplet>
6. on visait [personnage]< sans cesse><, on manquait [personnage] toujours>
7. <les gardes nationaux et >les soldats riaient< en ajustant [personnage]>
8. [personnage] se couchait<, [163#] se redressait><, s'effaçait dans un coin de porte><, [163#] bondissait><, disparaissait><, reparaissait><, se sauvait><, revenait><, ripostait à la mitraille par des pieds de nez>, [61#] [30#] pillait les cartouches<, vidait les gibernes>< [61#] remplissait son panier>
9. les insurgés<, haletants d'anxiété>, suivaient [personnage] des yeux
10. la barricade tremblait
11. [personnage] chantait
12. ce n'était pas un [enfant]<, ce n'était pas un homme>< ; c'était un étrange [enfant] fée>
13. on eût dit le nain invulnérable de la mêlée
14. les balles couraient< après [personnage]<, [personnage] était plus leste qu'elles>
15. [personnage] jouait< on ne sait quel effrayant jeu de cache-cache> avec la mort< ; chaque fois que la face camarde du spectre s'approchait, [personnage] lui donnait une pichenette>

Fragments dans lesquels la mise entre <…> signifie une partie facultative. Expliquer toutes les transformations de ces séquences obligerait à examiner en détail toutes les règles qui amènent à établir une décontextualisation totale. Disons simplement que chacun d’elle va recevoir une « clef contextuelle » élémentaire que, par exemple, que 3, 11, 12 recevront une clef ouverte et seront disponibles dans beaucoup de contextes, la plupart des autres recevront un contexte de type « combat » sur lequel le logiciel de recontextualisation s’appuie pour créer ses textes. De plus divers traitements vont contrôler les adaptations de surface. Si par exemple [personnage] peut être indifféremment, femme, homme, enfant, il faut que le texte produit puisse en tenir compte, par exemple dans la phrase 2 où l’adjectif « fusillé » exige un accord. Plus encore si [personnage] peut, indifféremment être singulier ou pluriel. De même, il faut établir si [personnage] joue un rôle important dans le texte, apparaissant comme un personnage principal, ou non. La phrase 7, par exemple, après l’ensemble de ses traitements sera enregistrée ainsi : « [combat] [62|m_militaire 1]< [63#] [62|m_militaire 1] [029000000|v_rire] [080200000|v_ajuster] [0|Héros] », qui peut produire un peu plus de 38.000 écritures de surface susceptibles d’adaptations lors de la centonisation.

Mais, laissons-là cette « cuisine » programmatique relativement simple. 

La richesse des textes produits dépend alors du plus ou moins grand nombre de données décontextualisées disponibles, mais aussi de l’utilisation plus ou moins poussée des clefs conceptuelles. Ainsi, rien n’empêche qu’une clef conceptuelle renferme en fait plusieurs autres clefs différentes. [météo], par exemple, peur contenir [pluie] [neige] [froid] [tempête], etc.. Tous ces éléments étant intégrés dans un logiciel de tabulation, la maîtrise de ces différentes clefs est un jeu d’enfant. Ainsi, si, dans l’ensemble de données dédiées à Un Monde Incertain, on veut faire générer un texte à partir des clefs contextuelles suivantes [pluie] [amour] [réflexion], on obtient indifféremment : « Des gouttes d'eau tombèrent. Oman ne donnait plus de dîners qu'Enriqueta n'y vienne. Il  savait sans cesse ce qu'il faut faire en toute circonstance. » mais aussi : « Quelques gouttes de pluie tombèrent… — Dieu ! Que n'ai-je autant d'esprit que ces feuilles de papier. Sa conscience ne se représentait qu'un fragment de la réalité. » ou « Il avait plu tout à l'heure. C'est une loi presque invariable que les plaisirs exquis se payent chèrement. Rien que d'ordinaire… », etc… le nombre de combinaisons étant presque illimité (ici 1200 structures sémantiques de base « pluie », 12500 « amour », 21876 « réflexion », permettent 32.814.0000.000 générations diverses). On sait, par ailleurs, la puissance productive d’une combinatoire… Le système est inépuisable car il est toujours possible de télécharger un nombre presque illimité de ces structures sémantiques de base. Or plus elles sont nombreuses plus l’ensemble est génératif.

Une fois ces structures de base appelées, le logiciel de génération peut se livrer à quelques opérations élémentaires de surface car, en fait, après les divers traitements d’importation, une structure élémentaire de base se présente ainsi : [12|m_pluie 1] [020000000|v_résonner 1]< [34#] grêle><, [142#] la capote [11|m_voiture 2]> renfermant ainsi divers éléments de syntaxisation et de surface sémantique : [m_pluie 1] permet : averse, pluie, ondée, orage… Le logiciel de génération va donc décider s’il écrit : « la pluie résonnait comme grêle » ou « l’orage retentissait » ou « l'orage retentissait comme grêle, sur la capote de l'Aston-Martin » ou « la pluie retentissait, sur la capote de la Dodge ». En fait dans ce cas précis, 1080 écritures de surface, ce qui enrichit encore considérablement la centonisation des structures sémantiques de base (354.391.200.000.000 écritures de surface possibles. Remarquons qu’à ce niveau le nombre de textes possibles ne veut plus rien dire mais signale quand même un paradoxe : quels que soient les exemples que je donne ici, aucun lecteur, jamais, quels que soient le nombre de parcours qu’il s’efforcera de faire dans Un Monde Incertain, ne pourra les retrouver. Il ne lui reste donc plus qu’à me faire confiance quant à leur authenticité.)

Quant aux petits problèmes d’accords qui lissent la surface des textes écrits (la plupart d’entre eux disparaissent à l’oral), ils sont réservés à une dernière étape de textualisation.

Voici par exemple un texte « brut », généré sans contrainte textuelle, avant traitement de surface :

« Fils d’un inspecteur de police, il avait hérité de la stature et de la démarche de son père. Sitôt que Arn fut sur le palier, l'individu tira de sa poche un béret de berger en laine, se le mit sur la tête et descendit rapidement l’escalier branlant... 
— chaque année, je fais un tour à bicyclette avec quelques camarades. Jonas sortit de la chambre Afag se hâta vers la porte... Mais personne ne lui refusait du talent Adur ne répondit pas aussitôt ; 
— Je crois ! Ajoute Madelgarde une nuance de moquerie atténua ce qu'il y faisait d’un peu servile dans sa manière et après tout, c'est le pays, comme on dit... 
— Servez-vous, messieurs, dit Alpaïs.
Maldegarde envoya sa fille aînée dans un bon couvent où on lui apprit le français et la musique et plus tard lui paya ses inscriptions au Conservatoire. »

et ce qu’il devient après traitement de surface :

Fils d’un inspecteur de police, Arn avait hérité de la stature et de la démarche de son père. Sitôt qu’il fut sur le palier, un individu tira de sa poche un béret de berger en laine, se le mit sur la tête et descendit rapidement l’escalier... 
— chaque année, je fais un tour à bicyclette avec quelques camarades. Arn sortit de la chambre. Il se hâta vers la porte... Mais personne ne lui refusait du talent. Il ne répondit pas aussitôt.
— Je crois ! Ajoute Madelgarde qu’une nuance de moquerie atténuerait ce qu'il y a d’un peu servile dans vos manières et après tout, c'est le pays, comme on dit... 
— Servez-vous, messieurs, dit Arn.
Maldegarde envoya sa fille aînée dans un bon couvent où on lui apprit le français et la musique et plus tard lui paya ses inscriptions au Conservatoire.»

En résumé, la génération automatique est, en ce qui me concerne, une centonisation généralisée et ouverte. Une fois l’importation de données faites, le texte, après leur transformation en structure sémantiques de base, se produit en trois étapes :

1. Sélection d’un certain nombre de structures sémantiques de base (nombre déterminé par l’aléatoire du générateur en fonction du type de Texte recherché. Pour des publications sur écran, ce nombre est déterminé par les possibilités d’affichage.
2. Transformation des structures sémantiques de base en structures sémantiques exploitables
3. Lissage de surface des variables de ces dernières.

Dans Un Monde Incertain, chaque participant (chaque auteur ?…) pouvait donc, sur la base de la structuration de données, définir un texte comme totalement libre ou le contraindre (par exemple : [philo] [pluie] [philo] [amour] [amour] [amour] [amour] [amour] [amour] [pluie] [philo]). Il pouvait également décider si sa vidéo devait utiliser un seul texte ou x textes différents, décider de leur mise en image et de leur mode d’apparition, de leur (ou non) illustration sonore, excepté dans la série dominée par le « style César » (http://www.balpe.name/+-Style-Cesar-+ ) ou dans Épilogue, série qui m’était réservée . Choisir la thématique parmi celles disponibles ou en créer une, s’adapter plus ou moins (ou non) aux productions des autres participants. Choisir s’il voulait un texte en prose ou en vers… La plupart des participants ont joué ce jeu ce qui fait qu’en moyenne ils ont produit 33 vidéos. Seuls deux d’entre eux ont mené une démarche peu collective : Ysé Marmaduke qui a produit 69 vidéos et Number Six qui n’en a produit que deux et en ne respectant que peu les règles (mais comment dire à un ami aussi productif qu’il devait sortir du projet ?). Après tout n’était-ce pas un autre niveau d’incertitude ?

Il faut cependant noter les insuffisances de cette approche particulière de la génération automatique où nombre de textes présentent encore des incohérences. L’ordinateur n’a pas la puissance d’un cerveau humain qui fait constamment son miel des contextes qu’il traverse et s’adapte sans grande difficulté. Ces insuffisances sont donc, pour l’essentiel, dues aux analyses automatiques des textes importés. Très souvent les étiquettes conceptuelles attribuées aux données sémantiques de base sont assez approximatives. Par exemple, une phrase telle que « D'abord, Berthe ne vit rien, le ciel restait clair : mais une tache sombre se montra à l'angle de la toiture, déborda » est affectée, sans aucune raison évidente, au concept [amour] parce qu’elle importée dans l’ensemble de textes parlant massivement d’amour, et l’affectation à un concept précis, dans ce cas, n’est pas évident. Or ce phénomène est fréquent même s’il ne gêne pas toujours la production de texte car une telle phrase, au fond, à la sémantique plutôt ouverte, peut intervenir dans de très nombreux contextes. Ces contextes sont en nombre très limités par rapport à ce que représente l’univers réel même si, au fur et à mesure des captures de données ils s’enrichissent constamment.

Une fois les données importées, leur traitement de surface n’est pas des plus évidents. Même si certaines conceptualisations sont apparemment simples, par exemple affecter une marque [personnage] est assez simple à partir d’une liste de prénoms, il n’est jamais sûr que la partie analyse du logiciel connaisse réellement tous les prénoms existant dans le monde et il en laisse passer un certain nombre. Situation encore plus complexe pour les noms propres et les noms de lieux qui sont en nombre infini suivant les contextes et il y a de grandes chances qu’une ville comme Ethekwini, malgré ses trois millions d’habitants lui soit inconnue. Un texte est confronté à toutes les connaissances disponibles du monde et un générateur automatique ne peut parvenir à les posséder même si, peu à peu, elles s’accroissent. Ainsi pour le logiciel Abainville est équivalent à Leipzig, pour les distinguer il faudrait en effet multiplier les critères : géographie, taille, histoire, etc… ce qui, pouvant être intéressant pour générer des textes à destination géographique n’a pas un grand intérêt dans un logiciel à vocation littéraire qui s’autorise de nombreuses approximations pourvu que les textes créés fonctionnent dans la cadre déterminé.

De même le traitement précis des structures élémentaires de base est souvent complexe, et, dans bien des cas encore hors de portée du logiciel que j’ai conçu. Déterminer, par exemple, ce qui, dans une phrase fait partie du cœur de la phrase et ce qui ne lui est que complémentaire est, en grande partie, peu ou pas automatisable (du moins je n’ai pas réussi à établir des règles logiques qui le permettraient). Dans « de bon matin, elle faisait irruption avec une bassine de patates ou de petits pois à écosser » (Yann Queffélec, Les Noces Barbares), la difficulté vient du « ou » alternatif : obtenir « <de bon matin, >elle faisait irruption avec une bassine< de patates>< ou de petits pois à écosser> » est impossible, on ne peut donc relativement assez facilement qu’obtenir « <de bon matin, >elle faisait irruption avec une bassine< de patates ou de petits pois à écosser> » mais si ce cas est assez simple d’autres se révèlent infiniment plus complexe à analyser automatiquement et, souvent même, impossible, l’analyse par la ponctuation étant insuffisante, fautive, ou ne révélant pas toujours les constituants syntaxiques. De plus certaines structures sémantiques de base ne peuvent être décrites par un concept unique. « La nuit soudain tombait vite ; une obscurité lancinante et poisseuse émanant d’un ciel noir gorgé d’électricité » (Yann Quéffelec, Les Noces Barbares) réfère à la nuit, mais aussi à l’orage et toutes ne sont pas aussi simples que celle-ci à diviser en deux structures élémentaires comme celle-ci.

Reste donc toujours un assez grand nombre d’approximations conceptuelles dont, heureusement, dans bien des cas, la coopérativité lectorielle fait que le lecteur s’en accommode, comme d’ailleurs dans nombre de textes écrits par des auteurs humains avec lesquels la génération automatique littéraire ne cherche en rien à rivaliser. Notons au passage que cette notion de coopérativité lectorielle est floue, dépendant en grande partie de la psychologie mais surtout de la culture du lecteur : un lecteur de poésie contemporaine et/ou amateur de cinéma où les ruptures logiques sont constantes, sera plus à même d’être coopératif qu’un autre. Par sa mobilité, son adaptabilité, sa générativité, la littérature générative se contente d’ouvrir d’autres perspectives à la littérature et donc de nouvelles modalités de présence.

Cette approche ne permet pas notamment la génération automatique de textes longs de plusieurs pages, une nouvelle courte, peut-être, un roman sûrement pas parce que au fur et à mesure de l’écriture les concepts et les variables non maîtrisés s’accumulent et que s’installent de plus en plus d’incohérences. Certaines « astuces » d’écriture peuvent limiter cela, par exemple en considérant dès le départ et en présentant ce choix comme un effet littéraire qu’il ne peut y avoir de cohérence entre les éléments de base. Par exemple :

« Taanach se souvenait : les Kaptars retournèrent vers leurs petits, voulant que le premier lait qu'ils sucent soit pénétré du suc des aurones 
Taanach se souvenait : quelques phares brillèrent à trois rues de distance
Taanach se souvenait : Taanach marchait 
Taanach se souvenait : ce jour-là eut lieu dans le foyer Epitecte le dîner d’adieu qu'Itta offrait aux trois hommes à qui elle devait la vie, c’est-à-dire Taanach, Aidan et Aidan 
Taanach se souvenait : il ne voulait pas de romans 
Taanach se souvenait : rentrant chez lui à l’improviste, à la minute même d’un coup de tonnerre d’une rare violence, il trouva sa jeune épouse complètement déshabillée par la violence du choc
Taanach se souvenait : rien ne distingua cette soirée des parties fines que faisaient à Nemours, les femmes et les Pémains 
Taanach se souvenait : un beau matin on lui donna une feuille de route et soixante-six francs qu'il s'était amassés dans ses quinze ans de galères, en travaillant seize heures par jour, trente jours par mois, et douze mois par année. » ou en remplaçant « Taanach se souvenait » par une date quelconque ou un lieu, etc. toute solution d’écriture dissociant dès le départ les phrases générées d’une cohérence forte d’ensemble.

La génération automatique de texte ne se destine donc pas à l’exactitude d’un rapport d’expertise, ainsi conçue elle se définit bien davantage comme un champ de recherche pour de nouvelles perspectives littéraires, notamment une confrontation à la mobilité et à l’infini et non comme un prolongement technique de modalités d’écriture déjà existantes.

Aucun commentaire:

Enregistrer un commentaire