Dans les mondes animistes, arbre, animaux, humain·es ou objets se distinguent les uns des autres par des formes différentes mais sont animés d’un esprit qui peut voyager, se transformer et agir sur le monde. Pour les sociétés totémiques, les êtres de toute sorte ont un lien avec un prototype (le totem) dont ils sont issus et se répartissent en différents groupes qui cohabitent mais se distinguent par cette appartenance. Dans les sociétés analogiques, chaque être se différencie des autres non par des caractéristiques propres mais par la position qu’il occupe dans le système global dont établir la cohérence et le fonctionnement est une difficulté en soi. Enfin, les sociétés naturalistes, qu’incarne la culture occidentale depuis sa prétendue modernité, identifient des règles biologiques et physiques, établies par la science, qui s’appliquent pareillement à tous les existants mais où l’humain·e se distingue par la spécificité de son intériorité. Dans ces différentes sociétés, les questions existentielles s’articulent autour de préoccupations tout à fait spécifiques : quel est l’esprit qui habite cet oiseau qui me regarde ? Ce kangourou est-il de ma famille ? Quelle est la place que j’occupe dans le cosmos ? Ne suis-je qu’un amas fugace de particules ?
La synthèse ambitieuse que propose Descola amène deux conséquences cruciales. Elles expliquent l’influence de son œuvre dans les domaines de l’anthropologie et de l’ethnographie. Sa réflexion irrigue également des milieux plus militants, notamment des luttes environnementales. D’une part, il faut acter que les représentations naturalistes que notre culture « moderne » nous a inculquées ne sont pas les seules explications qui donnent du sens au monde et à l’existence, même si elles ont pris le pouvoir dans les manières de gouverner. Et d’autre part, il faut prendre conscience que cette relation culturelle à l’environnement facilite l’exploitation des ressources dites « naturelles » — séparées de l’humanité car réduites à des matières dépourvues d’intériorité — que l’industrialisation a transformé en catastrophe aux conséquences planétaires.
Quinze ans après Par-delà Nature et Culture[1], Philippe Descola prolonge sa réflexion en s’intéressant aux images dans Les Formes du visible[2]. C’est à la suite de ces travaux de réflexion sur les cultures visuelles qu’il nous est apparu pertinent d’entendre l’anthropologue sur les enjeux contemporains des IA visuelles. En filigrane de cet échange plane un enjeu culturel spécifique à un monde globalisé, indifférent aux survivances des patrimoines culturels, des modes de vie alternatifs et de visions du monde potentiellement en voie d’extinction. Si l’IA générative s’impose comme l’outil de référence des représentations visuelles, sa nature d’outil statistique participerait à l’effacement des traditions et des imaginaires non compatibles avec le format numérique et non conformes à la manière de voir le monde qui s’est imposée à la faveur des colonisations et de la globalisation. Si la vocation des images est de donner à voir ce qui ne se voit pas, l’IA contribuerait à appauvrir les mondes invisibles et à faire disparaitre des imaginaires qui appartiennent au patrimoine humain.
Après votre travail sur les ontologies et la notion de nature, pourquoi vous êtes-vous intéressé aux images ?
C’est une forme de vérification de la pertinence des propositions que j’avais pu faire concernant les formes de mondiation. J’avais travaillé essentiellement sur la base de documents ethnographiques, à partir de textes philosophiques, de traités médicaux, de livres de toutes sortes qui me donnaient des informations sur d’autres façons de faire monde que les nôtres mais également sur celles qui nous sont familières. Et je me suis dit que s’il y a une pertinence à ces propositions, on devrait pouvoir en trouver la trace dans les images et dans l’organisation d’espaces visuels, c’est à dire dans ce qui était montré ou n’était pas montré dans l’image. J’ai donc commencé à travailler sur cette question par curiosité intellectuelle et parce que je m’intéresse aux images depuis longtemps, en amateur d’histoire de l’art, disons. J’ai commencé par monter une exposition au musée du Quai Branly il y a une douzaine d’années et qui m’a permis, pour la construire, de sélectionner un certain nombre d’images que je souhaitais mettre en regard les unes des autres. Et pour cela, il fallait aussi que ces images soient parlantes. Je souhaitais qu’un public qui n’était pas familier de ces mondes et des civilisations extra-modernes d’où ces images provenaient, et même pas nécessairement familier d’une partie de la peinture occidentale par exemple, puisse repérer, identifier des contrastes entre ces images de façon à ce que le message puisse passer. Je me suis beaucoup amusé.
J’avais sélectionné ces images parmi certaines de telle ou telle civilisation, en prenant celles qui correspondaient à ce que j’avais déjà identifié comme étant d’un régime plutôt animiste, analogiste ou totémique, etc. Dans un second temps, l’expérimentation a consisté à détecter dans ces ensembles d’images des dispositifs qui correspondaient à certains de ces régimes, et je les ai suivis à la trace avec l’ambition de mettre en évidence trois choses.
La première, c’est en quoi elles révèlent certains aspects du monde qui ne sont pas nécessairement visibles ou exprimées par les discours. Par exemple pour l’animisme, ce qui a retenu mon attention, c’est l’effet de commutation, ce que dans les analyses ethnologiques de l’animisme, on appelle la métamorphose. Il s’agit du basculement de point de vue entre la perception de l’intériorité d’un être et la perception de sa physicalité. Ou bien, pour l’analogisme, la mise en évidence de formes de méta-relations, de toutes sortes d’englobements, de correspondances, de hiérarchies entre les êtres.
Le deuxième aspect, c’était l’aspect formel : comment se construit l’espace visuel ? Avec notamment, et on aura l’occasion d’y revenir quand on parlera des images produites par l’intelligence artificielle, le fait qu’une des caractéristiques de la figuration naturaliste, c’est le mono-perspectivisme, c’est à dire l’émulation de la vision humaine : la tentative de reproduire le plus fidèlement possible ce que perçoit un humain lorsqu’il est face à une scène, un personnage. Cette caractéristique tranche de façon considérable sur d’autres façons de figurer et de construire l’espace visuel. Dans d’autres régimes de figuration, c’est le polyperspectivisme qui domine : on va donner d’un être ou d’une scène des points de vue différents, de façon à multiplier les informations sur cet être ou sur cette scène, y compris de façon contre-intuitive par rapport à la vision humaine. Cela a beaucoup troublé les Européens lorsqu’ils ont été confrontés à des images de civilisations extra-modernes vues comme étant malhabiles, contre-intuitives, magiques, etc. alors qu’elles adoptaient une perspective qui consistait à déplier les points de vue et les différentes faces d’un être de façon à ordonner sur cette image le plus grand nombre d’informations possibles sur cet être.
Le troisième aspect, c’est le fait que les images ont une puissance d’agir qui leur est propre. Cet aspect a retenu l’attention des historiens de l’art depuis plusieurs décennies mais aussi de l’anthropologie. Et l’hypothèse que j’ai souhaité défendre, c’est que les formes d’expression de la puissance d’agir des images varient en fonction des régimes ontologiques propres à chacun de ces modes de figuration. Il n’y a pas un mécanisme unique qui donne une puissance d’agir aux images, mais différents types de mécanismes d’animation de ces images qui sont en relation avec les circuits d’attente, avec la manière dont ces images sont accueillies.
Entrainées sur des corpus massifs de données occidentales, réalisées par des outils occidentaux, les IA génératives incarneraient l’omniprésence de l’image sur une surface plane (l’écran). Qu’est-ce que cette caractéristique technique vous inspire au regard de la diversité des images et de ce qu’elles donnent à voir ?
Même quand c’est un carré plat, le fait que ces images soient numérisées la plupart du temps, soit parce que ce sont des photographies numériques, soit parce que ce sont des peintures numérisées, aboutit à gommer le support, essentiel dans la puissance d’agir des images. Lorsqu’on regarde un retable dans une chapelle latérale d’une église mal éclairée avec des bougies, le lieu pour lequel il a été fait était déjà pris en compte par son concepteur. L’effet qu’il va exercer sur le spectateur est en partie défini par ces circonstances, qui sont toutes invisibles sur une surface en deux dimensions numérisées, même si l’image est déjà une surface en deux dimensions. Donc le mode d’exposition général, c’est-à-dire ce que j’évoquais en parlant des circuits d’attente ou des circuits d’accueil des images, disparaît complètement et uniformise des images qui sont en deux dimensions mais dont les formes d’exposition ne sont pas les mêmes selon les contextes culturels.
Le second aspect, c’est que beaucoup d’images dans le monde ne sont pas en deux dimensions. Soit parce que ce sont des images en trois dimensions, c’est à dire des sculptures, ou parce que ce sont des corps humains qui sont transformés en images [par des tatouages, des costumes, des masques…]. Et c’est cette diversité que l’IA et la généralisation des images numériques nous rend de plus en plus difficile d’imaginer. Ces différentes formes de figuration qui semblent extrêmement diverses ont pourtant le même sens : rendre présentes des choses invisibles ou absentes. Il faut en outre mettre l’accent sur le fait que ce qu’on appelle maintenant les arts premiers ont été pour l’essentiel des figurations en trois dimensions. Lorsqu’on regarde les revues spécialisées dans ces arts, elles sont pour l’essentiel consacrées à des sculptures, des effigies, des masques, etc. Il y a donc une sorte de tradition du fétiche qui subsiste et qui tend à garder à distance ces formes de figuration des civilisation extra-modernes. Car nous avons pris l’habitude de regarder les images comme étant des dispositifs en deux dimensions.
Donc ça veut dire qu’on aurait beau pousser la capacité à reproduire des images issues de toutes ces cultures, à partir du moment où on les désincarne de l’endroit où elles sont supposées être exposées, on a déjà perdu une partie de leur rôle et de leur valeur.
C’est le problème d’ailleurs des musées d’ethnographie en général. Quels que soient les efforts qu’on peut faire pour mettre en contexte, des images, on ne pourra jamais y parvenir complètement. Ça ne veut pas dire que ce soit une tentative invalide ou désespérée. Mais j’ai toujours pensé que les images avaient plusieurs vies en fonction des milieux et des médias au moyen desquels elles étaient rendues visibles. Leur apparition initiale pour une fonction précise dans un contexte précis est la plus importante. Mais je n’entends pas pour autant considérer que les autres sont complètement négligeables. Et la vie d’une image dans un musée, c’est une vie tout à fait singulière comme celle d’un masque rituel qu’on va trouver dans une vitrine, mais qui sera complètement dissociée à la fois du rite et de l’incarnation pour lesquels il a été créé, avec tous les effets de présence, de contexte, la musique, l’atmosphère générale, la chaleur, la poussière, le froid… tous ces éléments qui jouent un rôle très important dans les effets que les image produisent sur nous.
Certaines images qu’on a l’habitude de voir dans des églises sont pour moi indissociables de l’odeur de l’encens par exemple. Leur efficacité est liée à cette odeur. Ce sont des choses dont il est très difficile de rendre compte dans un musée. On peut projeter des petits films où on voit par exemple un masque rituel utilisé dans le contexte pour lequel il a été conçu. Mais, on a beau avoir une petite explication, c’est quand même encore très loin de permettre de comprendre quels sont les contextes dans lesquels ces images étaient exposées et étaient actives.
Au fond, je dirais que la façon dont les images sont montrées en deux dimensions par l’intelligence artificielle n’est qu’un prolongement d’un statut des images dans les musées, toutes présentées à l’identique qu’elles soient en deux ou trois dimensions, comme des témoignages d’un mode de figuration artistique d’un certain type que l’on a appris à considérer comme étant digne d’intérêt. Les images produites par l’intelligence artificielle occupent une certaine place dans une succession de monstrations des images qui a déjà commencé avec les musées.
Ce qui est frappant avec les IA génératives, c’est qu’elles sont conçues comme un outil qui promet de visualiser toutes les représentations possibles. Sur base d’une instruction, vous pourriez générer n’importe quelle image. Et elles sont entraînées à partir de masses d’images énormes qui sont étiquetées en fonction de ce qu’elles montrent. Selon vous, est-ce qu’on pourrait le voir comme une sorte de summum de cette espèce de domestication par le regard de tout, de tout ce qui peut se traduire en images du moins ?
Les premières figurations scientifiques au XVIème siècle, jusqu’aux rayons X et à toutes ces techniques de dévoilement, montrent bien les différentes étapes de la construction de l’objectivité naturaliste. Celle-ci a été constituée par les images avec les différents choix qui ont été faits à différentes époques pour révéler telle ou telle chose, c’est à dire soit des types soit au contraire les particularismes du réel. Les cristaux de neige par exemple ont d’abord été figurés de façon prototypique, en fonction des quelques modèles qui étaient identifiés, notamment par le microscope. Et puis peu à peu, on s’est aperçu qu’il y avait une plus grande diversité et on s’est attaché précisément à montrer plutôt la diversité que la prototypicalité. Ce qui est caractéristique des images produites par l’intelligence artificielle, c’est qu’on en est encore au stade de la prototypicalité : elles viennent prolonger des stéréotypes très anciens.
Prenons par exemple l’image de la nature avec une montagne au fond et un lac devant, produite par une IA. C’est un stéréotype qu’on retrouve dans la peinture du sublime aux États-Unis avec des artistes comme Albert Bierstadt (1830-1902). On peut retracer la transmission de cette image dans d’autres supports, notamment les publicités. Cette représentation est vraiment un stéréotype mental et visuel et je pense que les historiens de l’art pourraient s’intéresser à ces images produites par l’intelligence artificielle pour établir des généalogies de stéréotypes qui sont tout à fait caractéristiques et qui ignorent complètement d’autres modalités de figuration. En particulier le poly-perspectivisme qui propose des images inhabituelles qui veulent montrer simultanément plusieurs points de vue comme dans la peinture cubiste par exemple. Mais cette manière de représenter va tellement à l’encontre de nos modalités naturalistes habituelles, qui cherchent à émuler la vision humaine, qu’on en trouve peu de manifestations.
La stéréotypie visant à l’objectivité scientifique vient de là. De la réduction de la complexité de la diversité des spécimens observables à un type idéal qui existe dans la tête du savant qui demande à un artiste de le reproduire. D’une certaine façon, ce processus est déjà ancien. Pour les images que j’ai pu voir produites par l’intelligence artificielle, elles relèvent plutôt d’écarts empruntant à l’imaginaire. Mais c’est un imaginaire très attendu par ailleurs. Pour une image de création du monde, on voit un créateur. C’est un concept complètement méditerranéen, le démiurge, le potier, qui façonne la matière à partir de ses intentions, ce qu’on trouve à la fois dans la Bible et chez Platon. Mais c’est une vision tout à fait singulière. Pour beaucoup de culture, le monde n’a pas été créé. Il a toujours existé, ou alors il se transforme par des événements contingents. Ces images perpétuent des mythes anciens et occidentaux.
Est-ce que vous craignez que tous ces modes de représentation que l’IA ne génère pas en viennent à disparaître ?
Pour qui en viendraient-ils à disparaître ? Si c’est pour nous, Occidentaux, elles n’ont jamais été très présentes. On en a des échos dans les musées d’ethnographie ou dans ce que des artistes qui ont été intéressés par ces images ont pu en dire, notamment au début du siècle dernier. Mais il y un danger possible : celui de l’affadissement, si je puis dire, ou de la naturalisation des images. Le risque est que là où elles sont encore vivaces, d’autres formes de figuration disparaissent sous les assauts de la figuration naturaliste. Une chose qui me frappe en Amazonie, dans toutes les petites villes, dans des baraques en bois suintantes d’humidité, vous allez pour manger un morceau, et il y a des paysages au mur. Ce sont des peintures de châteaux de la Renaissance, de jardins à la française, ou de paysages des Alpes suisses avec des chalets et des pots de géranium. Donc la stéréotypie gagne dans les interstices de la civilisation — si on peut parler de civilisation dans ces villes frontières — mais ces images sont très appréciées par ceux qui peuplent ces villes et qui colonisent la forêt. Ces colons s’efforcent de détruire un certain rapport à la forêt qui les inquiète et les contrarie. Ils préfèrent un monde naturaliste, plus policé et plus maîtrisable d’une certaine façon.
Propos recueillis par Daniel Bonvoisin
[1] Philippe Descola, Par-delà nature et culture, Gallimard, 2005. Voir également Philippe Descola, Diversité des natures, diversité des cultures, Les petites conférences, Bayard, 2010, qui vulgarise les concepts abordés.
[2] Philippe Descola, Les Formes du visible, Seuil, 2021









