« Clémentine, 20 mois », un instantané en fait… très construit !
Sébastien Raynal, le papa, est chercheur au CNET, le Centre National d’Etudes des Télécommunications du groupe français Orange (ex France télécoms). Sur le site internet on apprend que Clémentine, sa fille de 20 mois lui sert régulièrement de partenaire pour les émissions qu’il publie relatant ses expérimentations et tests technologiques. De la vidéo dont il est question ici, on ne sait qu’une chose : la prise de vue a duré 30 minutes et, on peut le constater, s’est faite avec deux caméras tournant simultanément. Pour le reste, laissez-vous impressionner et concluez ce que vous voulez de ces 5’51“.
La vidéo qui nous est ici présentée a pour but de tester sur un petit enfant le degré de convivialité présentée par les produits de la gamme Apple (iPhone et iPad). En effet, « avec l’avènement du tactile, l’outil informatique a pris une dimension universelle : il suffit de toucher de son doigt ce que l’on voit à l’écran pour faire réagir les programmes. Il n’y a plus l’obstacle du langage (avec des icônes) ni celui de la souris par exemple. On a donc un outil qui est à la portée de tous [1] ». Ce n’est pourtant pas une vidéo publicitaire commanditée par l’équipementier mais plutôt un test de vérification d’un argument souvent avancé pour expliquer le positionnement préférentiel auprès des néophytes en informatique et multimédia, des interfaces de la marque à la pomme.
Certes, le papa le reconnaît, sa fille est déjà adepte de l’iPhone, ce qui devrait influencer l’expérience… mais le test ici rapporté met en scène une vraie situation de transposition : Clémentine, malgré son jeune âge, comprendra-t-elle que l’iPad fonctionne à la façon de l’iPhone dont elle connaît déjà l’écran ?
La mise en scène est simple : deux caméras. Une est placée en face de l’enfant, pour un rendu panoramique large. L’autre, en plongée, pour une captation des manipulations, est placée « par dessus l’épaule » de l’enfant. Le papa apparaît de temps à autre en incrustation pour commenter ce qu’il y a lieu de comprendre. Le reste du temps, la voix de l’enfant n’est pas « mutée [2] ». Une sorte de sous-titrage permet toutefois de comprendre ce que l’enfant dit quand ce n’est pas très audible. C’est la voix off du papa qui assure la transition des séquences et leur explication.
« Clémentine a 20 mois et elle va découvrir sous vos yeux, et pour la première fois, un iPad ». C’est du moins ce que nous devons croire de bonne foi, puisqu’il nous est impossible de vérifier la chose. Mais ne soyons pas fermé à l’expérience. Tout semble d’ailleurs mis en scène pour nous offrir un instantané en temps réel.
On remarquera d’emblée que les deux images associées en un seul écran sont simultanées… l’action filmée par une caméra est reprise par l’autre caméra de façon synchronisée. Sauf qu’un passage des images prises par une seule caméra en plein écran permet l’instant d’après un raccord vers tout autre plan disponible dans la masse des rushes.
Et donc, pour commencer, on peut voir l’enfant déverrouiller et allumer l’engin sans problème. C’est en tout cas ce que l’on nous dit. Le papa confirme d’ailleurs que l’expérience antérieure de l’enfant sur l’iPhone explique « son peu d’étonnement face à ce nouvel instrument ». Clémentine CHERCHE immédiatement l’album de ses photos… qu’elle ne trouve pas. Et pour cause, nous sommes sur une autre plate-forme. Il y a bien un album mais les datas ne sont pas au rendez-vous. Elle essaye alors d’autres icônes, et s’amuse avec l’écran tactile. On la voit tapoter sur le clavier virtuel… Combien de temps durent ces essais et erreurs ? Eveillent-ils chez l’enfant colère ou déception ? Quelle ampleur cette perplexité que le papa avoue chez sa fille ? On ne le sait pas… ou plutôt, on n’en voit rien. La seule chose que l’on peut se rappeler, c’est que 30 minutes de rushes ont été filmées pour produire cette vidéo de 5’52“. Des images sont passées à la trappe au moment du montage. Que racontaient-elles ? Impossible de le savoir.
Bloquée devant une certaine complexité du menu de navigation, l’enfant exprime sa conclusion : « Il est cassé ! ». L’expérimentation va-t-elle s’arrêter ici. Le test s’avèrera-t-il peu concluant pour l’entreprise basée à Cupertino ? Non… Le chercheur va juste relancer le processus d’une pitchenette sans grande incidence sur l’expérimentation. Là encore, les images nous montrent qu’il aura suffit pour le papa de montrer l’exemple. Le moment situé à 1’05“ est donc décisif : tout se débloque, « Clémentine est maintenant en mesure de naviguer à la recherche de ses applications favorites ».
La suite est assez évidente : l’enfant a maintenant suffisamment de repères pour reproduire ici ce qu’elle faisait sur le téléphone. Le « jeu de Nono », elle ne le trouve pas, en fait… mais son errance à travers les icônes se révèle intéressante : elle donne à penser que l’enfant CHERCHE quelque chose de précis (c’est ce que nous dit son papa) et qu’elle développe un vrai savoir-faire de navigation. On la voit finalement avec « Nono » à l’écran. Elle y est donc parvenue. Mais combien de temps aura été nécessaire et peut-être aussi l’aide du papa ? Qui sait ?
Et puis arrive une ellipse dont nous avons à prendre conscience. Celle-ci se passe à 1’59“ seul moment où il est possible de voir (mais la chose est vraiment très furtive) un fondu en grésillement [3] vers un nouveau plan, avouant le passage à une nouvelle séquence.
Celle-ci est à nouveau intéressante, car il s’agit d’une nouvelle hésitation de l’enfant : la machine serait-elle en panne ? Une posture qui crédibilise on-ne-peut mieux le caractère « pris sur le vif » de cette vidéo. Ceci nous amène au « jeu du cow-boy » que visiblement Clémentine connaît bien pour l’avoir pratiqué sur l’iPhone. Bon moment de plaisir et de manipulation réussie, grâce à un « petit doigt farté à la crotte de nez ». Là aussi, on fait dans l’authentique… cela crédibilise à nouveau l’ensemble du test et donne à penser qu’on livre les images façon « brut de décoffrage ».
A 2’59“, le papa reprend l’initiative. L’expérimentation passe à un second niveau. « Après quelques minutes, je décide de redonner à Clémentine, l’iPhone qu’elle connaît très bien ». Après combien de temps réellement ? L’ampleur de l’ellipse nous est à nouveau inconnue. « Comme avec l’iPad, Clémentine va directement cliquer sur les applications qu’elle connaît ». A nouveau, une fois qu’elle est dans l’album photos, l’interprétation que nous donne le papa va dans le sens de nous faire percevoir une INTENTION, un SAVOIR-FAIRE, une efficacité de procédure… qui est en fait ce que le test doit nous amener à vérifier : « Clémentine VERIFIE que ses photos et vidéos favorites soient là ». Puis « elle réitère l’expérience avec la boîte à Meuh et ses animaux favoris ». Des expressions du papa qui présupposent l’intentionnalité des manipulations et qui mettent dès lors en scène le caractère aisé de la procédure pour y arriver, puisque c’est ce que l’on voit l’enfant faire à l’écran. Notons pourtant que cette voix off est introduite au montage et qu’elle survient pour orienter/compléter la compréhension d’images mises intentionnellement en séquences successives par le réalisateur, d’un point de départ vers un dénouement, en imaginant et en verbalisant un certain récit..
Toutes ces manipulations sur l’iPhone RASSURENT Clémentine, nous dit le papa. Une nouvelle interprétation qui oriente sensiblement notre perception : avec ces interfaces, tout se passe bien pour un enfant débutant ! Une conclusion avant l’heure ?
« L’enfant DECIDE ensuite de faire de la musique sur le piano virtuel ». Nous voici à nouveau embarqué dans l’affirmation d’une intention formelle… Le message est clair : l’enfant VEUT faire quelque chose et il trouve aisément les outils pour le faire. Pourtant, le fait que l’enfant tient son piano à l’envers n’est pas relevé par le papa, car cela ne sert pas son propos. Que du contraire. Par contre, l’instant d’après, ce qui lui plait de faire remarquer, c’est qu’elle « va activer « Studio mini » un enregistreur 4 pistes ». Une caractéristique technique qui fait sens chez l’adulte qui visionnerait cette vidéo (Quoi ? Un enfant de 20 mois sait faire fonctionner un enregistreur 4 pistes ?) Nous rassurez-vous : peut-être a-t-elle assimilé l’usage des boutons « record » et « play », mais n’attendez pas qu’elle active toutes les fonctionnalités du programme de montage audio. Mais dans l’instant et compte tenu de la formule, peut-être est-ce ce que vous aurez cru devoir entendre ?
Certes, il s’agit là d’un moment particulièrement chaud de cette vidéo : l’enfant est-il vraiment désireux de faire fonctionner conjointement deux interfaces, parce que l’une ne permettrait pas ce que l’autre met en œuvre ? On peut un instant se le demander. Mais de nouveau, c’est le commentaire du papa qui nous impose son interprétation de la situation : « Clémentine est DECUE de ce que ça n’a pas l’air d’enregistrer ». Rien dans l’image ne permet de vérifier que l’enfant avait cette intention et qu’elle vérifie si le processus est efficace ou non. C’est le papa qui induit cette interprétation en ajoutant sa voix off en ce sens. Le fait qu’on la voit ensuite dans l’application Mélodica sur l’iPad est présentée comme une NOUVELLE TENTATIVE d’arriver à ses fins. A nouveau, intention, entêtement et finalisation avec les bons outils donnent à penser que l’outil se plie à la volonté de l’utilisatrice en culotte courte. Pourtant, rien ne garantit la succession de ces deux actions (recherche sur Studio mini puis sur Mélodica). A nouveau, il faut admettre de bonne foi ce qui nous est proposé.
Si l’expérience se solde par un échec, le message de conclusion n’est pas celui de l’enfant mais du papa : « Encore un peu tôt pour imaginer que Clémentine enregistre son premier tube » avec ces outils. Mais derrière cette limite constatée, une chose est affirmée : l’instantané que vous avez vu illustre bien que ces outils sont on-ne-peut plus ergonomiques dans les mains d’un enfant de 20 mois.
Or, que nous montrent les images tournées tout au long de 30 minutes de captation ? Une enfant à l’aise avec un nouvel outil, l’iPad, à l’interface fort semblable à celle qu’elle connaissait déjà, l’iPhone. Une enfant qui n’hésite pas à farfouiller dans les icônes interactives et qui pratique déjà avec aisance un certain nombre d’applications, parmi lesquelles des jeux assez stéréotypés, mais aussi des applications-outils invitant à produire du contenu original.
Si les manipulations demandées pour jouer sont bien en place, du côté des applications outils, on peut voir que la créativité ne se concrétise pas encore avec succès. Mais loin de constater cette limite, et de s’y tenir, l’agencement des plans et la voix off du papa orientent la compréhension globale de l’expérience de sorte à y voir une quête pas encore aboutie mais déjà très construite : une intention, une recherche systématique des processus pour la mettre en œuvre, un entêtement qui ne s’essouffle pas aux nombreux essais et erreurs qui parsèment le chemin.
Sans devoir conclure que tout n’est que mensonge, on doit pourtant admettre que cette vidéo est loin d’être un simple instantané figurant, en un long plan-séquence, une appropriation déjà très aboutie d’un nouvel outil informatique, en lien avec des objectifs prédéfinis. Il faut plutôt reconnaître que l’agencement de plusieurs séquences tirées de ce florilège de manipulations raconte une histoire au scénario fortement étayé par le commentaire du papa.
Sans cette prise en main au moment du montage et cette orientation narrative pour nous raconter une histoire, le bout à bout ininterrompu nous aurait sans doute apparu plus pauvre en termes d’intention et moins réussi en termes de progression.
Alors, mensonge ? Manipulation ? Sans doute pas… mais il faut admettre que de raconter une histoire réclame inévitablement d’installer les caractéristiques d’un récit : un point de départ, une intention/tension, un parcours et une chute. Et pour faire comprendre tout ceci, à défaut de pouvoir compter sur le dialogue des acteurs, inévitablement révéler le sens à donner aux images agencées dans un commentaire construit. Ainsi fonctionne l’audio-visuel.
Michel Berhin
[2] Piste son coupée, réduite au silence (de l’anglais to mute)
[3] On connaît les classiques « fondu au noir » et « fondu au blanc ». Ici, on est en présence d’une déclinaison pas courante : le plan de grésillement qui atteste clairement d’une transition.