L'IA, les algorithmes et le turc mécanique
Ou lorsque la « technologie » n'est qu'une forme élaborée de tromperie.
L'homme dans la machine
Le turc mécanique1 était un prétendu automate doté de la faculté de jouer aux échecs. Construit en 1770 par l'inventeur Johann Wolfgang von Kempelen, il avait pour but d'impressionner la cour de l'Impératrice d'Autriche Marie-Thérèse. L'automate était de taille humaine et habillé de manière à ressembler à un « sorcier oriental », placé derrière un meuble de jeu.
Subséquemment à son succès à la cour d'Autriche, l'automate a entamé des tournées en Europe et dans les Amériques. Battant la plupart de ses adversaires, y compris des hommes d'État tels que Napoléon Bonaparte et Benjamin Franklin.
Loin d'être un objet conscient, le turc était en réalité manipulé de l'intérieur par un maître des échecs, via un pointeur et un système de leviers. Des aimants, placés sous les pièces et associés à d'autres placés sous l'échiquier, permettaient au maître de visualiser les déplacements de ces dernières et les répliquer sur un second échiquier.
La clef de l'illusion ? Un ingénieux tour de passe-passe. Le meuble comportait diverses portes, qui une fois ouvertes permettaient de voir à travers la machine, et en observer le cœur : un habile mélange de rouages et poulies. Ce que von Kempelen oubliait d'indiquer, c'est que ce cœur n'était qu'une façade (littéralement), derrière laquelle le joueur placé dans le turc pouvait se réfugier lors de l'ouverture des portes.
L'homme est la machine
Loin d'être un artéfact des siècles derniers, le turc mécanique fait partie intégrante de nos technologies modernes. Dans le cadre contemporain, l'automate ottoman est remplacé par le terme d'IA et le maître des échecs par des travailleurs contractuels aux quatre coins du globe. Une seule constante, la prestidigitation.
Amazon et l'avènement de l'intelligence artificielle artificielle
C'est Amazon qui, en premier, a ressuscité l'invention de von Kempelen. En ouvrant sa marketplace à d'autres produits que les livres, la firme washingtonienne a rencontré un problème de taille : supprimer les dizaines de milliers de duplicatas apparaissant sur le site. Ne réussissant pas à développer un algorithme permettant d'automatiser cette suppression de manière efficace, ses ingénieurs se sont tournés vers l'humain.
Un système mixte a donc été créé : un logiciel décompose les tâches en petites unités, puis les distribue à un réseau de travailleurs humains. Payés par tâche, pour la plupart aux alentours de 2 $/h, et pour les plus chanceux 7,25 $/h.
Jeff Bezos décida d'ouvrir ce système au public en 2005, sous le nom d'Amazon Mechanical Turk2. En faisant, de fait, une « marketplace pour les travailleurs », dont l'objectif est d'invisibiliser ces derniers. Représentés par des nombres et non des noms, formant une intelligence artificielle artificielle, dans laquelle chaque « turker » est analogue à une instruction logicielle.
Le rôle des turkers a évolué au fil du temps. De la simple identification de textes et d'images, ils sont passés à l'identification en temps réel de produits — les magasins sans caissiers d'Amazon fonctionnaient grâce à mille personnes en Inde pour surveiller les achats3 — puis à l'étiquetage de données d'entraînement pour l'IA.
Optimus, le turc mécanique moderne
Les vidéos et photos du robot humanoïde d'Elon Musk ont fait le tour du monde. Observer un robot danser, faire un cocktail, ou parler dans la foule peut apparaître trop beau pour être vrai. C'était le but de l'évènement « We, Robot » de Tesla : créer un engouement pour les futurs projets de Musk — Optimus, le Robotaxi et le Robovan. « Regardez ce que le futur a à vous offrir ! »
Sauf que si l'on gratte un peu le vernis futuriste, on se rend compte de la supercherie. Optimus n'est pas autonome4, pour l'instant. Durant l'événement, les robots étaient téléopérés par des humains pour les tâches complexes5.
I asked the bartending Optimus if he was being remote controlled. I believe he essentially confirmed it. pic.twitter.com/WlGyuswWpI
— zhen (@zhentan) October 11, 2024
La modération, du Nord vers le Sud global
L'extension de la sphère publique à internet a donné lieu à une explosion du nombre de contenus disponibles en ligne. Problème : dans ce flux incessant se cachent des contenus en contradiction avec les conditions d'utilisation des plateformes. Les modérer est une nécessité. Oui, mais comment ?
On pense naïvement qu'un algorithme fait le sale boulot. Mais en réalité, une bonne partie de cette tâche est « outsourcée » à des milliers de travailleurs précaires du Sud global, qui vont identifier manuellement les contenus haineux ou à caractère sexuel afin de nourrir un algorithme6.
On parle ici de contenus décrivant des situations impliquant des abus sexuels sur mineurs, des actes de violence extrême, d'automutilation ou portant atteinte à la dignité humaine. Rien de bien traumatisant…
Un contrat de ce type avait été signé fin 2021 entre OpenAI et Sama pour étiqueter des descriptions de cette teneur, afin de rendre ChatGPT plus sûr7. Les employés de Sama au Kenya devaient lire entre 150 et 250 passages de texte par jour, allant d'une centaine de mots à plus de mille. Le tout pour environ 1,32 $/h.
« C'était de la torture. Vous lisez plusieurs déclarations de ce genre tout au long de la semaine. D'ici au vendredi, vous êtes perturbés à force de penser à ça. » — Un employé de Sama, au Times
Qui pourrait rester sain d'esprit après avoir catalogué des vidéos et images de meurtres, d'agressions, ou de viol à longueur de journée8 ? Personne, je présume. C'est pourtant le quotidien d'un nombre grandissant de personnes, fourmis ouvrières des algorithmes.
« Nous admirons avec enthousiasme le visage de la machine intelligente autonome, tout en ignorant, sinon en dissimulant activement, le travail humain qui la rend possible. » — Oscar Schwartz, IEEE Spectrum
La machine est l'homme
Entre 33 et 46 % des turkers utiliseraient une IA comme ChatGPT pour effectuer des tâches liées à la production de texte. C'est ce qu'ont découvert les chercheurs Veniamin Veselovsky, Manoel Horta Ribeiro et Robert West9.
Le serpent se mord la queue. L'utilisation de données générées par l'IA pour former l'IA pourrait introduire des erreurs supplémentaires dans des modèles déjà sujets aux erreurs. Les LLM présentent régulièrement des informations fausses comme des faits — en témoigne la citation, par l'IA de Bing, de propos générés par ChatGPT comme source10.
Il faudra attendre de nouvelles études pour déterminer si cette tendance s'est propagée à d'autres domaines. Dans l'hybride homme-machine, la seule partie qui semble inexorablement gagner du terrain, c'est la machine.
Lorsque quelque chose semble sorti tout droit d'un film de science-fiction, il faut jouer à « où est Charlie l'humain ? ». Afin de ne pas se faire avoir par les vendeurs d'huile de serpent du far-west numérique, qui semblent pulluler depuis quelques années.
Sources
- Wikipedia — Mechanical Turk↩
- Untold History of AI: How Amazon's Mechanical Turkers Got Squeezed — IEEE Spectrum↩
- Amazon's Just Walk Out stores relied on '1,000 people in India watching,' not AI — Washington Times↩
- Un prototype du robot d'Elon Musk assure qu'il est « assisté par un humain » — France TV Info↩
- The Optimus robots at Tesla's Cybercab event were humans in disguise — The Verge↩
- Moderating in Obscurity — econstor.eu↩
- The $2 Per Hour Workers Who Made ChatGPT Safer — Time↩
- The secret lives of Facebook moderators in America — The Verge↩
- Artificial Artificial Artificial Intelligence — arXiv↩
- AI is eating itself: Bing's AI quotes COVID disinfo sourced from ChatGPT — TechCrunch↩