• il y a 6 mois
J'ai le plaisir de vous annoncer que ma nouvelle BD "La Vie au Moyen Âge" vient de sortir ! Elle est disponible partout, autant en librairie que sur internet : https://amzn.to/3X4WqsH

Si je vous dis intelligence artificielle, vous pensez à quelques références de films comme I, Robot, A.I. intelligence artificielle ou Ex Machina. Bon on n'en est pas encore là, mais l'IA investit de plus en plus notre vie et se développe à une vitesse folle. Et comme on dit, la science n'attend pas : ça fait en réalité déjà longtemps que les IA sont utiles à la recherche historique et scientifique, parce qu'elles savent traiter une très grande quantité de données très rapidement, et donc détecter, lire, et même traduire des textes anciens durs à décrypter, reconstituer des objets 3D, identifier des contrefaçons, analyser des patterns de paysage… Bref, faciliter le travail des chercheurs ! Vous l'aurez compris, aujourd'hui, je vous propose de partir à la découverte de cette autre facette des IA, à savoir leur utilité en Histoire !

Écriture : Benjamin Brillaud, Bastien Verdier, Jean de Boisséson

Montage : Dead Will / Wilfried Kaiser https://www.youtube.com/c/DEADWILL

➤ Un grand merci à Julie Giovacchini pour sa relecture !

Sommaire :

0:00 : Nota BD, tome 6 !
1:14 : Introduction
2:45 : Déchiffrer et reconstituer des sources textuelles
17:54 : Big Data
21:59 : Conclusion : limites et avantages de l'IA

————————————————————————————————————————————
➤➤➤ Sources en fin de description
————————————————————————————————————————————
Découvrez ma boutique en ligne
➜ https://nota-bene.creator-spring.com/
————————————————————————————————————————————
Vous pouvez acheter mes ouvrages ici
➜ https://www.notabenemovies.com/ouvrages/
————————————————————————————————————————————
Rejoignez-moi sur les réseaux !
➜ Nota Bene : https://www.youtube.com/@notabenemovies
➜ Nota Bonus : https://www.youtube.com/@NotaBonus
➜ Twitch : https://www.twitch.tv/notabenemovies
➜ Facebook : http://facebook.com/notabenemovies
➜ Twitter : https://twitter.com/NotaBeneMovies
➜ Instagram : https://www.instagram.com/notabenemovies
➜ TikTok : https://www.tiktok.com/@notabenemovies
➜ Snapchat : https://t.snapchat.com/NV73QSxl
➜ Tipeee : https://www.tipeee.com/nota-bene
➜ Site internet : https://www.notabenemovies.com/
➜ Podcast : https://www.notabenemovies.com/podcasts/
————————————————————————————————————————————
Les images utilisées dans l'épisode : https://docs.google.com/spreadsheets/d/1ybVV_mQUp2vAUjgre4PM35OutAsqwVai/edit?usp=sharing&ouid=114961219766447019127&rtpof=true&sd=true
————————————————————————————————————————————
➤➤➤ Pour en savoir plus :
————————————————————————————————————————————
https://docs.google.com/document/d/1VEufpuJg3S3MMNA_1P0_RsZCBIQAgjT6zoVOEOnDLRM/edit?usp=sharing
Transcription
00:00 Petite annonce avant de commencer votre épisode je sors ma sixième bd nota bene et ça me fait trop plaisir
00:05 cette nouvelle bd elle vous fera découvrir la vie quotidienne au moyen âge et ça avec de
00:10 magnifiques couleurs parce que non le moyen âge c'est pas obscur de tous les points de vue ici il s'agit de manière
00:16 très légère avec des gags des personnages connus et moins connus de vous plonger dans ces mille ans d'histoire en
00:22 explorant diverses thématiques alors évidemment vous y trouverez un moyen âge qui bouge qui évolue qui est loin des clichés que j'adore
00:29 exploser à coups de bazooka et au delà d'une couverture qui me met
00:33 particulièrement en valeur sur les traits d'un chevalier bienveillant et bien vous découvrirez donc le vrai visage des mérovingiens
00:38 l'essor de la religion la manière dont on dormait et vivait la nuit dans les villages la vie des étudiants qui allaient à l'université
00:44 les fêtes de carnaval le voyage sur les routes dangereuses ou encore
00:48 l'organisation des tournois de joute ou des duels entre autres choses puisqu'il ya quand même pas mal de trucs différents et puisque le moyen âge
00:54 c'est très large évidemment il n'y a pas tout là dedans et il y aura carrément la place pour un prochain tome afin d'affirmer
00:59 le sujet c'est un tome qui s'inscrit vraiment dans la lignée des cinq premiers tomes l'objectif c'est de s'amuser avec l'histoire tout en restant rigoureux
01:05 sur le fond alors n'hésitez pas à aller y jeter un petit coup d'oeil c'est dispo absolument partout en librairie sur internet
01:10 dans les grandes enseignes type fnac bref vous avez le choix mes chers camarades bien le bonjour
01:15 si je vous dis intelligence artificielle vous pensez à quelques références de films comme irobot
01:21 AI intelligence artificielle ou encore ex machina des mondes où l'humain cohabite voire se confronte avec l'IA on n'en est pas encore là
01:29 mais si vous vivez pas dans une caverne
01:31 vous savez déjà que l'IA investi de plus en plus notre vie et se développe à une vitesse absolument folle
01:37 on parle pas encore de robots à visage humain mais on en a pas mal déjà parlé un mid journée chat gpt et compagnie
01:43 ça pose beaucoup de questions ces outils on les connaît parce qu'ils sont à la portée de tous aujourd'hui
01:48 et il n'arrête pas de s'améliorer avec le temps et on va pas redire la même chose cent fois ça lance des débats
01:55 méthodologiques et éthiques qui sont très compliqués
01:59 mais au delà de tout ça la science n'attend pas comme on dit en fait les IA ça fait déjà
02:04 longtemps que c'est très utile à la recherche historique et scientifique
02:07 parce qu'elle sait traiter une très grande quantité de données d'un seul coup et donc
02:12 détecter lire et même traduire des textes anciens durs à décrypter
02:16 reconstituer des objets 3d
02:19 identifier des contrefaçons
02:21 analyser des patterns de paysages
02:23 tout ça ça facilite le travail des chercheurs aujourd'hui je vous propose donc qu'on parle ensemble de cette autre facette des IA
02:30 leur utilité en histoire notamment ces derniers mois où de nombreux médias ont relayé des découvertes super intéressantes
02:38 faites grâce à elle mais on va aussi s'interroger sur leurs limites et sur les enjeux de leur utilisation dans le cadre de la recherche
02:51 Justement en mai 2023 dans la revue PNAS Nexus des chercheurs israéliens ont lancé un défi à une IA
02:58 capable de traduire directement en anglais des tablettes
03:01 mésopotamiennes couvertes d'écritures cunéiformes. Le cunéiforme déjà c'est assez compliqué
03:07 c'est un des systèmes d'écriture les plus anciens de l'histoire de l'humanité qui date d'environ 3 400 ans avant notre ère
03:13 on compte des centaines de milliers de textes en cunéiformes
03:17 la plupart rédigés en sumérien et en acadien. La langue acadienne est particulièrement difficile à interpréter
03:23 elle ne connaît pas la ponctuation et chaque glyphe peut être lu et
03:28 prononcé de différentes façons et donc changer le sens de la phrase en fonction du contexte. Pour traduire une tablette un expert a donc
03:35 trois choses à faire toujours dans le même ordre
03:37 numéro 1 recopier les glyphes, numéro 2 les retranscrire dans leur équivalent en alphabet latin et numéro 3
03:45 traduire le texte ainsi obtenu par exemple en anglais moderne. Mais si on donne tous ces textes déjà traduits
03:52 individuellement à l'IA ils lui servent de traduction de références
03:56 et en les imitant le réseau de neurones artificiels de l'IA est alors capable de traduire directement du cunéiforme
04:03 à l'anglais. Il n'y a pas besoin de l'étape intermédiaire en latin parce qu'il n'a pas besoin de comprendre ce qu'il traduit
04:09 et si on fait intervenir la machine uniquement à partir du latin
04:13 on se rend compte qu'elle obtient à peu près le même résultat donc c'est plutôt bon signe.
04:18 Maintenant la question qui nous intéresse on peut se la poser est ce que tout ça marche bien ?
04:22 En gros oui la machine réalise de bons scores mais dans la masse elle laisse aussi passer des erreurs. En effet comme elle invente
04:31 des possibilités de suite de mots en continu si jamais elle va buter par exemple sur un nom propre qu'elle n'a jamais rencontré
04:37 elle peut accoucher d'une phrase assez incohérente et cette erreur un humain
04:42 évidemment il la ferait pas parce qu'il sait de quoi il parle quand il parle. Malgré tout ça a un avantage pour
04:48 accélérer les choses mais faut qu'un expert repasse derrière pour contrôler pour corriger et pour parfaire les traductions artificielles.
04:56 Alors oui je vous disais qu'on avait des milliers de textes en cunéiforme
05:01 mais il y a quand même plusieurs problèmes. On l'a déjà mentionné ces textes sont majoritairement en
05:06 acadien et en sumérien. Bref plusieurs langues parce que le cunéiforme c'est un système d'écriture.
05:11 Donc déjà ça réduit les textes utilisables pour l'entraînement en fonction de la langue étudiée.
05:16 Ensuite on parle de textes qui s'étalent sur des milliers d'années avec des changements importants de syntaxe, de grammaire et de vocabulaire
05:24 les langues évoluent et elles évoluent assez vite.
05:27 Donc pour bien faire il faudrait séparer les différents textes en fonction de la période qui nous intéresse.
05:32 Bref on va réduire encore le corpus de textes et puis on va pas se mentir souvent ces textes
05:39 ce sont quelques inscriptions, deux lignes par ci par là, des fragments de tablettes, bref des textes très brefs et incomplets.
05:46 Et faut ajouter à ça que ce ne sont pas tous des textes très utiles pour l'IA parce que ce sont à 90% des textes épigraphiques
05:54 qui contiennent énormément de formules récurrentes, des titulatures, des formules protocolaires ou des informations répétitives.
06:02 Ça donne de bons résultats sur des textes du même style mais sur d'autres types de textes, par exemple des textes littéraires,
06:07 faut faire attention. Si ça vous intéresse vous pouvez essayer vous même avec l'application en ligne appelée "The Babylonian Empire"
06:15 c'est assez rigolo mais faut faire attention. On conseille de traduire un texte par petits morceaux de phrases courtes
06:21 parce que sinon clairement ça part vite en sucette.
06:24 En tout cas l'IA peut aller encore plus loin, elle peut reconstituer des textes qui sont illisibles pour l'œil humain.
06:31 Et oui parce que parfois on n'a pas un beau papyrus ou une tablette bien plate, bien conservée.
06:36 Mais par exemple on retrouve des rouleaux de papyrus qui sont enroulés, abîmés, voire carbonisés.
06:42 Et c'est impossible à les manipuler sans tout détruire.
06:46 Et justement ces deux dernières décennies l'équipe du chercheur Brent Seals a utilisé une méthode d'imagerie médicale,
06:52 la tomodensitométrie 3D qu'on appelle aussi la CT-scan qui permet de mesurer l'absorption des rayons X par l'objet qu'on analyse
07:01 et ensuite par traitement informatique de numériser et de reconstruire en 3D les structures internes.
07:08 Donc ils arrivent, pour le dire plus facilement, à dérouler virtuellement les couches extrêmement fines de papyrus qui sont enroulées.
07:15 Et donc en 2016 ils annoncent être parvenus à lire l'un des rouleaux carbonisés d'Aïn Gedi.
07:21 Il s'agit d'un exemplaire du livre du Lévitique qui date du 3ème, 4ème siècle de notre ère.
07:27 Son encre va contenir du métal et donc elle brille sous les rayons X, ce qui la rend particulièrement lisible pour une machine.
07:34 La suite consiste donc à reproduire la même chose pour les très nombreux papyrus qu'on a retrouvés dans une villa d'Herculanum,
07:41 une bibliothèque romaine complète qui a été carbonisée lors de l'éruption du Vésuve en 79, la même qu'a détruit Pompéi.
07:49 Retrouvés au 18ème siècle lors des fouilles de la villa, ils sont d'abord pris pour des bûches de charbon tellement ils sont abîmés.
07:56 Lorsque les archéologues se sont rendus compte de leur méprise, ils ont évidemment essayé de les ouvrir pour les lire.
08:01 Et depuis, on a beaucoup de techniques qui ont été testées avec plus ou moins de succès pour décrypter ces rouleaux sans les abîmer.
08:09 Contrairement à ce que les médias disent donc un peu partout, on a déjà beaucoup de textes de cette bibliothèque romaine qui ont été édités et analysées.
08:18 Mais le problème, comme souvent en archéologie, c'est que toutes ces techniques détruisent les rouleaux analysés et parfois font perdre des parties du texte au passage.
08:28 D'où l'intérêt de techniques d'imagerie qui permettraient d'accéder au texte sans détruire son support.
08:34 Et justement, c'est la spécialité de l'équipe de Sills, utiliser des techniques non-invasives pour numériser et reconstruire en 3D les objets patrimoniaux.
08:42 Comme des rouleaux de papyrus carbonisés par exemple.
08:45 Ainsi, en janvier 2023, un des livres d'Herculanum qui était bouffé par les cendres et qui nous était aussi facile à déchiffrer qu'un tas de boue, a d'abord été scanné et reconstruit en 3D.
08:57 La difficulté ici, c'est que l'encre utilisée, elle contient pas de métaux, mais elle est faite à base d'eau et de charbon.
09:03 Donc, il a fallu faire preuve de créativité en faisant appel à une IA qu'on a entraînée à détecter l'encre et à en déduire les lettres.
09:12 Cette IA, elle fait ce qu'on appelle du "machine learning".
09:15 Donc, on lui apprend à identifier des caractères complets dans d'autres textes connus, qu'elle va résumer à des petits alignements de points.
09:24 Et quand ça s'est fait, même face à des caractères à moitié effacés, il lui suffit de quelques-uns de ces petits points,
09:30 de quelques tâches d'encre indéchiffrables pour nous, pour dessiner les caractères complets et les plus probables.
09:37 Et comment on lui apprend ça, vous allez me dire ?
09:39 Eh bien, on lui fait lire les textes de la même époque qu'on a sous la main et qui sont déjà déchiffrés.
09:45 Mais pour que ça soit statistiquement robuste, vous l'imaginez bien, il faut des milliers de papyrus et malheureusement, souvent c'est pas le cas.
09:52 Conclusion, après lecture du résultat par les experts, eh bien le livre retrouvé dans la villa d'Herculanum n'est finalement peut-être pas un traité de philosophie comme on l'a longtemps cru.
10:02 Ce serait plutôt un bouquin d'histoire qui porterait sur la période après la mort d'Alexandre le Grand.
10:07 On a quelques noms de généraux d'Alexandre et quelques phrases qui confirment en effet que ce livre porte sur cette période.
10:14 Et cette avancée encourageante a rapidement été vue comme une opportunité par des entrepreneurs de la Silicon Valley qui ont lancé un concours en mars 2023.
10:23 C'est ce qu'on appelle le Challenge Vesuvius.
10:25 Le but, eh bien à partir des scans à haute résolution d'un rouleau qui est mis à disposition de tous par Seals,
10:31 les participants doivent réussir à déchiffrer au moins 140 caractères avant la fin de l'année.
10:37 Et à la clé, beaucoup d'argent donné par des investisseurs mais aussi par des centaines de milliers de passionnés via Twitter ou d'autres réseaux sociaux.
10:45 Dans les faits, on a donc des tonnes de passionnés et d'étudiants qui se sont lancés dans le projet.
10:51 Alors en gros, si on avait voulu y participer, qu'est-ce qu'on aurait dû faire ?
10:55 Déjà, il fallait mettre la main sur les scans 3D du rouleau.
10:58 Ça, c'est la partie facile.
11:00 Ensuite, il faut le dérouler virtuellement pour pouvoir le lire.
11:04 Chaque partie de la surface obtenue est séparée ensuite en zones, en segments,
11:08 qui sont regonflés en 3D par comparaison avec l'image 3D du rouleau complet.
11:14 Pourquoi ? Vous me direz.
11:15 Eh bien, c'est simple, c'est pour essayer de détecter le texte.
11:18 On a besoin tout simplement du relief du papier.
11:20 Comme je vous le disais, dans le cas des papyrus d'Herculanum, l'encre n'est pas visible directement sur les scans.
11:26 Donc, on va rechercher les craquelures et les reliefs indicatifs de la présence de l'encre.
11:32 Pour ça, l'IA est entraînée à repérer ces craquelures et à les identifier,
11:36 et on obtient ainsi un tout premier résultat des traces d'encre visibles.
11:41 Et à partir de là, ça se corse un peu.
11:43 Parce qu'à partir de ces traces d'encre, il faut reconstituer les lettres.
11:47 Et là, c'est reparti pour une nouvelle couche d'algorithmes,
11:50 dont le but est de repérer les schémas probables et compléter les traces incomplètes.
11:55 Ici, c'est très important de ne pas entraîner l'IA à directement repérer les lettres,
11:59 parce qu'elle partirait totalement en cacahuète et verrait des choses qui ne sont pas là.
12:03 Donc, on est ici sur un travail limite manuel, où il faut bien vérifier ce que l'algo sort,
12:09 et puis honnêtement, le résultat obtenu y ressemble à pas grand chose.
12:14 En gros, c'est des traces qui ressemblent vaguement à des lettres.
12:17 Les papyrologues sont donc là pour faire la reconstitution finale des lettres.
12:21 Et en octobre 2023, c'est un stagiaire de SpaceX de 21 ans, qui s'appelle Luc Faritor,
12:26 qui arrive à déchiffrer en premier un mot entier à l'intérieur du rouleau d'Herculanum,
12:32 avant d'autres étudiants qui vont travailler par la suite ensemble.
12:35 Et ce mot, c'est le mot pourpre.
12:37 En janvier 2024, les gagnants du challenge Vesuve ont été annoncés ainsi que leurs résultats.
12:43 Les trois gagnants reçoivent un prix de 700 000 dollars pour leur contribution à ce travail communautaire,
12:49 les codes d'autosegmentation et de détection ayant été mis à disposition de tous au fur et à mesure de l'année.
12:55 Bon, et finalement, après tout ça, qu'est-ce que ce rouleau nous dit ?
13:00 Eh bien, l'équipe de papyrologues du challenge Vesuve qui s'appuie sur les résultats du concours
13:04 ont pu déchiffrer approximativement 5% du premier parchemin.
13:09 Ils annoncent qu'il s'agit d'un texte inédit de l'Antiquité, encore inconnu jusqu'à présent,
13:13 et le sujet principal du texte serait le plaisir, un sujet très important dans la philosophie épicurienne.
13:19 Alors maintenant, il faut un peu nuancer tout ça, quand même.
13:23 Pour commencer, ces résultats sont obtenus dans le cadre d'un concours public,
13:27 et donc ils n'ont pas été validés par la communauté scientifique.
13:31 Aucune publication, par exemple, n'a été soumise à des journaux scientifiques à communauté de lecture,
13:36 ce qui permettrait des retours assez robustes de chercheurs qui sont spécialistes du sujet
13:41 pour valider que ce qui est proposé, c'est bien fait.
13:45 En plus, il faut aussi tempérer, parce que oui, c'est hyper impressionnant comme avancée scientifique,
13:51 on a pu identifier des mots entiers sans abîmer le rouleau, et ça c'est assez prodigieux,
13:56 mais n'empêche, c'est pas pour autant que d'un coup,
13:59 on va savoir déchiffrer l'entièreté de la bibliothèque de la Villa au papyrus.
14:03 Par exemple, le travail a été fait sur des colonnes de fin de rouleau,
14:06 c'est à dire la partie la plus extérieure, donc la plus facile à lire.
14:10 Le centre du rouleau va être bien plus complexe, car il est beaucoup plus écrasé,
14:15 donc on soupçonne que les reliefs vont être beaucoup plus difficiles à identifier et interpréter.
14:19 Et puis enfin, il est possible que plusieurs mains différentes aient participé à l'écriture du rouleau,
14:24 parce qu'il n'y avait pas de machine à écrire à l'époque.
14:27 Donc ça voudrait dire que pour chaque main qui écrit, et donc possiblement pour chaque rouleau,
14:32 il faudrait adapter l'entièreté du programme. Un travail absolument titanesque.
14:37 Comme vous le voyez, on n'est pas encore sorti du bois.
14:40 Alors on a pris le temps de s'attarder un peu sur les rouleaux d'Herculanum,
14:44 parce que c'est un peu la grosse actu de ce début d'année 2024.
14:48 Mais c'est évidemment pas le seul exemple d'utilisation d'IA en recherche.
14:51 Par exemple, le DecryptProject cherche à déchiffrer des manuscrits, des lettres,
14:56 des correspondances européennes présentes dans les archives,
14:59 et il a souvent recours à l'intelligence artificielle.
15:02 Récemment, ils ont déchiffré la correspondance secrète de Marie Stewart, la reine d'Ecosse,
15:07 quand elle était emprisonnée en Angleterre. Et ça, c'est super cool.
15:11 Et si ça vous intéresse, j'ai déjà interviewé Georges Lazeri,
15:15 un ingénieur informatique qui est membre du DecryptProject,
15:18 sur ma seconde chaîne YouTube, Nota Bonus,
15:21 donc je vous encourage vraiment à aller voir l'interview, parce que c'est super intéressant.
15:25 On pourrait aussi parler du logiciel Itaka.
15:27 Lui, en plus de déchiffrer les caractères,
15:29 il va essayer d'attribuer une date temporelle et spatiale aux textes.
15:33 Et ça, c'est vraiment top, vu que la datation en carbone 14,
15:37 par exemple sur les rouleaux, ça ne marche pas.
15:38 Itaka a plutôt de belles performances, parce qu'en le testant sur des corpus de textes,
15:42 il a quand même complété 62% des lacunes.
15:45 Il les a datés à 30 ans près et il a eu 71% d'exactitude géographique,
15:49 donc c'est plutôt pas mal.
15:51 En plus, le logiciel est gratuit et il mutualise à ce jour 78 000 inscriptions.
15:57 Et chaque nouveau texte qu'on lui confie, il améliore ses performances.
16:00 Mais en plus des caractères, il propose même des mots manquants.
16:03 Par exemple, s'il y a un trou sur un parchemin.
16:06 Ou plutôt, il va proposer pour chaque blanc une liste de mots qui sont possibles
16:11 et qui sont triés par probabilité.
16:14 Et ce répertoire mnémonique, comme on dit, peut faciliter le travail des chercheurs.
16:18 C'est comme un genre de super assistant qui ne remplacera jamais le chercheur,
16:22 on est bien d'accord, mais qui peut faciliter les choses.
16:24 D'autant que là, mine de rien, on touche quand même à une limite.
16:28 On est passé de déchiffrer le texte, le lire, le traduire, à carrément recréer du texte.
16:35 L'IA, elle invente, elle imagine des mots où il n'y en a pas.
16:38 Elle va proposer finalement des fictions.
16:40 Alors des fictions qui sont probables, ok, mais quand même assez incertaines.
16:44 Bref, ce n'est pas des sources historiques, mais presque des pseudo-sources.
16:49 Les chercheurs qui manipulent ce matériau, donc, ils restent très prudents.
16:53 On ne voit pas la même chose sur une image de l'objet et sur l'objet en lui-même.
16:58 Les deux peuvent être complémentaires, évidemment, l'un permettant de vérifier l'autre et vice-versa.
17:03 Si dans un sens, l'utilisation de l'IA et d'imagerie va permettre de diminuer les manipulations
17:09 et la destruction des objets patrimoniaux, on va tendre aussi vers l'utilisation uniquement
17:14 d'images de l'objet sans jamais avoir accès à son support, qui est nécessaire pour vérifier les interprétations.
17:21 Parce qu'on sait par bien les choses, les personnes qui sont capables de lire les textes
17:24 et de les comprendre ne sont pas celles qui fournissent l'image.
17:27 Et tout comme les philologues ne sont pas capables de contrôler le travail des informaticiens,
17:33 les informaticiens ne peuvent pas contrôler le travail des philologues.
17:36 Bref, en ajoutant des étapes, on augmente la probabilité de biais et d'erreurs qui n'existaient pas avant.
17:42 L'avantage des IA, c'est qu'elles cumulent des quantités de data absolument hallucinantes.
17:48 On parle même de big data, et ça c'est le deuxième grand usage principal de l'IA dans la recherche historique.
17:54 De nos jours, les services d'archives numérisent le plus possible.
18:04 Et ça c'est super chouette, mais c'est au cas où.
18:07 Parce que concrètement, on parle de millions de pages de coupures de journaux, de parchemins, de sources écrites qu'on a numérisées.
18:16 Donc oui, on a tout, mais on a personne pour lire tout ça.
18:21 Enfin, jusqu'à l'arrivée de l'IA justement.
18:24 Non seulement elle peut lire et retenir ces millions de documents, contrairement à nous,
18:29 mais en plus, sa mémoire a deux atouts.
18:32 Quantité et instantanéité.
18:35 En gros, si on cherche quels membres de l'élite byzantine du XIVe siècle ont été les plus influents sur leur époque, on peut.
18:42 Mais les chercheurs vont mettre des années, voire même des décennies à tenter de découvrir tout ça.
18:46 Parce qu'on parle de recouper des actions de centaines de personnes qui apparaissent dans des milliers de documents,
18:53 et qui font des choix se référant à des centaines de facteurs plus ou moins impactants.
18:57 Et bien l'IA justement, une fois entraînée, elle gère ça.
19:01 Elle peut retracer beaucoup plus vite des liens.
19:04 Littéralement, elle révèle presque instantanément le dessous de l'iceberg,
19:08 tout ce que nous, on ne peut pas voir à travers les textes, en tout cas, passant des années de travail.
19:14 Pour reprendre un peu mon exemple, c'est le professeur Johannes Preiser-Kapler de l'Académie autrichienne des sciences,
19:20 avec ses collaborateurs, qui ont confié une tonne de registres byzantins du XIVe siècle à une IA.
19:26 Ils ont ensuite constitué une base de données à la main, avec toutes les figures politiques de l'époque,
19:32 leurs débats, les lettres qu'ils écrivent, les sentences qu'ils prononcent ou les votes qu'ils décident de faire.
19:38 Et puis l'IA a pu analyser ces données avant de reconstituer toutes les connexions entre ces individus.
19:45 Et là, petite surprise, qu'est-ce qu'on découvre ?
19:48 Et bien qu'il y a un secret derrière toutes ces prises de parole,
19:52 et qu'en réalité, contrairement aux apparences, les personnages les plus influents ne sont pas ceux qui ont le plus parlé lors des réunions.
20:00 Idem en dehors de ces réunions très masculines, ici et là, les femmes des dirigeants apportent des contributions cachées en prenant part aux décisions.
20:09 Enfin, quand je dis ici et là, justement, non. Là encore, l'IA nous surprend en montrant que petit à petit, à force d'intervenir à chaque fois,
20:17 les femmes pourtant très peu présentes dans les sources ont en réalité joué un rôle considérable.
20:23 Donc là où un humain se serait concentré sur les noms les plus cités, sur les politiciens qui parlent le plus ou sur les tribuns qui font les plus longs discours,
20:32 l'intelligence artificielle a révélé l'efficacité de tous les autres.
20:36 Ceux qui stèsent plus, mais agissent davantage. Elle a dévoilé un trésor en faisant parler les documents.
20:43 Le Deep Learning, ou l'apprentissage profond en français, consiste à laisser un programme informatique analyser des données de manière autonome, tout seul, comme un grand.
20:52 En effet, son réseau neuronal convolutif, inspiré du fonctionnement du cerveau humain, fait passer l'information à travers différentes couches de neurones pour toujours gagner en précision.
21:03 Du coup, l'ordinateur détermine lui-même les critères pertinents et évite les biais d'analyse.
21:08 Par exemple, le projet ArcAid est utilisé par les archéologues depuis 2016 pour reconstituer la forme des poteries à partir de simples fragments.
21:17 A partir de milliers de fragments scannés en 3D, l'ordinateur a forgé ses propres critères, de textures, de formes, de poids, etc.
21:25 Et avec lui, les chercheurs gagnent des milliers d'heures de traitement d'images.
21:29 Avec la même méthode, juste à partir d'images LIDAR qui cartographient le territoire, un robot de l'université de Rennes a pu détecter tout seul des kernes néolithiques dans le morbillant.
21:40 Et le petit plus, c'est que le chercheur humain a parfois tendance à surinterpréter des nuances.
21:45 Par exemple, pour déterminer si un squelette est un homme ou une femme.
21:49 Plus neutre, l'intelligence artificielle se trompe moins souvent, comme le montre une étude publiée en 2019 dans le Journal of Forensic and Legal Medicine.
21:58 L'IA
22:03 Au final, comme le dit l'historienne Julie Clostre, l'IA c'est surtout un gain de temps.
22:09 Elle accélère la partie la moins gratifiante du travail de l'historien, comme par exemple retranscrire en paléographie pendant des jours et des jours.
22:17 Et là, deux possibilités pour par exemple quelqu'un qui fait sa thèse et qui descend dans les archives pendant 3 ans.
22:23 Numéro 1, il aura plus besoin de 3 ans pour la faire.
22:27 Ou numéro 2, en 3 ans, il va analyser beaucoup plus de sources.
22:31 Et là, on se le rappelle, l'histoire s'est croisée des sources.
22:35 Plus vous augmentez la quantité de sources, plus la qualité de votre analyse, elle suit derrière.
22:41 Donc oui, l'IA pourrait bel et bien nous aider à produire de meilleures thèses.
22:46 Ou au moins à avoir des étudiants, des jeunes chercheurs, des enseignants-chercheurs qui sont moins fatigués.
22:52 Ou qui, avec le même budget, abattent sereinement plus de travail.
22:56 Et ça, c'est quand même pas mal.
22:58 Par contre, l'IA a ses limites.
23:01 C'est un outil spécifique.
23:03 Si vous utilisez un mauvais outil, un algorithme qui est fragile, il peut vous induire en erreur.
23:08 Si vous prêtez un outil à quelqu'un d'autre, mais pour faire un autre boulot, ça ne va pas marcher.
23:14 On a par exemple une historienne, Intel, qui peut designer son IA dans un certain objectif.
23:19 Et donc avec un certain biais, qu'elle, elle maîtrise.
23:22 Mais si l'historien Intel débarque, qu'il n'est pas au courant, et qu'il veut utiliser cet outil, ça ne lui sert à rien.
23:28 Donc c'est un bel outil, mais qui n'a de valeur que parce qu'il est bien utilisé par des spécialistes.
23:33 Et il ne faudrait pas en devenir complètement dépendant, parce qu'on risque de perdre une expertise.
23:38 C'est ce qui arrive progressivement en philologie.
23:40 Les doctorants perdent progressivement la compétence linguistique.
23:44 Par exemple, la lecture du grec et du latin.
23:46 Et cette compétence, elle est confiée à des lématiseurs, à des systèmes de traduction automatique, qui commencent à avoir de bons résultats.
23:55 Dit comme ça, ça paraît super cool, on gagne du temps.
23:58 Mais il faut se poser la question de ce qu'on y perd, et des erreurs que ces outils peuvent entraîner.
24:02 Mais ce qui est sûr dans tout ça, c'est que pour ou contre, l'IA n'attendra pas la recherche pour avancer.
24:08 Donc autant que les chercheurs s'en emparent, et au plus vite.
24:11 Résultat, de nouveaux métiers apparaissent déjà dans la recherche historique,
24:15 avec le développement des humanités numériques, et des chercheurs qui doivent se former à tous ces changements.
24:21 Bien entendu, là j'ai parlé que des instruments de travail des chercheurs et des chercheuses.
24:26 Ces fonctions vont forcément impacter le monde de la recherche.
24:29 Mais l'intelligence artificielle s'applique aussi à plein d'autres champs historiques qui ne sont pas de la recherche.
24:35 Par exemple, la transmission, l'histoire publique, la communication, la mise en scène, etc.
24:40 Tout ça n'aura jamais le moindre impact sur les chercheurs.
24:43 Ils savent que le faux chatbot de Napoléon dans le musée de Napoléon, c'est un jeu, un support ludique qui s'adresse au grand public.
24:51 Donc ces utilisations ont aussi leurs risques pour nous, mais l'archéologue, l'historien, l'historien de l'art,
24:57 eux, ils continueront de travailler de leur côté sur les vraies lettres de Napoléon,
25:00 sur les vrais documents d'époque, sur les vrais chantiers de fouille, etc.
25:04 L'impact populaire de l'intelligence artificielle sur la perception commune de l'histoire,
25:09 ça c'est un autre problème qui pourrait très bien donner lieu à un autre épisode.
25:13 Et en attendant, toujours sur ma chaîne Nota Bonus, vous pouvez retrouver mes questionnements sur l'IA,
25:19 est-ce que ça va changer pour les créateurs de contenu ? Je vous invite à aller voir mes réflexions sur ce sujet.
25:24 Merci à Bastien Verdier pour l'écriture de cet épisode, merci à Julie Giovacchini pour sa relecture.
25:30 Si ça vous a plu, n'oubliez pas de vous abonner à la chaîne et de me suivre sur Insta, Snapchat, Facebook, TikTok,
25:36 on est absolument partout, même en podcast ! A la prochaine !

Recommandations