Accueil/ expose
Gallicagram, un nouvel outil de lexicographie : le big data sans ses gros sabots ?
mardi 11 mai 2021

Loading the player...
Descriptif

Exposés de Benoît de Courson (ENS PSL) et Benjamin Azoulay (ENS Paris-Saclay) dans le cadre du Séminaire Digital Humanities / Artificial Intelligence (DHAI).

Avec son outil Ngram Viewer, l'entreprise Google pensait en 2010 fonder une nouvelle science : les culturomics. Onze ans plus tard, force est de constater que malgré les ambitieuses promesses du logiciel, son utilisation par les chercheurs reste rare. Les griefs contre Ngram Viewer sont nombreux : corpus opaque, inaccessible et difficile à maîtriser, qualité médiocre des métadonnées, etc.

Gallicagram est un outil open-source, conçu pour répondre à ces enjeux essentiels d’interprétation en tirant le meilleur profit du libre accès aux données de Gallica. Il permet une maîtrise efficace des corpus étudiés grâce à leur délimitation, en amont des traitements effectués comme à leur description, en aval, et propose différents modes d'analyse complémentaires permettant de tester rapidement une hypothèse. L'analyse du corpus de presse introduit aussi de nouvelles possibilités en histoire politique et en histoire culturelle: il permet ainsi aux chercheurs de s'approcher au plus près des évènements tout en conservant une vision macroscopique.

Cette discussion vise à présenter cet outil, à décrire son fonctionnement et à en illustrer les nombreux usages possibles par plusieurs exemples concrets.

 

Voir aussi


  • Aucun exposé du même auteur.
  • IA et Peuples autochtones au Canada
    Karine Gentelet
  • The Neural Race Reduction : la dynamiqu...
    Andrew Saxe
  • Pile et face : Quand les humanités numér...
    Ecole normale supérieure
  • Alignement et comparaison de textes pou...
    Philippe Gambette
  • Redéfinir l'histoire culturelle des jour...
    Pierre-Carl Langlais
  • Sampling and Solving Linear Inverse Prob...
    Eero Simoncelli
  • Voir, c'est savoir
    Stavros Lazaris
  • L’IA et la manufacture des planches au X...
    Alexandre Guilbaud
  • Extraction et mise en correspondances au...
    Tom Monnier, Mathieu Aubry
  • Learning Solutions to the Schrödinger eq...
    Giuseppe Carleo
  • Embedded stories and narrative levels : ...
    Pablo Gervas
Auteur(s)
Benjamin Azoulay
ENS Paris-Saclay

Plus sur cet auteur
Voir la fiche de l'auteur

Cursus :

Benjamin Azoulay est chargé de mission au Ministère de la Mer, co-créateur du logiciel de lexicographie Gallicagram.

Cliquer ICI pour fermer
Benoît De Courson
ENS-PSL

Plus sur cet auteur
Voir la fiche de l'auteur

Cliquer ICI pour fermer
Annexes
Téléchargements :
   - Télécharger la vidéo
   - Télécharger l'audio (mp3)

Dernière mise à jour : 11/06/2021