Exposés de Benoît de Courson (ENS PSL) et Benjamin Azoulay (ENS Paris-Saclay) dans le cadre du Séminaire Digital Humanities / Artificial Intelligence (DHAI).
Avec son outil Ngram Viewer, l'entreprise Google pensait en 2010 fonder une nouvelle science : les culturomics. Onze ans plus tard, force est de constater que malgré les ambitieuses promesses du logiciel, son utilisation par les chercheurs reste rare. Les griefs contre Ngram Viewer sont nombreux : corpus opaque, inaccessible et difficile à maîtriser, qualité médiocre des métadonnées, etc.
Gallicagram est un outil open-source, conçu pour répondre à ces enjeux essentiels d’interprétation en tirant le meilleur profit du libre accès aux données de Gallica. Il permet une maîtrise efficace des corpus étudiés grâce à leur délimitation, en amont des traitements effectués comme à leur description, en aval, et propose différents modes d'analyse complémentaires permettant de tester rapidement une hypothèse. L'analyse du corpus de presse introduit aussi de nouvelles possibilités en histoire politique et en histoire culturelle: il permet ainsi aux chercheurs de s'approcher au plus près des évènements tout en conservant une vision macroscopique.
Cette discussion vise à présenter cet outil, à décrire son fonctionnement et à en illustrer les nombreux usages possibles par plusieurs exemples concrets.
Voir aussi
|
Cursus :
Benjamin Azoulay est chargé de mission au Ministère de la Mer, co-créateur du logiciel de lexicographie Gallicagram.
Cliquer ICI pour fermerDernière mise à jour : 11/06/2021