Un générateur de corpus dans #Idéo2017 !

La campagne présidentielle étant achevée, l’équipe d’#Idéo2017 projette de constituer, normaliser, et mettre à disposition de la communauté, l’ensemble des tweets récoltés (42290). Ceci passera par une structuration des données, une mise au format TEI, et une réflexion sur la récupération des images, vidéos, animations, qui sont de plus en plus nombreuses dans les tweets politiques.

Mais avant ce chantier, nous proposons un outil qui permet de générer des corpus, en choisissant la temporalité et le compte souhaités.

Voici les étapes qui permettent de générer son propre corpus autour de la #Présidentielle2017, grâce à #Idéo2017

Etape 1:

je vais sur #Idéo2017 (http://ideo2017.ensea.fr/plateforme/) et je choisis d’analyser les tweets d’un candidat:

Etape 2:

je clique sur la fonctionnalité « Extraction d’un corpus »

Etape 3:

je paramètre mes choix

Etape 4:

j’obtiens le corpus souhaité, balisé pour le logiciel Iramuteq (d’autres balisages pourront être introduits par la suite)

Il suffit alors de copier ce corpus et de le coller dans un fichier .txt pour réaliser ses analyses textométriques.

 

Bonne navigation sur #Idéo217 ! et n’hésitez pas à consulter la plateforme sur les législatives 2017, en cliquant en haut à droite de la plateforme.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *