Projet Polititweets

Le projet #Idéo2017 se situe dans la continuité de deux projets de recherche, portés par Julien Longhi en collaboration avec des membres du laboratoire ETIS impliqués dans #Idéo2017 (Claudia Marinica, Boris Borzic, Abdulhafiz Alkhouli).

Ces projets, également soutenus par la Fondation UCP, ont permis la constitution et la mise en ligne du premier corpus de tweets, Polititweets.

Ce corpus s’inscrit également dans le cadre du projet CoMeRe (dir. T. Chanier), projet créé dans le cadre des activités de l’IR Corpus:

comere

Le corpus est accessible et librement téléchargeable en ligne sur le site d’Ortolang:

comere-2

Le corpus est constitué selon les différents standards de la communauté en matière de format, codage, etc, notamment grâce à l’usage du format TEI:

comere3

 

Plusieurs travaux ont déjà été produits ou sont en cours de finalisation:

Longhi, J., Marinica, C., Borzic, B., Alkhouli, A., 2014Polititweets, corpus de tweets provenant de comptes politiques influents. In Chanier T. (ed) Banque de corpus CoMeRe. Ortolang.fr : Nancy. [cmr-polititweets- tei-v1]  – accessible via ce permalien.

Djemili S., Longhi J., Marinica C., Kotzinos D. & Sarfati G.-E., 2014: « What does Twitter have to say about ideology?  », Konvens 2014 – Workshop proceedings vol. 1 (NLP 4 CMC: Natural Language Processing for Computer-Mediated Communication / Social Media  – Pre-conference workshop at Konvens2014) , Germany (2014), p.16-25.

Longhi J. & Wigham C.R., 2015  :  « Structuring a CMCcorpus of political tweets in TEI: corpus features, ethics and workflow », Colloque Corpus Linguistics (Lancaster, 21-24 juillet 2015).

Longhi J., Marinica C. et Haddioui N., 2016 : « Extraction automatique de phénomènes linguistiques dans un corpus de tweets politiques : quelques éléments méthodologiques et applicatifs à propos de la négation », Res per nomen 5, Négation et référence,  Reims, EPURE (Éditions des Presses Universitaires de Reims) [lien HAL].

Longhi J., 2017 : « Le corpus Polititweets : enjeux institutionnels, juridiques, techniques et philologiques », Médias sociaux et corpus de communication médiée par les réseaux (Actes du colloque « ird-cmc-rennes : International Research Days: Social Media and CMC Corpora for the eHumanities », 23-24 octobre 2015), Paris, L’Harmattan, coll. « Humanités Numériques », p.37-50 [lien HAL].

Longhi J. & Meyer J., à paraître en 2017 : « De l’idéologie au discours idéologique : d’un discours institué au discours instituant », projet de n° pour la revue Le discours et la langue.