Twittoscope
Twittoscope est un baromètre de l'opinion politique sur le réseau social Twitter dans la perspective de l'élection présidentielle de 2012 en France. Il a été lancé en février 2010 par le journal Métro, TF1 News, TNS Sofres et Semiocast. Les résultats sont publiés le deuxième mercredi de chaque mois sur le site de Semiocast[1], sur papier (journal Métro) et sur le site des autres partenaires. Le dernier Twittoscope a été publié le [2].
La méthodologie[modifier]
Le recueil des messages[modifier]
Il se fait à partir de mots-clés (sur la base d'une liste d'environ 140 personnalités politiques majeures en France) en tenant compte du nom, du prénom, des surnoms et des abréviations (par exemple « DSK », « Sarko » ou « MAM »)… Cette liste est évolutive et pourra être complétée selon l'actualité.
Le filtrage[modifier]
Il sert à éliminer de manière automatique tous les messages citant des homonymes. Cette technique permet de garantir par exemple que les messages parlant de Royal évoquent bien la présidente du Conseil Regional de Poitou-Charentes et non l'adjectif ou une marque commerciale. De même, les messages parlant de Marine Le Pen sont distingués de ceux citant son père, etc...
Le Top 20[modifier]
Il est calculé, pour chaque personnalité, en comptabilisant mois par mois tous les messages qui l'évoquent. Il permet d'établir le classement des 20 personnalités politiques les plus citées.
Le Mood[modifier]
Il mesure les sentiments associés aux personnalités politiques dans les messages. Pour l'analyse, 4 catégories de « sentiments » ont été distinguées :
- Les Positifs : c'est-à-dire les messages formulant une opinion positive que ce soit pour saluer une action, une attitude, un avis, soit par adhésion pure et simple à l'individu ou à ses idées ;
- Les Échanges d'info : ce sont les messages évoquant une personnalité sans pour autant formuler une opinion positive, une critique ou un rejet. Cela peut être la reprise d'une intervention, d'un événement, d'un titre de presse ou de blog, sans commentaire personnel associé ;
- Les Critiques : ils désignent les messages formulant une critique soit directement soit de façon ironique (cette catégorie propre au sujet politique a été spécialement identifiée pour le Twittoscope) ;
- Les Rejets : ce sont les messages formulant un rejet clair et franc de la personnalité (voire une insulte).
Le codage des tweets selon ces 4 catégories est effectué manuellement avant d'être automatisé. Des tests sont réalisés régulièrement pour valider cette codification[3].
Gestion des spams[modifier]
Twitter est une plateforme souvent prise d'assaut par les spammeurs[4]. La méthodologie du Twittoscope[5] inclut donc une phase d'élimination des spams consistant à détecter des activités suspectes, type bourrage de tweets, et d'éliminer les messages postés de manière automatique sur un nombre important de comptes comme ceux envoyés depuis le site de François Hollande lors du deuxième débat de la primaire socialiste en septembre 2011[6].
Références[modifier]
- ↑ Baromètre politique Twitter
- ↑ EXCLUSIF : les résultats du Twittoscope de mars 2012, LCI, 10 avril 2012
- ↑ Twittoscope : comment ça marche ?, TF1 News, 9 février 2011
- ↑ (en) Twitter spam is out of control – What happened?, Tweetsmarter blog, 14 aout 2011
- ↑ Méthologie du Twittoscope
- ↑ Twitter: l'attaque des robots hollandistes
Liens externes[modifier]
Erreur Lua dans Module:Catégorisation_badges à la ligne 170 : attempt to index field 'wikibase' (a nil value).Erreur Lua dans Module:Suivi_des_biographies à la ligne 189 : attempt to index field 'wikibase' (a nil value).
Cet Article wiki "Twittoscope" est issu de Wikipedia. La liste de ses auteurs peut être visible dans ses historiques.