WikiTrends
WikiTrends est un service gratuit d’analyse d’audience de l’encyclopédie Wikipédia lancé en avril 2014. L'application permet de quantifier les thématiques les plus recherchées par les utilisateurs sur l’encyclopédie Wikipédia, au travers d'une interface de visualisation graphique[1],[2],[3],[4].
Fonctionnalités[modifier]
- Recherche par mot clé : comparaison du volume de recherches de termes associés à des pages Wikipédia[1] (cinq langues disponibles : français, anglais, espagnol, néerlandais, allemand) ;
- TOP 50 : classement et visualisation des 50 premières pages Wikipédia les plus recherchées, par territoire (France, Angleterre, Espagne, Hollande, Allemagne), à une date et une heure donnée[1] ;
- interface de représentation graphique de données statistiques[5].
Technologies[modifier]
L’application s’appuie sur les données partagées par Wikipédia, à savoir les données statistiques de visites des pages Wikipédia (pagecounts) publiées chaque heure et mises à disposition librement par la fondation Wikimedia[1],[6].
L’ensemble des fichiers récupérés sont décompressés puis chargés dans une infrastructure Big Data avant d’être restitués via l’application WikiTrends.
WikiTrends recueille 21 To de données issues de Wikipédia[1]. Ce volume de données est traité grâce au framework Java Hadoop et principalement à son sous-projet HBase, un système de gestion de bases de données non-relationnelles distribuées. HBase dispose d'un stockage structuré pour les grandes tables, et Hadoop stocke ces données dans son système de fichier HDFS.
Notes et références[modifier]
- ↑ 1,0 1,1 1,2 1,3 et 1,4 Stéphane Frachet, « La PME Cyrès quadrille Wikipédia » [html], sur www.usine-digitale.fr, (consulté le 17 novembre 2014)
- ↑ Laurence Texier, « Indre-et-Loire digital : Cyrès sur son petit nuage », La Nouvelle République, (lire en ligne)
- ↑ Christophe Cerqueira (directeur du pôle Ingensi - groupe Cyrès), « WikiTrends, l'application Big Data “French Touch” », sur www.channelbp.com, (consulté le 10 novembre 2014)
- ↑ Marlène Duretz, « Même pas mal », Le Monde, (lire en ligne)
- ↑ (en) Gerguis M.N., Salama C., El-Kharashi M.W. (2017) « WikiTrends: Unstructured Wikipedia-Based Text Analytics Framework » In: Frasincar F., Ittoo A., Nguyen L., Métais E. (eds) Natural Language Processing and Information Systems. NLDB 2017. Lecture Notes in Computer Science, vol 10260. Springer, Cham DOI:10.1007/978-3-319-59569-6_6
- ↑ (en) « Page view statistics for Wikimedia projects », sur dumps.wikimedia.org
Lien externe[modifier]
Erreur Lua dans Module:Catégorisation_badges à la ligne 170 : attempt to index field 'wikibase' (a nil value).Erreur Lua dans Module:Suivi_des_biographies à la ligne 189 : attempt to index field 'wikibase' (a nil value).
Cet Article wiki "WikiTrends" est issu de Wikipedia. La liste de ses auteurs peut être visible dans ses historiques et/ou la page Edithistory:WikiTrends.