Datafari
Créateur | Erreur Lua dans Module:Wikidata à la ligne 118 : attempt to index field 'wikibase' (a nil value). |
---|---|
Développé par | France Labs |
Première version | Erreur Lua dans Module:Wikidata à la ligne 118 : attempt to index field 'wikibase' (a nil value). |
Dernière version | Erreur Lua dans Module:Wikidata à la ligne 118 : attempt to index field 'wikibase' (a nil value). |
Version avancée | Erreur Lua dans Module:Wikidata à la ligne 118 : attempt to index field 'wikibase' (a nil value). |
Dépôt | Erreur Lua dans Module:Wikidata à la ligne 118 : attempt to index field 'wikibase' (a nil value). |
Assurance qualité | Erreur Lua dans Module:Wikidata à la ligne 118 : attempt to index field 'wikibase' (a nil value). |
Écrit en | Java |
Interface | Erreur Lua dans Module:Wikidata à la ligne 118 : attempt to index field 'wikibase' (a nil value). |
Supporte les langages | Erreur Lua dans Module:Wikidata à la ligne 118 : attempt to index field 'wikibase' (a nil value). |
Système d'exploitation | Erreur Lua dans Module:Wikidata à la ligne 118 : attempt to index field 'wikibase' (a nil value). |
Environnement | Multiplate-forme |
Taille des données | Erreur Lua dans Module:Wikidata à la ligne 118 : attempt to index field 'wikibase' (a nil value). |
Formats lus | Erreur Lua dans Module:Wikidata à la ligne 118 : attempt to index field 'wikibase' (a nil value). |
Formats écrits | Erreur Lua dans Module:Wikidata à la ligne 118 : attempt to index field 'wikibase' (a nil value). |
Langues | Erreur Lua dans Module:Wikidata à la ligne 118 : attempt to index field 'wikibase' (a nil value). |
Type | Moteur de recherche |
Licence | Licence Apache 2.0 |
Documentation | Erreur Lua dans Module:Wikidata à la ligne 118 : attempt to index field 'wikibase' (a nil value). |
Site web | www.datafari.com |
Chronologie des versions
Datafari est un moteur de recherche libre open source utilisant Solr (un des projets de l'Apache Software Foundation).
- C'est un moteur de recherche packagé dans le sens où il propose la connexion aux sources de données, l'indexation, la recherche et l'administration graphique du système. On peut aussi parler de solution de recherche.
- Il est distribué (architecture de type Architecture distribuée) en utilisant SolrCloud.
- Il utilise Solr pour l'indexation et la recherche des données.
- Il combine les technologies Apache ManifoldCF, Solr et Cassandra. Il propose une interface suivant les principes d'une architecture REST grâce aux capacités de ManifoldCF et de Solr. Il propose également un framework graphique opensource Ajaxfrancelabs, basé sur HTML5, CSS3 et jQuery.
Historique[modifier]
Datafari a été créé par France Labs. Pour avancer sur la R&D de son nouvel algorithme de pertinence intranet, France Labs cherche une solution de recherche open source. L'équipe réalise alors qu'il n'existe pas de solutions de recherche maintenue régulièrement en licence Apache. C'est pourquoi elle décide de créer Datafari. Ce dernier prend alors son indépendance vis-à-vis des travaux sur l'algorithme, étant donné son intérêt en tant que tel. La première version sort le 4 mars 2015 avec un numéro de version 1.0[1]. En mai 2015, France Labs remporte grâce à Datafari le prix Big Data de l'IT Innovation forum[2]. La version 2.0 (la montée en version étant liée au changement technique de la migration de Solr 4 vers Solr 5) sort le 7 septembre 2015[3].
La société France Labs est créée fin 2011 par Cédric Ulmer, Olivier Tavard et Aurélien Mazoyer ; le siège social est situé à Nice en France[4].
Fonctionnalités[modifier]
Les fonctionnalités principales de Datafari dans la version 2.2.1 :
Pour les utilisateurs du moteur[modifier]
- Recherche textuelle ou booléenne ;
- Un outil de moissonage (ou crawler) basé sur ManifoldCF et permettant donc de base d'indexer des CMS (Alfresco, Sharepoint, ...), des sites webs, des fichiers sur des partages (Netapp, Samba, Windows), des emails, des bases de données, Hadoop HDFS. Voir le site de ManifoldCF pour une liste plus complète. ;
- Analyse « full text » et système de plugins pour ajouter des filtres de traitement à l'indexation et à la recherche ;
- Gestion multilingues et reconnaissance automatique de plus de vingt langues ;
- API REST de configuration et de recherche grâce à Apache Solr et Apache ManifoldCF ;
- Algorithme de pertinence entièrement configurable ;
- Interface graphique en HTML5 et Javascript utilisant des widgets HTML, en responsive design ;
- Utilisation d'Apache Tika pour analyser et extraire le contenu et les meta-données de nombreux formats de documents (MSOffice, OpenOffice, HTML, XML, PDF, RTF, TXT, ZIP, EXIF, MP3...) ;
- Likes et favoris pour liker des résultats et pour les stocker afin de les consulter ultérieurement ;
- Système d'alertes emails afin de recevoir des notifications de nouveaux résultats en mode push (réception de l'information) plutôt que pull (envoie volontaire de requête) ;
- Système de business intelligence sur les données indexées et les requêtes utilisateurs, basé sur ELK.
Pour les administrateurs du moteur[modifier]
- Outil d'analyse graphique des informations de requêtes utilisateurs ;
- Outil d'administration du Solr utilisé dans Datafari ;
- Outil d'analyse des performances et du calcul de pertinence des requêtes ;
- Outil de gestion de la sécurité avec connexion à l'Active Directory ou au LDAP ;
- Outil de gestion des synonymes ;
- Outil de gestion des promoliens, qui permettent d'afficher des informations non présentes dans l'index selon des mots clés de recherche ;
- Outil de gestion des connecteurs de moissonage, avec de nombreuses sources de données pré-existantes (Sharepoint, partage de fichiers, emails, sites web, CMIS...) et la possibilité d'en créer de nouvelles ;
Développement[modifier]
- Le code source de Datafari est disponible sur Github ;
- La documentation technique de Datafari est disponible sur Confluence ;
Notes et références[modifier]
- ↑ « France Labs sort Datafari 1.0 », sur WebTimeMedias (consulté le 13 octobre 2015)
- ↑ « IT Innovation Forum : France Labs remporte 2 prix de l’Innovation IT. | MediaTic Info », sur mediatic-info.com (consulté le 7 décembre 2015)
- ↑ « Datafari Download », sur www.datafari.com (consulté le 13 octobre 2015)
- ↑ « Avenir Côte d'Azur », sur www.avenir-cotedazur.com, (consulté le 13 octobre 2015)
Erreur Lua dans Module:Catégorisation_badges à la ligne 170 : attempt to index field 'wikibase' (a nil value).Erreur Lua dans Module:Suivi_des_biographies à la ligne 189 : attempt to index field 'wikibase' (a nil value).
Cet Article wiki "Datafari" est issu de Wikipedia. La liste de ses auteurs peut être visible dans ses historiques.