TOOLinux

Le journal du Libre

OpenRefine aux Jeudis du Libre de Belgique le 19 juin

mardi 10 juin 2014

Quel que soit le domaine d’application, manipuler de gros volumes de données implique inévitablement une déperdition de leur qualité, surtout quand ces données ont été encodées par de nombreuses personnes, dans plusieurs langues et/ou sur un long laps de temps.

OpenRefine est un outil interactif de transformation qui permet de diagnostiquer les problèmes de qualité dans un set de données et de les corriger dans la foulée, ainsi que d’enrichir les données sémantiquement.

Cette présentation abordera successivement les points suivants :

- Big Data vs Data Quality ou comment concilier quantité et qualité ?
- De Google Refine à OpenRefine : historique d’un projet cédé à la communauté
- Raffinement des données : du minerai brut au diamant pur
- Vers un web de données : liaison avec le Linked Data Cloud
- La représentation des connaissances, un enjeu économique et politique

Les différentes fonctionnalités du logiciel seront illustrées à l’aide d’une collection de données ouvertes issues du domaine muséal, mais suivant une méthodologie applicable à n’importe quel autre domaine. Les retombées opérationnelles de l’utilisation d’OpenRefine seront illustrées à travers le projet Free Your Metadata.

Lieu de cette séance : HEPH Condorcet, Chemin du Champ de Mars, 15 - 7000 Mons - Auditorium 2 situé au rez de chaussée.