TOOLinux

Le journal du Libre

Projet Apache Arrow pour le big data

vendredi 19 février 2016

Arrow, le nouveau grand projet de la Fondation Apache, va fournir une couche de données haute performance pour l’analyse en mémoire sur le stockage en colonne à travers des systèmes disparates.

Il doit permettre de traiter les données sans sérialisation, ce qui est un gain de temps et d’énergie (en CPU) important. Divers systèmes, langages de programmation et applications pourront se voir combiner en un seul traitement. Le format JSON est notamment supporté.

« Nous anticipons que la majorité des données dans le monde seront traitées à travers Arrow dans les prochaines années », annonce Jacques Nadeau, vice-président du projet.

Liens :

- L’annonce sur le blog de la Fondation Apache
- Le site du projet Arrow
- Le dépôt Github