TOOLinux

Le journal du Libre

Unified Analytics : nouvelles fonctionnalités AutoML chez Databricks

vendredi 30 août 2019

L’éditeur d’Apache Spark annonce cette semaine que sa plateforme Unified Analytics offre désormais l’automatisation et des fonctions augmentées tout au long du cycle de vie du machine learning.

Gartner prévoit que d’ici 2020, plus de 40 % des tâches de data science seront automatisées, ce qui se traduira par une productivité accrue et une utilisation plus large par les citizen data scientists.

Databricks fourbit ses armes. L’offre d’analytique augmentée automatiser non seulement la conception de modèles de machine learning, mais s’appliquera également à l’automatisation de la préparation de données et au déploiement de modèles.

AutoML dans Databricks Unified Analytics

L’offre de Databricks fournit les fonctions AutoML à différents niveaux de contrôle et d’automatisation. D’abord, "AutoML Toolkit", pipeline de machine learning automatisé de bout-en-bout. Ensuite, "Automated Model Search", la recherche d’hyperparamètres conditionnels optimisée et distribuée avec la bibliothèque Hyperopt.



"Automated Hyperparameter Tuning" permet la recherche d’hyperparamètres optimisée et distribuée avec la bibliothèque Hyperopt et un suivi automatisé jusqu’à MLflow.

Enfin, l’éditeur annonce son intégration à AzureML : s’appuyant sur la collaboration MLflow open source entre Databricks et Microsoft annoncée en avril dernier. Cette intégration permet aux clients d’accéder aux fonctionnalités AutoML offertes par Azure Machine Learning.