Le marché de la science des données et de l’apprentissage automatique est solide et prometteur
Dans le cadre de son Magic Quadrant 2021 (le premier a été réalisé en 2014), publié le 1 mars 2021, Gartner a publié une analyse détaillée des solutions proposées par 20 acteurs relatives à la science des données (Data Science) et l’apprentissage automatique (Machine Learning). Ceci devrait être de nature à éclairer les diverses organisations qui se sont lancées dans la « culture data » et dans l’intelligence artificielle en qui elles attendent de la rationalisation, de la structuration et des bénéfices importants et significatifs. Allons plus loin dans cette étude annuelle.
Qu’est-ce que le « Magic Quadrant » de Gartner ?
Le Gartner « Magic Quadrant » découle d’une étude et analyse détaillées du marché et des acteurs dans de nombreux domaines technologiques. Le cabinet Gartner, qui est l’auteur de cette démarche, utilise un visuel clair, simple et efficace pour fournir aux entreprises à la recherche de produits et services les moyens de choisir leurs fournisseurs et prestataires. Ce visuel distingue quatre blocs ou groupes d’acteurs retenus dans l’étude annuelle :
• Les « Leaders » : acteurs combinant une excellente vision du marché avec une bonne capacité à exécuter ;
• Les « Challengers » : acteurs possédant une solide capacité d’exécution mais souffrant d’une vision imparfaite du marché ;
• Les « Visionnaires » : acteurs ayant une excellente vision du marché mais n’exécutant pas encore assez bien pour être leaders ;
• Les « Acteurs de niche » : acteurs qui se concentrent sur certains domaines d’activités précis (algorithmes, bases de données, machine learning, …) et/ou secteurs d’activités donnés (pharma, aéronautique, …) du marché disposant d’une capacité d’exécution et d’une vision du marché en retrait par rapport à leurs concurrents.
Les critères retenus par Gartner pour positionner les divers acteurs sur le « Magic Quadrant » portent essentiellement sur les fonctionnalités des produits et services proposés, la qualité et l’efficacité du support client, le go-to-market et le business model, l’implémentation géographique et les partenariats locaux, les évaluations et avis des clients, l’information et la communication, la prise en compte des demandes spécifiques des clients.
De quel marché parle-t-on ?
Le marché de la science des données (Data Science) et de l’apprentissage automatique (Machine Learning) qui est analysé par Gartner dans son étude connait une très forte croissance portée par la prolifération des données issues de tous les domaines d’activités. « Gartner définit une plate-forme de science des données et d’apprentissage automatique (DSML) comme un produit de base et un portefeuille de produits, de composants, de bibliothèques et de frameworks intégrés de manière cohérente (y compris propriétaires, partenaires et open source). Ses principaux utilisateurs sont des professionnels de la science des données, y compris des scientifiques des données experts, des scientifiques des données citoyennes, des ingénieurs de données, des développeurs d’applications et des spécialistes de l’apprentissage automatique (ML) ».
Ce que Gartner appelle « la plateforme DSML » offre les fonctionnalités suivantes :
- Mise à disposition d’un » mélange de fonctionnalités de base et avancées essentielles à la création de solutions DSML (principalement des modèles prédictifs et prescriptifs) » ;
- « Intégration de ces solutions dans les processus métier, l’infrastructure environnante, les produits et les applications » ;
- « Prise en charge de la consommation durable des informations dérivées de la plateforme et offre de fonctionnalités permettant de quantifier et de suivre la valeur des projets de science des données » ;
- Assistance et soutien aux professionnels de la science des données (data scientists, data analysts, …) ;
- Prise en charge des tâches inhérentes au cycle de vie de la science des données comme le support.
De quel marché parle-t-on ?
Gartner a évalué 20 fournisseurs de plateformes à travers le monde. Sans grande surprise, les poids lourds dans le domaine se classent dans la catégorie des « leaders » et des « visionnaires » (voir graphique ci-contre). L’analyse détaillée des « performances » de chaque acteur est disponible dans le rapport de Gartner.
Que retenir de cette étude ?
Pour notre part, nous retenons deux points importants de cette cuvée 2021 du « Magic Quadrant DSML » :
Un marché solide et prometteur
Malgré la crise sanitaire du Covid19, et contrairement à plusieurs autres marchés (transport, tourisme, …), le marché DSML a résisté et a pu continuer à croître et innover. Le chiffre d’affaires global des logiciels de plate-forme DSML a augmenté de 17,5% en 2019 (CA de 4 Md USD) contre 24,3 % en 2018(3,4 Md USD) pour représenter le deuxième segment à la croissance la plus rapide du marché des logiciels d’analyse et de BI. Sa part du marché global de l’analyse et de la BI est passée de 15,1 % en 2018 à 16,1 % en 2019. Ce sont surtout les petits et jeunes fournisseurs sur ce marché qui alimentent l’hyper-croissance.
L’innovation sur le marché DSML s’accélère à un rythme effréné
L’innovation est au cœur du marché DSML. Elle va passer à la vitesse supérieure dans presque tous les domaines, en particulier dans ceux qui suivent :
- La plateforme DSML évolue fortement dans le temps : les plates-formes composées de plusieurs composants sont devenues la norme car les fournisseurs développent leurs propres composants ou s’associent à d’autres fournisseurs pour élargir leurs offres.
- Cap sur l’open source : toutes les plateformes DSML utilisent et intègrent de plus en plus, à des degrés divers, des logiciels libres (open source).
- Cohérence de la plate-forme DSML : l’augmentation de ce que Gartner appelle la « componentisation » (plateforme ayant plusieurs composants) et l’incorporation de plus de logiciels libres crée plus de potentiel pour des solutions fragmentées et parfois inadaptées. « La nécessité d’accéder à plusieurs composants et platesformes pour des capacités complètes et robustes doit être mise en balance avec l’opportunité d’accéder à toutes les fonctionnalités de manière transparente et cohérente. À mesure que les offres embrassent un environnement hétérogène, la cohésion devient de plus en plus importante. Alors que les offres s’étendent pour fournir plus de capacités et suivre le rythme des technologies émergentes, il est crucial qu’elles prennent en charge la capacité non seulement de gérer plusieurs composants, mais également d’y accéder facilement et en toute transparence à partir de la plateforme » estime Gartner.
- Référentiels de modèles et de données : « il existe une tendance à fournir des moyens de suivi et de partage des données et des artefacts analytiques générés dans le cadre du processus d’élaboration et de déploiement du modèle. Ceci est essentiel pour la déduplication des efforts, la gouvernance et l’évolutivité d’entreprise des initiatives de science des données ».
- Plus de « collaboratif » : comme dans d’autres domaines de l‘aide à la décision, les utilisateurs qui accèdent aux plateformes DSML veulent pouvoir travailler de plus en plus en mode collaboratif car ils veulent échanger et partager en temps réel tout au long du cycle de vie de la science des données.