Une introduction à l'Apprentissage Statistique, avec des applications en R

Une introduction à l’apprentissage statistique (An Introduction to Statistical Learning, with Applications in R) écrit par Gareth James, Daniela Witten, Trevor Hastie et Robert Tibshirani (2021) apporte une contribution importante dans le domaine de l’apprentissage statistique, un ensemble d’outils essentiels pour donner un sens aux ensembles de données vastes et complexes qui ont émergé dans des domaines allant de la biologie à la finance en passant par le marketing et l’astrophysique au cours des vingt dernières années. Ce livre présente certaines des techniques de modélisation et de prédiction les plus importantes, ainsi que les applications pertinentes. Les sujets incluent la régression linéaire, la classification, les méthodes de rééchantillonnage, les approches de réduction, les méthodes basées sur les arbres, les machines à vecteurs de support, le clustering, etc.

Des graphiques en couleur et des exemples concrets sont utilisés pour illustrer les méthodes présentées. Étant donné que l’objectif de ce manuel est de faciliter l’utilisation de ces techniques d’apprentissage statistique par les praticiens de la science, de l’industrie et d’autres domaines, chaque chapitre contient un didacticiel sur la mise en œuvre des analyses et des méthodes présentées dans R, une plate-forme logicielle statistique open source extrêmement populaire.



Une introduction à l’apprentissage statistique couvre bon nombre des mêmes sujets, mais à un niveau accessible à un public beaucoup plus large. Ce livre s’adresse aussi bien aux statisticiens qu’aux non-statisticiens qui souhaitent utiliser des techniques d’apprentissage statistique de pointe pour analyser leurs données. Le texte ne suppose qu’un cours préalable en régression linéaire et aucune connaissance de l’algèbre matricielle.