La numérisation du monde a pour conséquence la mise à disposition de masses de données inédites, notamment celles provenant du web. La statistique qui s'est développée autrefois dans un contexte de rareté des données fait face à de nouveaux défis. Donner du sens aux données, développer des algorithmes prédictifs sans nécessairement avoir de modèle génératif, tels sont quelques-uns des objectifs de l'apprentissage statistique. L'apport d'autres disciplines - informatique et optimisation en particulier - est essentiel compte tenu de la nécessité de traiter rapidement les volumes de données impliqués. On distingue l'apprentissage supervisé, où l'objectif est de prévoir une réponse à partir de prédicteurs, de l'apprentissage non supervisé, qui recherche des structures et des formes sans chercher à prévoir une réponse particulière. Depuis les réseaux de neurones jusqu'aux forêts aléatoires, en passant par les séparateurs à vaste marge (SVM), de nombreux algorithmes ont été développés, ne reposant que faiblement sur des hypothèses probabilistes. Dans ce contexte, la validation, la capacité de généralisation à de nouvelles données et le passage à l'échelle sont donc essentiels. Cet ouvrage est le fruit de la collaboration entre spécialistes réputés : Sylvain Arlot (Université Paris Sud), Philippe Besse (INSA de Toulouse), Stéphane Canu (INSA de Rouen), Jean-Michel Poggi (Université Paris Descartes & LMO, Université Paris-Sud Orsay), Emmanuel Viennet (Université Paris 13) et Nathalie Villa-Vialaneix (INRA, Toulouse) réunis à l'occasion des 17" Journées d'étude en statistique organisées par la SFdS. Le lecteur y trouvera une synthèse des fondements et des travaux les plus récents dans le domaine de l'apprentissage statistique, avec des applications dans des domaines variés.
Résumé : Cet ouvrage propose aux étudiants de la première année d'études supérieures une méthode progressive et efficace pour apprendre, comprendre et appliquer les concepts fondamentaux des mathématiques. Associés à des rappels de cours clairs et concis, sous forme de fiches, 200 QCM et 200 exercices de difficulté croissante permettent de s'évaluer et de s'entraîner aux examens et concours. Les corrigés détaillés mettent l'accent sur la méthode de résolution.
Cet ouvrage propose aux étudiants de Licence 2 de Mathématiques ou de Physique une méthode efficace et progressive pour comprendre et appliquer les concepts fondamentaux des mathématiques. A la suite des rappels de cours, sous forme de fiches, chaque chapitre propose des exercices de difficulté croissante pour s'évaluer : QCM, questions Vrai/Faux et exercices d'entraînement. Les corrigés détaillés mettent en évidence la méthodologie.
Cet ouvrage propose aux étudiants de la première année d'études supérieures une méthode progressive et efficace pour apprendre, comprendre et appliquer les concepts fondamentaux des mathématiques. Associés à des rappels de cours clairs et concis, sous forme de fiches, 200 QCM et 230 exercices de difficulté croissante permettent de s'évaluer et de s'entraîner aux examens et concours. Les corrigés détaillés mettent l'accent sur la méthode de résolution.
Issu d'une longue expérience de formation auprès de publics très variés, cet ouvrage accompagne l'étudiant en Licence, en Master ou en écoles d'ingénieurs dans son apprentissage de la statistique avec R. Dans chaque chapitre, le lecteur trouvera : - un cours détaillé ponctué de nombreux exemples et de rubriques méthodologiques ; - des exercices répartis en deux catégories : des applications directes du cours et des problèmes plus sophistiqués permettant de généraliser les concepts ; - une rubrique "Du mal à démarrer ? " . Pour les questions les plus difficiles, une indication est proposée afin d'aider à la résolution de l'exercice ou du problème ; - les solutions détaillées des exercices et des problèmes. Cette nouvelle édition enrichie est à jour des dernières évolutions du logiciel R. Les codes sont téléchargeables à partir de la page d'accueil du livre sur le site dunod. com
Cet ouvrage rassemble les différents modes de présentation d'éléments chaudronnés couramment utilisés dans l'industrie. Il énonce les principes de base de construction, en perspective isométrique, des lignes de tuyauterie suivant les représentations simplifiées conventionnelles. Par de nombreuses illustrations, il permet au concepteur de plans d'établir la corrélation entre le symbole et l'appareil. Des exemples, extraits d'ensembles industriels, en illustrent l'emploi.
De nombreux problèmes industriels ou de management peuvent être décrits sous la forme d'un système à entrées-sorties : les variables de sortie Y du système dépendent de variables d'entrée X plus ou moins contrôlables. Il s'agit de comprendre et de décrire les relations souvent très complexes entre X et Y, en l'absence d'un modèle théorique. De nombreux problèmes industriels ou de management peuvent être décrits sous la forme d'un système à entrées-sorties : les variables de sortie Y du système dépendent de variables d'entrée X plus ou moins contrôlables. Il s'agit de comprendre et de décrire les relations souvent très complexes entre X et Y, en l'absence d'un modèle théorique. La régression PLS (Partial Least Squares) est une méthode d'analyse des données spécifiquement construite pour l'étude de ce type de problème. Elle a été proposée en 1983 par Svante Wold et ses collaborateurs et connaît depuis de grands développements, principalement dans le domaine des industries chimiques, pétrolières et agro-alimentaires. La régression PLS doit pouvoir s'appliquer à de nombreux domaines avec le même succès qu'en chimie. C'est ce que nous voulons démontrer dans ce livre dont l'objet est de faire le point sur cette méthode, à la fois sur les plans théorique et pratique. Sur le plan théorique, nous avons eu trois objectifs : Situer la régression PLS parmi les méthodes d'association et de prédiction en analyse des données : analyse canonique, analyse factorielle inter-batteries, analyse des redondances, algorithme NIPALS, algorithme SIMPLS et approche PLS. Décrire l'algorithme de régression PLS dans sa forme originale telle qu'elle est programmée dans des logiciels comme SIMCA ou The Unscrambler. Présenter en détail les principales propriétés mathématiques de la régression PLS car leur connaissance est essentielle pour une bonne utilisation de la méthode. Sur le plan pratique, nous illustrons l'apport de la régression PLS en l'utilisant sur de nombreux exemples tirés de la littérature. Nous décrivons avec un maximum de détails les sorties du logiciel de référence (SIMCA) à partir de ces exemples. Ainsi, un utilisateur de la régression PLS devrait trouver dans ce livre toute l'aide nécessaire pour une exploitation optimale des résultats.