
Etude de cas en statistique décisionnelle. 2e édition revue et augmentée
Comprendre les principes théoriques de la statistique est une chose ; savoir les mettre en pratique en est une autre, et le fossé peut être large entre les deux. C'est pour vous aider à le franchir que l'auteur a écrit un ouvrage de "travaux pratiques" de la statistique décisionnelle et de la data science, qui fait suite à son ouvrage Data Mining et Statistique Décisionnelle paru dans la même collection. Ce nouvel ouvrage présente une étude de cas réalisée de A à Z à partir du même jeu de données, et répondant de façon complète et cohérente à deux importantes problématiques : la construction d'une segmentation de clientèle et l'élaboration d'un score d'appétence à l'achat d'un produit ou la souscription d'un contrat. Les données utilisées sont à la fois réelles et complètes. Elles proviennent du secteur de l'assurance, mais l'étude qu'elles permettent de réaliser peut se transposer a de nombreux autres domaines. Ces données sont disponibles sur le Web, notamment sur le site des Editions Technip où elles sont accompagnées des programmes présentés dans l'ouvrage. Ceci permettra au lecteur de compléter sa lecture par des exercices personnels, par le test de variantes, mais aussi d'utiliser ces programmes pour les appliquer à ses propres données et ses propres projets. L'étude de cas est menée avec le logiciel SAS, qui est à la fois le plus complet et le plus répandu des logiciels statistiques commerciaux, et qui permet de traiter tous les sujets abordés dans l'ouvrage, et même d'optimiser et d'automatiser les traitements. Tout au long de l'ouvrage, une bonne partie des procédures classiques de SAS/STAT est passée en revue, en mentionnant les améliorations des versions récentes, mais, au-delà des questions de programmation, nous souhaitons surtout montrer au lecteur qu'il est souhaitable et possible de conjuguer rigueur et productivité. Pour le scoring, quatre méthodes classiques de modélisation sont mises en oeuvre et comparées, l'analyse discriminante linéaire, les arbres de décision, la régression logistique et le classificateur bayésien naïf, de même que le bagging et deux méthodes plus avancées mises en oeuvre par l'appel de code R dans le programme SAS : les forêts aléatoires et le gradient boosting.
| Nombre de pages | 400 |
|---|---|
| Date de parution | 04/12/2019 |
| Poids | 710g |
| Largeur | 170mm |
| EAN | 9782710811879 |
|---|---|
| Titre | Etude de cas en statistique décisionnelle. 2e édition revue et augmentée |
| Auteur | Tufféry Stéphane |
| Editeur | TECHNIP |
| Largeur | 170 |
| Poids | 710 |
| Date de parution | 20191204 |
| Nombre de pages | 400,00 € |
Pourquoi choisir Molière ?
Du même auteur
-

Modélisation prédictive et apprentissage statistique avec R. 2e édition revue et augmentée
Tufféry StéphaneIssu de formations devant des publics variés, cet ouvrage présente les principales méthodes de modélisation statistique et de machine learning, à travers le fil conducteur d'une étude de cas. Chaque méthode fait l'objet d'un rappel de cours et est accompagnée de références bibliographiques, puis est mise en oeuvre avec des explications détaillées sur les calculs effectués, les interprétations des résultats, et jusqu'aux astuces de programmation permettant d'optimiser les temps de calcul. A ce sujet, une annexe est consacrée au traitement des données massives. L'ouvrage commence par les méthodes de classement les plus classiques et les plus éprouvées, mais aborde rapidement les méthodes les plus récentes et les plus avancées : régression ridge, lasso, elastic net, boosting, forêts aléatoires, Extra-Trees, réseaux de neurones, séparateurs à vaste marge (SVM). A chaque fois, le lien est fait entre la théorie et les résultats obtenus, pour montrer qu'ils illustrent bien les principes sous-jacents à ces méthodes. L'aspect pratique est aussi privilégié, avec l'objectif de permettre au lecteur une mise en oeuvre rapide et efficace dans son travail concret. L'exploration et la préparation préliminaire des données sont d'ailleurs décrites, ainsi que le processus de sélection des variables. Une synthèse finale est faite de toutes les méthodes présentées et de leurs points forts. La mise en oeuvre s'appuie sur le logiciel libre R et sur un jeu de données public. Ce dernier peut être téléchargé sur Internet et présente l'intérêt d'être riche, complet et de permettre des comparaisons grâce aux nombreuses publications dans lesquelles il est cité. Quant au logiciel statistique R, non seulement il est devenu la lingua franca de la statistique et de la data science et le logiciel le plus répandu dans le monde universitaire, mais il a aussi conquis le monde de l'entreprise, à tel point que tous les logiciels commerciaux proposent désormais une interface avec R (ce point est abordé dans une annexe). Outre qu'il est disponible pour tous, dans tous les environnements, il est aussi le plus riche statistiquement, et c'est le seul logiciel permettant de mettre en oeuvre toutes les méthodes présentées dans cet ouvrage. Enfin, son langage de programmation particulièrement élégant et adapté au calcul mathématique permet de se concentrer dans le codage sur les aspects statistiques, sans les difficultés de programmation rencontrées avec d'autres logiciels. R permet d'arriver directement à l'essentiel et de mieux comprendre les méthodes exposées dans l'ouvrage.Sur commande, 4 à 6 joursCOMMANDER45,00 € -

Big Data, Machine Learning et apprentissage profond
Tufféry StéphaneCet ouvrage montre comment appliquer les méthodes de machine learning aux Big Data, et comment appliquer les méthodes plus spécifiques de deep learning aux problèmes plus complexes relevant de l'intelligence artificielle, tels que la reconnaissance d'image et le traitement du langage naturel.Sur commande, 4 à 6 joursCOMMANDER45,00 € -

Data Mining et statistique décisionnelle. La science des données, 5e édition revue et augmentée
Tufféry StéphaneLe data mining et la data science sont de plus en plus répandus dans les entreprises et les organisations soucieuses d'extraire l'information pertinente de leurs bases de données, qu'elles peuvent utiliser pour expliquer et prévoir les phénomènes qui les concernent (risques, production, consommation, fidélisation...). Cette cinquième édition, actualisée et augmentée de 90 pages, fait le point sur le data mining, ses méthodes, ses outils et ses applications, qui vont du scoring jusqu'au text mining, objet d'un chapitre complètement remanié. Nombre de ses outils appartiennent à l'analyse des données et à la statistique "classiques" (analyse factorielle, classification automatique, analyse discriminante, régression logistique, modèles linéaires généralisés, régression pénalisée, régression clusterwise...) mais certains sont plus spécifiques au data mining, comme les réseaux de neurones, les algorithmes génétiques, les SVM, les arbres de décision, les forêts aléatoires, le boosting et la détection des règles d'associations. Les avancées les plus récentes du machine learning et les applications les plus actuelles des Big Data sont présentées, qui vont des algorithmes de reconnaissance d'image aux méthodes de plongement de mots en text mining. Les chapitres sur les réseaux de neurones et les SVM sont illustrés par la reconnaissance de l'écriture manuscrite. Ces outils sont disponibles dans des logiciels de plus en plus puissants et complets, à commencer par le logiciel libre R, que nous comparons en détail aux logiciels SAS et IBM SPSS dans un chapitre spécifique. Ces logiciels sont utilisés pour illustrer par des exemples précis les explications théoriques données. Les aspects méthodologiques vont de la conduite des projets jusqu'aux facteurs de réussite et aux pièges à éviter, en passant par l'évaluation et la comparaison des modèles, leur intégration dans les processus opérationnels. Un chapitre est consacré à une étude de cas complète de credit scoring, de l'exploration des données jusqu'à l'élaboration de la grille de score.Sur commande, 4 à 6 joursCOMMANDER68,00 € -

Modélisation prédictive et apprentissage statistique avec R
Tufféry StéphaneCet ouvrage présente les principales méthodes de modélisation statistique et de machine learning, à travers le fil conducteur d'une étude de cas bancaire. Chaque méthode fait l'objet d'un rappel de cours et est accompagnée de références bibliographiques, puis est mise en couvre avec des explications détaillées sur les calculs effectués, les interprétations des résultats, et jusqu'aux astuces de programmation permettant d'optimiser les temps de calcul. A ce sujet, une annexe est consacrée au traitement des données massives. L'ouvrage commence par les méthodes de classement les plus classiques et les plus éprouvées, pour ensuite aborder les méthodes les plus récentes et les plus avancées régression ridge, lasso, elastic net, boosting, forêts aléatoires, Extra-Trees, SVM et réseaux de neurones. Le lien est toujours fait entre la théorie et les résultats obtenus, pour montrer qu'ils illustrent bien les principes sous-jacents à ces méthodes. L'aspect pratique est aussi privilégié, avec l'objectif de permettre au lecteur une mise en oeuvre rapide et efficace dans son travail concret. L'exploration et la préparation des données sont d'ailleurs décrites, ainsi que le processus de sélection des variables. Une synthèse finale récapitule les méthodes présentées et leurs points forts. Entre autres nouveautés, cette troisième édition présente le gradient boosting ainsi que des techniques innovantes pour automatiser la recherche des meilleurs modèles (auto-machine learning) et expliquer leurs prédictions individuelles, souci d'explicabilité qui s'est développé avec l'avènement des modèles complexes "boites noires". La mise en couvre s'appuie sur le logiciel libre R et sur un jeu de données public. Ce dernier peut être téléchargé sur Internet et présente l'intérêt d'être représentatif et de permettre des comparaisons grâce aux nombreuses publications dans lesquelles il est cité. Quant au logiciel R, s'il est devenu la lingua franca de la statistique et un logiciel très répandu dans le monde universitaire, il a aussi conquis le monde de l'entreprise. Outre qu'il est disponible pour tous, dans tous les environnements, il est aussi le plus complet statistiquement et il permet de mettre en couvre toutes les méthodes présentées dans cet ouvrage. Enfin, son langage de programmation particulièrement élégant et adapté au calcul mathématique permet de se concentrer sur les aspects statistiques dans le codage. R permet d'arriver directement à l'essentiel et de mieux assimiler les méthodes exposées dans l'ouvrage.Sur commande, 4 à 6 joursCOMMANDER45,95 €
Du même éditeur
-

Statistiques et analyses de données (data mining) avec R
Quatrehomme Gérald ; Du Jardin PhilippeGuide d'initiation à l'analyse des données (data mining), ce manuel présente les statistiques descriptives et explore un large éventail de techniques permettant de réaliser des comparaisons, des régressions ou des classifications à l'aide du logiciel R, en se reposant systématiquement sur des exemples pratiques facilement reproductibles. Il met également l'accent sur les conditions d'utilisation des différents tests et modélisations statistiques, un aspect primordial très souvent négligé par les utilisateurs. Destiné à un large public, cet ouvrage s'adresse aux chercheurs, praticiens et étudiants de nombreuses disciplines : médecine, biologie, anthropologie, économie, finance, marketing, psychologie, sociologie, démographie, et bien d'autres encore.Sur commande, 4 à 6 joursCOMMANDER37,00 € -

Le dessin technique de la tuyauterie industrielle. 3ème édition entièrement renouvelée
Bahr EdouardCet ouvrage rassemble les différents modes de présentation d'éléments chaudronnés couramment utilisés dans l'industrie. Il énonce les principes de base de construction, en perspective isométrique, des lignes de tuyauterie suivant les représentations simplifiées conventionnelles. Par de nombreuses illustrations, il permet au concepteur de plans d'établir la corrélation entre le symbole et l'appareil. Des exemples, extraits d'ensembles industriels, en illustrent l'emploi.Sur commande, 2 à 4 joursCOMMANDER36,00 € -

Probabilités. Exercices corrigés
Ghorbanzadeh DariushCet ouvrage est le fruit d'une longue expérience d'enseignement des probabilités-statistiques au sein de l'Institut d'Informatique d'Entreprise et de l'ESCPI Ingénieurs 2000 (CNAM). Il s'adresse aux élèves des écoles d'ingénieur, aux étudiants en mathématiques appliquées et aux ingénieurs et techniciens non-spécialistes en la matière. Son contenu et sa forme pédagogique facilitent l'assimilation de la théorie probabiliste, en particulier de certains thèmes difficiles tels le calcul de loi, le conditionnement et les notions d'asymptotique. Le livre introduit également au domaine des applications en statistiques et en fiabilité. Après des rappels de cours, les exercices abordent des sujets classiques comme les lois usuelles et les vecteurs gaussiens et d'autres plus spécifiques comme la détection de rupture, sujet actuellement leader en matière de recherche.Sur commande, 4 à 6 joursCOMMANDER32,00 €
De la même catégorie
-

Biostatistique. Une approche intuitive, 3e édition
Motulsky Harvey J. ; Citta Marco ; Citta-VanthemscRésumé : Ce livre s'adresse tout particulièrement aux professionnels de la santé, aux étudiants en sciences médicales et aux scientifiques qui consultent des statisticiens ou souhaitent comprendre les aspects statistiques de leurs recherches. L'auteur a conçu ce livre comme un guide d'interprétation de résultats plutôt que d'analyse des données. Pour ne pas dérouter les lecteurs, les mathématiques sont utilisées avec parcimonie, quand elles sont vraiment nécessaires à la bonne compréhension d'un concept et toujours accompagnées d'une explication contextuelle. Une méthodologie intuitive : Dans son livre, Motulsky présente les concepts et méthodes statistiques de manière claire et intuitive et les illustre par un grand nombre d'exemples basés sur des données réelles. Cet ouvrage traite des méthodes statistiques usuelles, aussi bien que de certaines méthodes avancées, incluant différents modèles tels que ta régression multiple, logistique et des risques instantanés proportionnels. Leurs conditions d'application sont discutées et une large place est donnée à l'interprétation des résultats qui en découlent. Un exposé théorique et pratique Tout au long de l'ouvrage, l'aspect pratique est mis en évidence, des exemples basés sur des données réelles ainsi que des analogies avec des exemples de la vie courante illustrent l'exposé théorique. L'auteur insiste sur tes conditions d'application des différentes méthodes et donne une importance toute particulière à l'interprétation critique des résultats de l'application de ces méthodes.EN STOCKCOMMANDER49,90 € -

Initiation à la statistique avec R. Cours, exemples, exercices et problèmes corrigés, 4e édition
Bertrand Frédéric ; Maumy-Bertrand MyriamIssu d'une longue expérience de formation auprès de publics très variés, cet ouvrage accompagne l'étudiant en Licence, en Master ou en écoles d'ingénieurs dans son apprentissage de la statistique avec R. Dans chaque chapitre, le lecteur trouvera : - un cours détaillé ponctué de nombreux exemples et de rubriques méthodologiques ; - des exercices répartis en deux catégories : des applications directes du cours et des problèmes plus sophistiqués permettant de généraliser les concepts ; - une rubrique "Du mal à démarrer ? " . Pour les questions les plus difficiles, une indication est proposée afin d'aider à la résolution de l'exercice ou du problème ; - les solutions détaillées des exercices et des problèmes. Cette nouvelle édition enrichie est à jour des dernières évolutions du logiciel R. Les codes sont téléchargeables à partir de la page d'accueil du livre sur le site dunod. comEN STOCKCOMMANDER33,15 € -

Analyse des données. Une approche par comparaison de modèles
Correll Joshua ; Folberg Abigail M. ; Judd CharlesLa référence pour une analyse plus simple et plus puissante des données Ce manuel aborde les outils statistiques de base exploités en sciences humaines et comportementales par une approche dite de comparaison de modèles. Cette perspective permet de présenter des techniques de construction de modèles limitées en nombre mais beaucoup plus puissantes. Entièrement mise à jour, cette 3e édition française traite en détail de l'ANOVA, de la régression multiple, des observations non-indépendantes, des modèles d'interaction et non-linéaires. Ses conseils dans les démarches à adopter face aux difficultés de l'analyse des données seront particulièrement utiles. L'approche par comparaison de modèles : - augmente la compréhension intuitive de la matière et la capacité future d'analyse des données ; - procure davantage de contrôle dans l'analyse des données ; - réduit le nombre de techniques statistiques à mémoriser. Ce livre enseigne aux lecteurs à devenir des "analyseurs de données" plutôt que des statisticiens. Retrouvez des compléments en ligne : - Pour les étudiants - Fichiers de données - Exercices pour s'entraîner - Pour les professeurs - Banque de questions d'examen - Supports de coursEN STOCKCOMMANDER45,90 € -

Statistique. Principes et méthodes
Cicchitelli Giuseppe ; D'Urso Pierpaolo ; MinozzoCe manuel s'adresse à un public d'étudiants de premier cycle qui ne sont pas destinés à devenir statisticiens, mais qui doivent utiliser les statistiques dans leur programme, par exemple en économie ou dans d'autres domaines. Nombre d'entre eux font face à des difficultés en mathématiques en raison de l'écart de niveau qui existe lorsqu'ils arrivent en première année de licence en particulier depuis la réforme du baccalauréat. La structure du livre est adaptée à cette nouvelle génération d'étudiants en reprenant les concepts étape par étape. Nous avons tenu compte de leur attente (format plus court) pour proposer un manuel concis, plus clair et truffé d'astuces pour utiliser les outils numériques (Excel et Wolfram Alpha) afin de gagner du temps. La recherche de clarté et de lisibilité ne sacrifie pas la rigueur : dans chaque chapitre, les encadrés soutiennent le processus d'apprentissage en mettant l'accent sur les définitions et les propositions. L'objectif principal de ce manuel est de développer une compréhension conceptuelle profonde plutôt qu'une connaissance superficielle des procédures. A cette fin, les concepts sont introduits par une approche intuitive et illustrés avec des exemples de travail.EN STOCKCOMMANDER39,00 €

