La préparation des données est un point clé du succès de votre modèle statistique. La garantie d’un résultat ou d’une interprétation cohérente de votre modèle passe par une phase de préparation des données. Ce cours vous présente comment préparer vos données de manière efficace..
Apprendre à
- Extraire les informations pertinentes
- Transformer des données transactionnelles en données utilisables pour la modélisation statistique
- Utiliser des données catégorielles
- Gérer les valeurs extrêmes et aberrantes
A qui s’adresse cette formation ?
Aux chargés d’étudesAux ingénieurs Aux analystesAux Data Miners
Télécharger le descriptif de formation
Avoir suivi « Programmation 1: les fondamentaux »Avoir des connaissances sur la modélisation statistique
Cette formation concerne Base SAS, SAS/STAT logiciel
JOUR 1- Introduction
- Structure générale des données
- Structure des données pour une modélisation statistique
- Aperçu des étapes de préparation des données
- Extraction de données
- Problèmes pouvant être rencontrés
- Accès et validation des données disponibles
- Création d’un échantillon non biaisé et représentatif
JOUR 2- Transformations de données transactionnelles
- Avantages et inconvénients de ce type de données
- Structure des données transactionnelles les plus courantes
- Définition de la notion temporelle des données
- Transformations applicables
- Utilisation de données non numériques
- Définition et problèmes engendrés par des données non numériques
- Détection des erreurs de codage et du nombre de modalités
JOUR 3- Utilisation de données non numériques
- Contrôle des degrés de liberté
- Données géographiques
- Gérer les données extrêmes
- Difficultés des points aberrants, des valeurs manquantes et des valeurs non-renseignées
- Détection des valeurs extrêmes
- Remèdes à utiliser pour traiter les valeurs extrêmes