Fondamentaux en statistique
- Duration: 4 weeks
- Effort: 24 hours
- Pace: ~6 hours/week
Description
La statistique est la science de la collecte, de l'organisation et de l'interprétation des données numériques. Sa compréhension et sa pratique sont essentielles pour comprendre les informations numériques et pour prendre des décisions fondées sur leur analyse.
Ce cours est une introduction aux concepts de base en statistique.
Il met l’accent sur l'application pratique de la statistique. Les étudiants apprendront :
- Quand et comment les outils statistiques peuvent être utilisés pour analyser les données
- Comment choisir et appliquer des outils statistiques aux sources de données
- De quelle façon interpréter les études quantitatives produites par les autres.
L’ensemble du cours repose sur l’utilisation du logiciel libre et gratuit R, dont l’installation et la manipulation seront expliquées pas à pas en semaine 0.
Format
Le cours se déroule pendant cinq semaines. Chaque semaine constitue un module consacré à un concept statistique spécifique, organisé en différentes séquences et abordé sous différentes formes (vidéos, textes, quizz). Le forum du cours, animé par l’équipe pédagogique, est consacré aux échanges entre les étudiants, au travail collaboratif et aux questions/réponses avec l'enseignant.Le temps de travail nécessaire est précisé au début de chaque semaine et en en-tête de chaque séquence. En moyenne le cours nécessite une charge de travail d'environ 6 à 8 heures par semaine. Au total, il est recommandé de consacrer entre 35 et 40 heures à ce cours, afin d'acquérir de manière durable et transférable les compétences visées par la formation.
Prerequisites
Course plan
- • A. Installation de R et Rstudio
• B. Premiers pas : créer des objets
• C. Importer des données (format texte, excel, etc.)
• D. Manipuler des données
• E. Ecrire une fonction
- • A. Que mesure-t-on ?
• B. Caractérisation d'une variable
• C. Représentation graphique
• D. Indices résumés : paramètres de localisation
• E. Indices résumés : paramètres de dispersion
• F. Représentation graphique resumée : le box-plot
- • A. Cas de deux variables qualitatives : tableau de contingence
• B. Cas de deux variables qualitatives : représentation graphique
• C. Cas de deux variables quantitatives : covariance et corrélation
• D. Cas de deux variables quantitatives : introduction à la régression
• E. Principe d'un test
• F. Application des tests en régression
- • A. Introduction aux méthodes factorielles
• B. Définition d'une distance entre individus
• C. Cas de p>2 variables quantitatives : projection et analyse en composantes principales
• D. Cas de p > 2 variables quantitatives : Interprétation de l’analyse en composantes principales (ACP)
• E. Cas de p > 2 variables qualitatives : analyse factorielle des correspondances (AFC)
- • A. Préalable
• B. Classification Ascendante Hiérarchique
• C. Nuées dynamiques (k-means)
• D. Classement
Course runs
Archived
- From March 26, 2015 to May 14, 2015
Course team
Avner Bar-Hen
Christine Keribin
Etienne Côme
Organizations
License
License for the course content
Attribution-NonCommercial-ShareAlike
You are free to:
- Share — copy and redistribute the material in any medium or format
- Adapt — remix, transform, and build upon the material
Under the following terms:
- Attribution — You must give appropriate credit, provide a link to the license, and indicate if changes were made. You may do so in any reasonable manner, but not in any way that suggests the licensor endorses you or your use.
- NonCommercial — You may not use the material for commercial purposes.
- ShareAlike — If you remix, transform, or build upon the material, you must distribute your contributions under the same license as the original.
License for the content created by course participants
Attribution-NonCommercial-ShareAlike
You are free to:
- Share — copy and redistribute the material in any medium or format
- Adapt — remix, transform, and build upon the material
Under the following terms:
- Attribution — You must give appropriate credit, provide a link to the license, and indicate if changes were made. You may do so in any reasonable manner, but not in any way that suggests the licensor endorses you or your use.
- NonCommercial — You may not use the material for commercial purposes.
- ShareAlike — If you remix, transform, or build upon the material, you must distribute your contributions under the same license as the original.