Les inscriptions sont closes
  • Fin d'inscription
  • Inscription close
  • Début du Cours
  • 27 fév 2017
  • Fin du cours
  • 06 mai 2017
  • Effort estimé
  • 05:00 h/semaine
  • Langue
  • Français

A propos du cours

Cette 3ème édition du cours d'analyse de données multidimensionnelles débutera le 1er mars 2017.

Ce cours vise à comprendre et appliquer les méthodes fondamentales de l'analyse des données : analyse en composantes principales, analyse factorielle des correspondances, analyse des correspondances multiples, classification ascendante hiérarchique. Une extension vers l'analyse factorielle multiple permettra d'aborder le traitement de données plus complexes (nouveauté par rapport à la première édition).

Conçu en vue des applications, ce cours donne une large place aux exemples et à la mise en œuvre logicielle (logiciel FactoMineR de R). La présentation des méthodes recourt le moins possible au formalisme mathématique en privilégiant l'approche géométrique.

L'objectif est de rendre les participants autonomes dans la mise en œuvre et l'interprétation d'analyses exploratoires multidimensionnelles.

A qui s'adresse ce MOOC ?

Ce MOOC a été conçu pour ceux qui, sans être statisticiens, sont confrontés à l'analyse statistique de données. Tous les domaines où l'on recueille des données sont concernés : enquêtes d'opinion, marketing, biologie, écologie, géographie, etc.

Pré-requis

Ce cours est destiné aux étudiants et professionnels ayant un niveau master et/ou un background dans une discipline scientifique.

Des connaissances de base en statistique sont nécessaires : coefficient de corrélation, test du Chi2, analyse de variance à un facteur.

Enfin, une initiation au langage R est suffisante pour la mise en œuvre concrète des méthodes.

Equipe pédagogique

François Husson

Professeur de statistique au département de mathématiques appliquées d'Agrocampus Ouest (Rennes), François Husson enseigne l'analyse des données auprès d'auditeurs variés, en particulier non mathématiciens. Il a publié plusieurs travaux de recherche et d'enseignement en analyse factorielle et développe le logiciel libre FactoMineR.

Jérôme Pagès

Professeur de statistique au département de mathématiques appliquées d'Agrocampus Ouest (Rennes) jusqu'en août 2014, Jérôme Pagès a consacré sa carrière à l'étude et la diffusion des méthodes d'analyse de données. Il a publié de nombreux articles de recherche et ouvrages d'enseignement en analyse factorielle.

Magalie Houée-Bigot

Ingénieur d'études au département de mathématique appliquées d'Agrocampus Ouest (Rennes), Magalie Houée-Bigot participe au développement de plusieurs packages sur le logiciel R et participe également à l'enseignement de méthodes d'analyse de données.

Plan du cours

Semaine 1 : Analyse en composantes principales
  • Données, problématique et exemples
  • Recherche d'une représentation des individus
  • Interprétation de la représentation des individus grâce aux variables
  • Représentation des variables
  • Aides à l'interprétation
  • Mise en œuvre sous FactoMineR
Semaine 2 : Analyse factorielle des correspondances
  • Données, notations, questions
  • Liaison et indépendance entre deux variables qualitatives
  • Comment l'AFC appréhende-t-elle l'écart à l'indépendance ?
  • Nuages des lignes et des colonnes et leur représentation
  • Pourcentages d'inertie et inerties en AFC
  • Représentation simultanée des lignes et des colonnes
  • Aides à l'interprétation
  • Mise en œuvre sous FactoMineR
Semaine 3 : Analyse des correspondances multiples
  • Données, objectifs et problématique
  • Transformation du tableau des données
  • Représentation des individus
  • Représentation des modalités comme aide à l'interprétation de la représentation des individus
  • Nuage des modalités et sa représentation optimale
  • Représentation simultanée des deux nuages
  • Interprétation des valeurs propres
  • Représentation des variables
  • Aides à l'interprétation
  • Tableau de Burt
  • Mise en œuvre sous FactoMineR
Semaine 4 : Classification
  • Données, définitions
  • Principe de construction d'un arbre hiérarchique
  • Algorithme de partitionnement : les K-means
  • Consolidation des classes
  • Classification sur données de grande dimension
  • Analyse factorielle et classification
  • Caractérisation des classes d'individus
  • Mise en œuvre sous FactoMineR
Semaine 5 : Analyse Factorielle Multiple
  • Données, problématique
  • Equilibre des groupes et choix d'une pondération des variables
  • Etude et représentation des groupes de variables
  • Représentation des points partiels
  • Représentation des analyses séparées
  • Prise en compte de groupes de variables qualitatives
  • Prise en compte de tableaux de contingence
  • Aide à l'interprétation
  • Mise en œuvre sous FactoMineR

Evaluation

L'évaluation de vos connaissances se fera en continu, sur la base de quiz autocorrectifs qui vous seront proposés à l'issue de chaque vidéo. Par ailleurs, des exercices sur table et des mini-projets vous donneront l'occasion de mettre en œuvre les méthodes sur logiciel et d'échanger sur les forums. Les réponses aux quiz et exercices ainsi qu'un exercice d'évaluation finale vous permettront d'obtenir une attestation de suivi avec succès.

Lecture conseillée

Ce cours est repris et développé dans le livre suivant :
Husson, F., Pagès, J. et S. Lê (2016). Analyse de données avec R. Presses Universitaires de Rennes (18 Eur.), 2ème édition

Conditions d'utilisation

Conditions d'utilisation du cours :

Licence Creative Commons BY NC ND : l'utilisateur doit mentionner le nom de l’auteur, il peut exploiter l’œuvre sauf dans un contexte commercial, il ne peut pas créer une œuvre dérivée de l’œuvre originale.

Conditions d'utilisation du contenu produit par les internautes :

Licence restrictive : votre production relève de votre propriété intellectuelle et ne peut donc pas être réutilisée.