Les inscriptions sont closes
  • Fin d'inscription
  • Inscription close
  • Début du Cours
  • 02 mar 2015
  • Fin du cours
  • 06 avr 2015
  • Effort estimé
  • 05:00 h/semaine
  • Langue
  • Français

A propos du cours

L'objectif de ce cours est de comprendre et appliquer les quatre méthodes fondamentales de l'analyse des données : analyse en composantes principales, analyse factorielle des correspondances, analyse des correspondances multiples et classification ascendante hiérarchique.

Il a été conçu en vue des applications : une large place est donnée aux exemples et à la mise en œuvre logicielle (logiciel FactoMineR de R). La présentation des méthodes recourt le moins possible au formalisme mathématique en privilégiant l'approche géométrique.

L'objectif est de rendre les participants autonomes dans la mise en œuvre et l'interprétation d'analyses exploratoires multidimensionnelles.

A qui s'adresse ce MOOC ?

Ce MOOC a été conçu pour ceux qui, sans être statisticiens, sont confrontés à l'analyse statistique de données. Tous les domaines où l'on recueille des données sont concernés : enquêtes d'opinion, marketing, biologie, écologie, géographie, etc.

Pré-requis

Ce cours est destiné aux étudiants et professionnels ayant un niveau master et/ou un background dans une discipline scientifique.

Des connaissances de base en statistique sont nécessaires : coefficient de corrélation, test du Chi2, analyse de variance à un facteur.

Enfin, une initiation au langage R est suffisante pour la mise en oeuvre concrète des méthodes.

Equipe pédagogique

François Husson

Professeur de statistique au laboratoire de mathématiques appliquées d'Agrocampus Ouest (Rennes), François Husson a une vaste expérience de l'enseignement de l'analyse des données auprès d'auditeurs variés, en particulier non mathématiciens. Il a publié de nombreux travaux de recherche et d'enseignement en analyse factorielle et développe le logiciel libre FactoMineR, largement utilisé dans de nombreux pays.

Jérôme Pagès

Professeur de statistique au laboratoire de mathématiques appliquées d'Agrocampus Ouest (Rennes) jusqu'en août 2014, Jérôme Pagès a consacré sa carrière à l'étude et la diffusion des méthodes d'analyse de données auprès d'auditeurs variés, en particulier non mathématiciens. Il a publié de nombreux articles de recherche et ouvrages d'enseignement en analyse factorielle.

Magalie Houée-Bigot

Ingénieur d'études au laboratoire de mathématique appliquées d'Agrocampus Ouest (Rennes), Magalie Houée-Bigot participe au développement de plusieurs packages sur le logiciel R et participe également à l'enseignement de méthodes d'analyse de données.

Plan du cours

Semaine 1 : Analyse en composantes principales
  • Données, notations, exemples
  • Problématique
  • Etude des individus
  • Ajustement du nuage des individus
  • Représentation des variables en tant qu'aide à l'interprétation de la représentation des individus
  • Nuage des variables
  • Aides à l'interprétation
  • Mise en œuvre sous FactoMineR
Semaine 2 : Analyse factorielle des correspondances
  • Données, notations, questions
  • Liaison et indépendance entre deux variables qualitatives
  • Comment l'AFC appréhende-t-elle l'écart à l'indépendance ?
  • Nuage des lignes et nuage des colonnes
  • Représentation des nuages des lignes et des colonnes
  • Interprétation simultanée des lignes et des colonnes
  • Pourcentages d'inertie
  • Inerties (valeurs propres)
  • Aides à l'interprétation
  • Nombre maximum d'axes et V de Cramer
  • Mise en œuvre sous FactoMineR
Semaine 3 : Analyse des correspondances multiples
  • Données
  • Objectifs, problématique
  • Transformation du tableau des données
  • Nuage des individus
  • Représentation des modalités en tant qu'aide à l'interprétation de la représentation des individus
  • Nuage des modalités
  • Représentation simultanée des deux nuages
  • Interprétation des valeurs propres
  • Représentation des variables
  • Aides à l'interprétation
  • Tableau de Burt
  • Mise en œuvre sous FactoMineR
Semaine 4 : Classification
  • Données, définitions
  • Principe de construction d'un arbre hiérarchique
  • Algorithme de partitionnement : les K-means
  • Consolidation des classes
  • Classification sur données de grande dimension
  • Analyse factorielle et classification
  • Caractérisation des classes d'individus
  • Mise en œuvre sous FactoMineR

Evaluation

L'évaluation de vos connaissances se fera en continu, sur la base de quiz autocorrectifs qui vous seront proposés à l'issue de chaque vidéo. Par ailleurs, des exercices sur table et des mini-projets vous donneront l'occasion de mettre en œuvre les méthodes sur logiciel et d'échanger sur les forums.

Lecture conseillée

Ce cours est repris et développé dans le livre :
Husson, F., Pagès, J. et S. Lê (2009). Analyse de données avec R. Presses Universitaires de Rennes (15 Eur.)

Conditions d'utilisation

  • du cours
  • Licence Creative Commons BY NC ND : l'utilisateur doit mentionner le nom de l’auteur, il peut exploiter l’œuvre sauf dans un contexte commercial, il ne peut pas créer une œuvre dérivée de l’œuvre originale.

  • du contenu produit par les internautes
  • Licence restrictive : votre production relève de votre propriété intellectuelle et ne peut donc pas être réutilisée.