Passer au contenu principal
FUN MOOC
  • FAQ
  • Accueil
  • Actualités
  • Cours
  • GRADEO
  • Diplômes
  • Etablissements
  • Vous êtes ici:
  • Accueil
  • Cours
  • Recherche reproductible : principes méthodologiques pour une science transparente

Recherche reproductible : principes méthodologiques pour une science transparente

Réf. 41016
CatégorieOutils pour la rechercheCatégorieNumérique et technologie
  • Effort : 24 heures
  • Rythme: Auto-rythmé
Ce Mooc propose des principes méthodologiques pour une science ouverte et transparente. Il aborde de manière pratique la prise de notes, le document computationnel, la réplicabilité des analyses.
Inscription
Du 10 janvier 2020 au 27 décembre 2023
Cours
Du 20 mars 2020 au 31 décembre 2023
Langues
Français

Ce que vous allez apprendre

À la fin de ce cours, vous saurez :

  • Comprendre les enjeux et les difficultés de la recherche reproductible
  • Découvrir des outils pour améliorer sa prise de notes, sa gestion des données, et des calculs
  • Se familiariser avec un outil de suivi de gestion de version (Gitlab)
  • Se familiariser avec les documents computationnels réplicables (Jupyter, RStudio ou Org-Mode)
  • Écrire un notebook pour combiner efficacement une analyse de données et sa documentation

Description

Vous prenez des notes et vous voulez vous y retrouver ? Vous faites des calculs sur ordinateur et vos résultats changent d’un jour à l’autre ? Vous aimeriez partager avec vos collègues vos analyses de données et vos derniers travaux et qu’ils puissent les réutiliser ?

Ce Mooc d'une durée de 24h est pour vous, doctorant-e-s, chercheur-se-s , étudiant-e-s en master, enseignant-e-s, ingénieur-e-s de toutes disciplines qui souhaitez vous former à des environnements de publication et des outils fiables :

  • Markdown pour la prise de note structurée
  • des Outils d'indexation (DocFetcher et ExifTool)
  • Gitlab pour le suivi de version et le travail collaboratif
  • Notebooks (jupyter, rstudio ou org-mode) pour combiner efficacement calcul, représentation et analyse des données

Vous apprendrez au cours des exercices basés sur des cas pratiques à utiliser ces outils pour améliorer votre prise de notes, votre gestion des données et des calculs. Pour cela, vous disposerez d'un espace Gitlab et d'un espace Jupyter, intégrés à la plateforme FUN et qui ne nécessitent aucune installation. Ceux qui le souhaitent pourront réaliser les travaux pratiques avec Rstudio ou Org-mode après avoir installé ces outils sur leur machine. Toutes les procédures d'installation et de configuration des outils sont fournies dans le Mooc, ainsi que de nombreux tutoriels.

Nous vous présenterons également les enjeux et les difficultés de la recherche reproductible.

    Format

    🆕 La 3ème session de ce Mooc est ouverte pour une durée de un an, ce qui vous permettra de suivre le Mooc à votre rythme et de vous inscrire quand vous aurez le temps. Le temps estimé pour suivre ce cours et faire les exercices est de 24h.

    Ce MOOC est composé de quatre modules qui combinent des vidéos de cours, de nombreuses ressources notamment sur l'installation et l'utilisation des outils présentés (sous forme de vidéos ou de pages web), des quizz, et des exercices pour la mise en pratique des méthodes présentées.
    Pour illustrer et approfondir certaines notions, vous pourrez écouter ou lire des interviews de nombreux chercheurs de domaines différents.

    Des cas pratiques vous sont proposés tout au long du cours. Nous vous proposons par exemple de travailler sur un jeu de données "historique", celui de l'analyse du risque de défaillance des joints toriques de la navette spatiale Challenger, tristement célèbre en raison de sa désintégration 73 secondes après son décollage, provoquant la mort des sept astronautes de l'équipage. Cet accident aurait peut-être pu être évité ...
    Un autre exercice, évalué par les autres participants, consiste à préparer une analyse de données sous forme d'un document computationnel, avec plusieurs sujets au choix basés sur des cas réels, sur des thématiques très différentes.

    Pour réaliser ces exercices, nous proposons trois parcours différents dont chacun utilise une technologie de notebook:

    - Le premier parcours repose sur Jupyter et le langage Python. Il ne nécessite aucune installation de votre part sur votre ordinateur.
    - Le deuxième parcours repose sur RStudio et le langage R. Il nécessitera l’installation de RStudio sur votre ordinateur mais nous vous guiderons dans ce processus en temps voulu.
    - Le troisième parcours repose sur Emacs/Org-mode et les langages Python et R. Il nécessitera l’installation d’Emacs, Python, et R sur votre ordinateur mais nous vous guiderons dans ce processus en temps voulu.

    Ce cours est bilingue français / anglais. Les vidéos sont en français sous-titrées en français et en anglais. Tous les autres contenus sont fournis dans les 2 langues ainsi que les Quiz et Exercices.
    Toutes les ressources de ce Mooc seront accessibles dans un entrepot Gitlab ouvert, dans les formats Org-mode ou Markdown.

    Prérequis

    Le premier module ne requiert aucune connaissance particulière. Dès le deuxième module, une connaissance des bases du langage Python (librairies pandas, numpy et matplotlib) ou du langage R est nécessaire.
    Si vous ne connaissez pas les librairies Python, n'hésitez pas à suivre le chapitre correspondant du Mooc "Python 3 : des fondamentaux aux concepts avancés du langage" (semaine 7 : l'écosystème data science Python).
    Dans le quatrième module, nous traitons des sujets plus spécialisés dont chacun peut nécessiter des compétences particulières.
    Une familiarité avec l'analyse de données et les statistiques est nécessaire pour certains exercices de cette session.
    🆕 De nouveaux sujets avec un prérequis moins élevé en statistiques ont été ajoutés dans cette 3ème session afin que chacun puisse trouver des exercices de son niveau. Néanmoins, même si vous ne parvenez pas à réaliser totalement ces exercices, cela ne vous empêchera pas de vous former sur de nombreux outils et méthodes pour la recherche reproductible.

    Evaluation et Certification

    Un badge de suivi sera délivré aux apprenants qui obtiennent une note finale égale ou supérieure à 50%. L’évaluation est basée sur des quiz, des exercices pratiques et un devoir qui sera évalué par d'autres élèves.

    Plan de cours

    • Posons le décor : La reproductibilité, en crise ? Reproductibilité et transparence
    • Module 1 : Cahier de notes, cahier de laboratoire
    • Module 2 : La vitrine et l’envers du décor : le document computationnel
    • Module 3 : La main à la pâte : une analyse réplicable
    • Module 4 : Vers une étude reproductible : la réalité du terrain

    Autres sessions

    Archivé

    • Du 22 octobre 2018 au 19 décembre 2018
    • Du 1 avril 2019 au 21 juin 2019
    • Du 14 mai 2020 au 22 novembre 2020

    Équipe pédagogique

    Christophe Pouzat

    Catégories

    Christophe Pouzat est chercheur CNRS au laboratoire MAP5, mathématiques appliquées à Paris-Descartes. Il est en fait neurophysiologiste et travaille sur l’analyse de données ; la recherche reproductible lui permet une communication explicite avec les expérimentateurs, ce qui évite bien des erreurs.

    Arnaud Legrand

    Catégories

    Arnaud Legrand est chercheur CNRS au Laboratoire d’Informatique de Grenoble. Il s’intéresse à l’évaluation de la performance de grandes infrastructures. Que ça soit lors de l’expérimentation ou lors de l’analyse des mesures, il est indispensable de capturer rigoureusement le processus utilisé.

    Konrad Hinsen

    Catégories

    Konrad Hinsen est chercheur CNRS au Centre de Biophysique Moléculaire à Orléans et au Synchrotron SOLEIL à Saint Aubin. Il explore la structure et la dynamique des protéines par des méthodes computationnelles, qu’il tente de rendre reproductibles.

    Établissements

    Inria

    Licence

    Licence pour le contenu du cours

    Attribution - Pas d’Utilisation Commerciale

    Vous êtes autorisé à :

    • Partager — copier, distribuer et communiquer le matériel par tous moyens et sous tous formats
    • Adapter — remixer, transformer et créer à partir du matériel

    Selon les conditions suivantes :

    • Attribution — Vous devez créditer l'oeuvre, intégrer un lien vers la licence et indiquer si des modifications ont été effectuées à l'oeuvre. Vous devez indiquer ces informations par tous les moyens raisonnables, sans toutefois suggérer que l'offrant vous soutient ou soutient la façon dont vous avez utilisé son oeuvre.
    • Pas d’Utilisation Commerciale — Vous n'êtes pas autorisé à faire un usage commercial de cette oeuvre, tout ou partie du matériel la composant.

    Licence pour le contenu créé par les participants du cours

    Attribution - Pas d’Utilisation Commerciale - Pas de Modification

    Vous êtes autorisé à :

    • Partager — copier, distribuer et communiquer le matériel par tous moyens et sous tous formats

    Selon les conditions suivantes :

    • Attribution — Vous devez créditer l'oeuvre, intégrer un lien vers la licence et indiquer si des modifications ont été effectuées à l'oeuvre. Vous devez indiquer ces informations par tous les moyens raisonnables, sans toutefois suggérer que l'offrant vous soutient ou soutient la façon dont vous avez utilisé son oeuvre.
    • Pas d’Utilisation Commerciale — Vous n'êtes pas autorisé à faire un usage commercial de cette oeuvre, tout ou partie du matériel la composant.
    • ​​​​​​​Pas de modifications — Dans le cas où vous effectuez un remix, que vous transformez, ou créez à partir du matériel composant l'oeuvre originale, vous n'êtes pas autorisé à distribuer ou mettre à disposition l'oeuvre modifiée.
    FacebookTwitterLinkedin

    En savoir plus

    • Aide et Contact
    • A propos de FUN
    • Foire aux questions
    • Mentions légales
    • Politique de confidentialité
    • Infolettres
    • Charte utilisateurs
    • Conditions générales d'utilisation
    • Accessibilité : partiellement conforme
    • Plan de site
    • Gestion des cookies
    Propulsé par Richie