Skip to main content
FUN MOOC
  • FAQ
  • Home
  • News
  • Courses
  • GRADEO
  • Diplômes
  • Organizations
  • You are here:
  • Home
  • Courses
  • Fondamentaux pour le Big Data

Fondamentaux pour le Big Data

Ref. 04006
CategoryComputer science and programmingCategoryMaths and statistics
  • Duration: 6 weeks
  • Effort: 24 hours
  • Pace: ~4 hours/week
Enrollment
From Jan. 26, 2023 to Dec. 31, 2023
Course
From Jan. 26, 2023 to Jan. 29, 2024
Languages
English

What you will learn

At the end of this course, you will be able to:

  • Pourquoi les bases de données relationnelles ne sont pas toujours adaptées aux systèmes de données massives qui sont déployées dans les contextes big data.
  • Pourquoi le langage Python est un langage très utilisé dans le domaine du traitement des masses de données. Ce cours vous initie à la programmation avec ce langage, particulièrement en utilisant la bibliothèque Numpy.
  • Quelles analyses statistiques nécessitent le traitement des données massives et la prédiction.

Cette formation vous fournit les concepts élémentaires en statistiques tels que :

  • les variables aléatoires,
  • le calcul différentiel,
  • les fonctions convexes,
  • les problèmes d'optimisation,
  • les modèles de régression.

Ces bases sont appliquées sur un algorithme de classification le Perceptron.

Description

Le MOOC «Fondamentaux pour le big data» permet d'acquérir efficacement le niveau prérequis en informatique et en statistiques pour suivre des formations dans le domaine du big data et data science.

Le big data offre de nouvelles opportunités d’emplois au sein des entreprises et des administrations. De nombreuses formations préparant à ces opportunités de métiers existent.

Le suivi de ces formations nécessite des connaissances de base en statistiques et en informatique que ce MOOC vous propose d’acquérir dans les domaines de l’analyse, algèbre, probabilités, statistiques, programmation Python et bases de données.

Format

Ce MOOC est ouvert à la demande : vous pouvez vous inscrire quand vous le souhaitez, et avancer à votre rythme.

Il comporte 6 semaines.

Les forums de discussions seront animés une demi-journée par semaine.

Prerequisites

Ce MOOC s'adresse à un public ayant des bases en mathématiques et en algorithmique (niveau L2 validé) nécessitant un rafraichissement de ces connaissances pour suivre des formations en data science et big data.

Il peut être suivi en préparation du Mastère Spécialisé « Big data : Gestion et analyse des données massives », du Certificat d’Etudes Spécialisées « Data Scientist » et de la formation courte «Data Science : Introduction au Machine Learning».

Assessment and certification

Chaque partie se termine par un quiz validant les acquis des différentes sessions vidéos.

Un quiz final faisant suite à un projet validera l’ensemble du MOOC.

Vous pouvez passer vos quiz et travailler sur votre mini-projet quand vous le souhaitez. Néanmoins, il faudra patienter un peu pour obtenir votre badge : il y aura 3 sessions d'évaluation dans l'année : le 16 mars, le 20 juillet et le 22 novembre 2018.

Course plan

  • Semaine 0 : Introduction - Les enjeux du Big Data et de ce MOOC
  • Semaine 1 : Python Partie 1 / Algèbre Partie 1
  • Semaine 2 : Limites des bases de données relationnelles / Python Partie 2/ Algèbre Partie 2
  • Semaine 3 : Probabilités Partie 1 / Analyse Partie 1
  • Semaine 4 : Probabilités Partie 2 / Analyse Partie 2
  • Semaine 5 : Statistique
  • Semaine 6 : Le classifieur Perceptron

Other course runs

Archived

  • From Jan. 14, 2015 to March 5, 2015
  • From June 6, 2017 to Aug. 2, 2017
  • From Sept. 4, 2017 to Oct. 24, 2017
  • From Nov. 20, 2017 to Nov. 30, 2018
  • From Dec. 3, 2018 to Dec. 30, 2021
  • From Jan. 7, 2022 to Dec. 31, 2022

Course team

Stéphan Clémençon

Categories

Professeur au département Traitement du Signal et de l'Image de Télécom ParisTech.

Pierre Senellart

Categories

Professeur à l'École normale supérieure et responsable de l'équipe Valda d'Inria Paris, anciennement professeur à Télécom ParisTech.

Anne Sabourin

Categories

Enseignant-chercheur au département Traitement du Signal et de l'Image de Télécom ParisTech.

Joseph Salmon

Categories

Enseignant-chercheur au département Traitement du Signal et de l'Image de Télécom ParisTech.

Alexandre Gramfort

Categories

Chercheur à l'INRIA.

Ons Jelassi

Categories

Enseignante à la formation continue de Télécom ParisTech, responsable des formations Big Data.

Organizations

IMT

Bibliographie - Webographie

Lectures / MOOC recommandés

  • MOOC « Bases de données relationnelles »

License

License for the course content

Attribution-NonCommercial-NoDerivatives

You are free to:

  • Share — copy and redistribute the material in any medium or format

Under the following terms:

  • Attribution — You must give appropriate credit, provide a link to the license, and indicate if changes were made. You may do so in any reasonable manner, but not in any way that suggests the licensor endorses you or your use.
  • NonCommercial — You may not use the material for commercial purposes.
  • NoDerivatives — If you remix, transform, or build upon the material, you may not distribute the modified material.

License for the content created by course participants

Attribution-NonCommercial-NoDerivatives

You are free to:

  • Share — copy and redistribute the material in any medium or format

Under the following terms:

  • Attribution — You must give appropriate credit, provide a link to the license, and indicate if changes were made. You may do so in any reasonable manner, but not in any way that suggests the licensor endorses you or your use.
  • NonCommercial — You may not use the material for commercial purposes.
  • NoDerivatives — If you remix, transform, or build upon the material, you may not distribute the modified material.
FacebookTwitterLinkedin

Learn more

  • Help and contact
  • About FUN
  • Legal
  • Privacy policy
  • User's charter
  • General Terms and Conditions of Use
  • Sitemap
  • Cookie management
Powered by Richie