Introduction à La Statistique Avec R - Cours - FUN MOOC

Passer au contenu principal
  • Vous êtes ici:
  • Accueil
  • Cours
  • Introduction à la statistique avec R
Introduction à la statistique avec R Réf. 71007 CatégorieMathématiques et statistiquesCatégorieOutils pour la rechercheCe cours permet d’apprendre la statistique à l’aide du logiciel libre R. Le recours aux mathématiques est minimal. L’objectif est de savoir analyser des données en comprenant ce que l’on fait.
  • Durée : 5 semaines
  • Effort : 25 heures
  • Rythme: ~5 heures/semaine
  • Langues: Français

Ce que vous allez apprendre

À la fin de ce cours, vous saurez :

  • comprendre les principes de base de la statistique
  • identifier les méthodes statistiques les plus couramment utilisées
  • utiliser le logiciel libre R

Description

Ce cours permet d’apprendre la statistique à l’aide du logiciel libre R.

Le recours aux mathématiques est minimal. L’objectif est de savoir analyser des données, de comprendre ce que l’on fait, et de pouvoir communiquer ses résultats.

Ce cours s’adresse aux étudiants et praticiens de toutes disciplines qui recherchent une formation pratique. Il sera utile à toute personne ayant le besoin d’analyser un jeu de données réel dans le cadre d’un enseignement, de son activité professionnelle ou de recherche, ou par simple curiosité d’analyser un jeu de données par soi-même (données du web, données publiques…).

Le cours s’appuie sur le logiciel libre R qui est un des logiciels de statistique les plus puissants disponibles actuellement.

Les méthodes abordées sont : les techniques descriptives, les tests, l’analyse de variance, les modèles de régression linéaire et logistique, les données censurées (de survie).

Format

Le cours comprend deux volets :

- des chapitres de cours abordant des notions de statistiques et des connaissances essentielles sur le logiciel R

- des "labs": vidéos de pratique du logiciel R sous l’interface RStudio.

Chaque semaine, 4 à 6 vidéos de cours d’une dizaine de minutes et un “lab” seront mis en ligne.

Prérequis

Il n’y a pas de pré-requis pour suivre ce cours. Des connaissances de base en algèbre ou en programmation sont utiles mais ne sont pas nécessaires. En revanche, la volonté d’apprendre à analyser un jeu de données par soi-même est essentielle.

Public visé

Ce cours s'adresse à un public francophone cherchant à se former aux bases de la statistique avec un logiciel libre (disponible gratuitement). Il vise aussi bien un public en formation initiale qu'un public en formation continue. Compte tenu des nombreux domaines d'application des statistiques et de la taille importante de la communauté R, ce cours concerne une large audience. Sciences fondamentales comme appliquées, sciences humaines, gestion de projet, les statistiques concernent potentiellement l'ensemble des professions.

Évaluation et Certification

L’évaluation comporte trois niveaux :

- des quiz “mémoire” (5 à 10 questions à la fin de chaque vidéo),

- des quiz “exercice” (le plus souvent des calculs simples à réaliser avec R),

- un devoir à rendre sous forme de script R.

Un badge numérique sera attribué par FUN et l'Université Paris-Saclay à l'issue du MOOC aux apprenants qui auront obtenu une note supérieure à 60 %.

Plan de cours

  • Semaine 1 : Introduction aux statistiques et à R, description d’une variable
    • IntroductionChapitre 1 : DéfinitionsChapitre 2 : Représentations graphiquesChapitre 3 : Mesures de position et de dispersion : les principesChapitre 4 : Mesures de position et de dispersion : la pratiqueLab 1 : Introduction à R studio, manipulation des fichiers et des variables
  • Semaine 2 : Intervalles de confiance, association entre variables
    • Chapitre 5 : Intervalles de confianceChapitre 6 : Coefficient de corrélationChapitre 7 : Risque relatif et odds-ratioLab 2 : Manipulation de données, résumés numériques et graphiquesLab 3 : RMarkdown et rapport automatisé
  • Semaine 3 : Tests statistiques et pratique des tests
    • Chapitre 8 : Tests statistiques : le “p”Chapitre 9 : Tests statistiques : l’approche de Neyman et PearsonChapitre 10 : Comparaison de deux pourcentagesChapitre 11 : Comparaison de deux moyennesChapitre 12 : Test de nullité d’une corrélation, diversLab 4 : Mesures d'association, tests statistiques, update sur RMarkdown
  • Semaine 4 : Régression linéaire simple et multiple, régression logistique
    • Chapitre 13 : Régression linéaire simpleChapitre 14 : Régression linéaire, corrélation et test tChapitre 15 : Régression linéaire multiple, analyse de varianceChapitre 16 : Introduction à la régression logistiqueChapitre 17 : Régression logistique multipleLab 5 : Régression linéaire et logistique
  • Semaine 5 : Données de survie (censurées), méthodes exploratoires multidimensionnelles
    • Chapitre 18 : Données de survie ou censuréesChapitre 19 : Tests et modèles pour données censuréesChapitre 20 : Introduction aux méthodes exploratoires multidimensionnellesChapitre 21 : Analyse en composantes principalesChapitre 22 : Classification hiérarchique

Équipe pédagogique

Bruno Falissard

Catégories

Professeur de biostatistique à l'Université Paris-Saclay, ancien élève de l'école polytechnique, pédopsychiatre

Christophe Lalanne

Catégories

Ingénieur de recherche (Université Paris-Diderot, AP-HP)

Établissements

Université Paris-Saclay

Lectures Recommandées

Falissard (Bruno), Comprendre et utiliser les statistiques dans les sciences de la vie, 3e édition. Masson (372 pages).

Falissard (Bruno), The analysis of questionnaire data with R, Chapman et Hall, CRC Press (280 pages)..

Licence

Licence pour le contenu du cours

Attribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions

Vous êtes autorisé à :

  • Partager — copier, distribuer et communiquer le matériel par tous moyens et sous tous formats
  • Adapter — remixer, transformer et créer à partir du matériel

Selon les conditions suivantes :

  • Attribution — Vous devez créditer l'oeuvre, intégrer un lien vers la licence et indiquer si des modifications ont été effectuées à l'oeuvre. Vous devez indiquer ces informations par tous les moyens raisonnables, sans toutefois suggérer que l'offrant vous soutient ou soutient la façon dont vous avez utilisé son oeuvre.
  • Pas d’Utilisation Commerciale — Vous n'êtes pas autorisé à faire un usage commercial de cette oeuvre, tout ou partie du matériel la composant.
  • Partage dans les Mêmes Conditions — Dans le cas où vous effectuez un remix, que vous transformez, ou créez à partir du matériel composant l'oeuvre originale, vous devez diffuser l'oeuvre modifiée dans les même conditions, c'est à dire avec la même licence avec laquelle l'oeuvre originale a été diffusée.

Licence pour le contenu créé par les participants du cours

Attribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions

Vous êtes autorisé à :

  • Partager — copier, distribuer et communiquer le matériel par tous moyens et sous tous formats
  • Adapter — remixer, transformer et créer à partir du matériel

Selon les conditions suivantes :

  • Attribution — Vous devez créditer l'oeuvre, intégrer un lien vers la licence et indiquer si des modifications ont été effectuées à l'oeuvre. Vous devez indiquer ces informations par tous les moyens raisonnables, sans toutefois suggérer que l'offrant vous soutient ou soutient la façon dont vous avez utilisé son oeuvre.
  • Pas d’Utilisation Commerciale — Vous n'êtes pas autorisé à faire un usage commercial de cette oeuvre, tout ou partie du matériel la composant.
  • Partage dans les Mêmes Conditions — Dans le cas où vous effectuez un remix, que vous transformez, ou créez à partir du matériel composant l'oeuvre originale, vous devez diffuser l'oeuvre modifiée dans les même conditions, c'est à dire avec la même licence avec laquelle l'oeuvre originale a été diffusée.

Tag » Apprendre Logiciel R