THIBAUD DEGUILHEM
  • Teaching
    • CC (ED 624)
    • AMA-R (M1)
    • ECON (L3)
    • ECO INTER (L3)
  • NET LAB
  • Gallery
  • Teaching
    • CC (ED 624)
    • AMA-R (M1)
    • ECON (L3)
    • ECO INTER (L3)
  • NET LAB
  • Gallery
Search
 ANALYSE STATISTIQUE APPLIQUEE - R
[ASA - R]
Picture

​Présentation et objectifs pédagogiques


Destiné aux étudiant-e-s de première année des Masters APE et MECI, cet enseignement offre un large panorama sur la statistique et l'économétrie appliquées aux données en coupe transversale et introduit les méthodes sur données de panel. Utilisant Rstudio, certains packages du tidyverse et l'environnement RMarkdown, ce cours propose aux étudiant-e-s de devenir autonomes dans l'utilisation des techniques usuelles de l'analyse quantitative en sciences sociales (socio-économie en particulier) en leur permettant de développer différentes compétences : (i.) connaître les outils statistiques et économétriques adaptés afin d'apporter des réponses quantitatives à des questions du même ordre, (ii.) maîtriser le Rbase et les packages du tidyverse pour gérer des bases de données (packages readr, dplyr) et les fonctionnalités essentielles Rstudio pour conduire une première analyse statistique à partir d'un jeu de données, (iii.) interpréter et mettre en valeur des résultats inférentiels et économétriques à l'aide de visualisations adaptées et de tableaux pertinents (packages ggplot2, rstatix et KableExtra), (iv.) réaliser collectivement un projet statistique, travailler en équipe sur RMarkdown.
​
​
​
Organisation et déroulement
​
Trois grandes parties composent ce cours depuis le data management et l'analyse descriptive et inférentielle, jusqu'à l'économétrie appliquée avec les modèles linéaires et leurs extensions aux fonctions non linéaires. Les étudiant-e-s retrouveront toutes les informations en ligne sur cette page dédiée au cours. A la fin du semestre, les étudiant-e-s devront réaliser et restituer un travail en groupe qui prendra la forme d'un rapport d'étude statistique compilé sous l'environnement Markdown. A partir d'applications pédagogiques, les étudiant-e-s seront accompagné-e-s dans leur pratique de Rstudio tout au long du semestre par la mise à disposition de jeux de données, une communauté (ASA-R sur le forum DATALAB) dédiée aux questions de "syntaxe" (script), de "tronçons" (chunk) ou de "tricotage" (knitr/compilation) (https://helpstudents.tribe.so) et leur apprentissage sera guidé par la réalisation de deux fiches d'exercices. Les étudiant-e-s peuvent enfin prendre rendez-vous durant les heures de permanence (vendredi 10h30-12h).

​
Modalités d'évaluation

Les étudiant-e-s sont évalué-e-s individuellement et collectivement en 100% CC.

  • Assiduité, implication et participation : 10%
     - Présence durant le semestre
     - Participation en séance, questions posées, implication sur le forum
 
  • Fiche individuelle : 50%  ​
           - Fiche d'exercices à faire individuellement : à rendre en ligne
           
  • Projet statistique collectif : 40% à rendre en ligne
           - Les étudiant-e-s devront réaliser un rapport statistique en groupe en respectant les normes classiques d'une étude économétrique (Stock and Watson, 2015) et le déposer en ligne avant l'heure limite en un seul et unique document, réalisé dans l'environnement Markdown et compilé au format html

​
Syllabus

Toutes les informations utiles concernant le cours d'ASA-R
  • Objectifs pédagogiques​
  • Description générale du cours
  • Plan avec les lectures obligatoires en préparation du cours
  • Modalités d'évaluation 
  • Bibliographie du cours

Document disponible ici : [LINK]

​
22-23.pdf
File Size: 2542 kb
File Type: pdf
Download File

Supports de cours et ressources

SEANCE 1 : Introduction
​Qu'est-ce que l'ASA et prise en main de Rstudio


  • Rappel : qu'est-ce que l'analyse statistique ?
  • Logiciels de statistiques : comment et quand les utiliser ?
  • Le choix du logiciel : R et Rstudio
  • Découverte de Rstudio, rappels de maths et calcul matriciel​
​
[Séance 1]          [Lectures conseillées]          [Fiche RStudio]​​​
Picture
SEANCE 2 : Data management
Gestion de bases de données : Rbase vs. Tidyverse

  • Manipuler une base de données : importation, fusion et agrégation
  • Manipuler des variables et des individus
  • Rappel de statistique descriptive (L1)

​ [Séance 2]             [Lectures conseillées]              [Fiches Dplyr & Reader]
​
qi.formation3.txt
File Size: 0 kb
File Type: txt
Download File

qi.formation2.csv
File Size: 0 kb
File Type: csv
Download File

Picture
SEANCE 3 : Projet et rapport
Organiser un travail sur Rstudio

​
  • Organiser son code R : Projet 
  • Rapport automatisé : Markdown ​
​
[Séance 3]               [Lectures conseillées]                 [Fiche RMarkdown]

​
Picture
SEANCE 4 : Basic statistics
​Statistiques univariées, bivariées et visualisations


  • Préparation des données : communes françaises (rp2012)
  • Statistiques descriptives
  • Visualisations
​
​ [Séance 4]             [Lectures conseillées]              [Fiche ggplot2]
​
pantheon_data_mit_2017.csv
File Size: 1542 kb
File Type: csv
Download File

pantheon_project_mit_2017.pdf
File Size: 50 kb
File Type: pdf
Download File

Picture
SEANCE 5 : Inférence statistique I
​Tests d'adéquation et d'homogénéité


  • Rappel d'inférence statistique​
  • Test d'adéquation (normalité)
  • Test de comparaison de moyennes
​​
​ [Séance 5]             [Lectures conseillées]
​
​
Picture
Pour aller plus loin : Inférence statistique II
​Tests d'association


  • ANOVA à un facteur
  • Corrélation linéaire
​​
​ [Séance 6]             [Lectures conseillées]
​
​
Picture
Fiche d'exercice
A rendre avant le 6-11-2022
​

[Sujet]           [Formulaire de dépôt]            [Corrigé]
Picture
SEANCE 7 : Modèle linéaire simple I
Modélisation et estimation


  • Modèles et modélisation
  • CSR Policy : running example
  • Régression et estimation par les MCO​
​​
​ [Séance 7]             [Lectures conseillées] ​
Picture
SEANCE 8 : Modèle linéaire simple II
Qualité, hypothèses, dummy et homoscédasticité


  • Qualité de l'ajustement
  • Hypothèses fondamentales du modèle linéaire
  • Régression avec dummy en VI
  • Inférence
  • Homoscédasticité et correction (robust)
​​
​ [Séance 8]             [Lectures conseillées]​
Picture
SEANCE 9 : Modèle linéaire multiple
Extension du modèle linéaire : régression multiple


  • Biais d'omission
  • Multicolinéarité
  • Qualité de l'estimation
  • Inférence et test conjoint
  • Spécification
​​
​ [Séance 9]             [Lectures conseillées]
Picture
Pour aller plus loin : Modèle linéaire et fonctions non linéaires
Modèles log, log-log et interactions


  • Stratégie pour modéliser des fonctions non linéaires
  • Interaction entre variables indépendantes/explicatives
​​
[Lectures conseillées]
Picture
SEANCE 11 : Rapport économétrique et discussion
Produire, commenter et discuter des résultats économétriques


  • Etapes clés d'une étude économétrique 
  • Validité interne des résultats
  • Validité externe
  • Références recommandées
​​
​ [Séance 11]             [Lectures conseillées]
Picture
Etude économétrique en groupe
A rendre avant le 8-01-2023


[Sujet]          [Documents complémentaires]            [Formulaire de dépôt]
​
Picture


Fiches méthodologiques
​​
Fiche et exemple questionnaire
​
Fiche échantillonnage 
m1-ape-meci-fiche-questionnaire.pdf
File Size: 726 kb
File Type: pdf
Download File

ird_iiss_mapnet_2019___kobotoolbox.pdf
File Size: 780 kb
File Type: pdf
Download File

m1-ape-meci-fiche-echantillonnage.pdf
File Size: 1185 kb
File Type: pdf
Download File



Forum pour répondre à toutes vos questions
​
Vous pouvez me poser toutes vos questions sur le forum "Help Students" en vous connectant et en allant sur les topics qui concernent le cours d'ASA-R :  [LINK]​

​
Ressources R, Rstudio et RMarkdown
​
​Tutoriel pour installer R et Rstudio [LINK]

​R pour les débutants d'Emmanuel Paradis [LINK]

​Programmation avec R de Vincent Goulet [LINK]

​

Autres ressources importantes R, Rstudio et Markdown (github...)
​
Quick-R est un très bon site d'aide à la programmation et à l'analyse statistique avec R  [LINK] 

The R Graph Gallery  [LINK]

R for Statistics de Pierre-André Cornillon et al.  [LINK]

Régression avec R de Pierre-André Cornillon et Eric Matzner-Lober  [LINK]

YaRrr ! THe Pirates' Guide to R de Nathaniel D. Phillips [LINK]  

Getting Used to R, RStudio, and R Markdown de Chester Ismay et Patrick Kennedy  [LINK]

Introduction à R et au tidyverse de Julien Barnier  [LINK]

​
Références importantes pour ce cours
​

Cornillon, P.-A., Guyader, A., Husson, F., Jégou, N., Josse, J., Kloareg, M., Matzner-Lober, E., and Rouvière, L. (2012). Statistiques avec R. Presses Universitaires de Rennes, Rennes. [BU Grands Moulins : 519.22 STA]

Denis, D. J. (2015). Applied Univariate, Bivariate, and Multivariate Statistics. Wiley-Blackwell, Hoboken.

Denis, D. J. (2020). Univariate, Bivariate, and Multivariate Statistics Using R : Quantitative Tools for Data Analysis and Data Science. Wiley-Blackwell, Hoboken. [BU Grands Moulins : 519.22 DEN]

Irizarry, R. A. (2019). Introduction to Data Science : Data Analysis and Prediction Algorithms With R. CRC Press, Boca Raton.

Stock, J. H. and Watson, M. (2014). Principes d'économétrie. Pearson, Paris. [BU Grands Moulins : 330.4 STO]

Stock, J. H. and Watson, M. W. (2015). Introduction to Econometrics : Global Edition. Pearson.

Wooldridge, J. (2018). Introduction à l'économétrie : une approche moderne. De Boeck Supérieur, Bruxelles, 2nd edition.
  • Teaching
    • CC (ED 624)
    • AMA-R (M1)
    • ECON (L3)
    • ECO INTER (L3)
  • NET LAB
  • Gallery