Représentations graphiques avec ggplot2 - ERFI1

De la théorie à la pratique sur les microdonnées de l’enquête Étude des Relations Familiales et Intergénérationnelles (ERFI1)

 

Ce kit s’adresse aux chercheur.es, étudiant.es, doctorant.es et personnels de soutien à la recherche souhaitant acquérir des compétences de base en représentation graphique avec ggplot2.

Il est recommandé d’avoir des premières notions du langage R et de son interface RStudio, incluant la manipulation d’objets, de variables et de données à l’aide des packages du tidyverse, ainsi que le calcul de statistiques simples.  Elles peuvent être acquises en suivant le kit pédagogique Initiation à l’exploitation de données d’enquête avec le langage R - ERFI1.

D’une durée de 6h, le kit peut être utilisé en totale autonomie comme une autoformation, ou constituer un support dans le cadre d’une formation accompagnée.

La formation comprend une introduction théorique aux principes fondamentaux de la visualisation des données, une présentation des concepts clés de ggplot2, ainsi qu’une application pratique consistant à reproduire certains graphiques tirés d’un article scientifique, en utilisant un jeu de données anonymisé de l’enquête ERFI-1 fourni par le Service des Enquêtes de l’INED.

Ce kit a été développé par le département Formations de LifeObs.

Objectifs pédagogiques

  • Maîtriser les principes fondamentaux de la représentation graphique afin de créer des visualisations claires et informatives, en tenant compte du type de variables à représenter (quantitatives ou qualitatives), des bonnes pratiques de sémiologie graphique (couleurs, formes, tailles, dispositions) et en intégrant des éléments essentiels tels que la légende, la source, le titre, ainsi que le choix des axes et des échelles.
  • Apprendre à utiliser le package R ggplot2, une extension du tidyverse et un outil puissant pour concevoir des graphiques reproductibles et esthétiques à partir d’une synthaxe cohérente et unifiée
  • Illustrer l’enseignement et mettre en pratique les compétences acquises à l’aide de microdonnées issues d’une enquête réelle, l’enquête “Étude des relations familiales et intergénérationnelles” (ERFI-1), réalisée en 2005 par l’INED (Institut National des Études Démographiques) et l’INSEE (Institut National de la Statistique et des Études Économiques). L’exercice proposé consiste à reproduire certains graphiques d’un article scientifique d’Arnaud Régnier-Loilier, publié en 2006 dans la revue Population et Sociétés : “À quelle fréquence voit-on ses parents ?”. Cet exercice vise également à encourager l’utilisation des données issues du nouveau cycle d’enquêtes ERFI-2, dont la collecte, lancée en 2023, s’inscrit dans le cadre du projet LifeObs coordonné par l’INED. La disponibilité prochaine des données d’ERFI-2 via l’application Quetelet Progedo-Diffusion ouvre de nombreuses perspectives pour analyser les comportements familiaux récents et leurs évolutions depuis le premier cycle d’enquêtes ERFI-1.

Ressources mobilisées

Plusieurs ressources sont mobilisées :

  • un jeu de données simplifié et anonymisé à visée pédagogique de l’enquête ERFI-1 préparé par le Service des Enquêtes de l’INED - SES (Institut national d’études démographiques). Il contient une sélection des réponses originales de l’enquête ERFI-1 dont certaines sont recodées/modifiées en vue de leur anonymisation.
  • un support de formation (conçu sous RStudio avec Quarto) mêlant exposés théoriques (grands principes de la représentation graphique, présentation du package ggplot2) et un cas pratique détaillant les différentes opérations à réaliser (instructions R et résultats de leur exécution) permettant de reproduire les premiers graphiques d’un article écrit par Arnaud Régnier-Loilier en 2006 dans la revue Population et Sociétés: “À quelle fréquence voit-on ses parents?”
  • d’autres documents utiles à la formation: documentations du jeu de données anonymisé et des données de l’enquête originale ERFI-1, article de la revue Population et Sociétés dont certains résultats sont répliqués, dictionnaire des variables du fichier anonymisé ERFI-1, etc.

En savoir plus sur l’enquête ERFI

L’Étude des Relations Familiales et Intergénérationnelles (ERFI) est la déclinaison française du programme d’enquêtes internationales et longitudinales Generations and Gender Programme (GGP) lancé par l’ONU au début des années 2000.

Ciblant les personnes âgées de 18 à 79 ans, l’objectif général de ERFI est de décrire la dynamique de la construction de la famille (fécondité, unions, ruptures, recomposition familiale) et d’en expliquer les mécanismes, en étudiant notamment le rôle joué par les relations entre hommes et femmes et les relations intergénérationnelles. Les données sont collectées dans plus d’une vingtaine de pays (principalement en Europe), avec un questionnaire standardisé.

En France, l’INSEE et l’INED ont réalisés un premier cycle d’enquêtes (ERFI-1) en trois vagues (2005, 2008, 2011). Un second cycle d’enquêtes (ERFI-2), selon une méthodologie très similaire a débuté en France en 2023.

Site de l’enquête : https://erfi.site.ined.fr/

Kit de formation LifeObs - ggplot2 -ERFI1

Support de formation : lien

Publication : lien