Méthodes
La réalisation des enquêtes LifeObs s’accompagne d’innovations méthodologiques, mutualisées par le département Innovation qui intervient en appui aux équipes en charge des enquêtes.
Anonymisation
Le développement d’une méthodologie d’anonymisation des données permet une diffusion large de fichiers simplifiés, tout en assurant leur confidentialité. Il s’agit d’un axe de travail clé du département innovations. Une collaboration avec l’INRIA a été mise en place, avec le recrutement d’une spécialiste des techniques d’anonymisation. L’objectif est d’aller plus loin dans l’assurance du bon respect des normes de protection de la vie privée des individus, tout en assurant une utilité maximale aux fichiers, en permettant notamment qu’ils contiennent autant de variables que possible. Une fois la méthodologie validée, il sera nécessaire de mettre en place un circuit de production des fichiers, ainsi qu’un circuit de diffusion des fichiers.
Pour en savoir plus :
présentation de l’anonymisation des enquêtes dans le cadre de LifeObs
Appariements
Un appariement consiste à rapprocher deux bases de données d’origine distincte partageant des unités statistiques communes mais contenant des informations différentes. Un cas classique pour le statisticien est l’appariement de fichiers de personnes. Les avantages sont multiples : repérage de doublons, enrichissements des bases... Cela pose des questions pratiques (identification d’un clef permettant de repérer les mêmes individus entre bases) et légales (déclarations à la CNIL, autorisation des producteurs…).
L’enrichissement de données d’enquête par des sources administratives est un cas particulier d’appariement. Il permet de réduire le nombre de questions posées en collectant directement de l’information dans les sources. Les personnes enquêtées doivent être informées des appariements réalisés. Les données des enquêtes de l’équipement LifeObs seront enrichies en réalisant des appariements avec des données administratives fiscales ou sociales.
Pour en savoir plus :
Appariements à des données administratives dans le cadre d’Erfi 2 et FamEmp
Regrouper les utilisateurs des données démographiques au CASD
Échantillonnage
Pour les enquêtes auprès des ménages ou des individus, dont plusieurs enquêtes LifeObs, la base de sondage peut être celle des données fiscales (base Fidéli). Cette base de sondage permet une bonne couverture de la population et de disposer de nombreuses informations auxiliaires pour réaliser des stratifications (type de logement, revenus, localisation géographique). Mobiliser cette base de sondage n’est possible qu’après validation par le Conseil national de l’information statistique (CNIS), via le comité du label de la statistique publique.
Lorsque l’utilisation de cette base n’est pas possible, d’autres méthodes d’échantillonnage aléatoire comme la génération aléatoire de numéros de téléphone peuvent également être utilisées pour les enquêtes téléphoniques.
Pour en savoir plus :
Géraldine Charrance, Amandine Stephan et Thomas Merly-Alpa, 2024, "Echantillonner des enquêtes multimode dans Fidéli : retours sur l’expérience de l’enquête Familles et employeurs". 13e Colloque Francophone sur les Sondages - 2024, Luxembourg (Luxembourg). http://hdl.handle.net/20.500.12204/j0RnYpMBGHEcdMY0JAE_
Les coordonnées de contact dans Fidéli-Nautile : Quels enseignements en tirer pour la mise en place de protocoles de collecte ? : Travaux menés dans le cadre d’une convention avec l’Insee et présentés lors de l’Assemblée du 14 octobre 2022, Ined
Optimiser une collecte par génération aléatoire de numéros de téléphones mobiles pour une enquête en population restreinte : présentation dans le cadre de l’Assemblée plénière LifeObs du 14 octobre 2022
Incitations financières
Pour le nouveau round des enquêtes européenne du Generations and Gender Programme, le passage au remplissage des questionnaires par internet s’est imposé. Dès 2018, face à la difficulté de réaliser des entretiens en face-à-face, à l’augmentation des coûts et à la baisse des taux de participation aux enquêtes, une expérimentation a été réalisée au Portugal, en Allemagne et en Croatie pour tester la faisabilité d’enquêtes en ligne, et l’efficacité d’incitations financières pour améliorer les taux de réponse et dédommager les participants de leur temps (Emery et al. 2020 ; Lugtig et al. 2022). Des tests ont été réalisé dans de nombreux pays, dont la France. Le test réalisé en France en 2021 pour l’enquête Erfi 2 (a comparé neuf scénarios comparant l’organisation des entretiens par téléphone et le remplissage des questionnaires par internet, combinés à la mise en place d’incitations financières, au moment de l’envoi de la lette annonce (incitations inconditionnelles) ou après le remplissage du questionnaire (incitations conditionnelles). Le test a montré que les incitations inconditionnelles (onéreuses en cas de taux de réponse faible) étaient nécessaires mais complexes et coûteuses, et que les réponses étaient nombreuses par Internet (Bouchet-Valat et al. 2022). Après consultation du comité d’éthique de l’Ined (avis 35 du 1/3/2024), le projet Erfi2 a renoncé aux incitations financières pour des raisons organisationnelles, financières et éthiques (Bouchet-Valat et al 2022 ; 2023).
En savoir plus :
- Lugtig, Peter, Vera Toepoel, Tom Emery, Susana L. F. Cabaço, Martin Bujard, Robert Naderi, Almut Schumann, et al. 2022. “Can We Successfully Move a Cross-national Survey Online? Results from a Large Three-country Experiment in the Gender and Generations Programme Survey.” SocArXiv. February 13. doi:10.31235/osf.io/mu8jy. https://osf.io/preprints/socarxiv/mu8jy
- Emery Tom, Detlev Lück, Almut Schumann, Susana Cabaço, Peter Lugtig, Vera Toepoel, Martin Bujard,Robert Naderi, Norbert F. Schneider, 2020, Three‐country Experiment on Modes of Data Collection. Generations and Gender Programme, 26 p. https://www.ggp-i.org/wp-content/uploads/2020/10/Three-country-push-to-web-experiment.pdf
- Bouchet-Valat Milan, Bondon Marine, Breda-Popa Ruxandra, Cochet Paul, Charrance Géraldine, Markou Efi, Toulemon Laurent, 2022, Telephone, Internet, and Incentives: First Lessons from the French GGP2020 Pilot, GGP-Connect Seminar. January 25th https://www.ggp-i.org/ggp-connect-seminar-series/#toc18
- Bouchet-Valat M., Toulemon L., Breda-Popa R, Markou E., Charrance G., Cochet P., Bondon M., 2023, L’enquête test de l’Étude des relations familiales et intergénérationnelles (erfi) 2.0. Enseignements d’une collecte multimode téléphone/Internet avec et sans incitations financières. , 12e Colloque francophone sur les sondages, 24 mars 2023. Session 3 : Enquêtes sociales internationales. https://archined.ined.fr/view/AYciUh0JLg0aT10Rufan
Multimode
Les protocoles multimodes occupent aujourd’hui une place centrale dans la recherche par enquête quantitative. Elles permettent de s’adapter aux évolutions des comportements des enquêtés et à la baisse tendancielle des taux de participation en proposant plusieurs modes de collecte. Ces dispositifs introduisent des problématiques méthodologiques spécifiques liées aux effets de mode, c’est-à-dire l’influence du mode de collecte sur les estimations produites.
Les effets de mode se décomposent en deux mécanismes :
- l’effet de sélection : résulte du fait que ce ne sont pas les mêmes personnes qui répondent en fonction des modes de collecte. Ces disparités s’expliquent par des facteurs comme les coordonnées mobilisables sur le terrain, les incitations à répondre ou encore les préférences des individus pour un mode de collecte. La non-réponse peut être considérée comme ignorable si, en tenant compte des caractéristiques observables des individus, leur participation ne dépend pas directement de la variable étudiée. Cependant, lorsqu’un biais inobservable affecte simultanément le choix du mode de collecte et la variable d’intérêt, la non-réponse devient non ignorable, ce qui introduit un biais de sélection endogène dans les résultats.
- l’effet de mesure : reflète les différences dans les réponses apportées par les « mêmes » individus selon le mode de collecte utilisé. Les modes avec enquêteur peuvent être sujets au phénomène de désirabilité sociale, où le répondant ajuste ses réponses en fonction d’attentes présumées ou de normes sociales implicites. À l’inverse, les modes auto-administrés, comme les questionnaires en ligne, peuvent favoriser une moindre implication de l’enquêté, correspondant à des comportements dits de « satisficing ». Cela se traduit par des réponses approximatives ou peu réfléchies, telles que la répétition systématique ou le choix aléatoire de réponses.
L’interaction entre ces deux mécanismes, sélection et mesure, est nécessaire pour une analyse des biais dans les enquêtes multimodes. Il s’agit de questionner si les différences observées résultent de l’impact du mode de collecte et / ou si elles traduisent un effet de sélection endogène. Cette distinction est essentielle pour évaluer la fiabilité des estimations produites.
Dans ce contexte, un groupe de travail a été créé pour mener des recherches méthodologiques afin de mieux comprendre et quantifier ces effets. Les travaux réalisés dans le cadre des enquêtes FamEmp et ERFI explorent des approches permettant de mesurer les effets de mesure et de sélection pour fournir des outils d’analyse et d’interprétation des biais liés aux enquêtes multimodes.
Pour en savoir plus :
Enquête « CDV-TCM » Votre cadre de vie, Enquête méthodologique en collecte multimode : présentation dans le cadre de l’assemblée plénière LifeObs 2022
Suivi de panels longitudinaux
La plupart des enquêtes LifeObs sont longitudinales, et permettent ainsi de suivre les trajectoires des mêmes individus au fil des vagues. Le département innovation travaille sur les modalités permettant de limiter ou contourner l’attrition des panels.
Pour en savoir plus:
Table ronde sur le suivi des panels du 14 octobre 2022
Table ronde sur la restitution des résultats d’enquête aux personnes répondantes du 16 octobre 2024