Analyse économétrique des données

La phase d’analyse des données est celle où l’on cherche à répondre aux questions qui ont motivé la conduite d’une évaluation.

C’est le point d’aboutissement que chacune des précédentes phases a préparé. A cette étape, il est procédé à l’estimation des scores des élèves au niveau global mais aussi pour différentes catégories (par exemple filles vs garçons, élèves ruraux vs élèves urbains, etc.) à des fins d’analyse d’équité. Ces analyses permettent de distinguer les différences brutes de scores entre les modalités d’une variable. Ces analyses préliminaires sont réalisées grâce aux méthodes de régression (plutôt que des tests simples) permettant ainsi de corriger la violation des hypothèses de la mise en œuvre des tests (de comparaison de moyennes de Student).

Les analyses précitées sont complétées par des analyses multi variées qui permettent d’analyser les scores des élèves en lien avec une gamme plus large de variables. On s’intéresse alors à la relation du score de l’élève à différentes variables prises conjointement telles que l’âge de l’élève, le genre de l’élève, le capital socioéconomique de sa famille, ses conditions d’apprentissages à domicile et à l’école.

La méthode d’analyse multi variée consiste en la mise en œuvre de modèles multi niveaux. Classiquement, un modèle sans variables explicatives est estimé et permet de déterminer les pourcentages de la variance des scores qui est imputable à chaque niveau de tirage (élèves et écoles). La démarche subséquente consiste en l’ajout de bloc de variables. On introduit successivement les caractéristiques des élèves, celles des maitres et de la classe et finalement celles du directeur et de l’école. Pour chacun des sous-modèles estimés, il est possible de calculer la réduction de la variance qui résulte de l’ajout du bloc de variables.