Utilisation méthode ANOVA

Bonjour,

Pour appliquer la méthode ANOVA, il est indiqué d’utiliser les deux lignes suivantes :

result = statsmodels.formula.api.ols(‹ pledged ~ main_category ›, data=df).fit()
table = statsmodels.api.stats.anova_lm(result)

Pourriez-vous m’expliquer la sintaxe de la première ligne et ce qu’elle fait exactement svp ?

Merci !

Marcello

Bonjour Marcello,

La première ligne permet simplement d’estimer notre modèle. On estime un modèle de régression linéaire avec la méthode des moindres carrés (en anglais « ols » pour « Ordinary Least Squares »). Ici la variable expliquée (ou cible) est la variable numérique pledged et la variable explicative est la variable qualitative main_category. La première partie statsmodels.formula.api.ols("pledged ~ main_category" , data=df) nous permet de définir le modèle. Puis la méthode fit() nous permet de l’estimer, on dit que l’on fit le modèle.

Le tableau produit par la seconde ligne donne le résultat de l’ANOVA entre les variables pledged et main_category.

En espérant avoir répondu à votre question,

1 Like