Remplacer des valeurs aberrantes par une moyenne

Bonjour à toutes et tous,

j’ai une question concernante l’usage de pandas. En effet j’ai un dataset où est indiqué pour chaque individu son âge. Dans certains cas l’âge indiqué est aberrante : individus de moins de 15 ans (exclus de l’échantillonnage) ou de plus de 100 ans.
Je voudrais savoir comment remplacer ces entrées par la moyenne de âge.

Merci d’avance

j’ai essayé l’option suivante

df.loc[(df[‹ age ›] < 15) | (df[‹ age ›] > 100)] = df[‹ age ›].mean()

Bonjour Francesco,

La solution suivante devrait fonctionner:

df.loc[(df["age"] < 15) | (df["age"] > 100), 'age'] = df["age"].mean()

En espérant que cela vous aide.

Dimitri

Bonjour, il me semble que cette syntaxe de la méthode loc n’a pas été vue dans le cours : est-il possible de mettre ce deuxième argument : , ‘age’?
Merci bcp.

df.loc[(df[“age”] < 15) | (df[“age”] > 100), ‘age’]