Bonjour,
J’essaye de remplacer des valeurs supérieures à un nombre dans une colonne pandas par la moyenne de la colonne, par exemple supérieur à 50 dans la colonne A dans l’exemple suivant:
Merci
#Creation du DataFrame
df = pd.DataFrame(np.random.randint(100, size=(10,4)), columns=['A', 'B', 'C', 'D'])
#Création d'une colonne index
df['index'] = range(10)
print('dataframe = \n\n',df)
#Moyenne des nombre sur la colonne A
moyenne_A = df['A'].mean()
print('\nmoyenne A = ', moyenne_A)
#reperer les valeurs Extremes superieur a 50
valeur_extreme= df[df['A'] >50 ]
print('\n\nles valeur extremes sont : \n\n',valeur_extreme)
#Remplacer les valeurs extremes par une moyenne
valeur_extreme['A'] = moyenne_A
print('\n\nles valeurs extremes remplacés par la moyenne sont :\n\n',valeur_extreme)
#Reconstruire le dataframe avec les valeurs extremes moyennées
merged_df=df.merge(valeur_extreme,on ='index',how='left')
print('le nouveau dataframe avec les valeurs extremes moyennées est : \n\n',merged_df)
merged_df