Bonjour,
Quelle est la différence entre les deux syntaxes suivante ?
prix=df['price']
mv=df[['curb-weight']]
On aurait pu faire aussi : mv=df['curb-weight']
??
merci.
Karine
Bonjour,
Quelle est la différence entre les deux syntaxes suivante ?
prix=df['price']
mv=df[['curb-weight']]
On aurait pu faire aussi : mv=df['curb-weight']
??
merci.
Karine
Bonjour Karine,
Si j’ai bien compris la question, vous vous questionnez sur la syntaxe df[ ['colonne' ] ]
et df[ 'colonne']
? La différence est le type d’objet qui sera renvoyé, dans le premier cas vous obtiendrez un DataFrame et dans l’autre cas un objet de type Series. Dans le cas de ce notebook, cela ne change rien au résultat de la régression mais la manière de réaliser certaines opérations diffère entre ces deux objets.
Bien à vous,
Mounir
ok.
si j’ai bien compris df[ ['colonne' ] ]
renvoie un dataframe et df[ ‹ colonne ›] renvoie une série…mais la régression fonctionne avec ces 2 types d’objet …c’était pour varier l’exercice ?
merci
Karine
Bonjour,
Quand j’ai essayé avec df[ ‹ colonne ›], j’avais un erreur de régression.
Donc je me suis dis que Series n’était pas accepté comme la variable explicative… mais bon, à confirmer par un data scientist
La régression linéaire simple peut s’appliquer à un DataFrame, un objet de type Series ou tout type d’objet de type array-like
, comme l’indique la documentation : sklearn.linear_model.LinearRegression — scikit-learn 0.24.2 documentation
Dans le cas de ce notebook, de mon côté, en exécutant les deux cas et même pour une liste, la régression s’effectue sans erreur. Si vous obtenez une erreur, c’est qu’il y a quelque part une méthode ou fonction qui ne fonctionne pas avec un des types d’objets.
Bien à vous,
Mounir