Entrainement d'un modèle KNN - nearest Neighbors

Bonjoour,

pourquoi dans la synthèse du module indiquez-vous que l’algorithme knn ne requiert aucun entrainement pour faire des prédictions :

alors que plusieurs fois dans le module, on a écrit

knn.fit(X_train, y_train) ?

Car depuis le module sur la regression logistique la fonction .fit est décrite comme l’étape d’entrainement !

Je ne comprends pas ! Pouvez-vous clarifier s’il vous plaît !

merci de votre aide,
Anne

Bonjour Anne,

Le modèle k-plus-proche voisin est simple et ne demande effectivement pas d’entraînement mais de stocker le jeu d’entraînement. L’idée est simple si je cherche à classifier un nouvel individu je regarde par exemple les 3 individus les plus proches de lui. Si 2 individus sont de classe 1 alors je prédis que mon nouvel individu est de classe 1.

La régression logistique fonctionne différemment. Elle construit une régression linéaire simple sur laquelle vous appliquez une fonction sigmoid. Tout l’enjeu est de trouver les bons poids dans la régression linéaire pour classifier au mieux. Pour trouver ces poids vous avez besoin d’entraîner le modèle sur un jeu de données d’apprentissage.

Si j’ai bien répondu à votre question n’hésitez pas à mettre la réponse en solution.