Le modèle k-plus-proche voisin est simple et ne demande effectivement pas d’entraînement mais de stocker le jeu d’entraînement. L’idée est simple si je cherche à classifier un nouvel individu je regarde par exemple les 3 individus les plus proches de lui. Si 2 individus sont de classe 1 alors je prédis que mon nouvel individu est de classe 1.
La régression logistique fonctionne différemment. Elle construit une régression linéaire simple sur laquelle vous appliquez une fonction sigmoid. Tout l’enjeu est de trouver les bons poids dans la régression linéaire pour classifier au mieux. Pour trouver ces poids vous avez besoin d’entraîner le modèle sur un jeu de données d’apprentissage.
Si j’ai bien répondu à votre question n’hésitez pas à mettre la réponse en solution.