Variable cible

Bonjour,

Après ma formation en Data Analyste, j’essaie de mettre en application dans mon travail ce que j’ai vu. Je travaille dans le secteur du tourisme. En pièce jointe mon fichier. J’avoue je ne sais pas vraiment comment le prendre en data analyse.
C’est une série temporelle sur 1 an.
On cherche à démontrer que la sur-fréquentation n’est pas le fait de la population touristique (touristes + excursionnistes français et étrangers). Près de 80% de la fréquentation est portée par des locaux.
Est-ce que je dois créer une variable fréquentation totale qui serait ma variable cible et voir quel segment de population explique cette fréquentation?

Je vous remercie,

Anne

Bonjour Anne,

Dans ton cas, il ne semble pas pertinent d’utiliser le machine learning, et donc pas besoin d’utiliser une variable cible.

Pour mettre en évidence le fait que 80% de la fréquentation est portée par des locaux, je t’invite à représenter l’évolution du taux d’occupation par les locaux en fonction du temps.

Bonjour,

Je vous remercie pour votre réponse.
Dans mon étude descriptive j’ai pu voir que les résidents ont tendance à quitter le territoire les jours fériés et durant les vacances. A contrario, les touristes ont tendance à venir les jours fériés et durant les vacances. L’absence des résidents permets de compenser en grande partie l’arrivée des touristes et de ne pas exercer de pression sur le territoire.
Néanmoins en juin, je note à l’oeil nu que la fréquentation est légèrement supérieure car les touristes sont déjà arrivés et les résidents ne sont pas encore partis en vacances. Je me demandais si je pouvais compléter l’étude avec quelque chose de plus scientifique mais à la lecture de votre réponse, il semble que ce n’est pas possible. Je vous remercie,