Bonjour,
Pouvez-vous m’expliquer les différences entre les (p,d,q) et les (P,D,Q) dans le modèle SARIMA(p,d,q)(P,D,Q)s.
Merci
Bonjour,
Pouvez-vous m’expliquer les différences entre les (p,d,q) et les (P,D,Q) dans le modèle SARIMA(p,d,q)(P,D,Q)s.
Merci
Bonjour Benjamin,
Voici une illustration et des explications qui devraient vous aider à mieux comprendre la différence entre les deux :
En effet comme expliqué dans l’illustration les paramètres (p,d,q) font référence à la différenciation simple quand les paramètres (P,D,Q) font référence à la différenciation saisonnière.
Si j’ai répondu à votre question, n’hésitez pas à mettre en solution la réponse.
Merci Thibault, c’est en effet beaucoup plus compréhensible pou moi.
Par contre, en reprenant l’exemple, avec une saisonnalité k = 12, on fait une différenciation saisonnière (D=1) mais que signifie exactement? Y(t) = X(t) - X(t-12) ? Et dans le cas de D = 2, que cela signifie t-il ?
Ces différents options se retrouvent dans la section du milieu de la sortie sm.tsa.SARIMAX?
Merci par avance.
La différenciation saisonnière correspond bien ici à :
Y*(t) = Y(t) – Y(t-12) puisque l’on a une saisonnalité de 12. Pour un t qui commence à 1, on aura donc :
Y*(1) = Y(12) – Y(1)
Y*(2) = Y(13) – Y(2) etc.
Si l’on différencie deux fois par rapport à la composante saisonnière (D=2) on aura :
Y**(1) = Y*(12) – Y*(1)
Y**(2) = Y*(13) – Y*(2) etc.
La série différenciée est la série qui est modélisée. La notation AR S L12 et MA S L12 correspondent aux paramètres que l’on estime et font donc référence aux paramètres P et Q.
Bonjour Thibault,
Je me permets de rebondir su ce post pour vous demander sur quelle colonne on se base pour « éliminer » des paramètres de SARIMA.
Quand je reprends le module " Time series : Analyses et prédictions: Analyse de série temporelle avec SARIMA" , je ne sais pas sur quelle colonne on retrouve le p-valeur. Est-ce que c’est la colonne « P>|z| » ou la colonne « z » ?
Concrètement je ne comprends pas pourquoi on commence d’abord par supprimer le paramètre q (« ma.L1 ») puis le paramètre P (« ar.S.L12 »).
Pourriez-vous me préciser la colonne prise en compte ainsi que les chiffres des paramètres respectifs P, Q, p et q pour que je comprenne sur quels critères on sélectionne les paramètres à supprimer ?
En vous remerciant.
Serait-i possible de me d
Bonjour Fabrice,
La colonne où l’on retrouve les p-valeurs est celle-ci : « P>|z| ».
Pour avoir une intuition des paramètres de votre modèle, i.e le nombre de lags considérés, nous utilisons les graphiques d’ACF et de PACF. Vous pouvez alors tester un modèle. Vous réajustez ensuite en supprimant une par une les p-valeurs qui sont supérieures au seuil que vous fixez (5% ou 10% en règle générale, donc supérieur à 0.05 ou 0.1). Lorsque les p-valeurs sont supérieures à ces seuils, on considère que le terme n’est pas significatif. Il serait d’usage de commencer par les p-valeurs les plus élevées.
En espérant avoir répondu à votre question,
Lara