À ce stade (qui est généralement appelé phase d`identification, voir ci-dessous), nous devons également décider combien de paramètres autorégressifs (p) et moyenne mobile (q) sont nécessaires pour donner un modèle efficace mais toujours parcimonieux du processus (parsimonieux signifie qu`il a le moins de paramètres et le plus grand nombre de degrés de liberté parmi tous les modèles qui correspondent aux données). Dans la pratique, les nombres des paramètres p ou q doivent très rarement être supérieurs à 2 (voir ci-dessous pour des recommandations plus spécifiques). Je parle des méthodes de prédiction et de prévision. Une telle méthode, qui traite des données basées sur le temps est modélisation de série temporelle. Comme son nom l`indique, il s`agit de travailler sur des données basées sur le temps (années, jours, heures, minutes), afin d`obtenir des informations cachées pour prendre des décisions éclairées. Nombre de paramètres à estimer. Avant que l`estimation puisse commencer, nous devons décider (identifier) le nombre spécifique et le type de paramètres ARIMA à estimer. Les principaux outils utilisés dans la phase d`identification sont les parcelles de la série, les correlogrammes de corrélation automatique (ACF) et l`autocorrélation partielle (PACF). La décision n`est pas simple et dans des cas moins typiques nécessite non seulement l`expérience, mais aussi une bonne partie de l`expérimentation avec des modèles alternatifs (ainsi que les paramètres techniques de ARIMA). Cependant, la majorité des modèles empiriques de séries chronologiques peuvent être suffisamment approximés en utilisant l`un des 5 modèles de base qui peuvent être identifiés en fonction de la forme de l`autocorrelogramme (ACF) et du correlogramme automatique partiel (PACF). Le bref résumé suivant est basé sur les recommandations pratiques de Pankratz (1983); pour de plus amples conseils pratiques, voir aussi Hoff (1983), McCleary et Hay (1980), McDowall, McCleary, Meidinger et Hay (1980), et vandaele (1983). Notez également que puisque le nombre de paramètres (à estimer) de chaque type est presque jamais supérieur à 2, il est souvent pratique d`essayer des modèles alternatifs sur les mêmes données.
Utilisez AIC et BIC pour trouver le modèle le plus approprié. Des valeurs inférieures d`AIC et de BIC sont souhaitables. Explorer les données devient le plus important dans un modèle de série temporelle-sans cette exploration, vous ne saurez pas si une série est stationnaire ou non. Comme dans ce cas, nous connaissons déjà beaucoup de détails sur le genre de modèle que nous cherchons. Modèle général. L`idée générale de la décomposition saisonnière est simple. En général, une série temporelle comme celle décrite ci-dessus peut être considérée comme consistant en quatre composantes différentes: (1) une composante saisonnière (notée St, où t représente le point particulier dans le temps) (2) une composante de tendance (TT), (3) une composante cyclique (CT) , et (4) un composant aléatoire, d`erreur ou irrégulier (IT). La différence entre un élément cyclique et un composant saisonnier est que ce dernier se produit à intervalles réguliers (saisonniers), tandis que les facteurs cycliques ont généralement une durée plus longue qui varie d`un cycle à l`autres. Dans la méthode du recensement I, la tendance et les composantes cycliques sont habituellement combinées en une composante du cycle de tendance (TCt).
La relation fonctionnelle spécifique entre ces composants peut assumer des formes différentes. Cependant, deux possibilités directes sont qu`ils se combinent dans un additif ou une mode multiplicatif: les procédures de modélisation et de prévision examinées dans identification des modèles dans les données chronologiques ont impliqué des connaissances sur le modèle mathématique du Processus. Cependant, dans la recherche et la pratique de la vie réelle, les schémas des données ne sont pas clairs, les observations individuelles impliquent une erreur considérable, et nous avons encore besoin non seulement de découvrir les schémas cachés dans les données, mais aussi de générer des prévisions. La méthodologie ARIMA développée par Box et Jenkins (1976) nous permet de faire exactement cela; Il a acquis une popularité énorme dans de nombreux domaines et la pratique de la recherche confirme sa puissance et sa souplesse (Hoff, 1983; Pankratz, 1983; Vandaele, 1983).