Primeira vez aqui? Seja bem vindo e cheque o FAQ!
x

Melhorando um modelo sem tendência para prever a venda de bebidas alcoólicas

0 votos
47 visitas
perguntada Jul 6 em Estatística por Victor Candido (21 pontos)  

A pergunta aqui é extraída do livro Elements of Forecasting do
Diebold. E á uma discussão sobre as disribuições acerca da
estatística Q. O problema, é um modelo estacionário, simples, para a
previsão de venda de bebidas alcooolicas, usando um AR(3) em um modelo quadrático log-linear. O \(\sideset{}{^{2}}R\) é de 89%. É um modelo bem interessante, uma vez que a benda de bebidas possua tendência não linear e grande sazonalidade ao longo do ano. Para quem tiver mais interesse o problema e diversas especificações e formas funcionais para o resolver o mesmo, podem ser encontradas a partir da página 194 do referido livro.

Aqui Reproduzo a mesma:

(a) Recall our earlier argument from Chapter 8 that best practice
requires using a \(\sideset{}{_{m-k}^{2}}X\), distribution rather than a \(\sideset{}{_{m}^{2}}X\), distribution to
assess the significance of Q-statistics for model residuals, where m
is the number of autocorrelations included in the Box-Pierce statistic
and k is the number of parameters estimated. In several places in this
chapter, we failed to heed this advice when evaluating the liquor
sales model. If we were instead to compare the residual Q-statistic
p-va\lies with a \(\sideset{}{_{m-k}^{2}}X\) distribution, how. if at all, would our
assessment of the model's adequacy change?

(b) Return to the log-quadratic trend model with seasonal dummies,
allow for ARMA(p,q) disturbances, and do a systematic selection of p
and q using the AIC and SIC. Do AIC and SIC select the same model? If
not, which do you prefer? If your preferred forecasting model differs
from the AR(3) that we used, replicate the analysis in the text using
your preferred model, and discuss your results.

E por último o item (c)

(c) Discuss and evaluate another possible model improvement: inclusion
of an additional dummy variable indicating the number of Fridays
and/or Saturdays in the month. Does this model have lower AIC or SIC
than the final model used in the text? Do you prefer it to the one in
the text? Why or why not?

Compartilhe

1 Resposta

0 votos
respondida Jul 6 por Victor Candido (21 pontos)  

Abaixo segue a minha discussão para o item (a):

Porque a distribuição \(\sideset{}{_{m-k}^{2}}X\) é deslocada para a
esquerda em relação a distribuição \(\sideset{}{_{m}^{2}}X\) , é
provável que mais estatísticas Q pareçam significativas. Isto é,
evidências contra a adequação do modelo serão aumentadas.

Abaixo segue a minha discussão para o item (b):

Independentemente de o modelo selecionado diferir de um AR(3), os
resultados qualitativos do exercício provavelmente não serão
alterados, porque o AR(3) fornece uma boa aproximação à dinâmica,
mesmo que não seja a melhor. É sempre importante lembrar que queremos
uma boa aproximação e não 100% de exatidão na previsão, buscar extrema
acurácia poderá nos levar a problemas de *overffiting, mesmo em
modelos simples como um AR(3).

Minha discussão para o item (c):

Tanto pelo AIC quanto pelo SIC, é provável que o modelo melhore. Para
modelos menores, o AIC acaba selecionando aqueles com maiores números
de parâmetros. E dado que sabemos, da realidade, que o consumo de
bebidas alcoólicas é sim significante maior nas sextas e sábados, pode
ser interessante sim modelar esses dias usando dummies sazonais.

...