Baixe aqui o texto completo
Nota divulgada em 27/03/2020
O LEGOS trata o problema de prever a evolução do total de casos confirmados de
COVID-19 no município do Rio de Janeiro. Para chegar aos resultados que serão apresentados a seguir utilizamos a série histórica do referido município que está disponível no
Painel Rio COVID SMS | IPP | COR. Esta série histórica é apresentada na tabela e figura abaixo.
Data |
Casos confirmados |
Data |
Casos confirmados |
06/03/2020 |
4 |
17/03/2020 |
60 |
07/03/2020 |
9 |
18/03/2020 |
63 |
08/03/2020 |
12 |
19/03/2020 |
63 |
09/03/2020 |
13 |
20/03/2020 |
94 |
10/03/2020 |
21 |
21/03/2020 |
103 |
11/03/2020 |
25 |
22/03/2020 |
170 |
12/03/2020 |
30 |
23/03/2020 |
214 |
13/03/2020 |
38 |
24/03/2020 |
278 |
14/03/2020 |
42 |
25/03/2020 |
331 |
15/03/2020 |
48 |
26/03/2020 |
366 |
16/03/2020 |
51 |
27/03/2020 |
?? |
Observando a figura acima podemos perceber que no município do Rio de Janeiro segue comportamento não linear. Entretanto, se separarmos este gráfico em 3 momentos diferentes podemos observar que:
- Dia 07/03 ao 16/03 segue um “comportamento linear”;
- Dia 17/03 ao 21/03 segue um “comportamento de crescimento exponencial”;
- Dia 22/03 até o momento em que tivemos informação disponível (boletim de 26/03/2020 18:00) segue um “comportamento linear” novamente, mas bem maior que o observado no período de 07/03 ao 17/03.
Assim, para reproduzirmos o comportamento esperado para a próxima semana consideraremos que a base histórica útil à nossa série se inicia no dia 17/03 (quando o total de casos confirmados de pacientes com COVID-19 ultrapassa 50) e perdura até o momento.
Modelos de previsão
Para estimarmos o total de casos de pacientes com COVID-19 confirmados no horizonte de 7 dias a frente (até 01/04) utilizamos modelos univariados consagrados da literatura e regressões apresentados abaixo:
- Modelos de suavização exponencial (ETS);
- Modelos auto regressivos integrados de média móvel (ARIMA);
- Regressão Linear (RL);
Nenhum dos 3 modelos apresentados acima foi concebido para tratar de séries temporais de comportamento explosivo (como é o nosso caso). Entretanto, podemos realizar algumas transformações na série original apresentada para que a série transformada atenda às condições de “contorno” das técnicas apresentadas acima. Neste sentido, as principais formas comumente utilizadas em séries temporais são: diferenciação e transformação logarítmica (elas também podem ser combinadas). Nas figuras abaixo são apresentadas a série original e cada série transformada (logarítmica, diferenciada e logarítmica-diferenciada) de casos confirmados no Município do Rio de Janeiro.
Como o objetivo de trabalhar sobre a série mais estacionária possível (ainda que com tendência) trabalharemos sobre as duas séries que melhor apresentam este comportamento. A partir deste ponto chamaremos as séries escolhidas para prever o total de casos confirmados de série original (SO) e a série “logaritimatizada” (SL) e apresentaremos abaixo características observadas de cada modelos e cada série.
- ETS na série original (ETS SO): não capturou o padrão de crescimento e se manteve constante ao longo do tempo;
- ETS na série logarimitizada (ETS SL): não capturou o padrão de crescimento e se manteve constante ao longo do tempo;
- ARIMA na série original (ARIMA SO): capturou o padrão de crescimento linear;
- ARIMA na série logarimitizada (ARIMA SL): capturou o padrão de crescimento explosivo;
- Regressão linear na série logarimitizada (RL SO): capturou o padrão de crescimento linear;
- Regressão linear na série logaritimizada (RL SL): capturou o padrão de crescimento explosivo;
As previsões otimista, esperada e pessimista de acordo com cada modelo são apresentados nas tabelas abaixo.
cenário otimista |
ets SO |
arima SO |
rl SO |
ets SL |
ARIMA SL |
rl SL |
27/03/2020 |
288 |
400 |
332 |
309 |
403 |
421 |
28/03/2020 |
252 |
431 |
364 |
287 |
471 |
521 |
29/03/2020 |
223 |
460 |
396 |
271 |
554 |
646 |
30/03/2020 |
196 |
486 |
428 |
259 |
657 |
800 |
31/03/2020 |
170 |
511 |
460 |
248 |
780 |
990 |
01/04/2020 |
145 |
535 |
492 |
239 |
930 |
1225 |
02/04/2020 |
121 |
556 |
523 |
231 |
1110 |
1516 |
cenário ESPERADO |
ets SO |
arima SO |
rl SO |
ets SL |
ARIMA SL |
rl SL |
27/03/2020 |
368 |
415 |
365 |
368 |
448 |
477 |
28/03/2020 |
368 |
455 |
398 |
368 |
546 |
595 |
29/03/2020 |
368 |
500 |
432 |
368 |
666 |
741 |
30/03/2020 |
368 |
542 |
465 |
368 |
811 |
924 |
31/03/2020 |
368 |
585 |
499 |
368 |
989 |
1151 |
01/04/2020 |
368 |
628 |
532 |
368 |
1205 |
1435 |
02/04/2020 |
368 |
671 |
566 |
368 |
1468 |
1788 |
cenário PESSIMISTA |
ets SO |
arima SO |
rl SO |
ets SL |
ARIMA SL |
rl SL |
27/03/2020 |
448 |
429 |
397 |
439 |
498 |
542 |
28/03/2020 |
484 |
480 |
432 |
472 |
634 |
679 |
29/03/2020 |
513 |
539 |
467 |
499 |
800 |
851 |
30/03/2020 |
540 |
597 |
502 |
523 |
1002 |
1067 |
31/03/2020 |
566 |
659 |
538 |
545 |
1252 |
1338 |
01/04/2020 |
591 |
721 |
573 |
566 |
1560 |
1679 |
02/04/2020 |
615 |
786 |
608 |
586 |
1941 |
2108 |
Conforme comentado anteriormente, podemos descartar a priori os modelos ETS SO e ETS SL porque não foram capazes de capturar o crescimento que devemos prever. Assim, analisaremos apenas os resultados dos modelos ARIMA SO, ETS SL, ARIMA SL e RL SL. Para selecionarmos qual modelo deveríamos usar para estimar a quantidade total de casos esperados para os próximos 7 dias utilizamos os seguintes critérios:
- Teste de normalidade dos resíduos.
- ARIMA SO: p-valor =0,1674. Não podemos rejeitar a hipótese nula de normalidade.
- RL SO: p-valor =0,693. Não podemos rejeitar a hipótese nula de normalidade.
- ARIMA SL: p-valor = 0,5382. Não podemos rejeitar a hipótese nula de normalidade.
- RL SL: p-valor = 0,3056. Não podemos rejeitar a hipótese nula de normalidade.
- Teste de autocorreção dos resíduos (ACF). O modelo RL SO apresentou auto correlação dos resíduos no lag 1 e foi descartada. As demais séries não apresentaram auto correlação.
- Menor média percentual absoluta do erro (MAPE) e menor erro quadrático médio (RMSE) dentre os modelos aprovados pelos critérios anteriores.
Modelos |
ME |
RMSE |
MAE |
MPE |
MAPE |
ETS SO |
-29,35 |
37,98 |
29,35 |
-22,31 |
22,31 |
ARIMA SO |
-5,04 |
18,17 |
11,86 |
-5,78 |
10,46 |
RL SO |
0 |
35,32 |
31,26 |
107,58 |
132,32 |
ETS SL |
-28,82 |
37,94 |
28,82 |
-21,14 |
21,14 |
ARIMA SL |
-0,49 |
19,9 |
15,15 |
-1,08 |
11,32 |
RL SL |
-2,51 |
17,34 |
15,23 |
-0,92 |
11,64 |
Na tabela acima observa-se que o modelo ARIMA SO atende ao critério de menor MAPE, RL SL atende ao critério menor RMSE e ARIMA SL é a segunda colocada em ambos os critérios. Entretanto, com o objetivo de prover apenas uma previsão, combinamos os modelos ARIMA SO e RL SL considerando: o menor valor entre estas séries, a cada dia, para estimar a previsão otimista, o valor médio entre ambas para estimar o valor esperado por dia e o maior valor, a cada dia, entre elas para estimar a previsão pessimista. Assim, os próximos valores esperados de quantidade de casos confirmados de COVID-19 no Município do Rio de Janeiro em cada cenário são apresentados na figura e tabela abaixo.
Dias |
Cenário Otimista |
Cenário Esperado |
Cenário pessimista |
27/03/2020 |
400 |
446 |
542 |
28/03/2020 |
431 |
525 |
679 |
29/03/2020 |
460 |
620 |
851 |
30/03/2020 |
486 |
733 |
1067 |
31/03/2020 |
511 |
868 |
1338 |
01/04/2020 |
535 |
1031 |
1679 |
02/04/2020 |
556 |
1229 |
2108 |
Autor
Daniel Assad
Currículo Lattes:
http://lattes.cnpq.br/0258423859812498
Coordenação do LEGOS|UERJ
Profa Thaís Spiegel, DSc. | thais@eng.uerj.br
Currículo Lattes:
http://lattes.cnpq.br/8880192361495671