Baixe aqui o texto completo
Nota divulgada em 26/03/2020
O LEGOS trata o problema de prever a evolução do total de casos confirmados de COVID-19 no município do Rio de Janeiro. Para chegar aos resultados que serão apresentados a seguir utilizamos a série histórica do referido município que está disponível no Painel Rio COVID SMS | IPP | COR. Esta série histórica é apresentada na tabela e figura abaixo.
Data | Casos confirmados | Data | Casos confirmados |
06/03/2020 | 4 | 16/03/2020 | 51 |
07/03/2020 | 9 | 17/03/2020 | 60 |
08/03/2020 | 12 | 18/03/2020 | 63 |
09/03/2020 | 13 | 19/03/2020 | 63 |
10/03/2020 | 21 | 20/03/2020 | 94 |
11/03/2020 | 25 | 21/03/2020 | 103 |
12/03/2020 | 30 | 22/03/2020 | 170 |
13/03/2020 | 38 | 23/03/2020 | 214 |
14/03/2020 | 42 | 24/03/2020 | 278 |
15/03/2020 | 48 | 25/03/2020 | 331 |
Observando a figura acima podemos perceber que no município do Rio de Janeiro segue comportamento não linear. Entretanto, se separarmos este gráfico em 3 momentos diferentes podemos observar que:
- Dia 07/03 ao 16/03 segue um “comportamento linear”;
- Dia 17/03 ao 21/03 segue um “comportamento de crescimento exponencial”;
- Dia 22/03 até o momento em que tivemos informação disponível (boletim de 25/03/2020 18:00) segue um “comportamento linear” novamente, mas bem maior que o observado no período de 07/03 ao 17/03.
Assim, para reproduzirmos o comportamento esperado para a próxima semana consideraremos que a base histórica útil à nossa série se inicia no dia 17/03 (quando o total de casos confirmados de pacientes com COVID-19 ultrapassa 50) e perdura até o momento.
Modelos de previsão
Para estimarmos o total de casos de pacientes com COVID-19 confirmados no horizonte de 7 dias a frente (até 01/04) utilizamos modelos univariados consagrados da literatura e regressões apresentados abaixo:
- Modelos de suavização exponencial (ETS);
- Modelos auto regressivos integrados de média móvel (ARIMA);
- Regressão Linear (RL);
Nenhum dos 3 modelos apresentados acima foi concebido para tratar de séries temporais de comportamento explosivo (como é o nosso caso). Entretanto, podemos realizar algumas transformações na série original apresentada para que a série transformada atenda às condições de “contorno” das técnicas apresentadas acima. Neste sentido, as principais formas comumente utilizadas em séries temporais são: diferenciação e transformação logarítmica (elas também podem ser combinadas). Nas figuras abaixo são apresentadas a série original e cada série transformada (logarítmica, diferenciada e logarítmica-diferenciada) de casos confirmados no Município do Rio de Janeiro.
Como o objetivo de trabalhar sobre a série mais estacionária possível (ainda que com tendência) trabalharemos sobre as duas séries que melhor apresentam este comportamento. A partir deste ponto chamaremos as séries escolhidas para prever o total de casos confirmados de série original (SO) e a série “logaritimatizada” (SL) e apresentaremos abaixo características observadas de cada modelos e cada série.
- ETS na série original (ETS SO): não capturou o padrão de crescimento e se manteve constante ao longo do tempo;
- ETS na série logarimitizada (ETS SL): não capturou o padrão de crescimento e se manteve constante ao longo do tempo;
- ARIMA na série original (ARIMA SO): capturou o padrão de crescimento linear;
- ARIMA na série logarimitizada (ARIMA SL): capturou o padrão de crescimento explosivo;
- Regressão linear na série logarimitizada (RL SO): capturou o padrão de crescimento linear;
- Regressão linear na série logaritimizada (RL SL): capturou o padrão de crescimento explosivo;
As previsões otimista, esperada e pessimista de acordo com cada modelo são apresentados nas tabelas abaixo.
cenário otimista | ets SO | arima SO | rl SO | ets SL | ARIMA SL | rl SL |
26/03/2020 | 256 | 377 | 281 | 262 | 365 | 341 |
27/03/2020 | 222 | 423 | 311 | 238 | 429 | 423 |
28/03/2020 | 193 | 466 | 340 | 221 | 511 | 524 |
29/03/2020 | 167 | 508 | 369 | 207 | 610 | 650 |
30/03/2020 | 143 | 548 | 398 | 196 | 732 | 805 |
31/03/2020 | 119 | 586 | 427 | 186 | 880 | 997 |
01/04/2020 | 95 | 623 | 456 | 178 | 1061 | 1234 |
cenário ESPERADO | ets SO | arima SO | rl SO | ets SL | ARIMA SL | rl SL |
26/03/2020 | 331 | 391 | 314 | 331 | 407 | 390 |
27/03/2020 | 331 | 447 | 345 | 331 | 502 | 488 |
28/03/2020 | 331 | 505 | 376 | 331 | 617 | 609 |
29/03/2020 | 331 | 561 | 407 | 331 | 760 | 762 |
30/03/2020 | 331 | 619 | 438 | 331 | 936 | 952 |
31/03/2020 | 331 | 676 | 469 | 331 | 1152 | 1189 |
01/04/2020 | 331 | 734 | 500 | 331 | 1418 | 1485 |
cenário PESSIMISTA | ets SO | arima SO | rl SO | ets SL | ARIMA SL | rl SL |
26/03/2020 | 406 | 405 | 346 | 418 | 455 | 448 |
27/03/2020 | 440 | 470 | 379 | 461 | 586 | 563 |
28/03/2020 | 469 | 543 | 412 | 497 | 747 | 709 |
29/03/2020 | 495 | 615 | 445 | 529 | 946 | 892 |
30/03/2020 | 519 | 691 | 478 | 560 | 1196 | 1125 |
31/03/2020 | 543 | 766 | 511 | 589 | 1507 | 1418 |
01/04/2020 | 567 | 844 | 545 | 617 | 1895 | 1788 |
Conforme comentado anteriormente, podemos descartar a priori os modelos ETS SO e ETS SL porque não foram capazes de capturar o crescimento que devemos prever. Assim, analisaremos apenas os resultados dos modelos ARIMA SO, ETS SL, ARIMA SL e RL SL. Para selecionarmos qual modelo deveríamos usar para estimar a quantidade total de casos esperados para os próximos 7 dias utilizamos os seguintes critérios:
- Teste de normalidade dos resíduos.
Neste teste utilizamos o nível de significância de 1% (ou 99% de intervalo de confiança e os resultados são apresentados a seguir:
ARIMA SO: p-valor =0, 01943. Não podemos rejeitar a hipótese nula de normalidade.
RL SO: p-valor =0,516. Não podemos rejeitar a hipótese nula de normalidade.
ARIMA SL: p-valor = 0,7187. Não podemos rejeitar a hipótese nula de normalidade.
RL SL: p-valor = 0,3181. Não podemos rejeitar a hipótese nula de normalidade.
- Teste de autocorreção dos resíduos (ACF). Nenhuma das séries testadas apresentaram auto correlação dos resíduos.
- Menor média percentual absoluta do erro (MAPE) e menor erro quadrático médio (RMSE) dentre os modelos aprovados pelos critérios anteriores.
Modelos | ME | RMSE | MAE | MPE | MAPE |
ETS SO | -28,4 | 38,05 | 28,4 | -22,98 | 22,98 |
ARIMA SO | -8,02 | 17,56 | 10,79 | -7,03 | 10,82 |
RL SO | 0 | 34,22 | 29,84 | -173,87 | 196,18 |
ETS SL | -28,06 | 38,03 | 28,06 | -22,25 | 22,25 |
ARIMA SL | -2,7 | 17,31 | 13,13 | -1,13 | 11,56 |
RL SL | -3,08 | 16,21 | 14,21 | -0,99 | 12,08 |
Na tabela acima observa-se que o modelo ARIMA SO atende ao critério de menor MAPE, RL SL atende ao critério menor RMSE e ARIMA SL é a segunda colocada em ambos os critérios. Entretanto, com o objetivo de prover apenas uma previsão, combinamos os modelos ARIMA SO e RL SL considerando: o menor valor entre estas séries, a cada dia, para estimar a previsão otimista, o valor médio entre ambas para estimar o valor esperado por dia e o maior valor, a cada dia, entre elas para estimar a previsão pessimista. Assim, os próximos valores esperados de quantidade de casos confirmados de COVID-19 no Município do Rio de Janeiro em cada cenário são apresentados na figura e tabela abaixo.
Dias | Cenário Otimista | Cenário Esperado | Cenário pessimista |
26/03/2020 | 341 | 391 | 448 |
27/03/2020 | 423 | 467 | 563 |
28/03/2020 | 466 | 557 | 709 |
29/03/2020 | 508 | 661 | 892 |
30/03/2020 | 548 | 785 | 1125 |
31/03/2020 | 586 | 933 | 1418 |
01/04/2020 | 623 | 1110 | 1788 |
Autor
Daniel Assad
Currículo Lattes: http://lattes.cnpq.br/0258423859812498
Coordenação do LEGOS|UERJ
Profa Thaís Spiegel, DSc. | thais@eng.uerj.br
Currículo Lattes: http://lattes.cnpq.br/8880192361495671