Previsão da evolução dos casos de COVID-19 no município do Rio de Janeiro para o período de 26/março a 01/abril

Baixe aqui o texto completo

Nota divulgada em 26/03/2020

O LEGOS trata o problema de prever a evolução do total de casos confirmados de COVID-19 no município do Rio de Janeiro. Para chegar aos resultados que serão apresentados a seguir utilizamos a série histórica do referido município que está disponível no Painel Rio COVID SMS | IPP | COR. Esta série histórica é apresentada na tabela e figura abaixo.

Data Casos confirmados Data Casos confirmados
06/03/2020 4 16/03/2020 51
07/03/2020 9 17/03/2020 60
08/03/2020 12 18/03/2020 63
09/03/2020 13 19/03/2020 63
10/03/2020 21 20/03/2020 94
11/03/2020 25 21/03/2020 103
12/03/2020 30 22/03/2020 170
13/03/2020 38 23/03/2020 214
14/03/2020 42 24/03/2020 278
15/03/2020 48 25/03/2020 331

Observando a figura acima podemos perceber que no município do Rio de Janeiro segue comportamento não linear. Entretanto, se separarmos este gráfico em 3 momentos diferentes podemos observar que:

  1. Dia 07/03 ao 16/03 segue um “comportamento linear”;
  2. Dia 17/03 ao 21/03 segue um “comportamento de crescimento exponencial”;
  3. Dia 22/03 até o momento em que tivemos informação disponível (boletim de 25/03/2020 18:00) segue um “comportamento linear” novamente, mas bem maior que o observado no período de 07/03 ao 17/03.

Assim, para reproduzirmos o comportamento esperado para a próxima semana consideraremos que a base histórica útil à nossa série se inicia no dia 17/03 (quando o total de casos confirmados de pacientes com COVID-19 ultrapassa 50) e perdura até o momento.

 

Modelos de previsão

Para estimarmos o total de casos de pacientes com COVID-19 confirmados no horizonte de 7 dias a frente (até 01/04) utilizamos modelos univariados consagrados da literatura e regressões apresentados abaixo:

  • Modelos de suavização exponencial (ETS);
  • Modelos auto regressivos integrados de média móvel (ARIMA);
  • Regressão Linear (RL);

Nenhum dos 3 modelos apresentados acima foi concebido para tratar de séries temporais de comportamento explosivo (como é o nosso caso). Entretanto, podemos realizar algumas transformações na série original apresentada para que a série transformada atenda às condições de “contorno” das técnicas apresentadas acima. Neste sentido, as principais formas comumente utilizadas em séries temporais são: diferenciação e transformação logarítmica (elas também podem ser combinadas). Nas figuras abaixo são apresentadas a série original e cada série transformada (logarítmica, diferenciada e logarítmica-diferenciada) de casos confirmados no Município do Rio de Janeiro.

Como o objetivo de trabalhar sobre a série mais estacionária possível (ainda que com tendência) trabalharemos sobre as duas séries que melhor apresentam este comportamento. A partir deste ponto chamaremos as séries escolhidas para prever o total de casos confirmados de série original (SO) e a série “logaritimatizada” (SL) e apresentaremos abaixo características observadas de cada modelos e cada série.

  • ETS na série original (ETS SO): não capturou o padrão de crescimento e se manteve constante ao longo do tempo;
  • ETS na série logarimitizada (ETS SL): não capturou o padrão de crescimento e se manteve constante ao longo do tempo;
  • ARIMA na série original (ARIMA SO): capturou o padrão de crescimento linear;
  • ARIMA na série logarimitizada (ARIMA SL): capturou o padrão de crescimento explosivo;
  • Regressão linear na série logarimitizada (RL SO): capturou o padrão de crescimento linear;
  • Regressão linear na série logaritimizada (RL SL): capturou o padrão de crescimento explosivo;

As previsões otimista, esperada e pessimista de acordo com cada modelo são apresentados nas tabelas abaixo.

cenário otimista ets SO arima SO rl SO ets SL ARIMA SL rl SL
26/03/2020 256 377 281 262 365 341
27/03/2020 222 423 311 238 429 423
28/03/2020 193 466 340 221 511 524
29/03/2020 167 508 369 207 610 650
30/03/2020 143 548 398 196 732 805
31/03/2020 119 586 427 186 880 997
01/04/2020 95 623 456 178 1061 1234

 

cenário ESPERADO ets SO arima SO rl SO ets SL ARIMA SL rl SL
26/03/2020 331 391 314 331 407 390
27/03/2020 331 447 345 331 502 488
28/03/2020 331 505 376 331 617 609
29/03/2020 331 561 407 331 760 762
30/03/2020 331 619 438 331 936 952
31/03/2020 331 676 469 331 1152 1189
01/04/2020 331 734 500 331 1418 1485

 

cenário PESSIMISTA ets SO arima SO rl SO ets SL ARIMA SL rl SL
26/03/2020 406 405 346 418 455 448
27/03/2020 440 470 379 461 586 563
28/03/2020 469 543 412 497 747 709
29/03/2020 495 615 445 529 946 892
30/03/2020 519 691 478 560 1196 1125
31/03/2020 543 766 511 589 1507 1418
01/04/2020 567 844 545 617 1895 1788

Conforme comentado anteriormente, podemos descartar a priori os modelos ETS SO e ETS SL porque não foram capazes de capturar o crescimento que devemos prever. Assim, analisaremos apenas os resultados dos modelos ARIMA SO, ETS SL, ARIMA SL e RL SL. Para selecionarmos qual modelo deveríamos usar para estimar a quantidade total de casos esperados para os próximos 7 dias utilizamos os seguintes critérios:

  • Teste de normalidade dos resíduos.

Neste teste utilizamos o nível de significância de 1% (ou 99% de intervalo de confiança e os resultados são apresentados a seguir:

ARIMA SO: p-valor =0, 01943. Não podemos rejeitar a hipótese nula de normalidade.

RL SO: p-valor =0,516. Não podemos rejeitar a hipótese nula de normalidade.

ARIMA SL: p-valor = 0,7187. Não podemos rejeitar a hipótese nula de normalidade.

RL SL: p-valor = 0,3181. Não podemos rejeitar a hipótese nula de normalidade.

 

  • Teste de autocorreção dos resíduos (ACF). Nenhuma das séries testadas apresentaram auto correlação dos resíduos.
  • Menor média percentual absoluta do erro (MAPE) e menor erro quadrático médio (RMSE) dentre os modelos aprovados pelos critérios anteriores.
Modelos ME RMSE MAE MPE MAPE
ETS SO -28,4 38,05 28,4 -22,98 22,98
ARIMA SO -8,02 17,56 10,79 -7,03 10,82
RL SO 0 34,22 29,84 -173,87 196,18
ETS SL -28,06 38,03 28,06 -22,25 22,25
ARIMA SL -2,7 17,31 13,13 -1,13 11,56
RL SL -3,08 16,21 14,21 -0,99 12,08

Na tabela acima observa-se que o modelo ARIMA SO atende ao critério de menor MAPE, RL SL atende ao critério menor RMSE e ARIMA SL é a segunda colocada em ambos os critérios. Entretanto, com o objetivo de prover apenas uma previsão, combinamos os modelos ARIMA SO e RL SL considerando: o menor valor entre estas séries, a cada dia, para estimar a previsão otimista, o valor médio entre ambas para estimar o valor esperado por dia e o maior valor, a cada dia, entre elas para estimar a previsão pessimista. Assim, os próximos valores esperados de quantidade de casos confirmados de COVID-19 no Município do Rio de Janeiro em cada cenário são apresentados na figura e tabela abaixo.

 

Dias Cenário Otimista Cenário Esperado Cenário pessimista
26/03/2020 341 391 448
27/03/2020 423 467 563
28/03/2020 466 557 709
29/03/2020 508 661 892
30/03/2020 548 785 1125
31/03/2020 586 933 1418
01/04/2020 623 1110 1788

 

Autor

Daniel Assad
Currículo Lattes: http://lattes.cnpq.br/0258423859812498
Coordenação do LEGOS|UERJ

Profa Thaís Spiegel, DSc. | thais@eng.uerj.br
Currículo Lattes: http://lattes.cnpq.br/8880192361495671

Deixe um comentário