Previsão da evolução dos casos de COVID-19 no município do Rio de Janeiro para o período de 25 a 31/março

Baixe aqui o texto completo

Nota divulgada em 25/03/2020

O LEGOS trata o problema de prever a evolução do total de casos confirmados de COVID-19 no município do Rio de Janeiro. Para chegar aos resultados que serão apresentados a seguir utilizamos a série histórica do referido município que está disponível no Painel Rio COVID SMS | IPP | COR. Esta série histórica é apresentada na tabela e figura abaixo.

Data Casos confirmados Data Casos confirmados
06/03/2020 4 16/03/2020 51
07/03/2020 9 17/03/2020 60
08/03/2020 12 18/03/2020 63
09/03/2020 13 19/03/2020 63
10/03/2020 21 20/03/2020 94
11/03/2020 25 21/03/2020 103
12/03/2020 30 22/03/2020 170
13/03/2020 38 23/03/2020 214
14/03/2020 42 24/03/2020 278
15/03/2020 48 25/03/2020 ??

Observando a figura acima podemos perceber que no município do Rio de Janeiro segue comportamento não linear e muito menos estacionário (nem estacionário com tendência). Para ratificar esta observação aplicamos teste Augmented Dickey Fuller (ADF) com hipótese nula de que a série é estacionária ou estacionária com tendência a um nível de significância de 5% (ou 95% de intervalo de confiança). Neste teste, obtivemos o valor Dickey-Fuller de -0,30324 e p-valor de 0,017. Logo, obtivemos resultado estatisticamente significativo de que devemos rejeitar a hipótese nula de estacionaridade e assumir a hipótese alternativa que indica um comportamento explosivo. Este comportamento também foi observado quando realizamos o teste Kwiatkowski–Phillips–Schmidt–Shin (KPSS) tanto para o nível (0,61825 e p-valor 0,021) quanto para a tendência (0, 16473 e p-valor 0,034).

Pelo gráfico acima é possível dividir a série em 3 momentos diferentes:

  1. Dia 07/03 ao 16/03 onde observamos um “comportamento linear”;
  2. Dia 17/03 ao 21/03 onde observamos o início de um “comportamento de crescimento exponencial”;
  3. Dia 22/03 até o momento em que tivemos informação disponível (boletim de 24/03/2020 18:00) onde observamos o início de um “comportamento linear” novamente, mas bem maior que o observado no período de 07/03 ao 17/03.

Assim, para reproduzirmos o comportamento esperado para a próxima semana consideraremos que a base histórica útil à nossa série se inicia no dia 17/03 (quando o total de casos confirmados de pacientes com COVID-19 ultrapassa 50) e perdura até o momento.

Modelos de previsão

Para estimarmos o total de casos de pacientes com COVID-19 confirmados no horizonte de 7 dias a frente (até 31/03) utilizamos modelos univariados consagrados da literatura e regressões apresentados abaixo:

  • Modelos de suavização exponencial (ETS);
  • Modelos auto regressivos integrados de média móvel (ARIMA);
  • Regressão Linear (RL);

Nenhum dos 3 modelos apresentados acima foi concebido para tratar de séries temporais de comportamento explosivo (como é o nosso caso). Entretanto, podemos realizar algumas transformações na série original apresentada para que a série transformada atenda às condições de “contorno” das técnicas apresentadas acima. Neste sentido, as principais formas comumente utilizadas em séries temporais são: diferenciação e transformação logarítmica (elas também podem ser combinadas). Nas figuras abaixo são apresentadas a série original e cada série transformada (logarítmica, diferenciada e logarítmica-diferenciada) de casos confirmados no Município do Rio de Janeiro.

 

Como o objetivo de trabalhar sobre a série mais estacionária possível (ainda que com tendência) trabalharemos sobre as duas séries que melhor apresentam este comportamento. A partir deste ponto chamaremos as séries escolhidas para prever o total de casos confirmados de série original (SO) e a série “logaritimatizada” (SL) e apresentaremos abaixo características observadas de cada modelos e cada série.

  • ETS na série original (ETS SO): não capturou o padrão de crescimento e se manteve constante ao longo do tempo;
  • ETS na série logarimitizada (ETS SL): não capturou o padrão de crescimento e se manteve constante ao longo do tempo;
  • ARIMA na série original (ARIMA SO): capturou o padrão de crescimento linear;
  • ARIMA na série logarimitizada (ARIMA SL): capturou o padrão de crescimento explosivo;
  • Regressão linear na série logarimitizada (RL SO): capturou o padrão de crescimento linear;
  • Regressão linear na série logaritimizada (RL SL): capturou o padrão de crescimento explosivo;

As previsões otimista, esperada e pessimista de acordo com cada modelo são apresentados nas tabelas abaixo.

cenário otimista ets SO arima SO rl SO ets SL ARIMA SL rl SL
25/03/2020 212 323 227 219 306 261
26/03/2020 182 363 252 198 360 322
27/03/2020 156 397 278 184 429 397
28/03/2020 133 428 303 172 514 488
29/03/2020 110 454 327 163 618 600
30/03/2020 88 477 352 154 745 738
31/03/2020 66 497 377 147 900 906

 

cenário ESPERADO ets SO arima SO rl SO ets SL ARIMA SL rl SL
25/03/2020 278 342 257 278 344 303
26/03/2020 278 406 284 278 425 377
27/03/2020 278 470 311 278 525 469
28/03/2020 278 534 338 278 649 583
29/03/2020 278 598 365 278 802 725
30/03/2020 278 662 392 278 992 901
31/03/2020 278 726 420 278 1226 1120

 

cenário PESSIMISTA ets SO arima SO rl SO ets SL ARIMA SL rl SL
25/03/2020 344 361 287 353 386 352
26/03/2020 374 449 316 390 501 441
27/03/2020 400 543 345 421 643 554
28/03/2020 423 640 374 449 820 696
29/03/2020 446 742 403 475 1042 875
30/03/2020 468 847 433 500 1321 1101
31/03/2020 490 955 462 525 1670 1385

Conforme comentado anteriormente, podemos descartar a priori os modelos ETS SO e RL SO porque não foram capazes de capturar o crescimento que devemos prever. Assim, analisaremos apenas os resultados dos modelos ARIMA SO, ETS SL, ARIMA SL e RL SL. Para selecionarmos qual modelo deveríamos usar para estimar a quantidade total de casos esperados para os próximos 7 dias utilizamos os seguintes critérios:

  • Teste de normalidade dos resíduos.
    • ARIMA SO: p-valor =0, 2987. Não podemos rejeitar a hipótese nula de normalidade.
    • ETS SL: p-valor =0, 1987. Não podemos rejeitar a hipótese nula de normalidade.
    • ARIMA SL: p-valor = 0,7852. Não podemos rejeitar a hipótese nula de normalidade.
    • RL SL: p-valor = 0,259. Não podemos rejeitar a hipótese nula de normalidade.
  • Teste de autocorreção dos resíduos (ACF). Apenas a ARIMA SO apresentou auto correlação dos resíduos, mas ela já foi descartada previamente.
  • Menor média percentual absoluta do erro (MAPE) dentre os modelos aprovados pelos critérios anteriores.

 

Modelos ME RMSE MAE MPE MAPE
ETS SO -25,69 36,01 25,69 -23,47 23,47
ARIMA SO -6,11 25,35 18,12 -7,57 16,60
RL SO 0,00 30,07 25,75 -28,25 49,88
ETS SL -25,29 35,99 25,29 -22,61 22,61
ARIMA SL -3,78 17,66 13,18 -1,24 12,43
RL SL -2,93 17,53 14,84 -1,08 13,11

Desta forma, escolhemos o modelo de ARIMA SL para prever os próximos valores esperados de quantidade de casos confirmados de COVID-19 no Município do Rio de Janeiro. O comportamento explosivo que a nossa previsão apresentou pode ser observado nas figuras e tabela abaixo.

 

Dias Cenário Otimista Cenário Esperado Cenário pessimista
25/03/2020 306 344 386
26/03/2020 360 425 501
27/03/2020 429 525 643
28/03/2020 514 649 820
29/03/2020 618 802 1042
30/03/2020 745 992 1321
31/03/2020 900 1226 1670

 

Autor

Daniel Assad
Currículo Lattes: http://lattes.cnpq.br/0258423859812498
Coordenação do LEGOS|UERJ

Profa Thaís Spiegel, DSc. | thais@eng.uerj.br
Currículo Lattes: http://lattes.cnpq.br/8880192361495671

Deixe um comentário