Previsão da evolução dos casos de COVID-19 no município do Rio de Janeiro para o período de 27/março a 02/abril

Baixe aqui o texto completo

Nota divulgada em 27/03/2020

O LEGOS trata o problema de prever a evolução do total de casos confirmados de COVID-19 no município do Rio de Janeiro. Para chegar aos resultados que serão apresentados a seguir utilizamos a série histórica do referido município que está disponível no Painel Rio COVID SMS | IPP | COR. Esta série histórica é apresentada na tabela e figura abaixo.
Data Casos confirmados Data Casos confirmados
06/03/2020 4 17/03/2020 60
07/03/2020 9 18/03/2020 63
08/03/2020 12 19/03/2020 63
09/03/2020 13 20/03/2020 94
10/03/2020 21 21/03/2020 103
11/03/2020 25 22/03/2020 170
12/03/2020 30 23/03/2020 214
13/03/2020 38 24/03/2020 278
14/03/2020 42 25/03/2020 331
15/03/2020 48 26/03/2020 366
16/03/2020 51 27/03/2020 ??
Observando a figura acima podemos perceber que no município do Rio de Janeiro segue comportamento não linear. Entretanto, se separarmos este gráfico em 3 momentos diferentes podemos observar que:
  1. Dia 07/03 ao 16/03 segue um “comportamento linear”;
  2. Dia 17/03 ao 21/03 segue um “comportamento de crescimento exponencial”;
  3. Dia 22/03 até o momento em que tivemos informação disponível (boletim de 26/03/2020 18:00) segue um “comportamento linear” novamente, mas bem maior que o observado no período de 07/03 ao 17/03.
Assim, para reproduzirmos o comportamento esperado para a próxima semana consideraremos que a base histórica útil à nossa série se inicia no dia 17/03 (quando o total de casos confirmados de pacientes com COVID-19 ultrapassa 50) e perdura até o momento. Modelos de previsão Para estimarmos o total de casos de pacientes com COVID-19 confirmados no horizonte de 7 dias a frente (até 01/04) utilizamos modelos univariados consagrados da literatura e regressões apresentados abaixo:
  • Modelos de suavização exponencial (ETS);
  • Modelos auto regressivos integrados de média móvel (ARIMA);
  • Regressão Linear (RL);
Nenhum dos 3 modelos apresentados acima foi concebido para tratar de séries temporais de comportamento explosivo (como é o nosso caso). Entretanto, podemos realizar algumas transformações na série original apresentada para que a série transformada atenda às condições de “contorno” das técnicas apresentadas acima. Neste sentido, as principais formas comumente utilizadas em séries temporais são: diferenciação e transformação logarítmica (elas também podem ser combinadas). Nas figuras abaixo são apresentadas a série original e cada série transformada (logarítmica, diferenciada e logarítmica-diferenciada) de casos confirmados no Município do Rio de Janeiro. Como o objetivo de trabalhar sobre a série mais estacionária possível (ainda que com tendência) trabalharemos sobre as duas séries que melhor apresentam este comportamento. A partir deste ponto chamaremos as séries escolhidas para prever o total de casos confirmados de série original (SO) e a série “logaritimatizada” (SL) e apresentaremos abaixo características observadas de cada modelos e cada série.
  • ETS na série original (ETS SO): não capturou o padrão de crescimento e se manteve constante ao longo do tempo;
  • ETS na série logarimitizada (ETS SL): não capturou o padrão de crescimento e se manteve constante ao longo do tempo;
  • ARIMA na série original (ARIMA SO): capturou o padrão de crescimento linear;
  • ARIMA na série logarimitizada (ARIMA SL): capturou o padrão de crescimento explosivo;
  • Regressão linear na série logarimitizada (RL SO): capturou o padrão de crescimento linear;
  • Regressão linear na série logaritimizada (RL SL): capturou o padrão de crescimento explosivo;
As previsões otimista, esperada e pessimista de acordo com cada modelo são apresentados nas tabelas abaixo.
cenário otimista ets SO arima SO rl SO ets SL ARIMA SL rl SL
27/03/2020 288 400 332 309 403 421
28/03/2020 252 431 364 287 471 521
29/03/2020 223 460 396 271 554 646
30/03/2020 196 486 428 259 657 800
31/03/2020 170 511 460 248 780 990
01/04/2020 145 535 492 239 930 1225
02/04/2020 121 556 523 231 1110 1516
 
cenário ESPERADO ets SO arima SO rl SO ets SL ARIMA SL rl SL
27/03/2020 368 415 365 368 448 477
28/03/2020 368 455 398 368 546 595
29/03/2020 368 500 432 368 666 741
30/03/2020 368 542 465 368 811 924
31/03/2020 368 585 499 368 989 1151
01/04/2020 368 628 532 368 1205 1435
02/04/2020 368 671 566 368 1468 1788
 
cenário PESSIMISTA ets SO arima SO rl SO ets SL ARIMA SL rl SL
27/03/2020 448 429 397 439 498 542
28/03/2020 484 480 432 472 634 679
29/03/2020 513 539 467 499 800 851
30/03/2020 540 597 502 523 1002 1067
31/03/2020 566 659 538 545 1252 1338
01/04/2020 591 721 573 566 1560 1679
02/04/2020 615 786 608 586 1941 2108
Conforme comentado anteriormente, podemos descartar a priori os modelos ETS SO e ETS SL porque não foram capazes de capturar o crescimento que devemos prever. Assim, analisaremos apenas os resultados dos modelos ARIMA SO, ETS SL, ARIMA SL e RL SL. Para selecionarmos qual modelo deveríamos usar para estimar a quantidade total de casos esperados para os próximos 7 dias utilizamos os seguintes critérios:
  • Teste de normalidade dos resíduos.
    1. ARIMA SO: p-valor =0,1674. Não podemos rejeitar a hipótese nula de normalidade.
    2. RL SO: p-valor =0,693. Não podemos rejeitar a hipótese nula de normalidade.
    3. ARIMA SL: p-valor = 0,5382. Não podemos rejeitar a hipótese nula de normalidade.
    4. RL SL: p-valor = 0,3056. Não podemos rejeitar a hipótese nula de normalidade.
  • Teste de autocorreção dos resíduos (ACF). O modelo RL SO apresentou auto correlação dos resíduos no lag 1 e foi descartada. As demais séries não apresentaram auto correlação.
  • Menor média percentual absoluta do erro (MAPE) e menor erro quadrático médio (RMSE) dentre os modelos aprovados pelos critérios anteriores.
Modelos ME RMSE MAE MPE MAPE
ETS SO -29,35 37,98 29,35 -22,31 22,31
ARIMA SO -5,04 18,17 11,86 -5,78 10,46
RL SO 0 35,32 31,26 107,58 132,32
ETS SL -28,82 37,94 28,82 -21,14 21,14
ARIMA SL -0,49 19,9 15,15 -1,08 11,32
RL SL -2,51 17,34 15,23 -0,92 11,64
Na tabela acima observa-se que o modelo ARIMA SO atende ao critério de menor MAPE, RL SL atende ao critério menor RMSE e ARIMA SL é a segunda colocada em ambos os critérios. Entretanto, com o objetivo de prover apenas uma previsão, combinamos os modelos ARIMA SO e RL SL considerando: o menor valor entre estas séries, a cada dia, para estimar a previsão otimista, o valor médio entre ambas para estimar o valor esperado por dia e o maior valor, a cada dia, entre elas para estimar a previsão pessimista. Assim, os próximos valores esperados de quantidade de casos confirmados de COVID-19 no Município do Rio de Janeiro em cada cenário são apresentados na figura e tabela abaixo.
Dias Cenário Otimista Cenário Esperado Cenário pessimista
27/03/2020 400 446 542
28/03/2020 431 525 679
29/03/2020 460 620 851
30/03/2020 486 733 1067
31/03/2020 511 868 1338
01/04/2020 535 1031 1679
02/04/2020 556 1229 2108
  Autor Daniel Assad Currículo Lattes: http://lattes.cnpq.br/0258423859812498 Coordenação do LEGOS|UERJ Profa Thaís Spiegel, DSc. | thais@eng.uerj.br Currículo Lattes: http://lattes.cnpq.br/8880192361495671

Deixe um comentário