Previsão da evolução dos casos de COVID-19 no município do Rio de Janeiro para o período de 14/abril a 04/maio

Autor Daniel Assad

Baixe aqui o texto completo

O LEGOS trata o problema de prever a evolução do total de casos confirmados de COVID-19 no município do Rio de Janeiro. Para chegar aos resultados que serão apresentados a seguir utilizamos a série histórica do referido município que está disponível no Painel Rio COVID SMS | IPP | COR. Esta série histórica é apresentada na tabela e figura abaixo.

DataCasos confirmadosDataCasos confirmados
06/03/2020426/03/2020428
07/03/2020927/03/2020491
08/03/20201228/03/2020549
09/03/20201329/03/2020575
10/03/20202230/03/2020613
11/03/20202931/03/2020643
12/03/20203601/04/2020757
13/03/20204902/04/2020867
14/03/20205403/04/2020927
15/03/20206204/04/20201042
16/03/20206805/04/20201128
17/03/20209306/04/20201170
18/03/20209807/04/20201311
19/03/202012308/04/20201509
20/03/202015409/04/20201693
21/03/202016310/04/20201868
22/03/202023011/04/20201965
23/03/202027412/04/20202056
24/03/202033813/04/20202382
25/03/2020391… 04/05/2020?

Observando as figuras acima podemos perceber que no município do Rio de Janeiro segue comportamento não linear e para reproduzirmos o comportamento esperado para os próximos 21 dias consideraremos que base histórica4até a última atualização (13/04 às 18h).

Modelos de previsão

Para estimarmos a quantidade total de pacientes confirmados com COVID-19 21 dias a frente (até 04/05) utilizamos modelos univariados consagrados da literatura e regressões apresentados abaixo:

  • Modelos de suavização exponencial (ETS);
  • Modelos auto regressivos integrados de média móvel (ARIMA);
  • Regressão Linear (RL);

Nenhum dos 3 modelos apresentados acima foi concebido para tratar de séries temporais de comportamento explosivo (como é o nosso caso). Entretanto, podemos realizar algumas transformações na série original apresentada para que a série transformada atenda às condições de “contorno” das técnicas apresentadas acima. Neste sentido, as principais formas comumente utilizadas em séries temporais são: diferenciação (neste caso, a série de internações por dia) e transformação logarítmica (elas também podem ser combinadas). Nas figuras abaixo são apresentadas a série original e cada série transformada (logarítmica, diferenciada e logarítmica-diferenciada) de casos confirmados no Município do Rio de Janeiro.

Como o objetivo de trabalhar sobre a série mais estacionária possível (ainda que com

tendência) trabalharemos sobre as duas séries que melhor apresentam este comportamento. A partir deste ponto chamaremos as séries escolhidas para prever o total

de casos confirmados de série original (SO) e a série em escala logarítmica (SL) e apresentaremos abaixo características observadas de cada modelos e cada série.

  • ETS na série original (ETS SO): capturou o padrão de crescimento linear;
  • ETS na série em escala logarítmica (ETS SL): capturou o padrão de crescimento explosivo;
  • ARIMA na série original (ARIMA SO): capturou o padrão de crescimento linear;
  • ARIMA na série em escala logarítmica (ARIMA SL): capturou o padrão de crescimento explosivo;
  • Regressão linear na série em escala logarítmica (RL SO): capturou o padrão de crescimento linear;
  • Regressão linear na série em escala logarítmica (RL SL): capturou o padrão de crescimento explosivo;

Cada modelo apresentado acima terá um conjunto de parâmetros que podem levar a previsões bastante distintas e avaliar qual seria o melhor modelo apenas pelo menor erro de acordo com a ser critério escolhido pode nos levar a uma baixa assertividade na previsão. Com objetivo de dirimir deste risco, fizemos primeiramente a avaliação dos resíduos do modelo de cada modelo apresentado acima seguindo as seguintes questões:

  • Média igual a 0 pelo teste de Student;
  • Segue uma distribuição normal pelo teste de Shapiro-Wilk;
  • É independente e identicamente distribuído (não existe auto correlação estatisticamente significativa) pelo teste de Ljung-Box;
  • É homocedástico (a variância se mantém constante ao longo do tempo) pelo teste de heteroscedasticidade condicional auto-regressiva (ARCH).

A resposta de cada uma destas perguntas para cada modelo é apresentada na tabela abaixo. Para fins de simplificação nela colocamos apenas os p-valores encontrados. O nível de significância escolhido foi de 0,05, ou seja, trabalhamos com um intervalo de confiança de 95%.

Teste estatísticoets SOarima SOrl SOets SLARIMA SLrl SL
Student0,0460,7510,990,1031
Shapiro-Wilk0,0030,0560,0020,6450,5900,432
Ljung-Box0, 7570, 537<0,0010,570,054<0,001
ARCH0,2490,013<0,0010,080,024<0,001

A tabela acima indica que apenas 1 modelo não deveria ser rejeitado ao nível de significância de 0,05: ETS SL (modelo com crescimento exponencial).

Os resultados de acurácia (precisão) olhando para a série histórica de todos modelos é apresentado na tabela abaixo. Nela, podemos observar que o modelo elegível pelo critério apresentado acima também leva a um menor média percentual absoluta do erro (MAPE) e segundo menor erro quadrático médio (RMSE).

ModelosMERMSEMAEMPEMAPE
ETS SO-9,9754,9233,89-2,615,75
ARIMA SO-12,3941,2928,74-35,95
RL SO0234,04201,5510,1768,91
ETS SL -2,6142,6828,76-0,235,47
ARIMA SL9,8246,7932,191,836,07
RL SL62,89256,75139,83-2,6619,45

Avaliado o resíduo do modelo ETS SL e tendo em conta a acurácia dos seus sinais na tabela e gráfico abaixo apresentamos os cenários otimista, esperado e pessimista. O intervalo de confiança utilizado para a geração dos cenários foi de 95%, ou seja, a probabilidade de o valor observado não estar entre os cenários otimistas e pessimistas é de 5%.

PrevisõesETS SL
DiaCenário OtimistaCenário EsperadoCenário Pessimista
14/04/2020238225212898
15/04/2020238227003223
16/04/2020238228853552
17/04/2020243130753891
18/04/2020252432724240
19/04/2020262134734602
20/04/2020272136804977
21/04/2020282238915364
22/04/2020292541065765
23/04/2020302943266179
24/04/2020313445506605
25/04/2020323847767045
26/04/2020334350067496
27/04/2020344852397960
28/04/2020355354748435
29/04/2020365657128922
30/04/2020375959519419
01/05/2020386161919927
02/05/20203962643310444
03/05/20204061667510971
04/05/20204159691811507

O objetivo dos modelos utilizados foi estimar, com a maior precisão possível, quantos casos de pacientes com COVID-19 poderão ser confirmados em um horizonte de tempo de 21 dias e, com base nos critérios apresentados, concluímos que um modelo exponencial foi o que se melhor ajustou aos valores históricos apresentados até o momento.

Não é possível, no entanto, extrapolar este método para um período maior de tempo e nem mesmo concluir, a partir de seus resultados, em que estágio o município está na curva esperada de uma epidemia. Estudos com estes objetivos necessitam de abordagens mais complexas e também são conduzidas dentro do LEGOS.

Autor

Daniel Assad

Currículo Lattes: http://lattes.cnpq.br/0258423859812498

 

Coordenação do LEGOS|UERJ

Profa Thaís Spiegel, DSc. | thais@eng.uerj.br

Currículo Lattes: http://lattes.cnpq.br/8880192361495671

Nota técnica divulgada em 13 de abril de 2020.

Deixe um comentário