Mais uma vez a XP Investimentos inovou ao transformar seu modelo de projeções de contágio do coronavírus em open-source. Com isto, visamos contribuir com a discussão a respeito da doença e permitir que todos os clientes utilizem a tecnologia desenvolvida por nosso time de especialistas de forma gratuita.
Optamos por desenvolver um modelo que:
- Fosse baseado no número de fatalidades e não no de casos confirmados;
- Nos permitisse analisar facilmente diversos países;
- Ajudasse no timing de tomadas de decisão tendo em vista a situação do coronavírus.
O modelo foi desenvolvido em python e está disponível neste repositório público. Assim, de forma gratuita, o modelo pode ser utilizado e modificado por qualquer um.
O problema atual
A pandemia de coronavírus trouxe um desafio nunca antes enfrentado pela humanidade. Pragas e pestes nos rondaram antes, mas hoje temos a oportunidade de enxergar e enfrentar um adversário invisível a olho nu com ferramentas de ponta.
Ao mesmo tempo, somos hoje um planeta urbano: já faz alguns anos que a maioria dos seres humanos vive em cidades e não no campo. A maior densidade populacional ajuda o vírus a se propagar, assim como a maior integração entre os vários povos que habitam esse pequeno ponto azul.
Nós da XP temos nos esforçado ao máximo para informar e ajudar todos a tomarem melhores decisões de investimentos, inclusive criamos um radar onde nossos clientes e visitantes podem acompanhar toda nossa cobertura sobre o coronavírus: lives, relatórios, notícias e um mapa com a evolução da doença em tempo real.
Vale a pena consultar também o site oficial do Ministério da Saúde sobre o COVID-19.
Governos têm agido com medidas rápidas e drásticas para conter a propagação do vírus e impedir que os sistemas de saúde nacionais fiquem sobrecarregados. Nunca antes na história da humanidade se imaginou que pudéssemos estar com quase 1 terço de todas as pessoas em suas casas.
As consequências econômicas dessas escolhas drásticas e inéditas são também drásticas e inéditas. Nenhuma empresa do planeta poderia ter cogitado um cenário onde seria impedida de funcionar por 1, 2 ou 3 meses. Bancos centrais, governantes e parlamentos têm colocado no ar medidas inéditas e expressivas para tentar conter dados maiores.
As quarentenas e lock-downs têm sido adotados para evitar uma possível falta de leitos nos sistemas de saúde, o que aumentaria a taxa de mortalidade da COVID-19.
A pergunta em todas as mentes é: quanto tempo teremos que ficar “em quarentena”, com comércio fechado e pessoas trancadas em suas casas?
Diversos especialistas têm buscado responder essa pergunta com o uso de modelos epidemiológicos e estatísticos. Após estudar as soluções atuais, nosso time propôs uma nova abordagem.
Os modelos existentes
Boa parte das abordagens para acompanhar a evolução do vírus são baseadas no Modelo SIR. Este modelo separa a população em três “compartimentos”, que dão origem à sigla:
- Suscetíveis: são todos aqueles que podem contrair a doença em algum momento.
- Infectados: aqueles que estão infectados em um dado momento, ou seja, os casos ativos.
- Removidos: aqui estão as pessoas que foram infectadas mas não possuem mais o vírus. Seja pela criação de anticorpos, seja pelo falecimento.
Adicionalmente, as relações abaixo são fundamentais para entender a propagação de uma doença:
- Quantas pessoas são contaminadas, em média, por cada infectado: o muito falado número básico de reprodução ou R0.
- Por quanto tempo cada pessoa contaminada permanece contagiosa.
- Quanto tempo as pessoas infectadas levam para se tornar removidas.
Muitos estudos têm sido feitos sob variações desse modelo para acompanhar a disseminação da doença ao redor do mundo. Infelizmente, esse modelo é muito simples para responder às perguntas que mais têm preocupado líderes e profissionais de saúde:
- Quantos leitos de UTI são necessários?
- Até quando o contato social tem que ficar restrito para não sobrecarregar as UTIs?
- Adicionar leitos pode reduzir em quanto o tempo necessário de quarentena?
Além de não responder a essas perguntas, as abordagens atuais dependem excessivamente de dados “ruins”, como casos confirmados e casos recuperados.
Estes dados são ditos ruins, pois são de difícil controle por parte dos órgãos competentes e, observando principalmente o gráfico de casos recuperados, ficam evidentes problemas nas constatação e publicação destes números.
O modelo SIRFH
Nosso analista Pedro Montero Mattos criou um novo modelo, que adiciona dois compartimentos ao modelo original:
- Fatalidades: número de pessoas que vieram a falecer.
- Hospitalizações: número de pessoas hospitalizadas em UTIs.
Isso exige novas dinâmicas que precisam ser modeladas:
- Quantos dentre os Infectados precisam de cuidado intensivo.
- Em quanto tempo os infectados que não precisaram de internação se recuperam.
- O percentual de fatalidade entre os internados.
- Em quanto tempo os internados sobreviventes se recuperam.
- Em quanto tempo os internados que virão a falecer o fazem.
Além disto, o modelo proposto inclui uma dinâmica de tempo para o ritmo de propagação da doença. Isto permite que o modelo inclua em suas projeções o fato de um país estar em quarentena.
Preenchendo as lacunas
Com o modelo em mãos, passamos a buscar dados para balizar o modelo. Alguns já estão disponíveis de maneira simples, outros tivemos que estimar com base em notícias de veículos de imprensa.
Fontes de dados
Buscamos os dados de infectados, recuperados e falecidos do repositório Johns Hopkins CSSE, instituição dos Estados Unidos que, desde o início da doença, tem feito um acompanhamento detalhado e disponibilizado os dados para o público.
Número de leitos de UTI no Brasil
O Brasil tem 61,8 mil leitos de UTI na soma de SUS e hospitais privados, de acordo com Cadastro Nacional de Sistemas de Saúde em 16 de abril, quando consultamos os dados.
Percentual de hospitalizações
O artigo científico Demanda por serviços de hospitalização de pacientes de COVID-19 no Brasil, escrito por Marcia C. Castro, Lucas Resende de Carvalho, Taylor Chin, Rebecca Kahn, Giovanny V. A. França, Eduardo Marques Macário e Wanderson Kleber de Oliveira, estima em 5% o percentual de infectados que irá necessitar de tratamento hospitalar intensivo.
Tempo de recuperação para infectados e hospitalizados
Com dados preliminares, a OMS (Organização Mundial de Saúde) estimou em 2 semanas (14 dias) o tempo de recuperação para casos leves e 3 a 6 semanas (21 a 42 dias) o tempo de recuperação de pacientes críticos.
Percentual de hospitalizados que vão a óbito
O The Guardian publicou ao final de março uma matéria que nos ajuda a estimar o percentual de óbitos dentre os pacientes internados. De 165 pacientes tratados em unidades intensivas da Inglaterra, País de Gales e Irlanda do Norte desde o final de fevereiro, 79 morreram e 86 receberam alta. Esses números, de 28 de março, foram consolidados à partir de uma amostra de 775 pessoas que estiveram ou estavam em tratamentos críticos em 285 UTIs diferentes. Os demais 610 pacientes continuavam internados.
Estudos de caso
Para verificar a adequação do modelo, é interessante realizar estudos de caso para outros países, em especial países que se encontram em estágio de contágio “avançado” em relação ao Brasil.
A título de comparação entre os países estudados, podemos observar o percentual de casos confirmados sobre o total de sua população assim como a data em que o país confirmou seu centésimo caso.
Coréia do Sul
No caso particular da Coréia do Sul, podemos ver no primeiro gráfico, de fatalidades diárias, que o pico verdadeiro parece ter sido um dado errático, e por esta razão o modelo não converge para o pico verdadeiro.
Itália
No caso da Itália, podemos observar que muito embora o pico verdadeiro tenha sido atingido 34 dias após a confirmação do centésimo caso, o modelo estima, desde a confirmação do centésimo caso, um pico com menos de uma semana de diferença.
Espanha
De forma semelhante à Itália, o pico de fatalidades diárias na Espanha foi atingido 31 dias após a confirmação do centésimo caso, ao passo que desde a confirmação o modelo estima uma data de pico com menos de 1 semana de erro.
Alemanha
Na Alemanha, a estimativa do modelo se aproxima do pico real, ficando a maior parte do tempo há 7-9 dias do verdadeiro. No caso da Alemanha os dados diários também se mostram erráticos.
Estados Unidos
Para os Estados Unidos, com base no gráfico de fatalidades diárias, é difícil estimar um pico a olho nu, pois quando a curva já aparenta estar na descendente, há a publicação no dia 29 de abril do maior valor da série.
Brasil
Para o caso brasileiro, adicionamos a capacidade estimada de leitos de UTI. Ainda assim, aconselhamos a análise do gráfico acima com bastante cautela, pois o modelo desconsidera diferenças regionais da distribuição de casos e de leitos de UTI. Ou seja, se estivermos acima ou abaixo da linha, não significa que teremos ou não capacidade de atender a demanda, pois o problema real é significativamente mais complexo.
Conclusão
O modelo SIRFH mostra evidências de que consegue prever, com pouca margem de erro, picos de fatalidades com 30 a 40 dias de antecedência. Ainda, o modelo se mostra robusto à diferenças entre países e se adapta bem à mudanças de regime antes e depois da quarentena.
Com isto, nossa equipe espera contribuir com uma ferramenta relevante para os mais diferentes interessados nesta discussão, seja o investidor individual, institucional ou quaisquer tomadores de decisão
Se você ainda não tem conta na XP Investimentos, abra a sua!