O Brasil depois da vacina

Uma Análise exploratória dos dados do OpenDataSUS


A vacinação no Brasil --- marcada por diversas polêmicas --- teve início dia 17 de janeiro de 2021. Essa página apresenta uma análise exploratória dos números de ocupação de leitos Clínicos e de UTI no Brasil em 2022.


Esta página é um projeto de (Serious) Storytelling usando conceitos de Visualização de Dados e Informação. A ideia é focar na apresentação de fatos derivados de dados por meio de visualizações (que, a partir de agora, serão carinhosamente referidas por VIS).

O Storytelling é importante pois nem sempre apenas uma VIS é suficiente para comunicar o que há nos dados. Dados possuem senmântica e precisam de um contexto para serem apresentados.

Não basta apenas entregar a VIS, queremos também extrair conhecimento dela. Queremos mostrá-la e responder a pergunta "e o que eu faço com isso?"

Foram selecionados os dados do registro de ocupação hospitalar do OpenDataSUS.

As etapas do storytelling foram:

  1. Explorar os dados: Os dados foram coletados do site, e uma série de processamentos foram feitos sobre eles, como o cálculo das médias móveis, filtragens, transformações e criação de campos calculados. Um segmento dos dados foi utilizado para gerar as visualizações finais. A exploração permitiu perceber que, apesar de 2022 já ter iniciado com uma grande parcela da população vacinada, o cenário ainda foi alarmante durante o decorrer do ano.
  2. Conceber a estória: Identifiquei a linha geral da estória, que seria chamar a atenção para o fato de que a ampla vacinação da população brasileira não pôs um ponto final nas mortes decorrentes de COVID-19. Pensando nisso, refinei os dados, separando informações para gerar VIS que permitissem ver o cenário estado a estado, região a região, e do país como um todo. A narrativa foi pensada para guiar o leitor até a conclusão de que a pandemia ainda não acabou.
  3. Materializar a estória: Para materializar a estória, construí os seguintes artefatos. Um repositório no GitHub com todo o código implementado, VIS geradas com o Bokeh, e a compilação das VIS com anotações em uma página web, pronta para o story share.

Embora o foco da página seja a estória, ao longo dela existem botões contando os aspectos de design envolvidos (como o botão que você clicou para ver esse texto!).



image/svg+xml
Rondônia

267 mortes | 17º lugar

Acre

58 mortes | 25º lugar

Amazonas

787 mortes | 11º lugar

Roraima

3 mortes | 27º lugar

Amapá

13 mortes | 26º lugar

Tocantins

101 mortes | 24º lugar

Mato Grosso

212 mortes | 20º lugar

Goiás

161039 mortes | 1º lugar

Mato Grosso do Sul

373 mortes | 14º lugar

Minas Gerais

20213 mortes | 3º lugar

Paraná

987 mortes | 10º lugar

Rio Grande do Sul

257 mortes | 18º lugar

Bahia

1214 mortes | 8º lugar

Piauí

211 mortes | 21º lugar

Ceará

1023 mortes | 9º lugar

Rio Grande do Norte

216 mortes | 19º lugar

Alagoas

146 mortes | 22º lugar

Sergipe

132 mortes | 23º lugar

Distrito Federal

376 mortes | 13º lugar

Pernambuco

1277 mortes | 6º lugar

Maranhão

281 mortes | 15º lugar

Pará

1305 mortes | 5º lugar

São Paulo

5178 mortes | 4º lugar

Rio de Janeiro

1256 mortes | 7º lugar

Espírito Santo

451 mortes | 12º lugar

Santa Catarina

40821 mortes | 2º lugar

Paraíba

270 mortes | 16º lugar


A VIS acima é interativa: a ação de colocar o mouse em cima de um estado (hover) apresenta um texto com o seu nome, número de óbitos acumulados em 2022, e sua classificação no índice dos estados mais acometidos (em valores absolutos) pela COVID-19. A cor de cada estado foi selecionada numa escala de vermelhos, sendo que tons mais escuros indicam piores cenários. As cores foram selecionadas de forma discreta, com base no rank dos estados. Então existem 26 tons diferentes de vermelho. A vantagem de visualizar esses dados de maneira georreferenciada é a possibilidade de identificar a relação de um estado com seus vizinhos.

Domínio
  • Perfil: Leitores do site com interesse em dados de COVID-19
  • Objetivo: Apresentar o panorama geral do Brasil
Abstração de dados
  • Estrutura: Dados tabulares
  • Item dos dados: Georreferenciado (nome do estado), Quantitativo (total de mortes), Quantitativo (rank de cada estado)
Abstração de tarefas
  • Comparar os diferentes estados
Designing the VIS
  • Variável visual: posição e cor
  • Tipo de descrição: hue

A vacina foi um passo fundamental no combate à COVID-19, mas não deveria ser vista como o único fator. Em 2022, o brasil enfrentou uma nova onda de casos, com altos índices de ocupações de leitos e, infelizmente, altos números de óbitos mesmo com a imunização em progresso.

O mapa acima mostra a quantidade de óbitos por estado para casos confirmados, com uma cor mais escura para os piores classificados. O estado de Goiás, primeiro na lista, teve um total de 161.039 vidas perdidas.

Santa Catarina foi o segundo estado que mais registrou 40.821 mortes, seguido de Minas Gerais, com 20.213 mortes.



A VIS acima é altamente interativa: pode-se comparar até 3 linhas ao mesmo tempo (selecionando os dados na caixa de seleção), por meio de várias interações (pan horizontal, hover e zoom), com um minimapa de seleção para controlar o pan horizontal. A ideia é que --- uma vez que temos finalidade de fornecer uma análise exploratória --- possibilitar que o usuário escolha seus próprios dados para focar e ver se encontra correlações. Por padrão, o gráfico vem com a correlação foco do site: Ocupação de UTIs e número de óbitos. Para criação de todos os dados, foi calculada a média móvel (procedimento que se tornou padrão para visualizar esse tipo de dado, graças às notícias na televisão, e que são de conhecimento da maioria da população. Em termos técnicos, a média móvel é um filtro passa-baixa, que remove dos dados oscilações altas, evitando uma linha muito ruidosa e difícil de ser lida e comparada).

Domínio
  • Perfil: Leitores do site com interesse em dados de COVID-19
  • Objetivo: Explorar correlações
Abstração de dados
  • Estrutura: Dados tabulares
  • Item dos dados: Ordinal (data), Quantitativo (médias móveis disponíveis)
Abstração de tarefas
  • Encontrar correlações por visualização
Designing the VIS
  • Variável visual: posição e cor
  • Tipo de descrição: linha e hue

Os dados de ocupação de leitos, tanto Clínicos quanto de UTI, mostram uma correlação com o número de óbitos decorrentes de COVID-19 (apenas para casos confirmados).

O alarmante número de ocupações, mesmo com as medidas públicas para disponibilização de leitos improvisados em todo o território nacional, suporta a hipótese de que não bastava a vacina para resolver o problema: foi uma questão de políticas públicas, respostas eficientes e disponibilização de infraestrutura para cuidado médico da população.

Á partir de 23 de Julho de 2022, quando a ocupação se tornou menor que 1000 (em clínicas) e 1580 (em UTIs), a taxa de óbitos caiu drasticamente.

No ápice de internações, em Fevereiro, o número de óbitos não respondeu de maneira proporcional ao número de internações.



A VIS acima é interativa: um hover permite ver informações sobre cada estado. A ideia dessa VIS é apresentar, ao longo do tempo, o número de ocupações (que pode ser visto pelo tamanho das barras), assim como explicitar as regiões mais afetadas (por meio das frações das barras de tamanhos grandes). Aqui há um compromisso entre efetividade (bom uso das primitivas para mostrar a informação) e expressividade (mostrar todos os dados que precisam ser mostrados), uma vez que algumas barras ficam pequenas e é difícil identificar as regiões. Entretanto, o foco foi chamar a atenção que a região do Sudeste se destaca.

Domínio
  • Perfil: Leitores do site com interesse em dados de COVID-19
  • Objetivo: Comparar
Abstração de dados
  • Estrutura: Dados tabulares
  • Item dos dados: Ordinal (regiões do Brasil), Ordinal (mês do ano (apresentados com enumeração de 1 a 12)), Quantitativo (Ocupação de leitos de UTI)
Abstração de tarefas
  • Comparar diferentes regiões ao longo do tempo
Designing the VIS
  • Variável visual: posição, cor
  • Tipo de descrição: barra e hue

A proporção entre as regiões do Brasil se mantiveram próximas. Para a região Sudeste, que contempla alguns dos estados com maior número de mortos, a ocupação foi sempre a maior entre as regiões do Brasil. No mês de Fevereiro, a região Sudeste sozinha correspondia a metade da ocupação total no Brasil.



A VIS acima tenta alinhar as diferentes métricas, sem se basear em médias móveis, e sim na soma dos valores absolutos para cada mês. A ideia é acompanhar a progressão de cada indicador, com um campo calculado sendo apresentado no último gráfico: a porcentagem de saídas do hospital correspondentes a óbitos. Chama a atenção que: ou a quantidade de óbitos é numericamente grande, ou é percentualmente grande.

Domínio
  • Perfil: Leitores do site com interesse em dados de COVID-19
  • Objetivo: Comparar
Abstração de dados
  • Estrutura: Dados tabulares
  • Item dos dados: Ordinal (mês do ano (apresentados com enumeração de 1 a 12)), Quantitativo (soma dos valores para cada mês)
Abstração de tarefas
  • Comparar diferentes indicadores ao longo do tempo
Designing the VIS
  • Variável visual: posição, cor
  • Tipo de descrição: barra e hue

Ao longo do tempo, podemos ver que houve um grande número de altas durante a primeira metade do ano, com uma proporção de óbitos de aproximadamente 10%. Após Julho, quando os índices de ocupação diminuíram, vemos uma redução (numérica) do número de altas e óbitos --- comportamento esperado, já que esse número deve responder à quantidade de ocupação.

Curiosamente, quando o número de ocupação diminuiu para a metade, a porcentagem de óbitos entre pacientes internados confirmados dobrou.

Mesmo com a redução significativa no número de ocupações e número de óbitos, durante o ano inteiro, o menor valor de ocupação mensal de UTIs no Brasil foi de mais ded 120.000 pessoas.