O SIVEP-DDA é o sistema de vigilância epidemiológica das doenças diarreicas agudas no Brasil. Suas informações ajudam a acompanhar a ocorrência semanal de casos, identificar padrões temporais e territoriais, monitorar surtos e subsidiar respostas de vigilância em saúde.
Esta base organiza dados do SIVEP-DDA em arquivos abertos, documentados e adequados para análises reprodutíveis. A proposta é transformar respostas recebidas por transparência passiva em uma base estruturada, com proveniência clara, formatos modernos de armazenamento e documentação suficiente para reuso.
Fonte dos dados
Os dados foram obtidos por pedido via Lei de Acesso à Informação (LAI) ao Ministério da Saúde, no processo 25072.030308202612.
Os depósitos no Zenodo incluem os arquivos originais recebidos na resposta da LAI, incluindo Sivep-DDA_ 2008_2026.zip, e os produtos processados gerados de forma reprodutível. A série histórica cobre os anos de 2008 a 2024. Os dados de 2025 e 2026 foram publicados em depósito separado por serem preliminares e sujeitos a atualizações mensais.
Conteúdo da base
O SIVEP-DDA disponibilizado nesta base contém registros agregados semanais em nível municipal. Entre as informações presentes estão ano e semana epidemiológica, códigos de unidade da federação e município, contagens de casos por faixa etária, contagens por plano de tratamento, indicadores de surto, investigação de surto e quantidade de unidades notificantes.
Essa estrutura permite estudos sobre sazonalidade, comparações entre territórios, monitoramento de alterações no perfil de notificação e avaliação de situações de aumento incomum de doenças diarreicas agudas.
Tratamento
O processamento é mantido no repositório sivep_dda. O fluxo padroniza nomes de variáveis, normaliza inconsistências de cabeçalho entre arquivos originais, converte variáveis categóricas codificadas para rótulos legíveis e trata campos de data.
Os produtos finais são organizados por ano nos formatos Parquet e CSV compactado, o que facilita tanto análises interativas quanto fluxos automatizados. Os depósitos também incluem metadados para auditoria e reutilização, como codebook, manifesto de publicação, checksums e relatório de valores não mapeados. O manifesto documenta seleção dos arquivos-fonte, contagens de linhas, diferenças de esquema entre anos, nomes dos arquivos de saída, datas de modificação das fontes e checksums MD5.
Acesso aos dados
Os arquivos processados estão disponíveis por ano nos formatos Parquet e CSV compactado. Os depósitos usam licença Creative Commons Attribution 4.0 International (CC BY 4.0).
| Período | Depósito Zenodo |
|---|---|
| 2008-2024 | 10.5281/zenodo.20752238 |
| 2025-2026 | 10.5281/zenodo.20752301 |
Exemplo de uso em R
O exemplo abaixo baixa o arquivo Parquet preliminar de 2025 com o pacote {zendown}, soma os casos registrados por faixa etária e cria uma série semanal de casos de doenças diarreicas agudas.
Código
library(arrow)
library(dplyr)
library(ggplot2)
library(zendown)
arquivo_dda_2025 <- zen_file(
deposit_id = 20752301,
file_name = "sivep_dda_2025.parquet"
)
dda_semana <- read_parquet(arquivo_dda_2025) |>
mutate(
casos = rowSums(
pick(nu_m1ano, nu_1a4, nu_5a9, nu_10oumais, nu_faixign),
na.rm = TRUE
)
) |>
group_by(sem_epid_week) |>
summarise(casos = sum(casos, na.rm = TRUE), .groups = "drop") |>
arrange(sem_epid_week)
ggplot(dda_semana, aes(x = sem_epid_week, y = casos)) +
geom_line(color = "#15616d", linewidth = 0.8) +
geom_point(color = "#15616d", size = 1.4) +
scale_y_continuous(
labels = scales::label_number(big.mark = ".", decimal.mark = ",")
) +
labs(
title = "Casos de DDA por semana epidemiológica",
subtitle = "Brasil, 2025",
x = "Semana epidemiológica",
y = "Casos"
) +
theme_bw()
Uso responsável
Como os dados se originam de um sistema de notificação em saúde pública, seu uso requer cuidado na análise, redistribuição e vinculação com outras bases. Recomenda-se citar o registro Zenodo utilizado, a origem via LAI, a data de processamento e o repositório de código associado.