Sobre o Projeto

Objetivo

O Arquivo da Violência tem como objetivo mapear todas as mortes violentas do Brasil em tempo real. O projeto começou pelo Rio de Janeiro, estado com altos índices de violência urbana, e pretende expandir para todo o território nacional.

Nosso propósito é criar um banco de dados aberto e acessível que documente cada vida perdida, contribuindo para a transparência, memória e formulação de políticas públicas de segurança.

Metodologia

O sistema utiliza uma abordagem automatizada de coleta e processamento de dados:

1

Coleta de Fontes

Monitoramos feeds RSS de portais de notícias locais e nacionais, buscando artigos que contenham palavras-chave relacionadas a mortes violentas (homicídio, assassinato, tiroteio, etc.).

2

Ingestão de Conteúdo

Os artigos identificados são baixados e armazenados em nosso banco de dados, incluindo URL, título, conteúdo completo e data de publicação.

3

Extração com IA

Utilizamos modelos de linguagem (LLM) para extrair informações estruturadas de cada artigo: nome da vítima, local, data do incidente e um resumo do ocorrido.

4

Deduplicação

Múltiplas fontes podem reportar o mesmo incidente. Nosso sistema utiliza algoritmos de correspondência fuzzy para identificar e agrupar notícias sobre o mesmo evento.

5

Consolidação

As extrações são consolidadas em incidentes únicos, cada um representando uma morte com todas as suas fontes e informações associadas.

Limitações

Este projeto está em desenvolvimento. As principais limitações atuais incluem:

  • Cobertura limitada ao Rio de Janeiro
  • Dependência de notícias publicadas (casos não noticiados não são capturados)
  • Possíveis erros na extração automática de informações
  • Atraso entre o evento e a publicação da notícia

Contribua

Este é um projeto de código aberto. Se você deseja contribuir com código, dados ou ideias, entre em contato ou acesse nosso repositório no GitHub.