O SINARC – Sistema Integrado de Análise de Redes Complexas é um programa experimental de análise de dados de fontes abertas desenvolvido sob os princípios da Ciência Aberta (metodologia aberta, código aberto, dados abertos, acesso aberto, revisão por pares aberta e recursos educacionais abertos), sob Licença MIT (software livre gratuito), para uso em computadores Windows. O sistema foi criado a partir do inspirador projeto Rede CNPJ, porém utilizando técnicas e ferramentas de programação distintas, o que lhe confere funcionalidades singulares.
Como sistema de inteligência para fontes abertas (Open Source Intelligence - OSINT), o SINARC se propõe a ampliar as perspectivas de análise das conexões existentes entre pessoas físicas, pessoas jurídicas, endereços, telefones e e-mails constantes na base de dados pública de CNPJ da Receita Federal, formada por 60 milhões de empresas, por meio da criação de uma interface gráfica concebida a partir dos princípios da percepção visual extraídos da Psicologia da Gestalt, facilitando a identificação visual das estruturas pelo analista, e de um conjunto de ferramentas computacionais que utilizam a teoria dos grafos para analisar a rede de conexões sob o ponto de vista de um sistema complexo e aplicar algoritmos matemáticos para auxiliar na identificação de informações e padrões ocultos relevantes para a produção de conhecimento.
Nota Técnica da Receita Federal especifica quais informações da base de dados de CNPJ não estão protegidas por sigilo fiscal. Todas as informações geradas com o SINARC são públicas e os exemplos meramente ilustrativos.
O vídeo a seguir demonstra a aplicação do SINARC no controle da Administração Pública. A partir de notícia publicada na internet sobre supostas irregularidades em licitação para contratação de serviço de sinalização semafórica, o sistema analisa a existência de vínculos entre as empresas citadas na notícia, cruzando os resultados com os participantes de outra licitação de mesmo objeto para verificar a existência de conexões entre os grupos econômicos:
Exemplo de vínculos existentes entre duas empresas, identificados pelo SINARC na 1ª camada
Confira exemplo de uso do SINARC em trabalho técnico desenvolvido pelo Ministério Público de Contas do Estado do Espírito Santo (MPC-ES): Parecer no Processo TC 784/2020 (pág. 110). Para saber mais sobre esta ação de controle do MPC-ES em defesa do meio ambiente, vide a respectiva notícia.
Assim como o projeto Rede CNPJ, o objetivo do SINARC é demonstrar a possibilidade de criação de ferramentas tecnológicas para exploração de dados abertos e incentivar o desenvolvimento de projetos semelhantes pela sociedade, considerando que "o verdadeiro progresso é o que põe a tecnologia ao alcance de todos!" (Henry Ford), sem exceção.
Para instalar o SINARC e o Rede CNPJ, siga as instruções contidas no arquivo INSTRUÇÕES.txt, disponível na página principal deste repositório. Devido à sua portabilidade, é possível instalar e executar o sistema diretamente em um HD externo.
Para ampliar a capacidade de pesquisa, baixe e descompacte na pasta SINARC (criada para abrigar o sistema) a versão portátil e gratuita do programa DB Browser (arquivo "DB Browser for SQLite - .zip (no installer) for 64-bit Windows"). Com o auxílio do DB Browser é possível realizar filtros e consultas SQL diretamente nas tabelas dos bancos de dados do sistema, combinando critérios de busca que não estão disponíveis nas interfaces gráficas do SINARC e do Rede CNPJ, e chegar aos números de CNPJ que deseja explorar com o SINARC.
Conquanto o SINARC utilize apenas a modelagem de criação e consulta aos bancos de dados do projeto Rede CNPJ, optou-se por disponibilizar também a íntegra deste formidável programa, permitindo ao cidadão explorar as duas ferramentas e, quem sabe, desenvolver seu próprio sistema de análise de grafos, com funcionalidades ainda mais interessantes, certamente, disponibilizando-o também como software livre para inspirar outras pessoas a se engajarem em iniciativas que promovam a transparência e a cidadania a partir de dados abertos.
O manual de instruções do SINARC pode ser acessado por meio da tecla h (de help), durante o uso do sistema. Já o manual do Rede CNPJ encontra-se disponível na própria página do projeto.
Exemplo de rede complexa de CNPJ sendo explorada pelo SINARC
O SINARC se destina a todos que exercem o controle social e institucional da Administração Pública, como auditores, jornalistas, comissões permanentes de licitação e de pregão, procuradorias jurídicas, sistemas de controle interno, ministérios públicos, entre outros órgãos e instituições, além do cidadão interessado em obter informações sobre a estrutura empresarial de grupos econômicos, a situação jurídica de empresas e as relações existentes entre pessoas físicas e jurídicas cadastradas na base de dados pública de CNPJ da Receita Federal.
ATENÇÃO: Antes de utilizar as informações obtidas por meio do SINARC, valide-as mediante consulta direta aos portais de transparência e às bases de dados primárias atualizadas.
Confira, a seguir, exemplos de exploração de redes complexas com o SINARC:
- Aberto em 4 camadas com o SINARC
- 6.602 nós
- 12.884 arestas (azul)
- Fonte: Empresas listadas na B3
Visão panorâmica da rede complexa gerada pelo SINARC
Aproximação da rede complexa gerada pelo SINARC
Detalhe da rede complexa gerado pelo SINARC
- Abertos em 2 camadas com o SINARC
- 31.606 nós
- 45.268 arestas (azul)
- Fonte: Empresas listadas na B3
Visão panorâmica da rede complexa gerada pelo SINARC
Aproximação da rede complexa gerada pelo SINARC
Detalhe da rede complexa gerado pelo SINARC (com ocultação de arestas)
Vínculo existente entre duas empresas, identificado pelo SINARC na 8ª camada
✅ Conhecer a estrutura de grupos empresariais com base no CNPJ, razão social, nome de fantasia, nome do sócio, entre outros parâmetros.
✅ Identificar vínculos entre pessoas físicas e jurídicas a partir de notícias publicadas na internet.
✅ Representar, por meio de grafos, empresas cujos números de CNPJ, no formato 00000000000000 ou 00.000.000/0000-00, se encontram citados em relatórios técnicos, diários oficiais ou qualquer documento ou tela com texto selecionável.
✅ Identificar vínculos entre licitantes a partir das atas das sessões públicas de procedimentos licitatórios, bem como das bases de dados disponibilizadas nos portais da transparência da Administração Pública.
✅ Identificar pessoas físicas e jurídicas com posições estratégicas na rede a partir da aplicação de algoritmos de medidas de centralidade de grafos, cono Centralidade de Grau (Degree Centrality), Centralidade de Intermediação (Betweenness Centrality), Centralidade de Proximidade (Closeness Centrality), Centralidade de Autovetor (Eigenvector Centrality) e Ranking de Página (Pagerank).
✅ Identificar toda a cadeia hierárquica formada por de pessoas físicas e jurídicas que integram os grupos econômicos controladores de determinada empresa.
✅ Gerar grafo contendo todas as empresas que se enquadrem na combinação de determinados critérios (mesmo endereço, rua, CEP, atividade econômica etc.), mediante consulta prévia à base de dados usando o programa gratuito DB Browser.
Relação de sites contendo informações (nomes de pessoas físicas, jurídicas e números de CNPJ) para testar as funcionalidades do SINARC:
-
Empresas beneficiadas por renúncias fiscais de tributos federais. Como não há CNPJ na planilha, selecione para consulta apenas a razão social, porém sem a parte final (Ltda., S.A.).
-
Bases de dados de licitações, contratos e execução orçamentária do Estado do Espírito Santo