-
Notifications
You must be signed in to change notification settings - Fork 0
3.2 Metodologia
Por meio da utilização do modelo DICCA (dado, informação, conhecimento, comunicação e ação) junto ao Modelo de Qualidade dos Dados é possível identificar os principais problemas sobre a qualidade dos dados de forma regionalizada.
Com o objetivo de caracterizar e medir a qualidade da base DataJud, foi construído o índice de qualidade (Qualidados CNJ). O Qualidados CNJ foi formado pela integração de valores de indicadores que expressam diferentes dimensões da qualidade dos dados e seguiram as etapas metodológicas previstas para a construção de um índice, expostas na figura abaixo (NERI e MOTA, 2016):
- Grau em que os registros de um Sistema de Informação possuem valores não nulos.
- Exemplo: Proporção de processos com o campo "classe" em branco.
Para calcular o índice de completude foram utilizados dois campos relacionados ao processo, o campo dadosBasicos.competencia
e o campo dadosBasicos.dscSistema
. Veja a descrição de cada um extraída do glossário de dados do DataJud:
dadosBasicos.competencia: identificador da competência a que pertence o processo, ou da competência a que ele se destina caso se trate de processo inicial; dadosBasicos.dscSistema: identifica qual o sistema eletrônico que o processo tramita. São valores possíveis: 1 – Pje, 2 – Projudi, 3 – SAJ, 4 – EPROC, 5 – Apolo, 6 – Themis, 7 – Libra, 8 – Outros;
Caso um processo seja armazenado no sistema sem uma dessas duas informações, ele é contado como um processo com informação ausente. Para calcular esse índice utilizamos a contagem de processos sem informações ausentes dividido pelo total de processos com informação ausente.
Para calcular esse índice utilizamos a contagem de processos sem informações ausentes dividido pelo total de processos.
- Grau em que variáveis relacionadas possuem valores coerentes e não contraditórios.
- Exemplo: Classe de processo civil com "crime contra a vida" no assunto, ou, com menos de 20 dígitos.
Para calcular o índice de consistência foram averiguadas duas variáveis: dadosBasicos.numero
e movimento
, onde através da última pode-se extrair a quantidade de movimentos de desarquivamentos e arquivamentos.
dadosBasicos.numero: numeração única do processo conforme determinado pela Resolução CNJ nº 65 de 16/12/2008; movimento: (Lista de movimentações processuais - relação com sgt_movimentos.csv).
Caso um processo não possua seu número de acordo com o padrão do conselho nacional de justiça, Resolução CNJ nº 65 de 16 de dezembro de 2008, ele é considerado um processo ‘inconsistente’.
Caso um processo possua mais movimentos de desarquivamentos que de arquivamento, ele será considerado um processo ‘inconsistente’.
Para chegarmos no cálculo do índice foi realizada a razão entre os processos marcados como consistentes pelo número total de processos.
- Grau em que, no conjunto de registros, cada evento do universo de abrangência do Sistema de Informação é representado uma única vez.
Para calcular o índice de não duplicidade foram averiguados quantos processos possuem registros de movimentos duplicados dentro da base de informações, onde um mesmo processo está relacionado a dois movimentos do mesmo tipo que foram realizados na mesma data e horário. Na imagem abaixo é possível averiguar que os dois movimentos são do mesmo tipo (código nacional) e foram feitos no mesmo horário (dataHora).
Para chegarmos no cálculo do índice foi realizada a razão entre os processos marcados como duplicados e o total de processos:
( Qtd Processos Duplicados / Total Processos ) = Índice de não duplicidade
Índice de não duplicidade - observações:
- Movimentos sem a informação de horário (apenas dia) não foram considerados no cálculo;
- Movimentos do tipo
11010
- Mero Expediente não foram considerados por ser uma movimentação muito comum.
- Grau em que estão registrados no Sistema de Informação os eventos do universo (escopo) para o qual foi desenvolvido.
- Exemplo: Número esperado e real de processos.
Para calcular este índice utilizamos a quantidade de processos recebidos pelo CNJ em 2020 dividido pela quantidade estimada de processos e multiplicamos por 100.
A ideia desse indicador é utilizar um cálculo de regressão que se baseia na quantidade de processos gerados por cada tribunal nos anos de 2017, 2018 e 2019, para estimar a quantidade de processos esperados para 2020.
Devido aos ‘furos’ na base (a maioria dos tribunais não possuem informação em todos meses dos últimos 3 anos) não foi possível realizar esse cálculo, então foi gerado um número aleatório para ser a quantidade de processos ‘estimados’ para 2020 de cada tribunal.
O cálculo do índice de cobertura é dado pela quantidade de processos recebidos pelo CNJ em 2020 dividido pela quantidade estimada de processos.
O índice foi calculado pela agregação dos valores obtidos para as dimensões de qualidade, utilizando a média aritmética simples.
O modelo DICCA unido ao Qualidados e aplicado ao processo de produção e aplicação da informação no CNJ pode contribuir para demonstrar que uma informação de baixa qualidade pode levar, dentre outras coisas, à impossibilidade de uso de outras tecnologias que reduzam o tempo de julgamento processual, que em alguns casos, tem custado a vida de pessoas que dependem de um julgamento célere.
A metodologia está alinhada ainda com as diretrizes da ecologia da informação (DAVENPORT, 1998), que enfatiza a perspectiva holística do ambiente da informação, onde a pessoa é o elemento central no processo de produção da informação, com cerne na maneira como as pessoas criam, distribuem, compreendem e usam a informação (MOTA e ALAZRAQUI, 2014). Notadamente a sistemática de construção desse trabalho está diretamente ligada à ecologia dos saberes (Santos, 2009), onde é promovido um diálogo entre vários saberes que podem ser considerados úteis para o avanço da ciência.