Skip to content

3.2 Metodologia

andrezaleite edited this page Oct 21, 2020 · 4 revisions

DICCA + Índice Qualidados CNJ


Por meio da utilização do modelo DICCA (dado, informação, conhecimento, comunicação e ação) junto ao Modelo de Qualidade dos Dados é possível identificar os principais problemas sobre a qualidade dos dados de forma regionalizada.

Com o objetivo de caracterizar e medir a qualidade da base DataJud, foi construído o índice de qualidade (Qualidados CNJ). O Qualidados CNJ foi formado pela integração de valores de indicadores que expressam diferentes dimensões da qualidade dos dados e seguiram as etapas metodológicas previstas para a construção de um índice, expostas na figura abaixo (NERI e MOTA, 2016):

qualidados-cnj


Indicadores de Qualidade


Completude

  • Grau em que os registros de um Sistema de Informação possuem valores não nulos.
    • Exemplo: Proporção de processos com o campo "classe" em branco.
Como este indicador foi calculado

Para calcular o índice de completude foram utilizados dois campos relacionados ao processo, o campo dadosBasicos.competencia e o campo dadosBasicos.dscSistema. Veja a descrição de cada um extraída do glossário de dados do DataJud:

dadosBasicos.competencia: identificador da competência a que pertence o processo, ou da competência a que ele se destina caso se trate de processo inicial; dadosBasicos.dscSistema: identifica qual o sistema eletrônico que o processo tramita. São valores possíveis: 1 – Pje, 2 – Projudi, 3 – SAJ, 4 – EPROC, 5 – Apolo, 6 – Themis, 7 – Libra, 8 – Outros;

Caso um processo seja armazenado no sistema sem uma dessas duas informações, ele é contado como um processo com informação ausente. Para calcular esse índice utilizamos a contagem de processos sem informações ausentes dividido pelo total de processos com informação ausente.

Para calcular esse índice utilizamos a contagem de processos sem informações ausentes dividido pelo total de processos.

Consistência

  • Grau em que variáveis relacionadas possuem valores coerentes e não contraditórios.
    • Exemplo: Classe de processo civil com "crime contra a vida" no assunto, ou, com menos de 20 dígitos.
Como este indicador foi calculado

Para calcular o índice de consistência foram averiguadas duas variáveis: dadosBasicos.numero e movimento, onde através da última pode-se extrair a quantidade de movimentos de desarquivamentos e arquivamentos.

dadosBasicos.numero: numeração única do processo conforme determinado pela Resolução CNJ nº 65 de 16/12/2008; movimento: (Lista de movimentações processuais - relação com sgt_movimentos.csv).

Caso um processo não possua seu número de acordo com o padrão do conselho nacional de justiça, Resolução CNJ nº 65 de 16 de dezembro de 2008, ele é considerado um processo ‘inconsistente’.

Resolução Nº 65 de 16 de dezembro de 2008 - Dispõe sobre a uniformização do número dos processos nos órgãos do Poder Judiciário.

Caso um processo possua mais movimentos de desarquivamentos que de arquivamento, ele será considerado um processo ‘inconsistente’.

Para chegarmos no cálculo do índice foi realizada a razão entre os processos marcados como consistentes pelo número total de processos.

Não Duplicidade

  • Grau em que, no conjunto de registros, cada evento do universo de abrangência do Sistema de Informação é representado uma única vez.
Como este indicador foi calculado

Para calcular o índice de não duplicidade foram averiguados quantos processos possuem registros de movimentos duplicados dentro da base de informações, onde um mesmo processo está relacionado a dois movimentos do mesmo tipo que foram realizados na mesma data e horário. Na imagem abaixo é possível averiguar que os dois movimentos são do mesmo tipo (código nacional) e foram feitos no mesmo horário (dataHora).

Para chegarmos no cálculo do índice foi realizada a razão entre os processos marcados como duplicados e o total de processos:

  • ( Qtd Processos Duplicados / Total Processos ) = Índice de não duplicidade

Índice de não duplicidade - observações:

  • Movimentos sem a informação de horário (apenas dia) não foram considerados no cálculo;
  • Movimentos do tipo 11010 - Mero Expediente não foram considerados por ser uma movimentação muito comum.

Cobertura

  • Grau em que estão registrados no Sistema de Informação os eventos do universo (escopo) para o qual foi desenvolvido.
    • Exemplo: Número esperado e real de processos.
Como este indicador foi calculado

Para calcular este índice utilizamos a quantidade de processos recebidos pelo CNJ em 2020 dividido pela quantidade estimada de processos e multiplicamos por 100.

A ideia desse indicador é utilizar um cálculo de regressão que se baseia na quantidade de processos gerados por cada tribunal nos anos de 2017, 2018 e 2019, para estimar a quantidade de processos esperados para 2020.

Devido aos ‘furos’ na base (a maioria dos tribunais não possuem informação em todos meses dos últimos 3 anos) não foi possível realizar esse cálculo, então foi gerado um número aleatório para ser a quantidade de processos ‘estimados’ para 2020 de cada tribunal.

O cálculo do índice de cobertura é dado pela quantidade de processos recebidos pelo CNJ em 2020 dividido pela quantidade estimada de processos.

Índice Geral - Qualidados

Como este índice foi calculado

O índice foi calculado pela agregação dos valores obtidos para as dimensões de qualidade, utilizando a média aritmética simples.

O modelo DICCA unido ao Qualidados e aplicado ao processo de produção e aplicação da informação no CNJ pode contribuir para demonstrar que uma informação de baixa qualidade pode levar, dentre outras coisas, à impossibilidade de uso de outras tecnologias que reduzam o tempo de julgamento processual, que em alguns casos, tem custado a vida de pessoas que dependem de um julgamento célere.

A metodologia está alinhada ainda com as diretrizes da ecologia da informação (DAVENPORT, 1998), que enfatiza a perspectiva holística do ambiente da informação, onde a pessoa é o elemento central no processo de produção da informação, com cerne na maneira como as pessoas criam, distribuem, compreendem e usam a informação (MOTA e ALAZRAQUI, 2014). Notadamente a sistemática de construção desse trabalho está diretamente ligada à ecologia dos saberes (Santos, 2009), onde é promovido um diálogo entre vários saberes que podem ser considerados úteis para o avanço da ciência.