Iniciativa agiliza e padroniza o tratamento de dados disponíveis na página de pesquisa de jurisprudência do Tribunal
O Supremo Tribunal Federal passou a contar, esta semana, com uma nova ferramenta de trabalho, que extrai automaticamente a legislação citada em acórdãos e decisões monocráticas. A iniciativa integra um projeto mais amplo de modernização da página de pesquisa de jurisprudência do STF e de otimização do tratamento de dados, conduzido pela Secretaria de Tecnologia da Informação (STI) e pela Secretaria de Gestão de Precedentes (SPR) do Tribunal.
Catalogação de legislação
A busca por legislação é uma das principais funcionalidades da página de jurisprudência do portal do STF. Por meio desse recurso, os usuários informam um ato normativo de interesse e, em resposta, recuperam todos os acórdãos e todas as decisões monocráticas que o mencionam.
Para viabilizar esse tipo de busca, a Coordenadoria de Jurisprudência do STF analisa, diariamente, centenas de decisões. Cada norma (constituições, leis, decretos, portarias, tratados, projetos de lei, regimentos internos etc.) e cada elemento (artigos, incisos, alíneas, parágrafos etc.) referenciados nos textos são registrados, de forma organizada, no banco de jurisprudência. O novo sistema auxilia exatamente nessa tarefa, com uso de inteligência artificial.
Funcionamento do sistema
De início, a ferramenta percorre a íntegra dos documentos para reconhecer os dispositivos legais citados. Em seguida, o sistema detecta as relações de hierarquia entre diferentes elementos e os correlaciona às respectivas normas. Por fim, o programa adapta as informações aos padrões do banco de jurisprudência e apresenta os dados à equipe responsável, que os valida por meio de uma nova interface, construída com foco na simplificação do processo de edição.
A ferramenta é capaz de identificar variações de grafia (artigo, art. ou ART.; parágrafo, par. ou §) e de ordenação e reconhecer apelidos de normas (Lei de Droga, por exemplo).
Tecnologia
O sistema foi desenvolvido, de forma customizada, pela STI, em parceria com a empresa Digesto Pesquisa e Banco de Dados S.A., e está sendo utilizado diariamente por cerca de 30 usuários internos da área de jurisprudência.
A legislação é extraída por um modelo de reconhecimento de entidades nomeadas (named-entity recognition – NER), que emprega redes neurais (neural networks) e foi treinado em uma coleção de 20 mil acórdãos cujas normas já haviam sido previamente catalogadas pela Coordenadoria de Jurisprudência. Em complemento a esse modelo e para apoiar o sistema, a empresa contratada também construiu um dicionário de apelidos de normas e estruturou um conjunto de regras destinadas a identificar as relações de hierarquia dos elementos com as normas correspondentes e dos elementos entre si.
Projeto “Ferramentas de Indexação e Pesquisa de Jurisprudência”
O desenvolvimento do extrator de legislação é uma das etapas do projeto “Ferramentas de Indexação e Pesquisa de Jurisprudência”. Além da nova página de pesquisa disponível no portal do STF, lançada em maio de 2020, essa iniciativa já resultou na construção de um sistema de extração automática de precedentes citados e de um programa de comparação de acórdãos e decisões monocráticas.
“O projeto, como um todo, foi planejado para substituir sistemas antigos por ferramentas mais modernas, adaptáveis e que pudessem acompanhar a evolução dos mecanismos de indexação e de busca de informações mundo afora”, explica o coordenador de Soluções Corporativas, Júlio César Gomides. Segundo ele, a iniciativa facilita o cotidiano dos usuários externos, por meio de uma pesquisa de jurisprudência simples e eficiente, e dos usuários dos sistemas internos, que passam a ter o apoio de soluções inteligentes que reduzem o tempo de análise. “Dessa forma, atividades repetitivas e essencialmente operacionais são delegadas aos algoritmos de inteligência artificial, que deixam com os analistas e técnicos atividades mais complexas”.
Catalogação de precedentes
Outro empreendimento foi a construção de um programa para identificar os precedentes citados pelos ministros em seus votos, em funcionamento desde agosto de 2020.
A aplicação reconhece acórdãos, decisões monocráticas e volumes da Revista Trimestral de Jurisprudência (RTJ) mencionados nos textos e, em seguida, valida essas informações nas próprias bases de dados do Tribunal. Para tanto, foi construída uma gramática específica, que combina expressões regulares, a fim de detectar os julgados referenciados pelos ministros.
Comparação de documentos
Já na terceira fase do projeto, concluída em fevereiro de 2021, criou-se uma ferramenta de comparação para aferir a similaridade entre documentos. O sistema foi concebido para auxiliar a atividade de agrupamento de acórdãos e decisões monocráticas no mesmo sentido, tradicionalmente realizada pela equipe da Coordenadoria de Jurisprudência com o objetivo de evitar repetições excessivas na base de dados.
Antigamente, para cada decisão publicada, a equipe realizava manualmente uma busca específica, à procura de documentos semelhantes que pudessem ser reunidos. Agora, essa atividade é executada automaticamente pelo programa, que compara, parágrafo a parágrafo, os documentos do banco de jurisprudência e sinaliza à equipe responsável a existência de acórdãos ou decisões monocráticas semelhantes, com a indicação do grau de similaridade entre eles.
Essa ferramenta se apoia em um modelo pré-treinado de text embedding, que, a partir de redes neurais, gera uma representação vetorial dos parágrafos dos documentos e, assim, permite quantificar a semelhança entre os textos.
Corte Digital
As iniciativas de automatização de atividades da Coordenadoria de Jurisprudência do STF incorporam ao dia a dia da unidade técnicas modernas de processamento de linguagem natural (PLN) e, dessa forma, representam um importante passo rumo à integração entre inteligência artificial e inteligência humana, diretriz da gestão do ministro Luiz Fux.
“Essas ferramentas são muito importantes para o trabalho desenvolvido na Coordenadoria de Jurisprudência, porque trazem maior agilidade e favorecem a padronização no tratamento dos dados”, afirma Aline Dourado, coordenadora do setor. “Tudo isso colabora para termos uma pesquisa de jurisprudência ainda mais eficiente”.