A partir das teorias, os alunos deverão desenvolver uma aplicação do tipo buscador, onde irão criar um Crawler para recuperar os documentos (HTML, PDF, CSV, TXT, etc) de um assunto escolhido para montar sua coleção. Em seguida deverão modelar (o vocabulário, a matriz de termos por documentos, realizar a limpeza se necessário, aplicar a ponderação TF-IDF), indexar os documentos para melhorar a recuperação. Por fim, criar uma interface com o usuário que seja amigável (Prompt, Web, App, Desktop) para a busca através dos termos de pesquisa informados pelo usuário.
O trabalho deverá ser postado no GitHub por completo, além de enviar uma cópia aqui. Não é necessário postar a coleção criada.
Trabalho elaborado pelos alunos Júlio Scopel e Iúri Brandão, publicado em 24 de julho de 2020.