Fala Camarada

Reunindo tudo o que se fala na Câmara dos Deputados.

Acesso aos dados

Os dados extraídos através do Fala Camara estão disponíveis para download aqui.

Como executar

🔻 Esse tutorial assume que você possui a linguagem Python 3.0+ instalada em sua máquina, bem como as bibliotecas Scrapy, Beautiful Soup e Pandas.

Inicialmente, clone esse repositório.

$ git clone https://github.com/alvesmatheus/fala-camarada.git

Acesse o diretório do repositório clonado.

$ cd fala-camarada

A seguir, antes de obter os discursos das comissões da Câmara dos Deputados, você precisará extrair a agenda de eventos destas comissões. Para isso, execute o comando a seguir.

$ scrapy crawl coletor-eventos-comissoes -o data/raw/agenda_comissoes.csv

Com a agenda de eventos das comissões já extraída, substitua a variável ano no comando abaixo por um valor entre 1995 e 2021 (inclusos) e execute-o. Os dados extraídos estarão disponíveis no diretório fala-camarada/data/raw/.

❗ Alterações no código-fonte podem ser necessárias para extração de discursos de outros anos.

$ scrapy crawl coletor-discursos-comissoes -o data/raw/discursos_comissoes_<ano>.csv -a year=<ano>

[Opcional] Quando a extração dos discursos de comissões for concluída para todos os anos de seu interesse, execute o script de limpeza de dados disponibilizado. Os dados produzidos estarão disponíveis no diretório fala-camarada/data/ready/.

$ python scripts/clean_data.py

[Opcional] O script run-collectors.sh pode ser utilizado para executar, sequencialmente, todos os coletores referentes ao período supracitado e, em seguida, a limpeza dos dados extraídos.

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
collectors		collectors
data		data
scripts		scripts
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
run-collectors.sh		run-collectors.sh
scrapy.cfg		scrapy.cfg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Fala Camarada

Acesso aos dados

Como executar

❗ Alterações no código-fonte podem ser necessárias para extração de discursos de outros anos.

About

Releases

Packages

Languages

License

alvesmatheus/fala-camarada

Folders and files

Latest commit

History

Repository files navigation

Fala Camarada

Acesso aos dados

Como executar

❗ Alterações no código-fonte podem ser necessárias para extração de discursos de outros anos.

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages