Fine-grained Visual Recognition with Side Information

Overview

This repository contains supplementary material to my Master's thesis - Fine-grained Visual Recognition with Side Information.

The thesis presents a method for fine-grained visual snake and fungi species recognition with side information. The proposed method is based on state-of-the-art deep neural networks for classification: Convolutional Neural Networks and Vision Transformers. The performance improvements are achieved by:

adopting loss functions proposed to address the class imbalance;
adjusting predictions by prior probabilities of side information like location and time of observation;
applying a weakly supervised method to localize snakes and fungi in images and crop the images based on the detected regions to enrich the training data.

Content

Cleaned SnakeCLEF Data

SnakeCLEF Additional Data

Detected Bounding Boxes using Saliency-based localization method

SnakeCLEF dataset
Danish Fungi dataset - DF20 and DF20M

Python Scripts and Jupyter Notebooks

Training and testing on the snake species recognition task:
- Training script
- Testing script
- Training Notebook
- Testing Notebook
- Training script on cropped images created using saliency-based localization method
Training and testing on the fungi species recognition task:
- Training script
- Testing script
- Training Notebook
- Testing Notebook
- Training script on cropped images created using saliency-based localization method
Data Preparation - notebooks for preparation, exploration, and cleaning of the SnakeCLEF and Danish Fungi datasets.
Side Information - notebooks for metadata inclusion. On the SnakeCLEF dataset, the method drops the predictions of the species not occurring in the country of the given image. For fungi species recognition, the method calibrates and adjusts the predictions by the prior probabilities of side information like habitat, substrate, location, and time of observation.
Informed Augmentation - notebooks for applying a weakly supervised saliency-based method to localize snakes and fungi in images.
Venomous/Non-venomous Snake Classification - example of using the proposed method to decide on medical response to snake bites.
Training Results

Getting Started

Datasets

The snake and fungi datasets, used in this thesis, are publicly available at:

Package Dependencies

The proposed method wes developed using Python=3.8 with PyTorch=1.7.1 machine learning framework. The pre-trained CNN networks were used from PyTorch Image Models library timm=0.4.12, and the pre-trained Vision Transformers were used from Hugging Face Trasformers library transformers=4.12.3. Additionally, the repository requires packages: numpy, pandas, scikit-learn, matplotlib and seaborn.

To install required packages with PyTorch for CPU run:

pip install -r requirements.txt

For PyTorch with GPU run:

pip install -r requirements_gpu.txt

The requirement files do not contain jupyterlab nor any other IDE. To install jupyterlab run

pip install jupyterlab

Authors

Rail Chamidullin - chamidullinr@gmail.com - Github account

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
01_data_preparation		01_data_preparation
02_side_information		02_side_information
03_informed_augmentation		03_informed_augmentation
04_venomous_classification		04_venomous_classification
data		data
experiment_results		experiment_results
figures		figures
rci_scripts		rci_scripts
src		src
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt
requirements_gpu.txt		requirements_gpu.txt
test_fungi.ipynb		test_fungi.ipynb
test_fungi.py		test_fungi.py
test_fungi.sh		test_fungi.sh
test_snake.ipynb		test_snake.ipynb
test_snake.py		test_snake.py
test_snake.sh		test_snake.sh
train_fungi.ipynb		train_fungi.ipynb
train_fungi.py		train_fungi.py
train_fungi_crop.py		train_fungi_crop.py
train_snake.ipynb		train_snake.ipynb
train_snake.py		train_snake.py
train_snake_crop.py		train_snake_crop.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Fine-grained Visual Recognition with Side Information

Overview

Content

Cleaned SnakeCLEF Data

SnakeCLEF Additional Data

Detected Bounding Boxes using Saliency-based localization method

Python Scripts and Jupyter Notebooks

Getting Started

Datasets

Package Dependencies

Authors

About

Releases

Packages

Languages

chamidullinr/fine-grained-visual-recognition

Folders and files

Latest commit

History

Repository files navigation

Fine-grained Visual Recognition with Side Information

Overview

Content

Cleaned SnakeCLEF Data

SnakeCLEF Additional Data

Detected Bounding Boxes using Saliency-based localization method

Python Scripts and Jupyter Notebooks

Getting Started

Datasets

Package Dependencies

Authors

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages