Image-Captioning

Image Captioning is the task of translating an input image into a textual description. As such, it connects Vision and Language in a generative fashion, with applications that range from multi-modal search engines to help visually impaired people.

Dataset used : https://www.kaggle.com/datasets/adityajn105/flickr8k

Data split : Training data = 6000 Images, Testing data = 1000 Images, Validation data = 1000 Images

Model Architechture

Model Weight losses

Based on this, model_19 was used for making predictions

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
Encoded Images		Encoded Images
Model_weights		Model_weights
Train Test Split		Train Test Split
Vocab Dictionaries		Vocab Dictionaries
Data Collection and Pre-Processing.ipynb		Data Collection and Pre-Processing.ipynb
Model Architechture and Training.ipynb		Model Architechture and Training.ipynb
Predictions.py		Predictions.py
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Image-Captioning

Model Architechture

Model Weight losses

Predictions

About

Releases

Packages

Languages

vansh-py04/Image-Captioning

Folders and files

Latest commit

History

Repository files navigation

Image-Captioning

Model Architechture

Model Weight losses

Predictions

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages