Semi Supervised Learning

Demonstrate how adding unlabeled data to a supervised problem can improve out-of-sample accuracy.

This repo provides an example of this accuracy improvement through a loss function := labeled_loss + unlabeled_loss which is optimized using expectation-maximization (EM).

Follows Nigam et al 2006 from "Semi-Supervised Learning", Chapelle et al.

Running experiments

Create virtual env

python -m venv venv4ssl

Activate virtual env

Windows/Anaconda: venv4ssl/Script/activate

Powershell notes:

you may need to Powershell as administrator
\venv4ssl\Scripts\Activate.ps1

macos/Linux: source venv4ssl/bin/activate

Linux notes: installing matplotlib may require headers like ft2build.h

Install requirements

python -m pip install --upgrade pip
pip install -r requirements.txt

nltk_data note:

Handled by specifying nltk data dir in run_experiments_main

run experiments with varying num of labeled samples:

python src/run_experiments_main.py 
--n_labeled 20,100,300,500,700,1000 
--n_unlabeled 10000 
--max_iters 5 
--out_dir <your_output_dir> 
--nltk_data_dir <optional: local nltk data dir> 
--test_acc_plot_fname test_acc.png

Name		Name	Last commit message	Last commit date
Latest commit History 119 Commits
src		src
.gitignore		.gitignore
README.md		README.md
__init__.py		__init__.py
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Semi Supervised Learning

Running experiments

Create virtual env

Activate virtual env

Install requirements

nltk_data note:

run experiments with varying num of labeled samples:

About

Releases

Packages

Contributors 3

Languages

ibarrien/SemiSupervisedLearning

Folders and files

Latest commit

History

Repository files navigation

Semi Supervised Learning

Running experiments

Create virtual env

Activate virtual env

Install requirements

nltk_data note:

run experiments with varying num of labeled samples:

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages