GitHub - kvignesh1420/single-index-ht: Heavy-tailed ESD without gradient noise

Crafting Heavy-Tails in Weight Matrix Spectrum without Gradient Noise

This repository explores various methods to generate heavy tails in the weight matrix spectrum of neural networks without the influence of gradient noise. We specifically train shallow neural networks using full-batch Gradient Descent (GD) or Adam optimizer with large learning rates over multiple steps.

Setup

To get started, set up your virtual environment and install the required dependencies:

$ python3.9 -m venv .venv
$ source .venv/bin/activate
$ pip install -r requirements.txt

Experiments

Single Configuration Runs

Investigate the properties of weights, features, overlap matrices, and more for a single configuration:

(.venv) $ python main.py configs/main.yml

To run with a learning rate schedule:

(.venv) $ python main.py configs/main_lr_schedule.yml

Varying Learning Rates for GD/Adam

Conduct experiments with multiple runs to plot losses, Kernel Target Alignment (KTA), and Power Law (PL) Alphas for different learning rates and optimizers:

(.venv) $ python bulk_lr.py configs/bulk_lr.yml

Losses with Varying Parameters

Perform experiments with multiple runs to plot the losses for different parameter settings:

Varying Dataset Size: `n`

(.venv) $ python bulk_losses.py configs/bulk_losses_vary_n.yml

Varying Regularization Parameter for Regression: `reg_lambda`

(.venv) $ python bulk_losses.py configs/bulk_losses_vary_reg_lambda.yml

Varying Label Noise: `label_noise_std`

(.venv) $ python bulk_losses.py configs/bulk_losses_vary_label_noise_std.yml

Varying Decay Factor of `StepLR` Learning Rate Schedule: `gamma`

(.venv) $ python bulk_losses.py configs/bulk_losses_vary_step_lr_gamma.yml

Output

The outputs of the experiments are stored in the out/ directory, named according to a hash value based on the experiment context.

Citation

@misc{kothapalli2024crafting,
      title={Crafting Heavy-Tails in Weight Matrix Spectrum without Gradient Noise}, 
      author={Vignesh Kothapalli and Tianyu Pang and Shenyang Deng and Zongmin Liu and Yaoqing Yang},
      year={2024},
      eprint={2406.04657},
      archivePrefix={arXiv},
}

Name		Name	Last commit message	Last commit date
Latest commit History 54 Commits
configs		configs
src		src
.gitignore		.gitignore
README.md		README.md
bulk_losses.py		bulk_losses.py
bulk_lr.py		bulk_lr.py
main.py		main.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Crafting Heavy-Tails in Weight Matrix Spectrum without Gradient Noise

Setup

Experiments

Single Configuration Runs

Varying Learning Rates for GD/Adam

Losses with Varying Parameters

Varying Dataset Size: `n`

Varying Regularization Parameter for Regression: `reg_lambda`

Varying Label Noise: `label_noise_std`

Varying Decay Factor of `StepLR` Learning Rate Schedule: `gamma`

Output

Citation

About

Releases

Packages

Contributors 3

Languages

kvignesh1420/single-index-ht

Folders and files

Latest commit

History

Repository files navigation

Crafting Heavy-Tails in Weight Matrix Spectrum without Gradient Noise

Setup

Experiments

Single Configuration Runs

Varying Learning Rates for GD/Adam

Losses with Varying Parameters

Varying Dataset Size: n

Varying Regularization Parameter for Regression: reg_lambda

Varying Label Noise: label_noise_std

Varying Decay Factor of StepLR Learning Rate Schedule: gamma

Output

Citation

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Varying Dataset Size: `n`

Varying Regularization Parameter for Regression: `reg_lambda`

Varying Label Noise: `label_noise_std`

Varying Decay Factor of `StepLR` Learning Rate Schedule: `gamma`

Packages