Growing parameter capacity as training progress #1539

emailweixu · 2023-09-21T19:11:13Z

This is done through Optimizer. Two arguments are added for optimizer:

capacity_ratio: scheduler for controlling the number of training elements of a parameter.
min_capacity: minimal number elements of each parameter being traing

To dynamically change capacity, we assign a random number for each element of the parameter. An element is turned on if its assigned random number is less than capacity_ratio. To save memory, we don't store the random numbers. Instead, we save the random number generator state.

This is done through Optimizer. Two arguments are added for optimizer: capacity_ratio: scheduler for controlling the number of training elements of a parameter. min_capacity: minimal number elements of each parameter being traing To dynamically change capacity, we assign a random number for each element of the parameter. An element is turned on if its assigned random number is less than capacity_ratio. To save memory, we don't store the random numbers. Instead, we save the random number generator state.

emailweixu requested a review from Haichao-Zhang September 21, 2023 19:11

Haichao-Zhang approved these changes Sep 21, 2023

View reviewed changes

emailweixu merged commit 61f1565 into pytorch Sep 22, 2023
2 checks passed

emailweixu deleted the PR_dynamic_capacity branch September 22, 2023 01:00

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Growing parameter capacity as training progress #1539

Growing parameter capacity as training progress #1539

emailweixu commented Sep 21, 2023

Growing parameter capacity as training progress #1539

Growing parameter capacity as training progress #1539

Conversation

emailweixu commented Sep 21, 2023