Releases · lucidrains/PaLM-rlhf-pytorch

11 Jan 04:16

0.0.53

9eb47db

0.0.53

add first pass of palm encoder decoder

Assets 2

10 Jan 22:25

lucidrains

0.0.52

cd714f7

0.0.52

some reorganization, to ready for encoder / decoder

Assets 2

10 Jan 22:24

lucidrains

0.0.51

124b93d

0.0.51

some reorganization, to ready for encoder / decoder

Assets 2

10 Jan 22:16

lucidrains

0.0.50

04f4b15

0.0.50

some reorganization, to ready for encoder / decoder

Assets 2

08 Jan 18:13

lucidrains

0.0.48

6e1baf6

0.0.48

fix masking logic when using palm as encoder

Assets 2

07 Jan 03:08

lucidrains

0.0.47

4cac0e6

0.0.47

make sure key padding mask is in effect if training reward model as e…

Assets 2

07 Jan 01:49

lucidrains

0.0.46

4fd9455

0.0.46

turn off xpos if using palm as encoder

Assets 2

03 Jan 08:53

lucidrains

0.0.45

a0b9774

0.0.45

fix pooled critic values during generation, thanks to @Nightbringers

Assets 2

29 Dec 19:41

lucidrains

0.0.44

0e45bac

0.0.44

able to override lora R value when adding a new finetuning scope

Assets 2

29 Dec 19:37

lucidrains

0.0.43

6126cde

0.0.43

make sure xpos scale base value is customizable from palm init

Assets 2

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Releases: lucidrains/PaLM-rlhf-pytorch

0.0.53

0.0.52

0.0.51

0.0.50

0.0.48

0.0.47

0.0.46

0.0.45

0.0.44

0.0.43