Skip to content

BELLEv0.9发布

Compare
Choose a tag to compare
@tjadamlee tjadamlee released this 03 Apr 16:41
· 441 commits to main since this release
0b354e5

发布了如下内容
训练代码v0.1:尽可能简化的一个训练代码实现,支持finetune,lora,deepspeed
数据开放:参考Stanford Alpaca生成的中文数据集1.5M
测试方法:一个1k+的测试集合,和对应打分prompt。包含多个类别,采用GPT-4或者ChatGPT打分
模型开放:基于BLOOMZ训练调优后的模型
量化方案:参考gptq的实现,对本项目中相关模型进行了量化