STF后发现模型的基础能力丢失 #5733

babybboy · 2024-10-17T08:33:41Z

babybboy
Oct 17, 2024

Reminder

I have read the README and searched the existing issues.

System Info

用一波客服的对话数据做SFT(Qwen2.5-0.5B-Instruct)，LoRA微调后(默认参数，最终loss=2.0)，发现模型的一部分基础能力没了(比如system prompt: 用英文回答所有问题，实际回复还是中文，base模型没问题的)，而换一个对话数据集就没事，确认可能是数据集有问题，但目测都是很正常的对话，完全看不出区别。有人遇到过类似问题么？

Reproduction

Expected behavior

No response

Others

No response

Coding-Zuo · 2024-10-22T03:34:36Z

Coding-Zuo
Oct 22, 2024

+1 SFT qwen2.5后发现 system prompt的灵活感知能力没有了。qwen2没有这种情况

2 replies

njzfw1024 Nov 6, 2024

同样的问题

babybboy Nov 11, 2024
Author

也就是说，这是qwen2.5的问题？
我当时更换数据集后测试没问题，但那个数据集比较小，是个测试的demo
我去试试其他LLM，确认下是数据集的问题，还是模型的问题

babybboy · 2024-11-14T03:26:42Z

babybboy
Nov 14, 2024
Author

确认是模型问题，不是 llama-factory 的坑
同样数据，换了 Gemma2 就没问题了

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

STF后发现模型的基础能力丢失 #5733

{{title}}

Replies: 2 comments 2 replies

{{title}}

{{title}}

{{title}}

{{title}}

Select a reply

STF后发现模型的基础能力丢失 #5733

babybboy Oct 17, 2024

Reminder

System Info

Reproduction

Expected behavior

Others

Replies: 2 comments · 2 replies

Coding-Zuo Oct 22, 2024

njzfw1024 Nov 6, 2024

babybboy Nov 11, 2024 Author

babybboy Nov 14, 2024 Author

babybboy
Oct 17, 2024

Replies: 2 comments 2 replies

Coding-Zuo
Oct 22, 2024

babybboy Nov 11, 2024
Author

babybboy
Nov 14, 2024
Author