Workaround for OOM during loading llama-405 #396

afierka-intel · 2024-10-16T14:24:02Z

Repeating missing code

michalkuligowski

Please add copyright at the top as in https://github.com/HabanaAI/vllm-fork/blob/habana_main/LICENSE#L178

Repeating missing code

Fix Llama-405 OOM in load_weights function

e1097e1

afierka-intel self-assigned this Oct 16, 2024

afierka-intel added bug Something isn't working habana Issues or PRs submitted by Habana Labs labels Oct 16, 2024

michalkuligowski requested changes Oct 16, 2024

View reviewed changes

Add licence

93566bd

afierka-intel requested a review from michalkuligowski October 16, 2024 15:37

michalkuligowski approved these changes Oct 16, 2024

View reviewed changes

afierka-intel merged commit 07c98a5 into habana_main Oct 18, 2024
19 checks passed

afierka-intel deleted the dev/afierka/fix-llama-405-oom branch October 18, 2024 07:13

xuechendi pushed a commit to xuechendi/vllm-fork that referenced this pull request Oct 23, 2024

Workaround for OOM during loading llama-405 (HabanaAI#396)

32ec8f4

Repeating missing code

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Workaround for OOM during loading llama-405 #396

Workaround for OOM during loading llama-405 #396

afierka-intel commented Oct 16, 2024

michalkuligowski left a comment

Workaround for OOM during loading llama-405 #396

Workaround for OOM during loading llama-405 #396

Conversation

afierka-intel commented Oct 16, 2024

michalkuligowski left a comment

Choose a reason for hiding this comment