Llama adapter modules base classes

adapter-hub · Jan 5, 2024 · a96a49f · a96a49f
1 parent 767e868
commit a96a49f
Showing 1 changed file with 3 additions and 3 deletions.
diff --git a/src/adapters/models/llama/modeling_llama.py b/src/adapters/models/llama/modeling_llama.py
@@ -33,7 +33,7 @@
     match_attn_matrices_for_parallel,
 )
 from transformers.cache_utils import Cache
-from transformers.models.llama.modeling_llama import apply_rotary_pos_emb, repeat_kv
+from transformers.models.llama.modeling_llama import LlamaAttention, LlamaDecoderLayer, apply_rotary_pos_emb, repeat_kv
 from transformers.utils import logging
 
 from .mixin_llama import LlamaAttentionMixin, LlamaDecoderLayerMixin
@@ -42,7 +42,7 @@
 logger = logging.get_logger(__name__)
 
 
-class LlamaAttentionWithAdapters(nn.Module, LlamaAttentionMixin):
+class LlamaAttentionWithAdapters(LlamaAttentionMixin, LlamaAttention):
     """Multi-headed attention from 'Attention Is All You Need' paper"""
 
     def forward(
@@ -165,7 +165,7 @@ def forward(
         return attn_output, attn_weights, past_key_value
 
 
-class LlamaDecoderLayerWithAdapters(nn.Module, LlamaDecoderLayerMixin):
+class LlamaDecoderLayerWithAdapters(LlamaDecoderLayerMixin, LlamaDecoderLayer):
     def forward(
         self,
         hidden_states: torch.Tensor,