Qwen
/

Qwen-7B-Chat

@@ -245,7 +245,7 @@ class QWenAttention(nn.Module):
             math.log(i, self.seq_length) if i > self.seq_length else 1
             for i in range(1, 32768)
         ]
-        self.logn_tensor = torch.Tensor(logn_list)[None, :, None, None]
         self._ntk_cached = 1.0
         self.attn_dropout = nn.Dropout(config.attn_pdrop)

             math.log(i, self.seq_length) if i > self.seq_length else 1
             for i in range(1, 32768)
         ]
+        self.logn_tensor = torch.tensor(logn_list)[None, :, None, None]
         self._ntk_cached = 1.0
         self.attn_dropout = nn.Dropout(config.attn_pdrop)