Spaces:

reynaldo22
/

bettina3.0

Sleeping

reynaldo22 commited on 19 days ago

Commit

b3faa92

verified ·

1 Parent(s): df01bff

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -71,6 +71,15 @@ try:
     print(f"Tentando baixar pesos do repositório: {REPO_ID}...")
     token = os.getenv("HF_TOKEN")
     vortex_path = hf_hub_download(repo_id=REPO_ID, filename="vortex.pt", token=token)
     emb_path = hf_hub_download(repo_id=REPO_ID, filename="embedding_projector.pt", token=token)
     corr_path = hf_hub_download(repo_id=REPO_ID, filename="correction_projector.pt", token=token)
@@ -182,8 +191,15 @@ def predict(contexto, frase_mask, chaos_factor):
             # Para cada palavra que aparece no contexto, aumentamos a probabilidade dela
             for token_id in context_tokens:
                 # O peso é proporcional ao Fator Caos.
-                # 0.5 é um ajuste fino para não ignorar totalmente a gramática.
                 resonance_bias[token_id] += (chaos_factor * 0.5)
             # Injeta a ressonância nos logits originais

     print(f"Tentando baixar pesos do repositório: {REPO_ID}...")
     token = os.getenv("HF_TOKEN")
+    # Fallback para arquivo local (para quem não consegue criar ENV)
+    if not token and os.path.exists("token.txt"):
+        try:
+            with open("token.txt", "r") as f:
+                token = f.read().strip()
+            print("⚠️ Usando token do arquivo token.txt")
+        except:
+            pass
     vortex_path = hf_hub_download(repo_id=REPO_ID, filename="vortex.pt", token=token)
     emb_path = hf_hub_download(repo_id=REPO_ID, filename="embedding_projector.pt", token=token)
     corr_path = hf_hub_download(repo_id=REPO_ID, filename="correction_projector.pt", token=token)
             # Para cada palavra que aparece no contexto, aumentamos a probabilidade dela
             for token_id in context_tokens:
+                # Verifica se é subword (começa com ##)
+                token_str = tokenizer.convert_ids_to_tokens(token_id)
+                # Pula subwords (ex: ##mos) e tokens especiais/curtos demais
+                # Isso evita que o modelo responda sufixos como "##mos"
+                if token_str.startswith("##") or len(token_str) < 2:
+                    continue
                 # O peso é proporcional ao Fator Caos.
                 resonance_bias[token_id] += (chaos_factor * 0.5)
             # Injeta a ressonância nos logits originais