Spaces:

WhotookNima
/

parser-flair

Runtime error

WhotookNima commited on May 6

Commit

84d64bf

verified ·

1 Parent(s): d7bd9f2

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,27 +1,35 @@
-from fastapi import FastAPI, Request
 from pydantic import BaseModel
-from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
 app = FastAPI()
-# Ladda modellen
-model_id = "AI-Sweden/gpt-sw3-126m"
-tokenizer = AutoTokenizer.from_pretrained(model_id)
-model = AutoModelForCausalLM.from_pretrained(model_id)
-# Om du kör på CPU – lägg till detta
-device = torch.device("cpu")
-model.to(device)
-# Input-modell
-class Prompt(BaseModel):
-    text: str
-    max_new_tokens: int = 50
-@app.post("/generate")
-async def generate_text(prompt: Prompt):
-    inputs = tokenizer(prompt.text, return_tensors="pt").to(device)
-    outputs = model.generate(**inputs, max_new_tokens=prompt.max_new_tokens)
-    generated = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    return {"response": generated}

+from fastapi import FastAPI
 from pydantic import BaseModel
 import torch
+from transformers import AutoTokenizer, AutoModelForCausalLM
+# Initialisera modellen och tokenizern
+model_name = "AI-Sweden-Models/gpt-sw3-126m-instruct"
+device = "cuda:0" if torch.cuda.is_available() else "cpu"
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = AutoModelForCausalLM.from_pretrained(model_name)
+model.to(device)
+model.eval()
+# FastAPI-applikationen
 app = FastAPI()
+class UserInput(BaseModel):
+    prompt: str
+@app.post("/generate/")
+async def generate_response(user_input: UserInput):
+    prompt = f"<|endoftext|><s>\nUser:\n{user_input.prompt}\n<s>\nBot:"
+    input_ids = tokenizer(prompt, return_tensors="pt")["input_ids"].to(device)
+    generated_token_ids = model.generate(
+        inputs=input_ids,
+        max_new_tokens=100,
+        do_sample=True,
+        temperature=0.6,
+        top_p=1
+    )[0]
+    generated_text = tokenizer.decode(generated_token_ids[len(input_ids[0]):-1], skip_special_tokens=True)
+    return {"response": generated_text.strip()}