Spaces:

kawre
/

Huggingface_Chatbot_Cascade

Running

App Files Files Community

kawre commited on 9 days ago

Commit

76c2898

verified ·

1 Parent(s): 55f556b

Update app.py

Browse files

Files changed (1) hide show

app.py +22 -25

app.py CHANGED Viewed

@@ -21,9 +21,7 @@ from typing import List, Dict, Any, Tuple
 import gradio as gr
 from huggingface_hub import InferenceClient
-# -------------------------
-# Config / Logging
-# -------------------------
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger("cascade_chatbot")
@@ -38,13 +36,13 @@ if not HF_TOKEN:
 # -------------------------
 # Inicializa clientes HF
 # -------------------------
-# Criamos clientes distintos por modelo para garantir independência de configuração
 try:
     client_main = InferenceClient(token=HF_TOKEN, model=DEFAULT_LLAMA_MODEL)
     client_aux1 = InferenceClient(token=HF_TOKEN, model=DEFAULT_AUX1)
     client_aux2 = InferenceClient(token=HF_TOKEN, model=DEFAULT_AUX2)
 except Exception:
-    # falha na inicialização do client (token inválido, etc)
     logger.exception("Falha ao inicializar InferenceClient(s). Verifique HF_TOKEN e nomes dos modelos.")
     # Criar objetos None para evitar crash imediato; erros aparecerão ao tentar usar
     client_main = None
@@ -66,7 +64,7 @@ def _messages_to_prompt(messages: List[Dict[str, str]]) -> str:
 def _extract_text_from_response(obj: Any) -> str:
     if obj is None:
         return ""
-    # Common attributes
     for attr in ("content", "text", "generated_text", "generation_text"):
         if hasattr(obj, attr):
             try:
@@ -76,7 +74,7 @@ def _extract_text_from_response(obj: Any) -> str:
                 return str(v)
             except Exception:
                 pass
-    # choices style
     try:
         choices = None
         if hasattr(obj, "choices"):
@@ -100,7 +98,7 @@ def _extract_text_from_response(obj: Any) -> str:
                 return first.text
     except Exception:
         pass
-    # generations
     try:
         if hasattr(obj, "generations") and len(obj.generations) > 0:
             g = obj.generations[0]
@@ -110,7 +108,7 @@ def _extract_text_from_response(obj: Any) -> str:
                 return g.text
     except Exception:
         pass
-    # dict fallback
     try:
         if isinstance(obj, dict):
             for k in ("text", "content", "generated_text"):
@@ -118,7 +116,7 @@ def _extract_text_from_response(obj: Any) -> str:
                     return obj[k]
     except Exception:
         pass
-    # last resort
     try:
         return str(obj)
     except Exception:
@@ -136,7 +134,7 @@ def call_model_with_messages(client: InferenceClient, messages: List[Dict[str, s
     def try_call(method, /, *pos_args, **kw_args):
         try:
-            # Não imprimir todo messages no log (pode ser grande) — resumir
             safe_kw = {k: ("[MESSAGES]" if k == "messages" else v) for k, v in kw_args.items()}
             logger.info("Tentando %s pos=%s kwargs=%s", getattr(method, "__name__", str(method)), pos_args, safe_kw)
             return method(*pos_args, **kw_args)
@@ -144,10 +142,10 @@ def call_model_with_messages(client: InferenceClient, messages: List[Dict[str, s
             logger.exception("Falha ao chamar %s", getattr(method, "__name__", str(method)))
             return None
-    # Tentar obter nome do modelo (fallback)
     model_name = getattr(client, "model", None) or DEFAULT_LLAMA_MODEL
-    # 1) chat_completion (método mais comum)
     try:
         cc = getattr(client, "chat_completion", None)
         if cc:
@@ -189,7 +187,7 @@ def call_model_with_messages(client: InferenceClient, messages: List[Dict[str, s
     except Exception:
         logger.exception("Erro no bloco chat namespace")
-    # 3) text_generation (fallback)
     prompt = _messages_to_prompt(messages)
     try:
         if hasattr(client, "text_generation"):
@@ -288,13 +286,13 @@ def pipeline_cascade(user_message: str, system_message: str,
 # Gradio App
 # -------------------------
 with gr.Blocks(title="Chatbot em Cascata - Llama + FLAN + BART") as demo:
-    gr.Markdown("## 🤖 Chatbot em Cascata\n"
-                "Fluxo: **Llama (entrada)** → **FLAN-T5 (reformulação)** → **BART (resumo em 3 frases)**\n\n"
-                "Antes de rodar, confirme que `HF_TOKEN` está definido nos Secrets do Space.")
     with gr.Row():
         with gr.Column(scale=2):
-            system_message = gr.Textbox(value="Você é um chatbot amigável e prestativo.",
                                        label="System Message", lines=2)
             chatbot = gr.Chatbot(label="Chat")
             user_input = gr.Textbox(label="Digite sua mensagem", placeholder="Digite aqui...")
@@ -323,11 +321,11 @@ with gr.Blocks(title="Chatbot em Cascata - Llama + FLAN + BART") as demo:
                            outputs=[chatbot, history])
         with gr.Column(scale=1):
-            gr.Markdown("### Model Info & Config (dentro do app)\n"
-                        "Este painel documenta os modelos usados e as configurações (exigência do trabalho).")
             model_info_md = f"""
-**Modelos usados (mínimo 3):**
 - Llama (input): `{DEFAULT_LLAMA_MODEL}`
 - Aux 1 (reformulação): `{DEFAULT_AUX1}`
@@ -365,10 +363,9 @@ with gr.Blocks(title="Chatbot em Cascata - Llama + FLAN + BART") as demo:
             btn_test = gr.Button("Run self-test")
             btn_test.click(run_self_test, inputs=[system_message, max_tokens, temperature, top_p], outputs=[test_output])
-            gr.Markdown("### Dicas de deploy\n"
-                        "- Defina `HF_TOKEN` nos Secrets do Space.\n"
-                        "- Use um runtime com GPU se disponível (modelos grandes exigem mais recursos).\n"
-                        "- Verifique permissões do modelo (alguns modelos exigem permissões específicas).")
 if __name__ == "__main__":
     demo.launch()

 import gradio as gr
 from huggingface_hub import InferenceClient
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger("cascade_chatbot")
 # -------------------------
 # Inicializa clientes HF
 # -------------------------
 try:
     client_main = InferenceClient(token=HF_TOKEN, model=DEFAULT_LLAMA_MODEL)
     client_aux1 = InferenceClient(token=HF_TOKEN, model=DEFAULT_AUX1)
     client_aux2 = InferenceClient(token=HF_TOKEN, model=DEFAULT_AUX2)
 except Exception:
     logger.exception("Falha ao inicializar InferenceClient(s). Verifique HF_TOKEN e nomes dos modelos.")
     # Criar objetos None para evitar crash imediato; erros aparecerão ao tentar usar
     client_main = None
 def _extract_text_from_response(obj: Any) -> str:
     if obj is None:
         return ""
+    # Common atributos
     for attr in ("content", "text", "generated_text", "generation_text"):
         if hasattr(obj, attr):
             try:
                 return str(v)
             except Exception:
                 pass
     try:
         choices = None
         if hasattr(obj, "choices"):
                 return first.text
     except Exception:
         pass
     try:
         if hasattr(obj, "generations") and len(obj.generations) > 0:
             g = obj.generations[0]
                 return g.text
     except Exception:
         pass
     try:
         if isinstance(obj, dict):
             for k in ("text", "content", "generated_text"):
                     return obj[k]
     except Exception:
         pass
     try:
         return str(obj)
     except Exception:
     def try_call(method, /, *pos_args, **kw_args):
         try:
+            # Não imprimir todo messages no log  — resumir
             safe_kw = {k: ("[MESSAGES]" if k == "messages" else v) for k, v in kw_args.items()}
             logger.info("Tentando %s pos=%s kwargs=%s", getattr(method, "__name__", str(method)), pos_args, safe_kw)
             return method(*pos_args, **kw_args)
             logger.exception("Falha ao chamar %s", getattr(method, "__name__", str(method)))
             return None
+    # Tentar obter nome do modelo
     model_name = getattr(client, "model", None) or DEFAULT_LLAMA_MODEL
+    # 1) chat_completion
     try:
         cc = getattr(client, "chat_completion", None)
         if cc:
     except Exception:
         logger.exception("Erro no bloco chat namespace")
+    # 3) text_generation
     prompt = _messages_to_prompt(messages)
     try:
         if hasattr(client, "text_generation"):
 # Gradio App
 # -------------------------
 with gr.Blocks(title="Chatbot em Cascata - Llama + FLAN + BART") as demo:
+    gr.Markdown("##  Chatbot em Cascata\n"
+                "Fluxo: **Llama (entrada)** → **FLAN-T5 (reformulação)** → **BART**\n\n"
+                "Disciplina: INTELIGÊNCIA ARTIFICIAL E APRENDIZADO DE MÁQUINA")
     with gr.Row():
         with gr.Column(scale=2):
+            system_message = gr.Textbox(value="Você é um chatbot racional e alegre.",
                                        label="System Message", lines=2)
             chatbot = gr.Chatbot(label="Chat")
             user_input = gr.Textbox(label="Digite sua mensagem", placeholder="Digite aqui...")
                            outputs=[chatbot, history])
         with gr.Column(scale=1):
+            gr.Markdown("### Inforações do Projeto\n"
+                        "Painel feito para descrever as configurações e realizar um teste automático")
             model_info_md = f"""
+**Modelos usados:**
 - Llama (input): `{DEFAULT_LLAMA_MODEL}`
 - Aux 1 (reformulação): `{DEFAULT_AUX1}`
             btn_test = gr.Button("Run self-test")
             btn_test.click(run_self_test, inputs=[system_message, max_tokens, temperature, top_p], outputs=[test_output])
+            gr.Markdown("### Disciplina: INTELIGÊNCIA ARTIFICIAL E APRENDIZADO DE MÁQUINA\n"
+                        "- Trabalho N2\n"
+                        "- Turma Noturna de Bacharelado em Ciências da Computação 2025.\n")
 if __name__ == "__main__":
     demo.launch()