Spaces:

AIEnergyScore
/

Label

Running

File size: 13,280 Bytes

import streamlit as st
import pandas as pd
from PIL import Image, ImageDraw, ImageFont
import io
import os
import socket
import calendar
import re
from typing import Optional
from huggingface_hub import hf_hub_download

# =========================
# Hugging Face Space config
# =========================
HF_REPO_ID = "AIEnergyScore/Leaderboard"   # Space slug
HF_REPO_TYPE = "space"
HF_DATA_PREFIX = "data/energy"             # path within the Space

# =========================
# Task -> CSV mapping
# =========================
TASK_TO_CSV = {
    "Text Generation":        "text_generation.csv",
    "Reasoning":              "reasoning.csv",           # now exists in your Space
    "Image Generation":       "image_generation.csv",
    "Text Classification":    "text_classification.csv",
    "Image Classification":   "image_classification.csv",
    "Image Captioning":       "image_captioning.csv",
    "Summarization":          "summarization.csv",
    "Speech-to-Text (ASR)":   "asr.csv",
    "Object Detection":       "object_detection.csv",
    "Question Answering":     "question_answering.csv",
    "Sentence Similarity":    "sentence_similarity.csv",
}
# Back-compat if parts of the code still reference this name:
task_to_file = TASK_TO_CSV

# =========================
# Helpers
# =========================
def read_csv_from_hub(file_name: str) -> pd.DataFrame:
    """
    Download a CSV from HF Space path data/energy/<file_name>,
    return a pandas DataFrame. Falls back to local if hub unavailable.
    """
    hub_path = f"{HF_DATA_PREFIX}/{file_name}"
    try:
        # helpful DNS check
        socket.gethostbyname("huggingface.co")
        local_path = hf_hub_download(
            repo_id=HF_REPO_ID,
            repo_type=HF_REPO_TYPE,
            filename=hub_path,
            revision="main",
            resume_download=True
        )
        return pd.read_csv(local_path)
    except Exception as e:
        try:
            return pd.read_csv(file_name)
        except Exception:
            raise RuntimeError(
                f"Unable to load '{file_name}' from Hub path '{hub_path}' or locally. "
                f"Original error: {e}"
            )

def format_with_commas(value) -> str:
    """
    Format numeric values with commas and two decimals.
    Example: 12345.678 -> '12,345.68'
    """
    try:
        return f"{float(value):,.2f}"
    except Exception:
        return str(value)

def _normalize(col: str) -> str:
    return re.sub(r"[^a-z0-9]", "", col.strip().lower())

def find_test_date_column(df: pd.DataFrame) -> Optional[str]:
    """
    Locate a 'test date' column. Strategy:
    1) Exact case-insensitive match 'test date'
    2) Any header whose normalized form contains both 'test' and 'date'
    3) Fallback to column E (index 4) if present
    """
    # (1) exact "test date"
    for c in df.columns:
        if c.strip().lower() == "test date":
            return c
    # (2) flexible match
    for c in df.columns:
        cn = _normalize(c)
        if "test" in cn and "date" in cn:
            return c
    # (3) fallback to E (0-based index 4)
    if len(df.columns) >= 5:
        return df.columns[4]
    return None

def month_abbrev_to_full(abbrev: str) -> Optional[str]:
    """
    Map 'Feb' -> 'February', 'Oct' -> 'October'. Returns None if unknown.
    """
    if not isinstance(abbrev, str) or not abbrev:
        return None
    abbr = abbrev.strip()[:3].title()  # normalize to 3-letter case 'Oct'
    for m in range(1, 13):
        if calendar.month_abbr[m] == abbr:
            return calendar.month_name[m]
    return None

def render_date_from_test_date(value: str) -> str:
    """
    Accepts formats:
      - 'Oct 2025'
      - 'Dec 25'  (2-digit year)
    Returns 'October 2025' or 'December 2025'.
    """
    if not isinstance(value, str):
        return ""
    s = value.strip()

    # Case 1: 'Oct 2025'
    m = re.match(r"^([A-Za-z]+)\s+(\d{4})$", s)
    if m:
        month_full = month_abbrev_to_full(m.group(1))
        return f"{month_full} {m.group(2)}" if month_full else ""

    # Case 2: 'Dec 25'  (map 25 -> 2025)
    m2 = re.match(r"^([A-Za-z]+)\s+(\d{2})$", s)
    if m2:
        month_full = month_abbrev_to_full(m2.group(1))
        year_full = f"20{m2.group(2)}"
        return f"{month_full} {year_full}" if month_full else ""

    return ""


def smart_capitalize(text):
    """Capitalize first letter only if not already; leave rest unchanged."""
    if not text:
        return text
    return text if text[0].isupper() else text[0].upper() + text[1:]

# =========================
# UI / App
# =========================
def main():
    # Tag styling
    st.markdown(
        """
        <style>
            .stMultiSelect [data-baseweb="tag"] {
                background-color: #3fa45bff !important;
                color: white !important;
                font-weight: 500;
                border-radius: 5px;
                padding: 5px 10px;
            }
            .stMultiSelect [data-baseweb="tag"]:hover { background-color: #358d4d !important; }
            .stMultiSelect input { color: black !important; }
        </style>
        """,
        unsafe_allow_html=True,
    )

    # Sidebar logo & title
    with st.sidebar:
        col1, col2 = st.columns([1, 5])
        with col1:
            logo = Image.open("logo.png")
            st.image(logo.resize((50, 50)))
        with col2:
            st.markdown(
                """
                <div style="display:flex;align-items:center;gap:10px;margin:0;padding:0;
                            font-family:'Inter',sans-serif;font-size:26px;font-weight:500;">
                    AI Energy Score
                </div>
                """,
                unsafe_allow_html=True,
            )

    st.sidebar.markdown("<hr style='border: 1px solid gray; margin: 15px 0;'>", unsafe_allow_html=True)
    st.sidebar.write("### Generate Label:")

    # Task order
    task_order = [
        "Text Generation",
        "Reasoning",
        "Image Generation",
        "Text Classification",
        "Image Classification",
        "Image Captioning",
        "Summarization",
        "Speech-to-Text (ASR)",
        "Object Detection",
        "Question Answering",
        "Sentence Similarity",
    ]

    # 1) Select task(s)
    st.sidebar.write("#### 1. Select task(s) to view models")
    selected_tasks = st.sidebar.multiselect("", options=task_order, default=["Text Generation"])

    # Default when nothing selected
    default_model_data = {
        'provider': "AI Provider",
        'model': "Model Name",
        'full_model': "AI Provider/Model Name",
        'date': "",
        'task': "",
        'hardware': "",
        'energy': 0.0,
        'score': 5
    }

    if not selected_tasks:
        model_data = default_model_data
    else:
        dfs = []
        for task in selected_tasks:
            file_name = TASK_TO_CSV.get(task)
            if not file_name:
                st.sidebar.error(f"Unknown task '{task}'.")
                continue

            try:
                df = read_csv_from_hub(file_name)
            except FileNotFoundError:
                st.sidebar.error(f"Could not find '{file_name}' for task {task}!")
                continue
            except Exception as e:
                st.sidebar.error(f"Error reading '{file_name}' for task {task}: {e}")
                continue

            # Split provider/model if combined as "Provider/Model"
            df['full_model'] = df['model']
            df[['provider', 'model']] = df['model'].str.split(pat='/', n=1, expand=True)

            # Convert kWh -> Wh (total_gpu_energy is in kWh); keep 2 decimals
            df['energy'] = (df['total_gpu_energy'] * 1000).round(2)

            # Score
            df['score'] = df['energy_score'].fillna(1).astype(int)

            # Hardware placeholder (adjust if you have a specific column)
            df['hardware'] = "NVIDIA H100-80GB"
            df['task'] = task

            # --- DATE: Use CSV 'test date' for Text Generation & Reasoning ---
            if task in {"Text Generation", "Reasoning"}:
                td_col = find_test_date_column(df)
                if td_col:
                    # Try to render; if empty/unparsable, fall back to "February 2025"
                    df['date'] = df[td_col].apply(render_date_from_test_date)
                    df['date'] = df['date'].where(df['date'].str.len() > 0, "February 2025")
                else:
                    # If column is missing, explicitly print "February 2025"
                    df['date'] = "February 2025"
            else:
                df['date'] = ""

            dfs.append(df)

        if not dfs:
            model_data = default_model_data
        else:
            data_df = pd.concat(dfs, ignore_index=True)
            if data_df.empty:
                model_data = default_model_data
            else:
                model_options = data_df["full_model"].unique().tolist()
                selected_model = st.sidebar.selectbox(
                    "Scored Models",
                    model_options,
                    help="Start typing to search for a model"
                )
                model_data = data_df[data_df["full_model"] == selected_model].iloc[0]

    st.sidebar.write("#### 3. Download the label")

    try:
        score = int(model_data["score"])
        background_path = f"{score}.png"
        background = Image.open(background_path).convert("RGBA")
    except FileNotFoundError:
        st.sidebar.error(f"Could not find background image '{score}.png'. Using default background.")
        background = Image.open("default_background.png").convert("RGBA")
    except ValueError:
        st.sidebar.error(f"Invalid score '{model_data['score']}'. Score must be an integer.")
        return

    final_size = (520, 728)
    generated_label = create_label_single_pass(background, model_data, final_size)

    st.image(generated_label, caption="Generated Label Preview", width=520)

    img_buffer = io.BytesIO()
    generated_label.save(img_buffer, format="PNG")
    img_buffer.seek(0)

    st.sidebar.download_button(
        label="Download",
        data=img_buffer,
        file_name="AIEnergyScore.png",
        mime="image/png"
    )

    st.sidebar.write("#### 4. Share your label!")
    st.sidebar.write("[Guidelines](https://huggingface.github.io/AIEnergyScore/#transparency-and-guidelines-for-label-use)")    
    st.sidebar.markdown("<hr style='border: 1px solid gray; margin: 15px 0;'>", unsafe_allow_html=True)
    st.sidebar.write("### Key Links")
    st.sidebar.markdown(
        """
        <ul style="margin-top:0;margin-bottom:0;padding-left:20px;">
            <li><a href="https://huggingface.co/spaces/AIEnergyScore/Leaderboard" target="_blank">Leaderboard</a></li>
            <li><a href="https://huggingface.co/spaces/AIEnergyScore/submission_portal" target="_blank">Submission Portal</a></li>
            <li><a href="https://huggingface.github.io/AIEnergyScore/#faq" target="_blank">FAQ</a></li>
            <li><a href="https://huggingface.github.io/AIEnergyScore/#documentation" target="_blank">Documentation</a></li>
        </ul>
        """,
        unsafe_allow_html=True,
    )

def create_label_single_pass(background_image, model_data, final_size=(520, 728)):
    bg_resized = background_image.resize(final_size, Image.Resampling.LANCZOS)

    # If no task is selected (i.e., using default model_data), return background
    if not model_data.get("task"):
        return bg_resized

    draw = ImageDraw.Draw(bg_resized)

    try:
        title_font = ImageFont.truetype("Inter_24pt-Bold.ttf", size=27)
        details_font = ImageFont.truetype("Inter_18pt-Regular.ttf", size=23)
        energy_font = ImageFont.truetype("Inter_18pt-Medium.ttf", size=24)
    except Exception as e:
        st.error(f"Font loading failed: {e}")
        return bg_resized

    title_x, title_y = 33, 150
    details_x, details_y = 480, 256
    energy_x, energy_y = 480, 472  # right-aligned anchors

    provider_text = str(model_data['provider'])
    model_text = str(model_data['model'])

    draw.text((title_x, title_y), provider_text, font=title_font, fill="black")
    draw.text((title_x, title_y + 38), model_text, font=title_font, fill="black")

    # Right-align details lines (date, task, hardware)
    details_lines = [
        str(model_data.get('date', "")),
        str(model_data.get('task', "")),
        str(model_data.get('hardware', "")),
    ]
    for i, line in enumerate(details_lines):
        bbox = draw.textbbox((0, 0), line, font=details_font)
        text_width = bbox[2] - bbox[0]
        draw.text((details_x - text_width, details_y + i * 47), line, font=details_font, fill="black")

    # Energy value (two decimals) right-aligned
    try:
        energy_value = float(model_data.get('energy', 0.0))
    except Exception:
        energy_value = 0.0
    energy_text = format_with_commas(energy_value)
    energy_bbox = draw.textbbox((0, 0), energy_text, font=energy_font)
    energy_text_width = energy_bbox[2] - energy_bbox[0]
    draw.text((energy_x - energy_text_width, energy_y), energy_text, font=energy_font, fill="black")

    return bg_resized

if __name__ == "__main__":
    main()