Spaces:

taesiri
/

CLIPScore

Running on Zero

App Files Files Community

taesiri commited on Aug 2, 2024

Commit

c890be1

verified ·

1 Parent(s): b5e4aa1

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -23

app.py CHANGED Viewed

@@ -3,50 +3,50 @@ import gradio as gr
 from transformers import CLIPProcessor, CLIPModel
 import spaces
-model = CLIPModel.from_pretrained("openai/clip-vit-base-patch16").to("cuda")
 processor = CLIPProcessor.from_pretrained("openai/clip-vit-base-patch16")
-@spaces.GPU(duration=120)
 def calculate_score(image, text):
     labels = text.split(";")
     labels = [l.strip() for l in labels]
     labels = list(filter(None, labels))
     if len(labels) == 0:
         return dict()
     inputs = processor(text=labels, images=image, return_tensors="pt", padding=True)
-    inputs = {
-        k: v.to("cuda") for k, v in inputs.items()
-    }
     outputs = model(**inputs)
-    logits_per_image = (
-        outputs.logits_per_image.detach().cpu().numpy()
-    )  # Move results back to CPU for further processing
-    results_dict = {
-        label: score / 100.0 for label, score in zip(labels, logits_per_image[0])
-    }
     return results_dict
 with gr.Blocks() as demo:
     gr.Markdown("# CLIP Score")
-    gr.Markdown(
-        "Calculate the [CLIP](https://openai.com/blog/clip/) score of a given image and text"
-    )
     with gr.Row():
         image_input = gr.Image()
         output_label = gr.Label()
     text_input = gr.Textbox(label="Descriptions (separated by semicolons)")
     image_input.change(
-        fn=calculate_score, inputs=[image_input, text_input], outputs=output_label
     )
     text_input.submit(
-        fn=calculate_score, inputs=[image_input, text_input], outputs=output_label
     )
     gr.Examples(
         examples=[
             [
@@ -59,4 +59,4 @@ with gr.Blocks() as demo:
         outputs=output_label,
     )
-demo.launch()

 from transformers import CLIPProcessor, CLIPModel
 import spaces
+model = CLIPModel.from_pretrained("openai/clip-vit-base-patch16")
 processor = CLIPProcessor.from_pretrained("openai/clip-vit-base-patch16")
+@spaces.GPU
 def calculate_score(image, text):
+    model.to("cuda")  # Move model to CUDA inside the GPU-decorated function
     labels = text.split(";")
     labels = [l.strip() for l in labels]
     labels = list(filter(None, labels))
     if len(labels) == 0:
         return dict()
     inputs = processor(text=labels, images=image, return_tensors="pt", padding=True)
+    inputs = {k: v.to("cuda") for k, v in inputs.items()}
     outputs = model(**inputs)
+    logits_per_image = outputs.logits_per_image.detach().cpu().numpy()
+    results_dict = {label: score / 100.0 for label, score in zip(labels, logits_per_image[0])}
     return results_dict
 with gr.Blocks() as demo:
     gr.Markdown("# CLIP Score")
+    gr.Markdown("Calculate the [CLIP](https://openai.com/blog/clip/) score of a given image and text")
     with gr.Row():
         image_input = gr.Image()
         output_label = gr.Label()
     text_input = gr.Textbox(label="Descriptions (separated by semicolons)")
     image_input.change(
+        fn=calculate_score,
+        inputs=[image_input, text_input],
+        outputs=output_label
     )
     text_input.submit(
+        fn=calculate_score,
+        inputs=[image_input, text_input],
+        outputs=output_label
     )
     gr.Examples(
         examples=[
             [
         outputs=output_label,
     )
+demo.launch()