Spaces:

VeuReu
/

demo

Running

App Files Files Community

VeuReu commited on Nov 11

Commit

a565d25

1 Parent(s): 6cd5d9e

Upload 2 files

Browse files

Files changed (1) hide show

api_client.py +39 -25

api_client.py CHANGED Viewed

@@ -114,35 +114,32 @@ class APIClient:
     def tts_matxa(self, text: str, voice: str = "central/grau") -> dict:
         """
         Llama al space 'tts' para sintetizar audio.
         Args:
             text (str): Texto a sintetizar.
-            voice (str): Voz de Matxa a usar (p.ej. 'central/alvocat').
         Returns:
-            dict: {'mp3_data_url': 'data:audio/mpeg;base64,...'}
         """
         if not self.tts_url:
             raise ValueError("La URL del servei TTS no està configurada (API_TTS_URL)")
-        # Si el texto es largo (> 480 caracteres), usar el endpoint de texto largo
         if len(text) > 480:
             url = f"{self.tts_url.rstrip('/')}/tts/text_long"
-            data = {
-                "texto": text,
-                "voice": voice,
-                "formato": "mp3"
-            }
         else:
             url = f"{self.tts_url.rstrip('/')}/tts/text"
-            data = {
-                "texto": text,
-                "voice": voice,
-                "formato": "mp3"
-            }
         try:
-            r = requests.post(url, data=data, timeout=self.timeout)
             r.raise_for_status()
             # Devolver los bytes directamente para que el cliente los pueda concatenar
@@ -201,10 +198,18 @@ class APIClient:
         except requests.exceptions.RequestException as e:
             return {"error": str(e)}
-    def rebuild_video_with_ad(self, video_path: str, srt_path: str) -> dict:
         """
         Llama al space 'tts' para reconstruir un vídeo con audiodescripció a partir de un SRT.
-        El servidor devuelve un ZIP, y de ahí extraemos el MP4 final.
         """
         if not self.tts_url:
             raise ValueError("La URL del servei TTS no està configurada (API_TTS_URL)")
@@ -212,18 +217,24 @@ class APIClient:
         url = f"{self.tts_url.rstrip('/')}/tts/srt"
         try:
-            files = {
-                'video': (os.path.basename(video_path), open(video_path, 'rb'), 'video/mp4'),
-                'srt': (os.path.basename(srt_path), open(srt_path, 'rb'), 'application/x-subrip')
-            }
-            data = {"include_final_mp4": 1}
-            r = requests.post(url, files=files, data=data, timeout=self.timeout * 5)
-            r.raise_for_status()
             # El servidor devuelve un ZIP, lo procesamos en memoria
             with zipfile.ZipFile(io.BytesIO(r.content)) as z:
-                # Buscamos el archivo .mp4 dentro del ZIP
                 for filename in z.namelist():
                     if filename.endswith('.mp4'):
                         video_bytes = z.read(filename)
@@ -237,6 +248,9 @@ class APIClient:
             return {"error": str(e)}
         except zipfile.BadZipFile:
             return {"error": "La respuesta del servidor no fue un archivo ZIP válido."}
     def refine_narration(self, dialogues_srt: str, frame_descriptions_json: str = "[]", config_path: str = "config.yaml") -> dict:

     def tts_matxa(self, text: str, voice: str = "central/grau") -> dict:
         """
         Llama al space 'tts' para sintetizar audio.
+        Usa /tts/text para textos cortos (<480 chars) o /tts/text_long para textos largos.
         Args:
             text (str): Texto a sintetizar.
+            voice (str): Voz de Matxa a usar (p.ej. 'central/grau').
         Returns:
+            dict: {'mp3_bytes': bytes} o {'error': str}
         """
         if not self.tts_url:
             raise ValueError("La URL del servei TTS no està configurada (API_TTS_URL)")
+        # Usar endpoint apropiado según la longitud del texto
         if len(text) > 480:
             url = f"{self.tts_url.rstrip('/')}/tts/text_long"
         else:
             url = f"{self.tts_url.rstrip('/')}/tts/text"
+        data = {
+            "texto": text,
+            "voice": voice,
+            "formato": "mp3"
+        }
         try:
+            r = self.session.post(url, data=data, timeout=self.timeout * 2)  # Más tiempo para textos largos
             r.raise_for_status()
             # Devolver los bytes directamente para que el cliente los pueda concatenar
         except requests.exceptions.RequestException as e:
             return {"error": str(e)}
+    def rebuild_video_with_ad(self, video_path: str, srt_path: str, voice: str = "central/grau") -> dict:
         """
         Llama al space 'tts' para reconstruir un vídeo con audiodescripció a partir de un SRT.
+        Usa el endpoint /tts/srt que devuelve un ZIP con el vídeo final.
+        Args:
+            video_path: Ruta al archivo de vídeo original
+            srt_path: Ruta al archivo SRT con las audiodescripciones
+            voice: Voz de Matxa (por defecto 'central/grau')
+        Returns:
+            dict: {'video_bytes': bytes} o {'error': str}
         """
         if not self.tts_url:
             raise ValueError("La URL del servei TTS no està configurada (API_TTS_URL)")
         url = f"{self.tts_url.rstrip('/')}/tts/srt"
         try:
+            with open(video_path, 'rb') as video_file:
+                with open(srt_path, 'rb') as srt_file:
+                    files = {
+                        'video': (os.path.basename(video_path), video_file, 'video/mp4'),
+                        'srt': (os.path.basename(srt_path), srt_file, 'application/x-subrip')
+                    }
+                    data = {
+                        "voice": voice,
+                        "ad_format": "mp3",
+                        "include_final_mp4": "1"
+                    }
+                    r = self.session.post(url, files=files, data=data, timeout=self.timeout * 5)
+                    r.raise_for_status()
             # El servidor devuelve un ZIP, lo procesamos en memoria
             with zipfile.ZipFile(io.BytesIO(r.content)) as z:
+                # Buscamos el archivo video_con_ad.mp4 dentro del ZIP
                 for filename in z.namelist():
                     if filename.endswith('.mp4'):
                         video_bytes = z.read(filename)
             return {"error": str(e)}
         except zipfile.BadZipFile:
             return {"error": "La respuesta del servidor no fue un archivo ZIP válido."}
+        except Exception as e:
+            print(f"Error inesperat: {e}")
+            return {"error": str(e)}
     def refine_narration(self, dialogues_srt: str, frame_descriptions_json: str = "[]", config_path: str = "config.yaml") -> dict: