catch openai rate limit error (#7658)

2025-08-20 19:59:11 +08:00 · 2024-08-26 19:36:44 +08:00 · 2024-08-26 19:36:44 +08:00 · 1473083a41
commit 1473083a41
parent 7cda73f192
7 changed files with 53 additions and 0 deletions
--- a/api/controllers/console/app/completion.py
+++ b/api/controllers/console/app/completion.py
@ -17,6 +17,7 @@ from controllers.console.app.error import (
 from controllers.console.app.wraps import get_app_model
 from controllers.console.setup import setup_required
 from controllers.console.wraps import account_initialization_required
 from controllers.web.error import InvokeRateLimitError as InvokeRateLimitHttpError
 from core.app.apps.base_app_queue_manager import AppQueueManager
 from core.app.entities.app_invoke_entities import InvokeFrom
 from core.errors.error import (
@ -31,6 +32,7 @@ from libs.helper import uuid_value
 from libs.login import login_required
 from models.model import AppMode
 from services.app_generate_service import AppGenerateService
 from services.errors.llm import InvokeRateLimitError
 # define completion message api for user
@ -135,6 +137,8 @@ class ChatMessageApi(Resource):
            raise ProviderQuotaExceededError()
        except ModelCurrentlyNotSupportError:
            raise ProviderModelCurrentlyNotSupportError()
        except InvokeRateLimitError as ex:
            raise InvokeRateLimitHttpError(ex.description)
        except InvokeError as e:
            raise CompletionRequestError(e.description)
        except (ValueError, AppInvokeQuotaExceededError) as e:
--- a/api/controllers/console/app/error.py
+++ b/api/controllers/console/app/error.py
@ -119,3 +119,11 @@ class TracingConfigCheckError(BaseHTTPException):
    error_code = "trace_config_check_error"
    description = "Invalid Credentials."
    code = 400
 class InvokeRateLimitError(BaseHTTPException):
    """Raised when the Invoke returns rate limit error."""
    error_code = "rate_limit_error"
    description = "Rate Limit Error"
    code = 429
--- a/api/controllers/web/completion.py
+++ b/api/controllers/web/completion.py
@ -15,6 +15,7 @@ from controllers.web.error import (
    ProviderNotInitializeError,
    ProviderQuotaExceededError,
 )
 from controllers.web.error import InvokeRateLimitError as InvokeRateLimitHttpError
 from controllers.web.wraps import WebApiResource
 from core.app.apps.base_app_queue_manager import AppQueueManager
 from core.app.entities.app_invoke_entities import InvokeFrom
@ -24,6 +25,7 @@ from libs import helper
 from libs.helper import uuid_value
 from models.model import AppMode
 from services.app_generate_service import AppGenerateService
 from services.errors.llm import InvokeRateLimitError
 # define completion api for user
@ -120,6 +122,8 @@ class ChatApi(WebApiResource):
            raise ProviderQuotaExceededError()
        except ModelCurrentlyNotSupportError:
            raise ProviderModelCurrentlyNotSupportError()
        except InvokeRateLimitError as ex:
            raise InvokeRateLimitHttpError(ex.description)
        except InvokeError as e:
            raise CompletionRequestError(e.description)
        except ValueError as e:
--- a/api/controllers/web/error.py
+++ b/api/controllers/web/error.py
@ -125,3 +125,11 @@ class WebSSOAuthRequiredError(BaseHTTPException):
    error_code = "web_sso_auth_required"
    description = "Web SSO authentication required."
    code = 401
 class InvokeRateLimitError(BaseHTTPException):
    """Raised when the Invoke returns rate limit error."""
    error_code = "rate_limit_error"
    description = "Rate Limit Error"
    code = 429
--- a/api/core/errors/error.py
+++ b/api/core/errors/error.py
@ -43,3 +43,8 @@ class ModelCurrentlyNotSupportError(Exception):
    Custom exception raised when the model not support
    """
    description = "Model Currently Not Support"
 class InvokeRateLimitError(Exception):
    """Raised when the Invoke returns rate limit error."""
    description = "Rate Limit Error"
--- a/api/services/app_generate_service.py
+++ b/api/services/app_generate_service.py
@ -1,6 +1,8 @@
 from collections.abc import Generator
 from typing import Any, Union
 from openai._exceptions import RateLimitError
 from configs import dify_config
 from core.app.apps.advanced_chat.app_generator import AdvancedChatAppGenerator
 from core.app.apps.agent_chat.app_generator import AgentChatAppGenerator
@ -10,6 +12,7 @@ from core.app.apps.workflow.app_generator import WorkflowAppGenerator
 from core.app.entities.app_invoke_entities import InvokeFrom
 from core.app.features.rate_limiting import RateLimit
 from models.model import Account, App, AppMode, EndUser
 from services.errors.llm import InvokeRateLimitError
 from services.workflow_service import WorkflowService
@ -86,6 +89,8 @@ class AppGenerateService:
                )
            else:
                raise ValueError(f"Invalid app mode {app_model.mode}")
        except RateLimitError as e:
            raise InvokeRateLimitError(str(e))
        finally:
            if not streaming:
                rate_limit.exit(request_id)
--- a/api/services/errors/llm.py
+++ b/api/services/errors/llm.py
@ -0,0 +1,19 @@
 from typing import Optional
 class InvokeError(Exception):
    """Base class for all LLM exceptions."""
    description: Optional[str] = None
    def __init__(self, description: Optional[str] = None) -> None:
        self.description = description
    def __str__(self):
        return self.description or self.__class__.__name__
 class InvokeRateLimitError(InvokeError):
    """Raised when the Invoke returns rate limit error."""
    description = "Rate Limit Error"