From e013ac52af3ad22ad00f8750a32defcf265547d4 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E9=BB=84=E8=85=BE?=
 <101850389+hangters@users.noreply.github.com>
Date: Tue, 13 Aug 2024 16:09:10 +0800
Subject: [PATCH] add support for SILICONFLOW (#1926)

### What problem does this PR solve?

#1853 add support for SILICONFLOW

### Type of change


- [x] New Feature (non-breaking change which adds functionality)

---------

Co-authored-by: Zhedong Cen <cenzhedong2@126.com>
---
 conf/llm_factories.json                       | 286 +++++++++++++++++-
 rag/llm/__init__.py                           |   9 +-
 rag/llm/chat_model.py                         |   8 +-
 rag/llm/embedding_model.py                    |   7 +
 rag/llm/rerank_model.py                       |  37 ++-
 web/src/assets/svg/llm/siliconflow.svg        |   6 +
 .../user-setting/setting-model/constant.ts    |   3 +-
 7 files changed, 349 insertions(+), 7 deletions(-)
 create mode 100644 web/src/assets/svg/llm/siliconflow.svg

diff --git a/conf/llm_factories.json b/conf/llm_factories.json
index 2b90ca076..2e556edb6 100644
--- a/conf/llm_factories.json
+++ b/conf/llm_factories.json
@@ -2767,6 +2767,290 @@
                     "model_type": "chat"
                 }
             ]
-        }
+        },
+        {
+            "name": "SILICONFLOW",
+            "logo": "",
+            "tags": "LLM,TEXT EMBEDDING,TEXT RE-RANK",
+            "status": "1",
+            "llm": [
+                {
+                    "llm_name": "Qwen/Qwen2-7B-Instruct",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Qwen/Qwen2-1.5B-Instruct",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Qwen/Qwen1.5-7B-Chat",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "THUDM/glm-4-9b-chat",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "THUDM/chatglm3-6b",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "01-ai/Yi-1.5-9B-Chat-16K",
+                    "tags": "LLM,CHAT,16k",
+                    "max_tokens": 16384,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "01-ai/Yi-1.5-6B-Chat",
+                    "tags": "LLM,CHAT,4k",
+                    "max_tokens": 4096,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "google/gemma-2-9b-it",
+                    "tags": "LLM,CHAT,8k",
+                    "max_tokens": 8192,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "internlm/internlm2_5-7b-chat",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "meta-llama/Meta-Llama-3-8B-Instruct",
+                    "tags": "LLM,CHAT,8k",
+                    "max_tokens": 8192,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "meta-llama/Meta-Llama-3.1-8B-Instruct",
+                    "tags": "LLM,CHAT,8k",
+                    "max_tokens": 8192,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "mistralai/Mistral-7B-Instruct-v0.2",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Pro/Qwen/Qwen2-7B-Instruct",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Pro/Qwen/Qwen2-1.5B-Instruct",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Pro/Qwen/Qwen1.5-7B-Chat",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Pro/THUDM/glm-4-9b-chat",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Pro/THUDM/chatglm3-6b",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Pro/01-ai/Yi-1.5-9B-Chat-16K",
+                    "tags": "LLM,CHAT,16k",
+                    "max_tokens": 16384,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Pro/01-ai/Yi-1.5-6B-Chat",
+                    "tags": "LLM,CHAT,4k",
+                    "max_tokens": 4096,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Pro/internlm/internlm2_5-7b-chat",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Pro/google/gemma-2-9b-it",
+                    "tags": "LLM,CHAT,8k",
+                    "max_tokens": 8192,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Pro/meta-llama/Meta-Llama-3.1-8B-Instruct",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Pro/meta-llama/Meta-Llama-3-8B-Instruct",
+                    "tags": "LLM,CHAT,8k",
+                    "max_tokens": 8192,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Pro/mistralai/Mistral-7B-Instruct-v0.2",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Qwen/Qwen2-72B-Instruct",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Qwen/Qwen2-Math-72B-Instruct",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Qwen/Qwen2-57B-A14B-Instruct",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Qwen/Qwen1.5-110B-Chat",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Qwen/Qwen1.5-32B-Chat",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Qwen/Qwen1.5-14B-Chat",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "01-ai/Yi-1.5-34B-Chat-16K",
+                    "tags": "LLM,CHAT,16k",
+                    "max_tokens": 16384,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "deepseek-ai/DeepSeek-Coder-V2-Instruct",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "deepseek-ai/DeepSeek-V2-Chat",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "deepseek-ai/deepseek-llm-67b-chat",
+                    "tags": "LLM,CHAT,4k",
+                    "max_tokens": 4096,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "internlm/internlm2_5-20b-chat",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "meta-llama/Meta-Llama-3.1-405B-Instruct",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "meta-llama/Meta-Llama-3.1-70B-Instruct",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "meta-llama/Meta-Llama-3-70B-Instruct",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "mistralai/Mixtral-8x7B-Instruct-v0.1",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "google/gemma-2-27b-it",
+                    "tags": "LLM,CHAT,8k",
+                    "max_tokens": 8192,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "BAAI/bge-m3 ",
+                    "tags": "TEXT EMBEDDING,8K",
+                    "max_tokens": 8192,
+                    "model_type": "embedding"
+                },
+                {
+                    "llm_name": "BAAI/bge-large-en-v1.5 ",
+                    "tags": "TEXT EMBEDDING,512",
+                    "max_tokens": 512,
+                    "model_type": "embedding"
+                },
+                {
+                    "llm_name": "BAAI/bge-large-zh-v1.5 ",
+                    "tags": "TEXT EMBEDDING,512",
+                    "max_tokens": 512,
+                    "model_type": "embedding"
+                },
+                {
+                    "llm_name": "netease-youdao/bce-embedding-base_vl",
+                    "tags": "TEXT EMBEDDING,512",
+                    "max_tokens": 512,
+                    "model_type": "embedding"
+                },
+                {
+                    "llm_name": "BAAI/bge-reranker-v2-m3",
+                    "tags": "RE-RANK, 512",
+                    "max_tokens": 1024,
+                    "model_type": "rerank"
+                },
+                {
+                    "llm_name": "netease-youdao/bce-reranker-base-v1",
+                    "tags": "RE-RANK, 512",
+                    "max_tokens": 1024,
+                    "model_type": "rerank"
+                }
+            ]
+        }        
     ]
 }
diff --git a/rag/llm/__init__.py b/rag/llm/__init__.py
index 49a22aa15..1756051d3 100644
--- a/rag/llm/__init__.py
+++ b/rag/llm/__init__.py
@@ -41,7 +41,8 @@ EmbeddingModel = {
     "cohere": CoHereEmbed,
     "TogetherAI": TogetherAIEmbed,
     "PerfXCloud": PerfXCloudEmbed,
-    "Upstage": UpstageEmbed
+    "Upstage": UpstageEmbed,
+    "SILICONFLOW": SILICONFLOWEmbed
 }
 
 
@@ -92,7 +93,8 @@ ChatModel = {
     "TogetherAI": TogetherAIChat,
     "PerfXCloud": PerfXCloudChat,
     "Upstage":UpstageChat,
-    "novita.ai": NovitaAIChat
+    "novita.ai": NovitaAIChat,
+    "SILICONFLOW": SILICONFLOWChat
 }
 
 
@@ -105,7 +107,8 @@ RerankModel = {
     "LM-Studio": LmStudioRerank,
     "OpenAI-API-Compatible": OpenAI_APIRerank,
     "cohere": CoHereRerank,
-    "TogetherAI": TogetherAIRerank
+    "TogetherAI": TogetherAIRerank,
+    "SILICONFLOW": SILICONFLOWRerank
 }
 
 
diff --git a/rag/llm/chat_model.py b/rag/llm/chat_model.py
index 64fc13426..4696499a5 100644
--- a/rag/llm/chat_model.py
+++ b/rag/llm/chat_model.py
@@ -1016,4 +1016,10 @@ class NovitaAIChat(Base):
         if not base_url:
             base_url = "https://api.novita.ai/v3/openai"
         super().__init__(key, model_name, base_url)
-        
\ No newline at end of file
+
+
+class SILICONFLOWChat(Base):
+    def __init__(self, key, model_name, base_url="https://api.siliconflow.cn/v1"):
+        if not base_url:
+            base_url = "https://api.siliconflow.cn/v1"
+        super().__init__(key, model_name, base_url)
\ No newline at end of file
diff --git a/rag/llm/embedding_model.py b/rag/llm/embedding_model.py
index db5f450a4..d0e011197 100644
--- a/rag/llm/embedding_model.py
+++ b/rag/llm/embedding_model.py
@@ -574,3 +574,10 @@ class UpstageEmbed(OpenAIEmbed):
         if not base_url:
             base_url = "https://api.upstage.ai/v1/solar"
         super().__init__(key, model_name, base_url)
+
+
+class SILICONFLOWEmbed(OpenAIEmbed):
+    def __init__(self, key, model_name, base_url="https://api.siliconflow.cn/v1"):
+        if not base_url:
+            base_url = "https://api.siliconflow.cn/v1"
+        super().__init__(key, model_name, base_url)
\ No newline at end of file
diff --git a/rag/llm/rerank_model.py b/rag/llm/rerank_model.py
index 7f39f7a6a..f452ea6c7 100644
--- a/rag/llm/rerank_model.py
+++ b/rag/llm/rerank_model.py
@@ -252,4 +252,39 @@ class TogetherAIRerank(Base):
         pass
 
     def similarity(self, query: str, texts: list):
-        raise NotImplementedError("The api has not been implement")
\ No newline at end of file
+        raise NotImplementedError("The api has not been implement")
+
+
+class SILICONFLOWRerank(Base):
+    def __init__(
+        self, key, model_name, base_url="https://api.siliconflow.cn/v1/rerank"
+    ):
+        if not base_url:
+            base_url = "https://api.siliconflow.cn/v1/rerank"
+        self.model_name = model_name
+        self.base_url = base_url
+        self.headers = {
+            "accept": "application/json",
+            "content-type": "application/json",
+            "authorization": f"Bearer {key}",
+        }
+
+    def similarity(self, query: str, texts: list):
+        payload = {
+            "model": self.model_name,
+            "query": query,
+            "documents": texts,
+            "top_n": len(texts),
+            "return_documents": False,
+            "max_chunks_per_doc": 1024,
+            "overlap_tokens": 80,
+        }
+        response = requests.post(
+            self.base_url, json=payload, headers=self.headers
+        ).json()
+        rank = np.array([d["relevance_score"] for d in response["results"]])
+        indexs = [d["index"] for d in response["results"]]
+        return (
+            rank[indexs],
+            response["meta"]["tokens"]["input_tokens"] + response["meta"]["tokens"]["output_tokens"],
+        )
diff --git a/web/src/assets/svg/llm/siliconflow.svg b/web/src/assets/svg/llm/siliconflow.svg
new file mode 100644
index 000000000..4ce6323dc
--- /dev/null
+++ b/web/src/assets/svg/llm/siliconflow.svg
@@ -0,0 +1,6 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<svg version="1.1" xmlns="http://www.w3.org/2000/svg" width="80" height="80">
+<path d="M0 0 C1.02148636 -0.00960754 2.04297272 -0.01921509 3.09541321 -0.02911377 C4.75010872 -0.03548859 4.75010872 -0.03548859 6.43823242 -0.04199219 C7.57395187 -0.04769226 8.70967133 -0.05339233 9.87980652 -0.05926514 C12.28477038 -0.06871672 14.68974721 -0.07524974 17.09472656 -0.07910156 C20.76870405 -0.08880119 24.44212077 -0.11982145 28.1159668 -0.15136719 C30.45255202 -0.15789791 32.78914124 -0.16314811 35.12573242 -0.16699219 C36.22279007 -0.17933899 37.31984772 -0.19168579 38.45014954 -0.20440674 C44.02913207 -0.18816619 48.2109756 -0.08523706 52.98120117 3.16113281 C56.8930694 7.39017955 58.0991288 10.49128125 58.14233398 16.17993164 C58.15194153 17.201418 58.16154907 18.22290436 58.17144775 19.27534485 C58.17569763 20.37847519 58.17994751 21.48160553 58.18432617 22.61816406 C58.19002625 23.75388351 58.19572632 24.88960297 58.20159912 26.05973816 C58.21105071 28.46470202 58.21758373 30.86967885 58.22143555 33.2746582 C58.23113518 36.94863569 58.26215544 40.62205241 58.29370117 44.29589844 C58.30023189 46.63248366 58.30548209 48.96907288 58.30932617 51.30566406 C58.32167297 52.40272171 58.33401978 53.49977936 58.34674072 54.63008118 C58.33050017 60.20906371 58.22757104 64.39090724 54.98120117 69.16113281 C50.75215444 73.07300104 47.65105273 74.27906044 41.96240234 74.32226562 C40.94091599 74.33187317 39.91942963 74.34148071 38.86698914 74.35137939 C37.21229362 74.35775421 37.21229362 74.35775421 35.52416992 74.36425781 C34.38845047 74.36995789 33.25273102 74.37565796 32.08259583 74.38153076 C29.67763196 74.39098235 27.27265513 74.39751537 24.86767578 74.40136719 C21.19369829 74.41106682 17.52028157 74.44208708 13.84643555 74.47363281 C11.50985033 74.48016353 9.17326111 74.48541373 6.83666992 74.48925781 C5.73961227 74.50160461 4.64255463 74.51395142 3.51225281 74.52667236 C-2.06672973 74.51043182 -6.24857325 74.40750268 -11.01879883 71.16113281 C-14.93066706 66.93208608 -16.13672646 63.83098437 -16.17993164 58.14233398 C-16.18953918 57.12084763 -16.19914673 56.09936127 -16.20904541 55.04692078 C-16.21329529 53.94379044 -16.21754517 52.8406601 -16.22192383 51.70410156 C-16.2276239 50.56838211 -16.23332397 49.43266266 -16.23919678 48.26252747 C-16.24864836 45.8575636 -16.25518138 43.45258677 -16.2590332 41.04760742 C-16.26873283 37.37362993 -16.29975309 33.70021321 -16.33129883 30.02636719 C-16.33782955 27.68978197 -16.34307975 25.35319275 -16.34692383 23.01660156 C-16.35927063 21.91954391 -16.37161743 20.82248627 -16.38433838 19.69218445 C-16.36809783 14.11320191 -16.2651687 9.93135839 -13.01879883 5.16113281 C-8.78975209 1.24926458 -5.68865039 0.04320518 0 0 Z " fill="#8359F6" transform="translate(19.018798828125,2.8388671875)"/>
+<path d="M0 0 C1.15145508 -0.03673828 1.15145508 -0.03673828 2.32617188 -0.07421875 C7.92495778 -0.10350621 7.92495778 -0.10350621 10.4375 2.2421875 C11.69562959 4.92554202 11.95020734 6.44524379 11.4375 9.375 C10.125 11.625 10.125 11.625 7.4375 13.375 C5.6323643 13.60827908 3.81695494 13.76725604 2 13.875 C-1.5560898 14.09814582 -3.45201973 14.31975987 -6.6875 15.9375 C-9.35595151 19.40648696 -9.3455524 22.03604808 -9.5625 26.375 C-8.46550781 26.32859375 -7.36851563 26.2821875 -6.23828125 26.234375 C-4.7838815 26.1968421 -3.32945217 26.16044357 -1.875 26.125 C-1.15376953 26.09148438 -0.43253906 26.05796875 0.31054688 26.0234375 C4.1678197 25.95298503 6.04994221 26.1445738 9.453125 28.16796875 C11.4375 30.375 11.4375 30.375 11.5 33.9375 C10.3064266 37.79906101 9.92419627 38.52877486 6.4375 40.375 C3.60349714 40.58840383 1.00733831 40.65964991 -1.8125 40.5625 C-2.55757812 40.54896484 -3.30265625 40.53542969 -4.0703125 40.52148438 C-5.90135416 40.48627204 -7.73202169 40.43246851 -9.5625 40.375 C-9.51029297 42.22351562 -9.51029297 42.22351562 -9.45703125 44.109375 C-9.46245748 49.03638883 -10.7883193 52.32181391 -13.5625 56.375 C-18.10435427 60.80039647 -22.68322603 62.66040037 -29 62.75 C-34.81308178 62.62515529 -37.9397117 61.1121333 -41.99609375 56.87890625 C-46.69765352 51.53804091 -46.91431201 47.18794083 -46.83984375 40.3203125 C-46.32742664 34.87858711 -43.407234 32.01177889 -39.5 28.5625 C-35.61307697 25.66798285 -33.0886645 25.25128358 -28.375 25.3125 C-27.47394531 25.32152344 -26.57289062 25.33054687 -25.64453125 25.33984375 C-24.95746094 25.35144531 -24.27039063 25.36304687 -23.5625 25.375 C-23.68625 23.951875 -23.68625 23.951875 -23.8125 22.5 C-23.77685224 16.64188446 -21.77569622 10.87575768 -17.87890625 6.47265625 C-16.16016842 4.9609062 -14.48188794 3.62091848 -12.5625 2.375 C-12.00691406 2.00117188 -11.45132813 1.62734375 -10.87890625 1.2421875 C-7.29507618 -0.09948244 -3.79543712 0.0064058 0 0 Z " fill="#FCFBFE" transform="translate(55.5625,8.625)"/>
+<path d="M0 0 C2 2 2 2 2.3125 4.4375 C2 7 2 7 0.9375 8.875 C-2.11569315 10.64782183 -4.66411708 9.69235306 -8 9 C-9.32561852 2.61292897 -9.32561852 2.61292897 -7.9375 0 C-5.02830946 -1.5015177 -3.0821738 -0.85251616 0 0 Z " fill="#885FF6" transform="translate(31,48)"/>
+</svg>
diff --git a/web/src/pages/user-setting/setting-model/constant.ts b/web/src/pages/user-setting/setting-model/constant.ts
index b2a79ee09..196fc6476 100644
--- a/web/src/pages/user-setting/setting-model/constant.ts
+++ b/web/src/pages/user-setting/setting-model/constant.ts
@@ -28,7 +28,8 @@ export const IconMap = {
   TogetherAI:'together-ai',
   PerfXCould: 'perfx-could',
   Upstage: 'upstage',
-  "novita.ai": 'novita-ai'
+  "novita.ai": 'novita-ai',
+  "SILICONFLOW": 'siliconflow'
 };
 
 export const BedrockRegionList = [