Add suuport for AWS Bedrock Cohere embedding (#3444)

2025-08-13 11:59:00 +08:00 · 2024-04-16 13:22:38 +08:00 · 2024-04-16 13:22:38 +08:00 · 200010be19
commit 200010be19
parent 5e02a83b53
4 changed files with 58 additions and 15 deletions
--- a/api/core/model_runtime/model_providers/bedrock/text_embedding/_position.yaml
+++ b/api/core/model_runtime/model_providers/bedrock/text_embedding/_position.yaml
@ -1 +1,3 @@
 - amazon.titan-embed-text-v1
 - cohere.embed-english-v3
 - cohere.embed-multilingual-v3
--- a/api/core/model_runtime/model_providers/bedrock/text_embedding/cohere.embed-english-v3.yaml
+++ b/api/core/model_runtime/model_providers/bedrock/text_embedding/cohere.embed-english-v3.yaml
@ -0,0 +1,8 @@
 model: cohere.embed-english-v3
 model_type: text-embedding
 model_properties:
  context_size: 512
 pricing:
  input: '0.1'
  unit: '0.000001'
  currency: USD
--- a/api/core/model_runtime/model_providers/bedrock/text_embedding/cohere.embed-multilingual-v3.yaml
+++ b/api/core/model_runtime/model_providers/bedrock/text_embedding/cohere.embed-multilingual-v3.yaml
@ -0,0 +1,8 @@
 model: cohere.embed-multilingual-v3
 model_type: text-embedding
 model_properties:
  context_size: 512
 pricing:
  input: '0.1'
  unit: '0.000001'
  currency: USD
--- a/api/core/model_runtime/model_providers/bedrock/text_embedding/text_embedding.py
+++ b/api/core/model_runtime/model_providers/bedrock/text_embedding/text_embedding.py
@ -1,4 +1,5 @@
 import json
 import logging
 import time
 from typing import Optional
@ -24,6 +25,7 @@ from core.model_runtime.errors.invoke import (
 )
 from core.model_runtime.model_providers.__base.text_embedding_model import TextEmbeddingModel
 logger = logging.getLogger(__name__)
 class BedrockTextEmbeddingModel(TextEmbeddingModel):
@ -53,17 +55,19 @@ class BedrockTextEmbeddingModel(TextEmbeddingModel):
        embeddings = []
        token_usage = 0
-
+        
        model_prefix = model.split('.')[0]
-        if model_prefix == "amazon":
+         
-            for text in texts:
+        if model_prefix == "amazon" :
-                body = {
+           for text in texts:
-                    "inputText": text,
+              body = {
-                }
+                 "inputText": text,
-                response_body = self._invoke_bedrock_embedding(model, bedrock_runtime, body)
+              }
-                embeddings.extend([response_body.get('embedding')])
+              response_body = self._invoke_bedrock_embedding(model, bedrock_runtime, body)
-                token_usage += response_body.get('inputTextTokenCount')
+              embeddings.extend([response_body.get('embedding')])
-            result = TextEmbeddingResult(
+              token_usage += response_body.get('inputTextTokenCount')
           logger.warning(f'Total Tokens: {token_usage}')
           result = TextEmbeddingResult(
                model=model,
                embeddings=embeddings,
                usage=self._calc_response_usage(
@ -71,11 +75,32 @@ class BedrockTextEmbeddingModel(TextEmbeddingModel):
                    credentials=credentials,
                    tokens=token_usage
                )
-            )
+           )
-        else:
+           return result
-            raise ValueError(f"Got unknown model prefix {model_prefix} when handling block response")
+           
-
+        if model_prefix == "cohere" :
-        return result
+           input_type = 'search_document' if len(texts) > 1 else 'search_query'
           for text in texts:
              body = {
                 "texts": [text],
                 "input_type": input_type,
              }
              response_body = self._invoke_bedrock_embedding(model, bedrock_runtime, body)
              embeddings.extend(response_body.get('embeddings'))
              token_usage += len(text)
           result = TextEmbeddingResult(
                model=model,
                embeddings=embeddings,
                usage=self._calc_response_usage(
                    model=model,
                    credentials=credentials,
                    tokens=token_usage
                )
           )
           return result
        #others
        raise ValueError(f"Got unknown model prefix {model_prefix} when handling block response")
    def get_num_tokens(self, model: str, credentials: dict, texts: list[str]) -> int: