mirror of
https://git.mirrors.martin98.com/https://github.com/infiniflow/ragflow.git
synced 2025-04-21 05:29:57 +08:00
Miscellaneous updates (#6245)
### What problem does this PR solve? ### Type of change - [x] Documentation Update
This commit is contained in:
parent
d16033dd2c
commit
f540559c41
@ -353,9 +353,12 @@ docker build -f Dockerfile -t infiniflow/ragflow:nightly .
|
|||||||
## 📚 Documentation
|
## 📚 Documentation
|
||||||
|
|
||||||
- [Quickstart](https://ragflow.io/docs/dev/)
|
- [Quickstart](https://ragflow.io/docs/dev/)
|
||||||
- [User guide](https://ragflow.io/docs/dev/category/guides)
|
- [Configuration](https://ragflow.io/docs/dev/configurations)
|
||||||
|
- [Release notes](https://ragflow.io/docs/dev/release_notes)
|
||||||
|
- [User guides](https://ragflow.io/docs/dev/category/guides)
|
||||||
|
- [Developer guides](https://ragflow.io/docs/dev/category/developers)
|
||||||
- [References](https://ragflow.io/docs/dev/category/references)
|
- [References](https://ragflow.io/docs/dev/category/references)
|
||||||
- [FAQ](https://ragflow.io/docs/dev/faq)
|
- [FAQs](https://ragflow.io/docs/dev/faq)
|
||||||
|
|
||||||
## 📜 Roadmap
|
## 📜 Roadmap
|
||||||
|
|
||||||
|
@ -319,9 +319,12 @@ docker build -f Dockerfile -t infiniflow/ragflow:nightly .
|
|||||||
## 📚 Dokumentasi
|
## 📚 Dokumentasi
|
||||||
|
|
||||||
- [Quickstart](https://ragflow.io/docs/dev/)
|
- [Quickstart](https://ragflow.io/docs/dev/)
|
||||||
- [Panduan Pengguna](https://ragflow.io/docs/dev/category/guides)
|
- [Configuration](https://ragflow.io/docs/dev/configurations)
|
||||||
- [Referensi](https://ragflow.io/docs/dev/category/references)
|
- [Release notes](https://ragflow.io/docs/dev/release_notes)
|
||||||
- [FAQ](https://ragflow.io/docs/dev/faq)
|
- [User guides](https://ragflow.io/docs/dev/category/guides)
|
||||||
|
- [Developer guides](https://ragflow.io/docs/dev/category/developers)
|
||||||
|
- [References](https://ragflow.io/docs/dev/category/references)
|
||||||
|
- [FAQs](https://ragflow.io/docs/dev/faq)
|
||||||
|
|
||||||
## 📜 Roadmap
|
## 📜 Roadmap
|
||||||
|
|
||||||
|
@ -315,9 +315,12 @@ docker build -f Dockerfile -t infiniflow/ragflow:nightly .
|
|||||||
## 📚 ドキュメンテーション
|
## 📚 ドキュメンテーション
|
||||||
|
|
||||||
- [Quickstart](https://ragflow.io/docs/dev/)
|
- [Quickstart](https://ragflow.io/docs/dev/)
|
||||||
- [User guide](https://ragflow.io/docs/dev/category/guides)
|
- [Configuration](https://ragflow.io/docs/dev/configurations)
|
||||||
|
- [Release notes](https://ragflow.io/docs/dev/release_notes)
|
||||||
|
- [User guides](https://ragflow.io/docs/dev/category/guides)
|
||||||
|
- [Developer guides](https://ragflow.io/docs/dev/category/developers)
|
||||||
- [References](https://ragflow.io/docs/dev/category/references)
|
- [References](https://ragflow.io/docs/dev/category/references)
|
||||||
- [FAQ](https://ragflow.io/docs/dev/faq)
|
- [FAQs](https://ragflow.io/docs/dev/faq)
|
||||||
|
|
||||||
## 📜 ロードマップ
|
## 📜 ロードマップ
|
||||||
|
|
||||||
|
@ -315,9 +315,12 @@ docker build -f Dockerfile -t infiniflow/ragflow:nightly .
|
|||||||
## 📚 문서
|
## 📚 문서
|
||||||
|
|
||||||
- [Quickstart](https://ragflow.io/docs/dev/)
|
- [Quickstart](https://ragflow.io/docs/dev/)
|
||||||
- [User guide](https://ragflow.io/docs/dev/category/guides)
|
- [Configuration](https://ragflow.io/docs/dev/configurations)
|
||||||
|
- [Release notes](https://ragflow.io/docs/dev/release_notes)
|
||||||
|
- [User guides](https://ragflow.io/docs/dev/category/guides)
|
||||||
|
- [Developer guides](https://ragflow.io/docs/dev/category/developers)
|
||||||
- [References](https://ragflow.io/docs/dev/category/references)
|
- [References](https://ragflow.io/docs/dev/category/references)
|
||||||
- [FAQ](https://ragflow.io/docs/dev/faq)
|
- [FAQs](https://ragflow.io/docs/dev/faq)
|
||||||
|
|
||||||
## 📜 로드맵
|
## 📜 로드맵
|
||||||
|
|
||||||
|
@ -339,10 +339,13 @@ docker build -f Dockerfile -t infiniflow/ragflow:nightly .
|
|||||||
|
|
||||||
## 📚 Documentação
|
## 📚 Documentação
|
||||||
|
|
||||||
- [Início rápido](https://ragflow.io/docs/dev/)
|
- [Quickstart](https://ragflow.io/docs/dev/)
|
||||||
- [Guia do usuário](https://ragflow.io/docs/dev/category/guides)
|
- [Configuration](https://ragflow.io/docs/dev/configurations)
|
||||||
- [Referências](https://ragflow.io/docs/dev/category/references)
|
- [Release notes](https://ragflow.io/docs/dev/release_notes)
|
||||||
- [FAQ](https://ragflow.io/docs/dev/faq)
|
- [User guides](https://ragflow.io/docs/dev/category/guides)
|
||||||
|
- [Developer guides](https://ragflow.io/docs/dev/category/developers)
|
||||||
|
- [References](https://ragflow.io/docs/dev/category/references)
|
||||||
|
- [FAQs](https://ragflow.io/docs/dev/faq)
|
||||||
|
|
||||||
## 📜 Roadmap
|
## 📜 Roadmap
|
||||||
|
|
||||||
|
@ -329,9 +329,12 @@ npm install
|
|||||||
## 📚 技術文檔
|
## 📚 技術文檔
|
||||||
|
|
||||||
- [Quickstart](https://ragflow.io/docs/dev/)
|
- [Quickstart](https://ragflow.io/docs/dev/)
|
||||||
- [User guide](https://ragflow.io/docs/dev/category/guides)
|
- [Configuration](https://ragflow.io/docs/dev/configurations)
|
||||||
|
- [Release notes](https://ragflow.io/docs/dev/release_notes)
|
||||||
|
- [User guides](https://ragflow.io/docs/dev/category/guides)
|
||||||
|
- [Developer guides](https://ragflow.io/docs/dev/category/developers)
|
||||||
- [References](https://ragflow.io/docs/dev/category/references)
|
- [References](https://ragflow.io/docs/dev/category/references)
|
||||||
- [FAQ](https://ragflow.io/docs/dev/faq)
|
- [FAQs](https://ragflow.io/docs/dev/faq)
|
||||||
|
|
||||||
## 📜 路線圖
|
## 📜 路線圖
|
||||||
|
|
||||||
|
@ -328,9 +328,12 @@ docker build --build-arg NEED_MIRROR=1 -f Dockerfile -t infiniflow/ragflow:night
|
|||||||
## 📚 技术文档
|
## 📚 技术文档
|
||||||
|
|
||||||
- [Quickstart](https://ragflow.io/docs/dev/)
|
- [Quickstart](https://ragflow.io/docs/dev/)
|
||||||
- [User guide](https://ragflow.io/docs/dev/category/guides)
|
- [Configuration](https://ragflow.io/docs/dev/configurations)
|
||||||
|
- [Release notes](https://ragflow.io/docs/dev/release_notes)
|
||||||
|
- [User guides](https://ragflow.io/docs/dev/category/guides)
|
||||||
|
- [Developer guides](https://ragflow.io/docs/dev/category/developers)
|
||||||
- [References](https://ragflow.io/docs/dev/category/references)
|
- [References](https://ragflow.io/docs/dev/category/references)
|
||||||
- [FAQ](https://ragflow.io/docs/dev/faq)
|
- [FAQs](https://ragflow.io/docs/dev/faq)
|
||||||
|
|
||||||
## 📜 路线图
|
## 📜 路线图
|
||||||
|
|
||||||
|
@ -51,18 +51,25 @@ If a rerank model is selected, a combination of weighted keyword similarity and
|
|||||||
Using a rerank model will *significantly* increase the system's response time.
|
Using a rerank model will *significantly* increase the system's response time.
|
||||||
:::
|
:::
|
||||||
|
|
||||||
|
### Tavily API key
|
||||||
|
|
||||||
|
If an API key is correctly set here, Tavily-based web searches will be used to supplement knowledge base retrieval.
|
||||||
|
|
||||||
|
### Use knowledge graph
|
||||||
|
|
||||||
|
It will retrieve descriptions of relevant entities,relations and community reports, which will enhance inference of multi-hop and complex question.
|
||||||
|
|
||||||
### Knowledge bases
|
### Knowledge bases
|
||||||
|
|
||||||
*Required*
|
Select the knowledge base(s) to retrieve data from.
|
||||||
|
|
||||||
You are required to select the knowledge base(s) to retrieve data from.
|
|
||||||
|
|
||||||
:::danger IMPORTANT
|
:::danger IMPORTANT
|
||||||
If you select multiple knowledge bases, you must ensure that the knowledge bases (datasets) you select use the same embedding model; otherwise, an error message would occur.
|
If you select multiple knowledge bases, you must ensure that the knowledge bases (datasets) you select use the same embedding model; otherwise, an error message would occur.
|
||||||
:::
|
:::
|
||||||
|
|
||||||
|
### Empty response
|
||||||
|
|
||||||
|
Set this as a response if no results are retrieved from the knowledge bases for your query, or leave this field blank to allow the LLM to improvise when nothing is found.
|
||||||
|
|
||||||
## Examples
|
## Examples
|
||||||
|
|
||||||
|
@ -39,18 +39,18 @@ This section covers the following topics:
|
|||||||
|
|
||||||
RAGFlow offers multiple chunking template to facilitate chunking files of different layouts and ensure semantic integrity. In **Chunk method**, you can choose the default template that suits the layouts and formats of your files. The following table shows the descriptions and the compatible file formats of each supported chunk template:
|
RAGFlow offers multiple chunking template to facilitate chunking files of different layouts and ensure semantic integrity. In **Chunk method**, you can choose the default template that suits the layouts and formats of your files. The following table shows the descriptions and the compatible file formats of each supported chunk template:
|
||||||
|
|
||||||
| **Template** | Description | File format |
|
| **Template** | Description | File format |
|
||||||
|--------------|-----------------------------------------------------------------------|------------------------------------------------------------------------------|
|
|--------------|-----------------------------------------------------------------------|-----------------------------------------------------------------------------------------------|
|
||||||
| General | Files are consecutively chunked based on a preset chunk token number. | DOCX, XLSX, XLS (Excel97~2003), PPT, PDF, TXT, JPEG, JPG, PNG, TIF, GIF, CSV |
|
| General | Files are consecutively chunked based on a preset chunk token number. | DOCX, XLSX, XLS (Excel97~2003), PPT, PDF, TXT, JPEG, JPG, PNG, TIF, GIF, CSV, JSON, EML, HTML |
|
||||||
| Q&A | | XLSX, XLS (Excel97~2003), CSV/TXT |
|
| Q&A | | XLSX, XLS (Excel97~2003), CSV/TXT |
|
||||||
| Manual | | PDF |
|
| Manual | | PDF |
|
||||||
| Table | | XLSX, XLS (Excel97~2003), CSV/TXT |
|
| Table | | XLSX, XLS (Excel97~2003), CSV/TXT |
|
||||||
| Paper | | PDF |
|
| Paper | | PDF |
|
||||||
| Book | | DOCX, PDF, TXT |
|
| Book | | DOCX, PDF, TXT |
|
||||||
| Laws | | DOCX, PDF, TXT |
|
| Laws | | DOCX, PDF, TXT |
|
||||||
| Presentation | | PDF, PPTX |
|
| Presentation | | PDF, PPTX |
|
||||||
| Picture | | JPEG, JPG, PNG, TIF, GIF |
|
| Picture | | JPEG, JPG, PNG, TIF, GIF |
|
||||||
| One | The entire document is chunked as one. | DOCX, XLSX, XLS (Excel97~2003), PDF, TXT |
|
| One | The entire document is chunked as one. | DOCX, XLSX, XLS (Excel97~2003), PDF, TXT |
|
||||||
|
|
||||||
You can also change a file's chunk method on the **Datasets** page.
|
You can also change a file's chunk method on the **Datasets** page.
|
||||||
|
|
||||||
|
@ -13,6 +13,10 @@ Retrieval accuracy is the touchstone for a production-ready RAG framework. In ad
|
|||||||
|
|
||||||
To use this feature, ensure you have at least one properly configured tag set, specify the tag set(s) on the **Configuration** page of your knowledge base (dataset), and then re-parse your documents to initiate the auto-tag process. During this process, each chunk in your dataset is compared with every entry in the specified tag set(s), and tags are automatically applied based on similarity.
|
To use this feature, ensure you have at least one properly configured tag set, specify the tag set(s) on the **Configuration** page of your knowledge base (dataset), and then re-parse your documents to initiate the auto-tag process. During this process, each chunk in your dataset is compared with every entry in the specified tag set(s), and tags are automatically applied based on similarity.
|
||||||
|
|
||||||
|
:::danger IMPORTANT
|
||||||
|
The auto-tagging feature is *unavailable* on the [Infinity](https://github.com/infiniflow/infinity) document engine.
|
||||||
|
:::
|
||||||
|
|
||||||
## Scenarios
|
## Scenarios
|
||||||
|
|
||||||
Auto-tagging applies in situations where chunks are so similar to each other that the intended chunks cannot be distinguished from the rest. For example, when you have a few chunks about iPhone and a majority about iPhone case or iPhone accessaries, it becomes difficult to retrieve the iPhone-specific chunks without additional information.
|
Auto-tagging applies in situations where chunks are so similar to each other that the intended chunks cannot be distinguished from the rest. For example, when you have a few chunks about iPhone and a majority about iPhone case or iPhone accessaries, it becomes difficult to retrieve the iPhone-specific chunks without additional information.
|
||||||
|
@ -16,6 +16,10 @@ By default, each RAGFlow user is assigned a single team named after their name.
|
|||||||
- Update the default configurations for your datasets.
|
- Update the default configurations for your datasets.
|
||||||
- Parse documents in your datasets.
|
- Parse documents in your datasets.
|
||||||
|
|
||||||
|
:::danger IMPORTANT
|
||||||
|
To allow your team members to view and update your knowledge base, ensure that you set **Permissions** on its **Configuration** page from **Only me** to **Team**.
|
||||||
|
:::
|
||||||
|
|
||||||
:::tip NOTE
|
:::tip NOTE
|
||||||
Team members are currently *not* allowed to invite users to your team, and only you, the team owner, is permitted to do so.
|
Team members are currently *not* allowed to invite users to your team, and only you, the team owner, is permitted to do so.
|
||||||
:::
|
:::
|
||||||
@ -43,3 +47,5 @@ When using email address to invite a team member, ensure it is associated with a
|
|||||||
## Accept or decline team invite
|
## Accept or decline team invite
|
||||||
|
|
||||||

|

|
||||||
|
|
||||||
|
_After accepting the team invite, you should be able to view and update the team owner's knowledge bases whose **Permissions** is set to **Team**._
|
@ -51,7 +51,7 @@ Released on March 11, 2025.
|
|||||||
|
|
||||||
- A repetitive knowledge graph extraction issue.
|
- A repetitive knowledge graph extraction issue.
|
||||||
- Issues with API calling.
|
- Issues with API calling.
|
||||||
- Options in the **Document parser** dropdown are missing.
|
- Options in the **PDF parser**, aka **Document parser**, dropdown are missing.
|
||||||
- A Tavily web search issue.
|
- A Tavily web search issue.
|
||||||
- Unable to preview diagrams or images in an AI chat.
|
- Unable to preview diagrams or images in an AI chat.
|
||||||
|
|
||||||
@ -59,7 +59,7 @@ Released on March 11, 2025.
|
|||||||
|
|
||||||
#### Added documents
|
#### Added documents
|
||||||
|
|
||||||
[Use tag set](./guides/dataset/use_tag_sets.md)
|
- [Use tag set](./guides/dataset/use_tag_sets.md)
|
||||||
|
|
||||||
## v0.17.0
|
## v0.17.0
|
||||||
|
|
||||||
@ -71,7 +71,7 @@ Released on March 3, 2025.
|
|||||||
- AI chat: Leverages Tavily-based web search to enhance contexts in agentic reasoning. To activate this, enter the correct Tavily API key under the **Assistant Setting** tab of your chat assistant dialogue.
|
- AI chat: Leverages Tavily-based web search to enhance contexts in agentic reasoning. To activate this, enter the correct Tavily API key under the **Assistant Setting** tab of your chat assistant dialogue.
|
||||||
- AI chat: Supports starting a chat without specifying knowledge bases.
|
- AI chat: Supports starting a chat without specifying knowledge bases.
|
||||||
- AI chat: HTML files can also be previewed and referenced, in addition to PDF files.
|
- AI chat: HTML files can also be previewed and referenced, in addition to PDF files.
|
||||||
- Dataset: Adds a **Document parser** dropdown menu to dataset configurations. This includes a DeepDoc model option, which is time-consuming, a much faster **naive** option (plain text), which skips DLA (Document Layout Analysis), OCR (Optical Character Recognition), and TSR (Table Structure Recognition) tasks, and several currently *experimental* large model options.
|
- Dataset: Adds a **PDF parser**, aka **Document parser**, dropdown menu to dataset configurations. This includes a DeepDoc model option, which is time-consuming, a much faster **naive** option (plain text), which skips DLA (Document Layout Analysis), OCR (Optical Character Recognition), and TSR (Table Structure Recognition) tasks, and several currently *experimental* large model options.
|
||||||
- Agent component: **(x)** or a forward slash `/` can be used to insert available keys (variables) in the system prompt field of the **Generate** or **Template** component.
|
- Agent component: **(x)** or a forward slash `/` can be used to insert available keys (variables) in the system prompt field of the **Generate** or **Template** component.
|
||||||
- Object storage: Supports using Aliyun OSS (Object Storage Service) as a file storage option.
|
- Object storage: Supports using Aliyun OSS (Object Storage Service) as a file storage option.
|
||||||
- Models: Updates the supported model list for Tongyi-Qianwen (Qwen), adding DeepSeek-specific models; adds ModelScope as a model provider.
|
- Models: Updates the supported model list for Tongyi-Qianwen (Qwen), adding DeepSeek-specific models; adds ModelScope as a model provider.
|
||||||
@ -99,7 +99,7 @@ Adds a key option `"meta_fields"` to the [Update document](./references/python_a
|
|||||||
|
|
||||||
#### Added documents
|
#### Added documents
|
||||||
|
|
||||||
[Run retrieval test](./guides/dataset/run_retrieval_test.md)
|
- [Run retrieval test](./guides/dataset/run_retrieval_test.md)
|
||||||
|
|
||||||
## v0.16.0
|
## v0.16.0
|
||||||
|
|
||||||
|
@ -168,7 +168,7 @@ export default {
|
|||||||
html4excel: 'Excel zu HTML',
|
html4excel: 'Excel zu HTML',
|
||||||
html4excelTip: 'Wenn aktiviert, wird die Tabelle in HTML-Tabellen umgewandelt, mit maximal 256 Zeilen pro Tabelle. Andernfalls wird sie in Schlüssel-Wert-Paare nach Zeilen umgewandelt.',
|
html4excelTip: 'Wenn aktiviert, wird die Tabelle in HTML-Tabellen umgewandelt, mit maximal 256 Zeilen pro Tabelle. Andernfalls wird sie in Schlüssel-Wert-Paare nach Zeilen umgewandelt.',
|
||||||
autoKeywords: 'Auto-Schlüsselwort',
|
autoKeywords: 'Auto-Schlüsselwort',
|
||||||
autoKeywordsTip: 'Extrahiert automatisch N Schlüsselwörter für jeden Chunk, um deren Ranking für Anfragen mit diesen Schlüsselwörtern zu erhöhen. Sie können die hinzugefügten Schlüsselwörter für einen Chunk in der Chunk-Liste überprüfen oder aktualisieren. Beachten Sie, dass zusätzliche Tokens vom in den "Systemmodelleinstellungen" angegebenen LLM verbraucht werden.',
|
autoKeywordsTip: 'Extrahieren Sie automatisch N Schlüsselwörter für jeden Abschnitt, um deren Ranking in Abfragen mit diesen Schlüsselwörtern zu verbessern. Beachten Sie, dass zusätzliche Tokens vom in den "Systemmodelleinstellungen" angegebenen Chat-Modell verbraucht werden. Sie können die hinzugefügten Schlüsselwörter eines Abschnitts in der Abschnittsliste überprüfen oder aktualisieren.',
|
||||||
autoQuestions: 'Auto-Frage',
|
autoQuestions: 'Auto-Frage',
|
||||||
autoQuestionsTip: 'Extrahiert automatisch N Fragen für jeden Chunk, um deren Ranking für Anfragen mit diesen Fragen zu erhöhen. Sie können die hinzugefügten Fragen für einen Chunk in der Chunk-Liste überprüfen oder aktualisieren. Diese Funktion unterbricht den Chunking-Prozess nicht, wenn ein Fehler auftritt, außer dass sie möglicherweise ein leeres Ergebnis zum ursprünglichen Chunk hinzufügt. Beachten Sie, dass zusätzliche Tokens vom in den "Systemmodelleinstellungen" angegebenen LLM verbraucht werden.',
|
autoQuestionsTip: 'Extrahiert automatisch N Fragen für jeden Chunk, um deren Ranking für Anfragen mit diesen Fragen zu erhöhen. Sie können die hinzugefügten Fragen für einen Chunk in der Chunk-Liste überprüfen oder aktualisieren. Diese Funktion unterbricht den Chunking-Prozess nicht, wenn ein Fehler auftritt, außer dass sie möglicherweise ein leeres Ergebnis zum ursprünglichen Chunk hinzufügt. Beachten Sie, dass zusätzliche Tokens vom in den "Systemmodelleinstellungen" angegebenen LLM verbraucht werden.',
|
||||||
redo: 'Möchten Sie die vorhandenen {{chunkNum}} Chunks löschen?',
|
redo: 'Möchten Sie die vorhandenen {{chunkNum}} Chunks löschen?',
|
||||||
@ -246,7 +246,7 @@ export default {
|
|||||||
manual: `<p>Nur <b>PDF</b> wird unterstützt.</p><p>
|
manual: `<p>Nur <b>PDF</b> wird unterstützt.</p><p>
|
||||||
Wir gehen davon aus, dass das Handbuch eine hierarchische Abschnittsstruktur aufweist und verwenden die Titel der untersten Abschnitte als Grundeinheit für die Aufteilung der Dokumente. Daher werden Abbildungen und Tabellen im selben Abschnitt nicht getrennt, was zu größeren Chunk-Größen führen kann.
|
Wir gehen davon aus, dass das Handbuch eine hierarchische Abschnittsstruktur aufweist und verwenden die Titel der untersten Abschnitte als Grundeinheit für die Aufteilung der Dokumente. Daher werden Abbildungen und Tabellen im selben Abschnitt nicht getrennt, was zu größeren Chunk-Größen führen kann.
|
||||||
</p>`,
|
</p>`,
|
||||||
naive: `<p>Unterstützte Dateiformate sind <b>DOCX, EXCEL, PPT, IMAGE, PDF, TXT, MD, JSON, EML, HTML</b>.</p>
|
naive: `<p>Unterstützte Dateiformate sind <b>DOCX, XLSX, XLS (Excel97~2003), PPT, PDF, TXT, JPEG, JPG, PNG, TIF, GIF, CSV, JSON, EML, HTML</b>.</p>
|
||||||
<p>Diese Methode teilt Dateien mit einer 'naiven' Methode auf: </p>
|
<p>Diese Methode teilt Dateien mit einer 'naiven' Methode auf: </p>
|
||||||
<p>
|
<p>
|
||||||
<li>Verwenden eines Erkennungsmodells, um die Texte in kleinere Segmente aufzuteilen.</li>
|
<li>Verwenden eines Erkennungsmodells, um die Texte in kleinere Segmente aufzuteilen.</li>
|
||||||
|
@ -108,7 +108,7 @@ export default {
|
|||||||
processDuration: 'Duration',
|
processDuration: 'Duration',
|
||||||
progressMsg: 'Progress',
|
progressMsg: 'Progress',
|
||||||
testingDescription:
|
testingDescription:
|
||||||
'Conduct a retrieval test to check if RAGFlow can recover the intended content for the LLM. If you have adjusted the default settings, such as keyword similarity weight or similarity threshold, to achieve the optimal results, be aware that these changes will not be automatically saved. You must apply them to your chat assistant settings or the **Retrieval** agent component settings.',
|
'Conduct a retrieval test to check if RAGFlow can recover the intended content for the LLM. If you have adjusted the default settings, such as keyword similarity weight or similarity threshold, to achieve the optimal results, be aware that these changes will not be automatically saved. You must apply them to your chat assistant settings or the Retrieval agent component settings.',
|
||||||
similarityThreshold: 'Similarity threshold',
|
similarityThreshold: 'Similarity threshold',
|
||||||
similarityThresholdTip:
|
similarityThresholdTip:
|
||||||
'RAGFlow employs either a combination of weighted keyword similarity and weighted vector cosine similarity, or a combination of weighted keyword similarity and weighted reranking score during retrieval. This parameter sets the threshold for similarities between the user query and chunks. Any chunk with a similarity score below this threshold will be excluded from the results.',
|
'RAGFlow employs either a combination of weighted keyword similarity and weighted vector cosine similarity, or a combination of weighted keyword similarity and weighted reranking score during retrieval. This parameter sets the threshold for similarities between the user query and chunks. Any chunk with a similarity score below this threshold will be excluded from the results.',
|
||||||
@ -167,7 +167,7 @@ export default {
|
|||||||
html4excel: 'Excel to HTML',
|
html4excel: 'Excel to HTML',
|
||||||
html4excelTip: `When enabled, the spreadsheet will be parsed into HTML tables, and at most 256 rows for one table. Otherwise, it will be parsed into key-value pairs by row.`,
|
html4excelTip: `When enabled, the spreadsheet will be parsed into HTML tables, and at most 256 rows for one table. Otherwise, it will be parsed into key-value pairs by row.`,
|
||||||
autoKeywords: 'Auto-keyword',
|
autoKeywords: 'Auto-keyword',
|
||||||
autoKeywordsTip: `Automatically extract N keywords for each chunk to increase their ranking for queries containing those keywords. You can check or update the added keywords for a chunk from the chunk list. Be aware that extra tokens will be consumed by the LLM specified in 'System model settings'.`,
|
autoKeywordsTip: `Automatically extract N keywords for each chunk to increase their ranking for queries containing those keywords. Be aware that extra tokens will be consumed by the chat model specified in 'System model settings'. You can check or update the added keywords for a chunk from the chunk list. `,
|
||||||
autoQuestions: 'Auto-question',
|
autoQuestions: 'Auto-question',
|
||||||
autoQuestionsTip: `Automatically extract N questions for each chunk to increase their ranking for queries containing those questions. You can check or update the added questions for a chunk from the chunk list. This feature will not disrupt the chunking process if an error occurs, except that it may add an empty result to the original chunk. Be aware that extra tokens will be consumed by the LLM specified in 'System model settings'.`,
|
autoQuestionsTip: `Automatically extract N questions for each chunk to increase their ranking for queries containing those questions. You can check or update the added questions for a chunk from the chunk list. This feature will not disrupt the chunking process if an error occurs, except that it may add an empty result to the original chunk. Be aware that extra tokens will be consumed by the LLM specified in 'System model settings'.`,
|
||||||
redo: 'Do you want to clear the existing {{chunkNum}} chunks?',
|
redo: 'Do you want to clear the existing {{chunkNum}} chunks?',
|
||||||
@ -246,7 +246,7 @@ export default {
|
|||||||
manual: `<p>Only <b>PDF</b> is supported.</p><p>
|
manual: `<p>Only <b>PDF</b> is supported.</p><p>
|
||||||
We assume that the manual has a hierarchical section structure, using the lowest section titles as basic unit for chunking documents. Therefore, figures and tables in the same section will not be separated, which may result in larger chunk sizes.
|
We assume that the manual has a hierarchical section structure, using the lowest section titles as basic unit for chunking documents. Therefore, figures and tables in the same section will not be separated, which may result in larger chunk sizes.
|
||||||
</p>`,
|
</p>`,
|
||||||
naive: `<p>Supported file formats are <b>DOCX, EXCEL, PPT, IMAGE, PDF, TXT, MD, JSON, EML, HTML</b>.</p>
|
naive: `<p>Supported file formats are <b>DOCX, XLSX, XLS (Excel97~2003), PPT, PDF, TXT, JPEG, JPG, PNG, TIF, GIF, CSV, JSON, EML, HTML</b>.</p>
|
||||||
<p>This method chunks files using a 'naive' method: </p>
|
<p>This method chunks files using a 'naive' method: </p>
|
||||||
<p>
|
<p>
|
||||||
<li>Use vision detection model to split the texts into smaller segments.</li>
|
<li>Use vision detection model to split the texts into smaller segments.</li>
|
||||||
|
@ -209,7 +209,7 @@ export default {
|
|||||||
Kami mengasumsikan manual memiliki struktur bagian hierarkis. Kami menggunakan judul bagian terendah sebagai poros untuk memotong dokumen.
|
Kami mengasumsikan manual memiliki struktur bagian hierarkis. Kami menggunakan judul bagian terendah sebagai poros untuk memotong dokumen.
|
||||||
Jadi, gambar dan tabel dalam bagian yang sama tidak akan dipisahkan, dan ukuran potongan mungkin besar.
|
Jadi, gambar dan tabel dalam bagian yang sama tidak akan dipisahkan, dan ukuran potongan mungkin besar.
|
||||||
</p>`,
|
</p>`,
|
||||||
naive: `<p>Format file yang didukung adalah <b>DOCX, EXCEL, PPT, IMAGE, PDF, TXT, MD, JSON, EML, HTML</b>.</p>
|
naive: `<p>Format file yang didukung adalah <b>DOCX, XLSX, XLS (Excel97~2003), PPT, PDF, TXT, JPEG, JPG, PNG, TIF, GIF, CSV, JSON, EML, HTML</b>.</p>
|
||||||
<p>Metode ini menerapkan cara naif untuk memotong file: </p>
|
<p>Metode ini menerapkan cara naif untuk memotong file: </p>
|
||||||
<p>
|
<p>
|
||||||
<li>Teks berturut-turut akan dipotong menjadi potongan menggunakan model deteksi visual.</li>
|
<li>Teks berturut-turut akan dipotong menjadi potongan menggunakan model deteksi visual.</li>
|
||||||
|
@ -162,7 +162,7 @@ export default {
|
|||||||
html4excel: 'ExcelをHTMLに変換',
|
html4excel: 'ExcelをHTMLに変換',
|
||||||
html4excelTip: `有効にすると、スプレッドシートはHTMLテーブルとして解析されます。それ以外の場合、キーと値のペアとして解析されます。`,
|
html4excelTip: `有効にすると、スプレッドシートはHTMLテーブルとして解析されます。それ以外の場合、キーと値のペアとして解析されます。`,
|
||||||
autoKeywords: '自動キーワード',
|
autoKeywords: '自動キーワード',
|
||||||
autoKeywordsTip: `各チャンクの上位Nキーワードを抽出してランキングを向上させます。`,
|
autoKeywordsTip: `各チャンクに含まれるキーワードのランキングを向上させるために、自動的にN個のキーワードを抽出します。「システムモデル設定」で指定されたチャットモデルによって追加のトークンが消費されることに注意してください。チャンクリストから追加されたキーワードを確認または更新することができます。`,
|
||||||
autoQuestions: '自動質問',
|
autoQuestions: '自動質問',
|
||||||
autoQuestionsTip: `各チャンクの上位N質問を抽出してランキングを向上させます。`,
|
autoQuestionsTip: `各チャンクの上位N質問を抽出してランキングを向上させます。`,
|
||||||
},
|
},
|
||||||
@ -212,7 +212,7 @@ export default {
|
|||||||
manual: `<p>対応するのは<b>PDF</b>のみです。</p><p>
|
manual: `<p>対応するのは<b>PDF</b>のみです。</p><p>
|
||||||
マニュアルは階層的なセクション構造を持つと仮定され、最下位のセクションタイトルを基にチャンク分割を行います。そのため、同じセクション内の図表は分割されませんが、大きなチャンクサイズになる可能性があります。
|
マニュアルは階層的なセクション構造を持つと仮定され、最下位のセクションタイトルを基にチャンク分割を行います。そのため、同じセクション内の図表は分割されませんが、大きなチャンクサイズになる可能性があります。
|
||||||
</p>`,
|
</p>`,
|
||||||
naive: `<p>対応ファイル形式は<b>DOCX, EXCEL, PPT, IMAGE, PDF, TXT, MD, JSON, EML, HTML</b>です。</p>
|
naive: `<p>対応ファイル形式は<b>DOCX, XLSX, XLS (Excel97~2003), PPT, PDF, TXT, JPEG, JPG, PNG, TIF, GIF, CSV, JSON, EML, HTML</b>です。</p>
|
||||||
<p>この方法では、'ナイーブ'な方法でファイルを分割します:</p>
|
<p>この方法では、'ナイーブ'な方法でファイルを分割します:</p>
|
||||||
<p>
|
<p>
|
||||||
<li>視覚認識モデルを使用してテキストを小さなセグメントに分割します。</li>
|
<li>視覚認識モデルを使用してテキストを小さなセグメントに分割します。</li>
|
||||||
|
@ -170,7 +170,7 @@ export default {
|
|||||||
'Quando ativado, a planilha será analisada em tabelas HTML, com no máximo 256 linhas por tabela. Caso contrário, será analisada em pares chave-valor por linha.',
|
'Quando ativado, a planilha será analisada em tabelas HTML, com no máximo 256 linhas por tabela. Caso contrário, será analisada em pares chave-valor por linha.',
|
||||||
autoKeywords: 'Palavras-chave automáticas',
|
autoKeywords: 'Palavras-chave automáticas',
|
||||||
autoKeywordsTip:
|
autoKeywordsTip:
|
||||||
'Extraia automaticamente N palavras-chave para cada fragmento para aumentar sua classificação para consultas que contenham essas palavras-chave. Você pode verificar ou atualizar as palavras-chave adicionadas para um fragmento na lista de fragmentos. Esteja ciente de que tokens extras serão consumidos pelo LLM especificado nas "Configurações do modelo do sistema".',
|
'Extraia automaticamente N palavras-chave de cada bloco para aumentar sua classificação em consultas que contenham essas palavras-chave. Esteja ciente de que o modelo de chat especificado nas "Configurações do modelo do sistema" consumirá tokens adicionais. Você pode verificar ou atualizar as palavras-chave adicionadas a um bloco na lista de blocos.',
|
||||||
autoQuestions: 'Perguntas automáticas',
|
autoQuestions: 'Perguntas automáticas',
|
||||||
autoQuestionsTip: `Extraia automaticamente N perguntas para cada fragmento para aumentar sua relevância em consultas que contenham essas perguntas. Você pode verificar ou atualizar as perguntas adicionadas a um fragmento na lista de fragmentos. Essa funcionalidade não interromperá o processo de fragmentação em caso de erro, exceto pelo fato de que pode adicionar um resultado vazio ao fragmento original. Esteja ciente de que tokens extras serão consumidos pelo LLM especificado nas 'Configurações do modelo do sistema'.`,
|
autoQuestionsTip: `Extraia automaticamente N perguntas para cada fragmento para aumentar sua relevância em consultas que contenham essas perguntas. Você pode verificar ou atualizar as perguntas adicionadas a um fragmento na lista de fragmentos. Essa funcionalidade não interromperá o processo de fragmentação em caso de erro, exceto pelo fato de que pode adicionar um resultado vazio ao fragmento original. Esteja ciente de que tokens extras serão consumidos pelo LLM especificado nas 'Configurações do modelo do sistema'.`,
|
||||||
redo: 'Deseja limpar os {{chunkNum}} fragmentos existentes?',
|
redo: 'Deseja limpar os {{chunkNum}} fragmentos existentes?',
|
||||||
@ -243,7 +243,7 @@ export default {
|
|||||||
Os fragmentos terão granularidade compatível com 'ARTIGO', garantindo que todo o texto de nível superior seja incluído no fragmento.</p>`,
|
Os fragmentos terão granularidade compatível com 'ARTIGO', garantindo que todo o texto de nível superior seja incluído no fragmento.</p>`,
|
||||||
manual: `<p>Apenas <b>PDF</b> é suportado.</p><p>
|
manual: `<p>Apenas <b>PDF</b> é suportado.</p><p>
|
||||||
Assumimos que o manual tem uma estrutura hierárquica de seções, usando os títulos das seções inferiores como unidade básica para fragmentação. Assim, figuras e tabelas na mesma seção não serão separadas, o que pode resultar em fragmentos maiores.</p>`,
|
Assumimos que o manual tem uma estrutura hierárquica de seções, usando os títulos das seções inferiores como unidade básica para fragmentação. Assim, figuras e tabelas na mesma seção não serão separadas, o que pode resultar em fragmentos maiores.</p>`,
|
||||||
naive: `<p>Os formatos de arquivo suportados são <b>DOCX, EXCEL, PPT, IMAGE, PDF, TXT, MD, JSON, EML, HTML</b>.</p>
|
naive: `<p>Os formatos de arquivo suportados são <b>DOCX, XLSX, XLS (Excel97~2003), PPT, PDF, TXT, JPEG, JPG, PNG, TIF, GIF, CSV, JSON, EML, HTML</b>.</p>
|
||||||
<p>Este método fragmenta arquivos de maneira 'simples':</p>
|
<p>Este método fragmenta arquivos de maneira 'simples':</p>
|
||||||
<p>
|
<p>
|
||||||
<li>Usa um modelo de detecção visual para dividir os textos em segmentos menores.</li>
|
<li>Usa um modelo de detecção visual para dividir os textos em segmentos menores.</li>
|
||||||
|
@ -166,7 +166,7 @@ export default {
|
|||||||
html4excel: 'Excel sang HTML',
|
html4excel: 'Excel sang HTML',
|
||||||
html4excelTip: `Excel sẽ được phân tích cú pháp thành bảng HTML hay không. Nếu là FALSE, mỗi hàng trong Excel sẽ được tạo thành một khối.`,
|
html4excelTip: `Excel sẽ được phân tích cú pháp thành bảng HTML hay không. Nếu là FALSE, mỗi hàng trong Excel sẽ được tạo thành một khối.`,
|
||||||
autoKeywords: 'Từ khóa tự động',
|
autoKeywords: 'Từ khóa tự động',
|
||||||
autoKeywordsTip: `Trích xuất N từ khóa cho mỗi khối để tăng thứ hạng của chúng cho các truy vấn chứa các từ khóa đó. Bạn có thể kiểm tra hoặc cập nhật các từ khóa đã thêm cho một khối từ danh sách khối. Lưu ý rằng các token bổ sung sẽ được tiêu thụ bởi LLM được chỉ định trong 'Cài đặt mô hình hệ thống'.`,
|
autoKeywordsTip: `Tự động trích xuất N từ khóa cho mỗi khối để tăng thứ hạng của chúng trong các truy vấn chứa các từ khóa đó. Lưu ý rằng các token bổ sung sẽ được tiêu thụ bởi mô hình trò chuyện được chỉ định trong "Cài đặt mô hình hệ thống". Bạn có thể kiểm tra hoặc cập nhật các từ khóa đã thêm cho một khối từ danh sách khối.`,
|
||||||
autoQuestions: 'Câu hỏi tự động',
|
autoQuestions: 'Câu hỏi tự động',
|
||||||
autoQuestionsTip: `Trích xuất N câu hỏi cho mỗi khối để tăng thứ hạng của chúng cho các truy vấn chứa các câu hỏi đó. Bạn có thể kiểm tra hoặc cập nhật các câu hỏi đã thêm cho một khối từ danh sách khối. Tính năng này sẽ không làm gián đoạn quá trình phân khối nếu xảy ra lỗi, ngoại trừ việc nó có thể thêm kết quả trống vào khối gốc. Lưu ý rằng các token bổ sung sẽ được tiêu thụ bởi LLM được chỉ định trong 'Cài đặt mô hình hệ thống'.`,
|
autoQuestionsTip: `Trích xuất N câu hỏi cho mỗi khối để tăng thứ hạng của chúng cho các truy vấn chứa các câu hỏi đó. Bạn có thể kiểm tra hoặc cập nhật các câu hỏi đã thêm cho một khối từ danh sách khối. Tính năng này sẽ không làm gián đoạn quá trình phân khối nếu xảy ra lỗi, ngoại trừ việc nó có thể thêm kết quả trống vào khối gốc. Lưu ý rằng các token bổ sung sẽ được tiêu thụ bởi LLM được chỉ định trong 'Cài đặt mô hình hệ thống'.`,
|
||||||
delimiterTip: `Hỗ trợ nhiều ký tự phân cách, và các ký tự phân cách nhiều ký tự được bao bọc bởi dấu . Ví dụ: nếu được cấu hình như thế này: "##"; thì văn bản sẽ được phân tách bởi dấu xuống dòng, hai dấu # và dấu chấm phẩy, sau đó được lắp ráp theo kích thước của "số token".`,
|
delimiterTip: `Hỗ trợ nhiều ký tự phân cách, và các ký tự phân cách nhiều ký tự được bao bọc bởi dấu . Ví dụ: nếu được cấu hình như thế này: "##"; thì văn bản sẽ được phân tách bởi dấu xuống dòng, hai dấu # và dấu chấm phẩy, sau đó được lắp ráp theo kích thước của "số token".`,
|
||||||
@ -229,7 +229,7 @@ export default {
|
|||||||
<p>
|
<p>
|
||||||
<li>Sử dụng mô hình nhận dạng thị giác để chia các văn bản thành các phân đoạn nhỏ hơn.</li>
|
<li>Sử dụng mô hình nhận dạng thị giác để chia các văn bản thành các phân đoạn nhỏ hơn.</li>
|
||||||
<li>Sau đó, kết hợp các phân đoạn liền kề cho đến khi số lượng token vượt quá ngưỡng được chỉ định bởi 'Số token khối', tại thời điểm đó, một khối được tạo.</li></p>
|
<li>Sau đó, kết hợp các phân đoạn liền kề cho đến khi số lượng token vượt quá ngưỡng được chỉ định bởi 'Số token khối', tại thời điểm đó, một khối được tạo.</li></p>
|
||||||
<p>Các định dạng tệp được hỗ trợ là <b>DOCX, EXCEL, PPT, IMAGE, PDF, TXT, MD, JSON, EML, HTML</b>.</p>`,
|
<p>Các định dạng tệp được hỗ trợ là <b>DOCX, XLSX, XLS (Excel97~2003), PPT, PDF, TXT, JPEG, JPG, PNG, TIF, GIF, CSV, JSON, EML, HTML</b>.</p>`,
|
||||||
paper: `<p>Chỉ hỗ trợ tệp <b>PDF</b>.</p><p>
|
paper: `<p>Chỉ hỗ trợ tệp <b>PDF</b>.</p><p>
|
||||||
Bài báo sẽ được chia theo các phần, chẳng hạn như <i>tóm tắt, 1.1, 1.2</i>. </p><p>
|
Bài báo sẽ được chia theo các phần, chẳng hạn như <i>tóm tắt, 1.1, 1.2</i>. </p><p>
|
||||||
Cách tiếp cận này cho phép LLM tóm tắt bài báo hiệu quả hơn và cung cấp các phản hồi toàn diện, dễ hiểu hơn.
|
Cách tiếp cận này cho phép LLM tóm tắt bài báo hiệu quả hơn và cung cấp các phản hồi toàn diện, dễ hiểu hơn.
|
||||||
|
@ -165,7 +165,7 @@ export default {
|
|||||||
html4excel: '表格轉HTML',
|
html4excel: '表格轉HTML',
|
||||||
html4excelTip: `啟用後,電子表格將解析為 HTML 表格,一張表格最多 256 行。否則,會按行解析成鍵值對。`,
|
html4excelTip: `啟用後,電子表格將解析為 HTML 表格,一張表格最多 256 行。否則,會按行解析成鍵值對。`,
|
||||||
autoKeywords: '自動關鍵字',
|
autoKeywords: '自動關鍵字',
|
||||||
autoKeywordsTip: `在查詢此類關鍵字時,為每個區塊提取 N 個關鍵字以提高其排名分數。在「系統模型設定」中設定的 LLM 將消耗額外的 token。您可以在區塊清單中查看結果。 `,
|
autoKeywordsTip: `自動為每個文字區塊中提取 N 個關鍵詞,以提升查詢精度。請注意:此功能採用「系統模型設定」中設定的預設聊天模型提取關鍵詞,因此也會產生更多 Token 消耗。此外,你也可以手動更新生成的關鍵詞。`,
|
||||||
autoQuestions: '自動問題',
|
autoQuestions: '自動問題',
|
||||||
autoQuestionsTip: `在查詢此類問題時,為每個區塊提取 N 個問題以提高其排名分數。在「系統模型設定」中設定的 LLM 將消耗額外的 token。您可以在區塊清單中查看結果。如果發生錯誤,此功能不會破壞整個分塊過程,除了將空結果新增至原始區塊。 `,
|
autoQuestionsTip: `在查詢此類問題時,為每個區塊提取 N 個問題以提高其排名分數。在「系統模型設定」中設定的 LLM 將消耗額外的 token。您可以在區塊清單中查看結果。如果發生錯誤,此功能不會破壞整個分塊過程,除了將空結果新增至原始區塊。 `,
|
||||||
redo: '是否清空已有 {{chunkNum}}個 chunk?',
|
redo: '是否清空已有 {{chunkNum}}個 chunk?',
|
||||||
@ -240,7 +240,7 @@ export default {
|
|||||||
我們假設手冊具有分層部分結構。我們使用最低的部分標題作為對文檔進行切片的樞軸。
|
我們假設手冊具有分層部分結構。我們使用最低的部分標題作為對文檔進行切片的樞軸。
|
||||||
因此,同一部分中的圖和表不會被分割,並且塊大小可能會很大。
|
因此,同一部分中的圖和表不會被分割,並且塊大小可能會很大。
|
||||||
</p>`,
|
</p>`,
|
||||||
naive: `<p>支持的文件格式為<b>DOCX、EXCEL、PPT、IMAGE、PDF、TXT、MD、JSON、EML、HTML</b>。</p>
|
naive: `<p>支持的文件格式為<b>DOCX、XLSX、XLS (Excel97~2003)、PPT、PDF、TXT、JPEG、JPG、PNG、TIF、GIF、CSV、JSON、EML、HTML</b>。</p>
|
||||||
<p>此方法將簡單的方法應用於塊文件:</p>
|
<p>此方法將簡單的方法應用於塊文件:</p>
|
||||||
<p>
|
<p>
|
||||||
<li>系統將使用視覺檢測模型將連續文本分割成多個片段。</li>
|
<li>系統將使用視覺檢測模型將連續文本分割成多個片段。</li>
|
||||||
|
@ -164,9 +164,9 @@ export default {
|
|||||||
'支持多字符作为分隔符,多字符分隔符用`包裹。如配置成这样:\n`##`;那么就会用换行,两个#以及分号先对文本进行分割,然后按照“ token number”大小进行拼装。',
|
'支持多字符作为分隔符,多字符分隔符用`包裹。如配置成这样:\n`##`;那么就会用换行,两个#以及分号先对文本进行分割,然后按照“ token number”大小进行拼装。',
|
||||||
html4excel: '表格转HTML',
|
html4excel: '表格转HTML',
|
||||||
html4excelTip: `开启后电子表格会被解析为 HTML 表格,每张表格最多 256 行,否则会按行解析为键值对。`,
|
html4excelTip: `开启后电子表格会被解析为 HTML 表格,每张表格最多 256 行,否则会按行解析为键值对。`,
|
||||||
autoKeywords: '自动关键词',
|
autoKeywords: '自动关键词提取',
|
||||||
autoKeywordsTip: `在查询此类关键词时,为每个块提取 N 个关键词以提高其排名得分。在“系统模型设置”中设置的 LLM 将消耗额外的 token。您可以在块列表中查看结果。`,
|
autoKeywordsTip: `自动为每个文本块中提取 N 个关键词,用以提升查询精度。请注意:该功能采用“系统模型设置”中设置的默认聊天模型提取关键词,因此也会产生更多 Token 消耗。另外,你也可以手动更新生成的关键词。`,
|
||||||
autoQuestions: '自动问题',
|
autoQuestions: '自动问题提取',
|
||||||
autoQuestionsTip: `在查询此类问题时,为每个块提取 N 个问题以提高其排名得分。在“系统模型设置”中设置的 LLM 将消耗额外的 token。您可以在块列表中查看结果。如果发生错误,此功能不会破坏整个分块过程,除了将空结果添加到原始块。`,
|
autoQuestionsTip: `在查询此类问题时,为每个块提取 N 个问题以提高其排名得分。在“系统模型设置”中设置的 LLM 将消耗额外的 token。您可以在块列表中查看结果。如果发生错误,此功能不会破坏整个分块过程,除了将空结果添加到原始块。`,
|
||||||
redo: '是否清空已有 {{chunkNum}}个 chunk?',
|
redo: '是否清空已有 {{chunkNum}}个 chunk?',
|
||||||
setMetaData: '设置元数据',
|
setMetaData: '设置元数据',
|
||||||
@ -240,7 +240,7 @@ export default {
|
|||||||
我们假设手册具有分层部分结构。 我们使用最低的部分标题作为对文档进行切片的枢轴。
|
我们假设手册具有分层部分结构。 我们使用最低的部分标题作为对文档进行切片的枢轴。
|
||||||
因此,同一部分中的图和表不会被分割,并且块大小可能会很大。
|
因此,同一部分中的图和表不会被分割,并且块大小可能会很大。
|
||||||
</p>`,
|
</p>`,
|
||||||
naive: `<p>支持的文件格式为<b>DOCX、EXCEL、PPT、IMAGE、PDF、TXT、MD、JSON、EML、HTML</b>。</p>
|
naive: `<p>支持的文件格式为<b>DOCX、XLSX、XLS (Excel97~2003)、PPT、PDF、TXT、JPEG、JPG、PNG、TIF、GIF、CSV、JSON、EML、HTML</b>。</p>
|
||||||
<p>此方法将简单的方法应用于块文件:</p>
|
<p>此方法将简单的方法应用于块文件:</p>
|
||||||
<p>
|
<p>
|
||||||
<li>系统将使用视觉检测模型将连续文本分割成多个片段。</li>
|
<li>系统将使用视觉检测模型将连续文本分割成多个片段。</li>
|
||||||
@ -365,8 +365,9 @@ export default {
|
|||||||
<ul>
|
<ul>
|
||||||
<li>标签集是一个由用户定义和管理的封闭集,而自动生成的关键词属于开放集合。 </li>
|
<li>标签集是一个由用户定义和管理的封闭集,而自动生成的关键词属于开放集合。 </li>
|
||||||
<li>在给你的知识库文本块批量打标签之前,你需要先生成标签集作为样本。 </li>
|
<li>在给你的知识库文本块批量打标签之前,你需要先生成标签集作为样本。 </li>
|
||||||
<li>自动关键词功能中的关键词由 LLM 生成,此过程相对耗时,并且会产生一定的 Token 消耗。 </li>
|
<li>自动关键词提取功能中的关键词由 LLM 生成,此过程相对耗时,并且会产生一定的 Token 消耗。 </li>
|
||||||
</ul>
|
</ul>
|
||||||
|
<p> 详见:https://ragflow.io/docs/dev/use_tag_sets </p>
|
||||||
`,
|
`,
|
||||||
tags: '标签',
|
tags: '标签',
|
||||||
addTag: '增加标签',
|
addTag: '增加标签',
|
||||||
|
Loading…
x
Reference in New Issue
Block a user