mirror of
https://git.mirrors.martin98.com/https://github.com/infiniflow/ragflow.git
synced 2025-06-04 11:24:00 +08:00
Miscelleneous editorial updates (#5390)
### What problem does this PR solve? ### Type of change - [x] Documentation Update
This commit is contained in:
parent
0284248c93
commit
f372bd8809
@ -204,9 +204,6 @@ releases! 🌟
|
||||
/_/ |_|/_/ |_|\____//_/ /_/ \____/ |__/|__/
|
||||
|
||||
* Running on all addresses (0.0.0.0)
|
||||
* Running on http://127.0.0.1:9380
|
||||
* Running on http://x.x.x.x:9380
|
||||
INFO:werkzeug:Press CTRL+C to quit
|
||||
```
|
||||
|
||||
> If you skip this confirmation step and directly log in to RAGFlow, your browser may prompt a `network anormal`
|
||||
@ -252,7 +249,9 @@ RAGFlow uses Elasticsearch by default for storing full text and vectors. To swit
|
||||
```bash
|
||||
$ docker compose -f docker/docker-compose.yml down -v
|
||||
```
|
||||
Note: `-v` will delete the docker container volumes, and the existing data will be cleared.
|
||||
|
||||
> [!WARNING]
|
||||
> `-v` will delete the docker container volumes, and the existing data will be cleared.
|
||||
|
||||
2. Set `DOC_ENGINE` in **docker/.env** to `infinity`.
|
||||
|
||||
|
@ -197,9 +197,6 @@ Coba demo kami di [https://demo.ragflow.io](https://demo.ragflow.io).
|
||||
/_/ |_|/_/ |_|\____//_/ /_/ \____/ |__/|__/
|
||||
|
||||
* Running on all addresses (0.0.0.0)
|
||||
* Running on http://127.0.0.1:9380
|
||||
* Running on http://x.x.x.x:9380
|
||||
INFO:werkzeug:Press CTRL+C to quit
|
||||
```
|
||||
|
||||
> Jika Anda melewatkan langkah ini dan langsung login ke RAGFlow, browser Anda mungkin menampilkan error `network anormal`
|
||||
|
@ -176,9 +176,6 @@
|
||||
/_/ |_|/_/ |_|\____//_/ /_/ \____/ |__/|__/
|
||||
|
||||
* Running on all addresses (0.0.0.0)
|
||||
* Running on http://127.0.0.1:9380
|
||||
* Running on http://x.x.x.x:9380
|
||||
INFO:werkzeug:Press CTRL+C to quit
|
||||
```
|
||||
|
||||
> もし確認ステップをスキップして直接 RAGFlow にログインした場合、その時点で RAGFlow が完全に初期化されていない可能性があるため、ブラウザーがネットワーク異常エラーを表示するかもしれません。
|
||||
|
@ -177,9 +177,6 @@
|
||||
/_/ |_|/_/ |_|\____//_/ /_/ \____/ |__/|__/
|
||||
|
||||
* Running on all addresses (0.0.0.0)
|
||||
* Running on http://127.0.0.1:9380
|
||||
* Running on http://x.x.x.x:9380
|
||||
INFO:werkzeug:Press CTRL+C to quit
|
||||
```
|
||||
|
||||
> 만약 확인 단계를 건너뛰고 바로 RAGFlow에 로그인하면, RAGFlow가 완전히 초기화되지 않았기 때문에 브라우저에서 `network anormal` 오류가 발생할 수 있습니다.
|
||||
|
@ -196,9 +196,6 @@ Experimente nossa demo em [https://demo.ragflow.io](https://demo.ragflow.io).
|
||||
/_/ |_|/_/ |_|\____//_/ /_/ \____/ |__/|__/
|
||||
|
||||
* Rodando em todos os endereços (0.0.0.0)
|
||||
* Rodando em http://127.0.0.1:9380
|
||||
* Rodando em http://x.x.x.x:9380
|
||||
INFO:werkzeug:Pressione CTRL+C para sair
|
||||
```
|
||||
|
||||
> Se você pular essa etapa de confirmação e acessar diretamente o RAGFlow, seu navegador pode exibir um erro `network anormal`, pois, nesse momento, seu RAGFlow pode não estar totalmente inicializado.
|
||||
|
@ -181,9 +181,6 @@
|
||||
/_/ |_|/_/ |_|\____//_/ /_/ \____/ |__/|__/
|
||||
|
||||
* Running on all addresses (0.0.0.0)
|
||||
* Running on http://127.0.0.1:9380
|
||||
* Running on http://x.x.x.x:9380
|
||||
INFO:werkzeug:Press CTRL+C to quit
|
||||
```
|
||||
|
||||
> 如果您跳過這一步驟系統確認步驟就登入 RAGFlow,你的瀏覽器有可能會提示 `network anormal` 或 `網路異常`,因為 RAGFlow 可能並未完全啟動成功。
|
||||
|
@ -182,9 +182,6 @@
|
||||
/_/ |_|/_/ |_|\____//_/ /_/ \____/ |__/|__/
|
||||
|
||||
* Running on all addresses (0.0.0.0)
|
||||
* Running on http://127.0.0.1:9380
|
||||
* Running on http://x.x.x.x:9380
|
||||
INFO:werkzeug:Press CTRL+C to quit
|
||||
```
|
||||
|
||||
> 如果您跳过这一步系统确认步骤就登录 RAGFlow,你的浏览器有可能会提示 `network anormal` 或 `网络异常`,因为 RAGFlow 可能并未完全启动成功。
|
||||
|
@ -42,9 +42,9 @@ RAGFlow offers multiple chunking template to facilitate chunking files of differ
|
||||
| **Template** | Description | File format |
|
||||
|--------------|-----------------------------------------------------------------------|------------------------------------------------------|
|
||||
| General | Files are consecutively chunked based on a preset chunk token number. | DOCX, EXCEL, PPT, PDF, TXT, JPEG, JPG, PNG, TIF, GIF |
|
||||
| Q&A | | EXCEL, CSV/TXT |
|
||||
| Q&A | | XLSX, CSV/TXT |
|
||||
| Manual | | PDF |
|
||||
| Table | | EXCEL, CSV/TXT |
|
||||
| Table | | XLSX, CSV/TXT |
|
||||
| Paper | | PDF |
|
||||
| Book | | DOCX, PDF, TXT |
|
||||
| Laws | | DOCX, PDF, TXT |
|
||||
|
@ -65,9 +65,9 @@ In a knowledge graph, a community is a cluster of entities linked by relationshi
|
||||
|
||||
2. The knowledge graph of your knowlege base does *not* automatically update *until* a newly uploaded file is parsed.
|
||||
|
||||
_A **Knowledge Graph** entry appears under **Configuration** once a knowledge graph is created._
|
||||
_A **Knowledge graph** entry appears under **Configuration** once a knowledge graph is created._
|
||||
|
||||
3. Click **Knowledge Graph** to view the details of the generated graph.
|
||||
3. Click **Knowledge graph** to view the details of the generated graph.
|
||||
|
||||
## Frequently asked questions
|
||||
|
||||
@ -81,4 +81,4 @@ Nope. The knowledge graph does *not* automatically update *until* a newly upload
|
||||
|
||||
### How to remove a generated knowledge graph?
|
||||
|
||||
To remove the generated knowledge graph, delete all related files in your knowledge base. Although the **Knowledge Graph** entry will still be visible, the graph has actually been deleted.
|
||||
To remove the generated knowledge graph, delete all related files in your knowledge base. Although the **Knowledge graph** entry will still be visible, the graph has actually been deleted.
|
@ -223,9 +223,6 @@ This section provides instructions on setting up the RAGFlow server on Linux. If
|
||||
/_/ |_|/_/ |_|\____//_/ /_/ \____/ |__/|__/
|
||||
|
||||
* Running on all addresses (0.0.0.0)
|
||||
* Running on http://127.0.0.1:9380
|
||||
* Running on http://x.x.x.x:9380
|
||||
INFO:werkzeug:Press CTRL+C to quit
|
||||
```
|
||||
|
||||
> If you skip this confirmation step and directly log in to RAGFlow, your browser may prompt a `network anomaly` error because, at that moment, your RAGFlow may not be fully initialized.
|
||||
|
@ -12,7 +12,7 @@ A complete list of models supported by RAGFlow, which will continue to expand.
|
||||
<APITable>
|
||||
```
|
||||
|
||||
| Provider | Chat | Embedding | Rerank | Img2txt | Sequence2txt | TTS |
|
||||
| Provider | Chat | Embedding | Rerank | Img2txt | Speech2txt | TTS |
|
||||
| --------------------- | ------------------ | ------------------ | ------------------ | ------------------ | ------------------ | ------------------ |
|
||||
| Anthropic | :heavy_check_mark: | | | | | |
|
||||
| Azure-OpenAI | :heavy_check_mark: | :heavy_check_mark: | | :heavy_check_mark: | :heavy_check_mark: | |
|
||||
|
@ -15,9 +15,9 @@ Released on February 6, 2025.
|
||||
|
||||
- Supports DeepSeek R1 and DeepSeek V3.
|
||||
- GraphRAG refactor: Knowledge graph is dynamically built on an entire knowledge base (dataset) rather than on an individual file, and automatically updated when a newly uploaded file starts parsing. See [here](https://ragflow.io/docs/dev/construct_knowledge_graph).
|
||||
- Adds an **Iteration** agent component and a **Research report generator** agent template. See [here](https://ragflow.io/docs/dev/iteration_component).
|
||||
- Adds an **Iteration** agent component and a **Research report generator** agent template. See [here](./references/agent_component_reference/iteration.mdx).
|
||||
- New UI language: Portuguese.
|
||||
- Allows setting metadata for a specific file in a knowledge base to enhance AI-powered chats. See [here](https://ragflow.io/docs/dev/set_metada).
|
||||
- Allows setting metadata for a specific file in a knowledge base to enhance AI-powered chats. See [here](./guides/configure_knowledge_base/set_metadata.md).
|
||||
- Upgrades RAGFlow's document engine [Infinity](https://github.com/infiniflow/infinity) to v0.6.0.dev3.
|
||||
- Supports GPU acceleration for DeepDoc (see [docker-compose-gpu.yml](https://github.com/infiniflow/ragflow/blob/main/docker/docker-compose-gpu.yml)).
|
||||
- Supports creating and referencing a **Tag** knowledge base as a key milestone towards bridging the semantic gap between query and response.
|
||||
@ -30,22 +30,21 @@ The **Tag knowledge base** feature is *unavailable* on the [Infinity](https://gi
|
||||
|
||||
#### Added documents
|
||||
|
||||
- [Construct knowledge graph](https://ragflow.io/docs/dev/construct_knowledge_graph)
|
||||
- [Set metadata](https://ragflow.io/docs/dev/set_metada)
|
||||
- [Begin component](https://ragflow.io/docs/dev/begin_component)
|
||||
- [Generate component](https://ragflow.io/docs/dev/generate_component)
|
||||
- [Interact component](https://ragflow.io/docs/dev/interact_component)
|
||||
- [Retrieval component](https://ragflow.io/docs/dev/retrieval_component)
|
||||
- [Categorize component](https://ragflow.io/docs/dev/categorize_component)
|
||||
- [Keyword component](https://ragflow.io/docs/dev/keyword_component)
|
||||
- [Message component](https://ragflow.io/docs/dev/message_component)
|
||||
- [Rewrite component](https://ragflow.io/docs/dev/rewrite_component)
|
||||
- [Switch component](https://ragflow.io/docs/dev/switch_component)
|
||||
- [Concentrator component](https://ragflow.io/docs/dev/concentrator_component)
|
||||
- [Template component](https://ragflow.io/docs/dev/template_component)
|
||||
- [Iteration component](https://ragflow.io/docs/dev/iteration_component)
|
||||
- [Note component](https://ragflow.io/docs/dev/note_component)
|
||||
|
||||
- [Construct knowledge graph](./guides/configure_knowledge_base/construct_knowledge_graph.md)
|
||||
- [Set metadata](./guides/configure_knowledge_base/set_metadata.md)
|
||||
- [Begin component](./references/agent_component_reference/begin.mdx)
|
||||
- [Generate component](./references/agent_component_reference/generate.mdx)
|
||||
- [Interact component](./references/agent_component_reference/interact.mdx)
|
||||
- [Retrieval component](./references/agent_component_reference/retrieval.mdx)
|
||||
- [Categorize component](./references/agent_component_reference/categorize.mdx)
|
||||
- [Keyword component](./references/agent_component_reference/keyword.mdx)
|
||||
- [Message component](./references/agent_component_reference/message.mdx)
|
||||
- [Rewrite component](./references/agent_component_reference/rewrite.mdx)
|
||||
- [Switch component](./references/agent_component_reference/switch.mdx)
|
||||
- [Concentrator component](./references/agent_component_reference/concentrator.mdx)
|
||||
- [Template component](./references/agent_component_reference/template.mdx)
|
||||
- [Iteration component](./references/agent_component_reference/iteration.mdx)
|
||||
- [Note component](./references/agent_component_reference/note.mdx)
|
||||
|
||||
## v0.15.1
|
||||
|
||||
|
@ -258,10 +258,10 @@ export default {
|
||||
<i>This chunk method is automatically applied to all uploaded PPT files, so you do not need to specify it manually.</i></p>`,
|
||||
qa: `
|
||||
<p>
|
||||
This chunk method supports <b>EXCEL</b> and <b>CSV/TXT</b> file formats.
|
||||
This chunk method supports <b>XLSX</b> and <b>CSV/TXT</b> file formats.
|
||||
</p>
|
||||
<li>
|
||||
If a file is in <b>Excel</b> format, it should contain two columns
|
||||
If a file is in <b>XLSX</b> format, it should contain two columns
|
||||
without headers: one for questions and the other for answers, with the
|
||||
question column preceding the answer column. Multiple sheets are
|
||||
acceptable, provided the columns are properly structured.
|
||||
@ -281,7 +281,7 @@ export default {
|
||||
Résumés of various forms are parsed and organized into structured data to facilitate candidate search for recruiters.
|
||||
</p>
|
||||
`,
|
||||
table: `<p>Supported file formats are <b>EXCEL</b> and <b>CSV/TXT</b>.</p><p>
|
||||
table: `<p>Supported file formats are <b>XLSX</b> and <b>CSV/TXT</b>.</p><p>
|
||||
Here're some prerequisites and tips:
|
||||
<ul>
|
||||
<li>For CSV or TXT file, the delimiter between columns must be <em><b>TAB</b></em>.</li>
|
||||
@ -317,8 +317,8 @@ export default {
|
||||
<p>Knowlege base using 'Tag' as a chunking method is <b>NOT</b> supposed to be involved in RAG procedure.</p>
|
||||
<p>The chunks in this knowledge base are examples of tags, which demonstrate the entire tag set and the relevance between chunk and tags.</p>
|
||||
|
||||
<p>This chunk method supports <b>EXCEL</b> and <b>CSV/TXT</b> file formats.</p>
|
||||
<p>If a file is in <b>Excel</b> format, it should contain two columns without headers: one for content and the other for tags, with the content column preceding the tags column. Multiple sheets are acceptable, provided the columns are properly structured.</p>
|
||||
<p>This chunk method supports <b>XLSX</b> and <b>CSV/TXT</b> file formats.</p>
|
||||
<p>If a file is in <b>XLSX</b> format, it should contain two columns without headers: one for content and the other for tags, with the content column preceding the tags column. Multiple sheets are acceptable, provided the columns are properly structured.</p>
|
||||
<p>If a file is in <b>CSV/TXT</b> format, it must be UTF-8 encoded with TAB as the delimiter to separate content and tags.</p>
|
||||
<p>In tags column, there're English <b>comma</b> between tags.</p>
|
||||
<i>Lines of texts that fail to follow the above rules will be ignored, and each pair will be considered a distinct chunk.</i>
|
||||
@ -352,16 +352,16 @@ The above is the content you need to summarize.`,
|
||||
searchTags: 'Search tags',
|
||||
tagCloud: 'Cloud',
|
||||
tagTable: 'Table',
|
||||
tagSet: 'Tag set',
|
||||
tagSet: 'Tag sets',
|
||||
tagSetTip: `
|
||||
<p> Selecting the 'Tag' knowledge bases helps to tag every chunks. </p>
|
||||
<p>Query to those chunks will also be with tags too.</p>
|
||||
This procedure will improve precision of retrieval by adding more information to the dataset, especially when there's a large set of chunks.
|
||||
<p>Difference between tags and keywords:</p>
|
||||
<p> Select one or multiple tag knowledge bases to auto-tag chunks in your knowledge base. </p>
|
||||
<p>The user query will also be auto-tagged.</p>
|
||||
This auto-tag feature enhances retrieval by adding another layer of domain-specific knowledge to the existing dataset.
|
||||
<p>Difference between auto-tag and auto-keyword:</p>
|
||||
<ul>
|
||||
<li>Tag is a close set which is defined and manipulated by user while keyword is an open set.</li>
|
||||
<li>You need to upload tag sets with samples prior to use.</li>
|
||||
<li>Keywords are generated by LLM which is expensive and time consuming.</li>
|
||||
<li>A tag knowledge base is a user-defined close set, whereas keywords extraced by the LLM can be regarded as an open set.</li>
|
||||
<li>You must upload tag sets in specified formats before running the auto-tag feature.</li>
|
||||
<li>The auto-keyword feature is dependent on the LLM and consumes a significant number of tokens.</li>
|
||||
</ul>
|
||||
`,
|
||||
topnTags: 'Top-N Tags',
|
||||
@ -420,7 +420,7 @@ This procedure will improve precision of retrieval by adding more information to
|
||||
language: 'Language',
|
||||
emptyResponse: 'Empty response',
|
||||
emptyResponseTip: `Set this as a response if no results are retrieved from the knowledge bases for your query, or leave this field blank to allow the LLM to improvise when nothing is found.`,
|
||||
emptyResponseMessage: `Empty response will be triggered when nothing relevant is retrieved from knowledge bases. Erase 'Empty response' since none of knowledge base is selected.`,
|
||||
emptyResponseMessage: `Empty response will be triggered when nothing relevant is retrieved from knowledge bases. You must clear the 'Empty response' field if no knowledge base is selected.`,
|
||||
setAnOpener: 'Opening greeting',
|
||||
setAnOpenerInitial: `Hi! I'm your assistant, what can I do for you?`,
|
||||
setAnOpenerTip: 'Set an opening greeting for users.',
|
||||
|
@ -225,10 +225,10 @@ export default {
|
||||
<i>Semua file PPT yang Anda unggah akan dipotong menggunakan metode ini secara otomatis, pengaturan untuk setiap file PPT tidak diperlukan.</i></p>`,
|
||||
qa: `
|
||||
<p>
|
||||
Metode potongan ini mendukung format file <b>EXCEL</b> dan <b>CSV/TXT</b>.
|
||||
Metode potongan ini mendukung format file <b>XLSX</b> dan <b>CSV/TXT</b>.
|
||||
</p>
|
||||
<li>
|
||||
Jika file dalam format <b>Excel</b>, harus terdiri dari dua kolom
|
||||
Jika file dalam format <b>XLSX</b>, harus terdiri dari dua kolom
|
||||
tanpa header: satu untuk pertanyaan dan yang lainnya untuk jawaban, dengan
|
||||
kolom pertanyaan mendahului kolom jawaban. Lembar kerja ganda dapat diterima selama kolom terstruktur dengan benar.
|
||||
</li>
|
||||
@ -251,7 +251,7 @@ export default {
|
||||
maka Anda dapat mencantumkan semua kandidat yang memenuhi kualifikasi hanya dengan berbicara dengan <i>'assistxsuite'</i>.
|
||||
</p>
|
||||
`,
|
||||
table: `<p>Format file yang didukung adalah <b>EXCEL</b> dan <b>CSV/TXT</b>.</p><p>
|
||||
table: `<p>Format file yang didukung adalah <b>XLSX</b> dan <b>CSV/TXT</b>.</p><p>
|
||||
Berikut beberapa tips:
|
||||
<ul>
|
||||
<li>Untuk file csv atau txt, pembatas antara kolom adalah <em><b>TAB</b></em>.</li>
|
||||
|
@ -226,10 +226,10 @@ export default {
|
||||
<i>このチャンク方法はすべてのPPTファイルに自動的に適用されるため、手動で指定する必要はありません。</i></p>`,
|
||||
qa: `
|
||||
<p>
|
||||
このチャンク方法は<b>EXCEL</b>および<b>CSV/TXT</b>ファイル形式をサポートします。
|
||||
このチャンク方法は<b>XLSX</b>および<b>CSV/TXT</b>ファイル形式をサポートします。
|
||||
</p>
|
||||
<li>
|
||||
<b>Excel</b>形式のファイルには、ヘッダーのない2つの
|
||||
<b>XLSX</b>形式のファイルには、ヘッダーのない2つの
|
||||
列が必要です: 1つは質問の列でもう1つは回答の列です
|
||||
(質問列が先行)。複数のシートも可能です。
|
||||
|
||||
@ -249,7 +249,7 @@ export default {
|
||||
さまざまな形式の履歴書を解析し、構造化データとして整理してリクルーターの候補者検索を支援します。
|
||||
</p>
|
||||
`,
|
||||
table: `<p>対応ファイル形式は<b>EXCEL</b>および<b>CSV/TXT</b>です。</p><p>
|
||||
table: `<p>対応ファイル形式は<b>XLSX</b>および<b>CSV/TXT</b>です。</p><p>
|
||||
いくつかの前提条件とヒントはこちらです:
|
||||
<ul>
|
||||
<li>CSVまたはTXTファイルの場合、列間の区切り文字は<b>TAB</b>である必要があります。</li>
|
||||
|
@ -254,8 +254,8 @@ export default {
|
||||
presentation: `<p>Os formatos de arquivo suportados são <b>PDF</b>, <b>PPTX</b>.</p><p>
|
||||
Cada página do slide é tratada como um fragmento, com sua imagem em miniatura armazenada.</p><p>
|
||||
<i>Esse método de fragmentação é aplicado automaticamente a todos os arquivos PPT enviados, então não é necessário especificá-lo manualmente.</i></p>`,
|
||||
qa: `<p>Este método suporta arquivos nos formatos <b>EXCEL</b> e <b>CSV/TXT</b>.</p>
|
||||
<li>Se o arquivo estiver no formato <b>Excel</b>, ele deve conter duas colunas sem cabeçalhos: uma para perguntas e outra para respostas, com a coluna de perguntas antes da de respostas. Múltiplas planilhas são aceitas, desde que as colunas estejam corretamente estruturadas.</li>
|
||||
qa: `<p>Este método suporta arquivos nos formatos <b>XLSX</b> e <b>CSV/TXT</b>.</p>
|
||||
<li>Se o arquivo estiver no formato <b>XLSX</b>, ele deve conter duas colunas sem cabeçalhos: uma para perguntas e outra para respostas, com a coluna de perguntas antes da de respostas. Múltiplas planilhas são aceitas, desde que as colunas estejam corretamente estruturadas.</li>
|
||||
<li>Se o arquivo estiver no formato <b>CSV/TXT</b>, ele deve estar codificado em UTF-8 e usar TAB como delimitador para separar perguntas e respostas.</li>
|
||||
<p><i>Linhas de texto que não seguirem essas regras serão ignoradas, e cada par de Pergunta & Resposta será tratado como um fragmento distinto.</i></p>`,
|
||||
useRaptor: 'Usar RAPTOR para melhorar a recuperação',
|
||||
|
@ -239,10 +239,10 @@ export default {
|
||||
<i>Phương thức phân khối này được tự động áp dụng cho tất cả các tệp PPT được tải lên, do đó bạn không cần phải chỉ định thủ công.</i></p>`,
|
||||
qa: `
|
||||
<p>
|
||||
Phương thức phân khối này hỗ trợ các định dạng tệp <b>EXCEL</b> và <b>CSV/TXT</b>.
|
||||
Phương thức phân khối này hỗ trợ các định dạng tệp <b>XLSX</b> và <b>CSV/TXT</b>.
|
||||
</p>
|
||||
<li>
|
||||
Nếu tệp ở định dạng <b>Excel</b>, nó phải chứa hai cột
|
||||
Nếu tệp ở định dạng <b>XLSX</b>, nó phải chứa hai cột
|
||||
không có tiêu đề: một cột cho câu hỏi và cột còn lại cho câu trả lời, với
|
||||
cột câu hỏi đứng trước cột câu trả lời. Nhiều trang tính được chấp nhận, miễn là các cột được cấu trúc chính xác.
|
||||
</li>
|
||||
@ -260,7 +260,7 @@ export default {
|
||||
</p><p>
|
||||
Các bản lý lịch với nhiều hình thức khác nhau được phân tích cú pháp và tổ chức thành dữ liệu có cấu trúc để hỗ trợ nhà tuyển dụng tìm kiếm ứng viên.
|
||||
</p>`,
|
||||
table: `<p>Các định dạng tệp được hỗ trợ là <b>EXCEL</b> và <b>CSV/TXT</b>.</p><p>
|
||||
table: `<p>Các định dạng tệp được hỗ trợ là <b>XLSX</b> và <b>CSV/TXT</b>.</p><p>
|
||||
Dưới đây là một số điều kiện tiên quyết và mẹo:
|
||||
<ul>
|
||||
<li>Đối với tệp CSV hoặc TXT, dấu phân cách giữa các cột phải là <em><b>TAB</b></em>.</li>
|
||||
@ -319,8 +319,8 @@ export default {
|
||||
tag: `<p>Cơ sở kiến thức sử dụng 'Tag' làm phương pháp phân đoạn được cho là sẽ được sử dụng bởi các cơ sở kiến thức khác để thêm thẻ vào các đoạn của chúng, các truy vấn tới đó cũng sẽ có thẻ.</p>
|
||||
<p>Cơ sở kiến thức sử dụng 'Tag' làm phương pháp phân đoạn <b>KHÔNG</b> được dự định tham gia vào quy trình RAG.</p>
|
||||
<p>Các đoạn trong cơ sở kiến thức này là ví dụ về thẻ, thể hiện toàn bộ tập hợp thẻ và mối quan hệ giữa đoạn và thẻ.</p>
|
||||
<p>Phương pháp phân đoạn này hỗ trợ định dạng tệp <b>EXCEL</b> và <b>CSV/TXT</b>.</p>
|
||||
<p>Nếu tệp ở định dạng <b>Excel</b>, nó phải chứa hai cột không có tiêu đề: một cho nội dung và một cho thẻ, với cột nội dung đứng trước cột thẻ. Nhiều trang tính được chấp nhận, miễn là các cột được cấu trúc đúng.</p>
|
||||
<p>Phương pháp phân đoạn này hỗ trợ định dạng tệp <b>XLSX</b> và <b>CSV/TXT</b>.</p>
|
||||
<p>Nếu tệp ở định dạng <b>XLSX</b>, nó phải chứa hai cột không có tiêu đề: một cho nội dung và một cho thẻ, với cột nội dung đứng trước cột thẻ. Nhiều trang tính được chấp nhận, miễn là các cột được cấu trúc đúng.</p>
|
||||
<p>Nếu tệp ở định dạng <b>CSV/TXT</b>, nó phải được mã hóa UTF-8 với TAB làm dấu phân cách để phân tách nội dung và thẻ.</p>
|
||||
<p>Trong cột thẻ, có dấu <b>phẩy</b> tiếng Anh giữa các thẻ.</p>
|
||||
<i>Các dòng văn bản không tuân theo các quy tắc trên sẽ bị bỏ qua và mỗi cặp sẽ được coi là một đoạn riêng biệt.</i>`,
|
||||
|
@ -277,7 +277,7 @@ export default {
|
||||
您只需與<i>'ragflow'</i>交談即可列出所有符合資格的候選人。
|
||||
</p>
|
||||
`,
|
||||
table: `支持<p><b>excel</b>和<b>csv/txt</b>格式文件。</p><p>以下是一些提示: <ul> <li>对于Csv或Txt文件,列之间的分隔符为 <em><b>tab</b></em>。</li> <li>第一行必须是列标题。</li> <li>列标题必须是有意义的术语,以便我们的大語言模型能够理解。列举一些同义词时最好使用斜杠<i>'/'</i>来分隔,甚至更好使用方括号枚举值,例如 <i>“性別/性別(男性,女性)”</i>.<p>以下是标题的一些示例:<ol> <li>供应商/供货商<b>'tab'</b>顏色(黃色、紅色、棕色)<b>'tab'</b>性別(男、女)<b>'tab'</B>尺码(m、l、xl、xxl)</li> <li>姓名/名字<b>'tab'</b>電話/手機/微信<b>'tab'</b>最高学历(高中,职高,硕士,本科,博士,初中,中技,中专,专科,专升本,mpa,mba,emba)</li> </ol> </p> </li> <li>表中的每一行都将被视为一个块。</li> </ul>`,
|
||||
table: `支持<p><b>XLSX</b>和<b>csv/txt</b>格式文件。</p><p>以下是一些提示: <ul> <li>对于Csv或Txt文件,列之间的分隔符为 <em><b>tab</b></em>。</li> <li>第一行必须是列标题。</li> <li>列标题必须是有意义的术语,以便我们的大語言模型能够理解。列举一些同义词时最好使用斜杠<i>'/'</i>来分隔,甚至更好使用方括号枚举值,例如 <i>“性別/性別(男性,女性)”</i>.<p>以下是标题的一些示例:<ol> <li>供应商/供货商<b>'tab'</b>顏色(黃色、紅色、棕色)<b>'tab'</b>性別(男、女)<b>'tab'</B>尺码(m、l、xl、xxl)</li> <li>姓名/名字<b>'tab'</b>電話/手機/微信<b>'tab'</b>最高学历(高中,职高,硕士,本科,博士,初中,中技,中专,专科,专升本,mpa,mba,emba)</li> </ol> </p> </li> <li>表中的每一行都将被视为一个块。</li> </ul>`,
|
||||
picture: `
|
||||
<p>支持圖像文件。視頻即將推出。</p><p>
|
||||
如果圖片中有文字,則應用 OCR 提取文字作為其文字描述。
|
||||
@ -302,8 +302,8 @@ export default {
|
||||
<p>使用「標籤」作為分塊方法的知識庫<b>不</b>應該參與 RAG 過程。
|
||||
<p>本知識庫中的區塊是標籤的範例,展示了整個標籤集以及區塊與標籤之間的相關性。
|
||||
|
||||
<p>此區塊方法支援<b>EXCEL</b>和<b>CSV/TXT</b>檔案格式。
|
||||
<p>如果檔案採用 <b>Excel</b> 格式,則應包含兩列,不含標題:一列用於內容,另一列用於標籤,內容列位於標籤列之前。只要列的結構正確,多張紙也是可以接受的。
|
||||
<p>此區塊方法支援<b>XLSX</b>和<b>CSV/TXT</b>檔案格式。
|
||||
<p>如果檔案採用 <b>XLSX</b> 格式,則應包含兩列,不含標題:一列用於內容,另一列用於標籤,內容列位於標籤列之前。只要列的結構正確,多張紙也是可以接受的。
|
||||
<p>如果檔案為<b>CSV/TXT</b>格式,則必須採用UTF-8編碼,並以TAB作為分隔符號來分隔內容和標籤。
|
||||
<p>標籤欄中,標籤之間有英文<b>逗號</b>。
|
||||
<i>不符合上述規則的文字行將被忽略,並且每一對將被視為一個不同的區塊。
|
||||
|
@ -278,7 +278,7 @@ export default {
|
||||
您只需与<i>'RAGFlow'</i>交谈即可列出所有符合资格的候选人。
|
||||
</p>
|
||||
`,
|
||||
table: `支持<p><b>EXCEL</b>和<b>CSV/TXT</b>格式文件。</p><p>
|
||||
table: `支持<p><b>XLSX</b>和<b>CSV/TXT</b>格式文件。</p><p>
|
||||
以下是一些提示:
|
||||
<ul>
|
||||
<li>对于 csv 或 txt 文件,列之间的分隔符为 <em><b>TAB</b></em>。</li>
|
||||
@ -318,8 +318,8 @@ export default {
|
||||
<p>使用“标签”作为分块方法的知识库<b>不</b>应该参与 RAG 过程。</p>
|
||||
<p>此知识库中的块是标签的示例,它们演示了整个标签集以及块和标签之间的相关性。</p>
|
||||
|
||||
<p>此块方法支持<b>EXCEL</b>和<b>CSV/TXT</b>文件格式。</p>
|
||||
<p>如果文件为<b>Excel</b>格式,则它应该包含两列无标题:一列用于内容,另一列用于标签,内容列位于标签列之前。可以接受多个工作表,只要列结构正确即可。</p>
|
||||
<p>此块方法支持<b>XLSX</b>和<b>CSV/TXT</b>文件格式。</p>
|
||||
<p>如果文件为<b>XLSX</b>格式,则它应该包含两列无标题:一列用于内容,另一列用于标签,内容列位于标签列之前。可以接受多个工作表,只要列结构正确即可。</p>
|
||||
<p>如果文件为 <b>CSV/TXT</b> 格式,则必须使用 UTF-8 编码并以 TAB 作为分隔符来分隔内容和标签。</p>
|
||||
<p>在标签列中,标签之间使用英文 <b>逗号</b>。</p>
|
||||
<i>不符合上述规则的文本行将被忽略,并且每对文本将被视为一个不同的块。</i>
|
||||
|
Loading…
x
Reference in New Issue
Block a user