GITBOOK-162: No subject
parent
000322605c
commit
a43c839768
|
|
@ -15,6 +15,8 @@
|
|||
|
||||
<figure><img src="../../.gitbook/assets/image (187).png" alt=""><figcaption><p>在应用内关联知识库</p></figcaption></figure>
|
||||
|
||||
***
|
||||
|
||||
### 2 召回模式
|
||||
|
||||
进入 **上下文 -- 参数设置 -- 召回设置**,可以选择知识库的召回模式。
|
||||
|
|
@ -61,6 +63,8 @@ N 选 1 召回依赖模型的推理能力,使用限制较多,计划在 2024
|
|||
|
||||
多路召回模式不依赖于模型的推理能力或知识库描述,该模式在多知识库检索时能够获得质量更高的召回效果,因此更**推荐将召回模式设置为多路召回**。
|
||||
|
||||
***
|
||||
|
||||
### 3 重排序(Rerank)
|
||||
|
||||
重排序模型通过将候选文档列表与用户问题语义匹配度进行重新排序,从而改进语义排序的结果。其原理是计算用户问题与给定的每个候选文档之间的相关性分数,并返回按相关性从高到低排序的文档列表。
|
||||
|
|
@ -98,4 +102,3 @@ Dify 目前已支持 Cohere Rerank 模型,通过进入“模型供应商-> Coh
|
|||
通过进入“提示词编排->上下文->设置”页面中设置为多路召回模式时需开启 Rerank 模型。
|
||||
|
||||
<figure><img src="../../.gitbook/assets/image (1) (1) (1) (1) (1) (1) (1) (1) (1) (1).png" alt=""><figcaption><p>数据集多路召回模式中设置 Rerank 模型</p></figcaption></figure>
|
||||
|
||||
|
|
|
|||
|
|
@ -25,6 +25,8 @@ Dify 知识库内提供了文本召回测试的功能,用于调试不同检索
|
|||
* **TopK 代表按相似分数倒排时召回分段的最大个数**。TopK 值调小,将会召回更少分段,可能导致召回的相关文本不全;TopK 值调大,将召回更多分段,可能导致召回语义相关性较低的分段使得 LLM 回复质量降低。
|
||||
* **召回阈值(Score)代表允许召回分段的最低相似分数。**召回分数调小,将会召回更多分段,可能导致召回相关度较低的分段;召回分数阈值调大,将会召回更少分段,过大时将会导致丢失相关分段。
|
||||
|
||||
***
|
||||
|
||||
### 2 引用与归属
|
||||
|
||||
在应用内测试知识库效果时,你可以进入 **工作室 -- 添加功能 -- 引用归属**,打开引用归属功能。
|
||||
|
|
|
|||
|
|
@ -6,6 +6,8 @@
|
|||
|
||||
<figure><img src="../../.gitbook/assets/image (3) (1).png" alt=""><figcaption><p>查看已上传的文档分段</p></figcaption></figure>
|
||||
|
||||
***
|
||||
|
||||
### 2 检查分段质量
|
||||
|
||||
文档分段对于知识库应用的问答效果有明显影响,在将知识库与应用关联之前,建议人工检查分段质量。
|
||||
|
|
@ -26,6 +28,8 @@
|
|||
|
||||
<figure><img src="../../.gitbook/assets/image (185).png" alt="" width="357"><figcaption><p>明显的语义截断</p></figcaption></figure>
|
||||
|
||||
***
|
||||
|
||||
### 3 添加文本分段
|
||||
|
||||
在分段列表内点击 「 添加分段 」 ,可以在文档内自行添加一个或批量添加多个自定义分段。
|
||||
|
|
@ -36,12 +40,16 @@
|
|||
|
||||
<figure><img src="../../.gitbook/assets/image (4).png" alt=""><figcaption><p>批量添加自定义分段</p></figcaption></figure>
|
||||
|
||||
***
|
||||
|
||||
### 4 编辑文本分段
|
||||
|
||||
在分段列表内,你可以对已添加的分段内容直接进行编辑修改。包括分段的文本内容和关键词。
|
||||
|
||||
<figure><img src="../../.gitbook/assets/image (5).png" alt=""><figcaption><p>编辑文档分段</p></figcaption></figure>
|
||||
|
||||
***
|
||||
|
||||
### 5 元数据管理
|
||||
|
||||
除了用于标记不同来源文档的元数据信息,例如网页数据的标题、网址、关键词、描述等。元数据将被用于知识库的分段召回过程中,作为结构化字段参与召回过滤或者显示引用来源。
|
||||
|
|
@ -52,6 +60,8 @@
|
|||
|
||||
<figure><img src="../../.gitbook/assets/image (179).png" alt=""><figcaption><p>元数据管理</p></figcaption></figure>
|
||||
|
||||
***
|
||||
|
||||
### 6 添加文档
|
||||
|
||||
在「 知识库 > 文档列表 」 点击 「 添加文件 」,可以在已创建的知识库内上传新的文档或者 [Notion 页面](sync-from-notion.md)。
|
||||
|
|
@ -60,15 +70,17 @@
|
|||
|
||||
<figure><img src="../../.gitbook/assets/image (181).png" alt=""><figcaption><p>知识库上传新文档</p></figcaption></figure>
|
||||
|
||||
***
|
||||
|
||||
|
||||
### 文档禁用和归档
|
||||
### 7 文档禁用和归档
|
||||
|
||||
**禁用**:数据集支持将暂时不想被索引的文档或分段进行禁用,在数据集文档列表,点击禁用按钮,则文档被禁用;也可以在文档详情,点击禁用按钮,禁用整个文档或某个分段,禁用的文档将不会被索引。禁用的文档点击启用,可以取消禁用。
|
||||
|
||||
**归档**:一些不再使用的旧文档数据,如果不想删除可以将它进行归档,归档后的数据就只能查看或删除,不可以进行编辑。在数据集文档列表,点击归档按钮,则文档被归档,也可以在文档详情,归档文档。归档的文档将不会被索引。归档的文档也可以点击撤销归档。
|
||||
|
||||
### 知识库设置
|
||||
***
|
||||
|
||||
### 8 知识库设置
|
||||
|
||||
在知识库的左侧导航中点击**设置**,你可以改变知识库的以下设置项:
|
||||
|
||||
|
|
@ -90,7 +102,9 @@
|
|||
|
||||
**检索设置**,[参考文档](chuang-jian-zhi-shi-ku-shang-chuan-wen-dang.md#jian-suo-she-zhi)
|
||||
|
||||
### 知识库 API 管理
|
||||
***
|
||||
|
||||
### 9 知识库 API 管理
|
||||
|
||||
Dify 知识库提供整套标准 API ,开发者通过 API 调用对知识库内的文档、分段进行增删改查等日常管理维护操作,请参考[知识库 API 文档](maintain-dataset-via-api.md)。
|
||||
|
||||
|
|
|
|||
Loading…
Reference in New Issue