GITBOOK-6: 中文文档更新

feat/huggingface-embedding-support
潘辉燕 2023-09-21 02:08:13 +00:00 committed by gitbook-bot
parent 6ac388bffb
commit d0ffda7590
No known key found for this signature in database
GPG Key ID: 07D2180C7B12D0FF
7 changed files with 29 additions and 21 deletions

Binary file not shown.

Before

Width:  |  Height:  |  Size: 157 KiB

After

Width:  |  Height:  |  Size: 688 KiB

Binary file not shown.

Before

Width:  |  Height:  |  Size: 81 KiB

After

Width:  |  Height:  |  Size: 770 KiB

Binary file not shown.

Before

Width:  |  Height:  |  Size: 219 KiB

After

Width:  |  Height:  |  Size: 609 KiB

View File

@ -4,7 +4,7 @@
Dify 的数据集功能可以使开发者(甚至非技术人员)以简单的方式管理数据集,并自动集成至 AI 应用中。你只需准备文本内容,例如:
* 长文本内容TXT、Markdown、JSONL 甚至是 PDF 文件)
* 长文本内容TXT、Markdown、DOCX、HTML、JSONL 甚至是 PDF 文件)
* 结构化数据CSV、Excel 等)
另外,我们正在逐步支持从诸多数据源同步数据至数据集,包括:
@ -21,7 +21,7 @@ Dify 的数据集功能可以使开发者(甚至非技术人员)以简单的
### 数据集与文档
在 Dify 中,**数据集Datasets**是一些**文档Documents**的集合。一个数据集可以被整体集成至一个应用中作为上下文使用。文档可以由开发者或运营人员上传,或由其它数据源同步(通常对应数据源中的一个文件单位)。
在 Dify 中,\*\*数据集Datasets**是一些**文档Documents\*\*的集合。一个数据集可以被整体集成至一个应用中作为上下文使用。文档可以由开发者或运营人员上传,或由其它数据源同步(通常对应数据源中的一个文件单位)。
**上传文档的步骤:**
@ -82,9 +82,16 @@ Dify 的数据集功能可以使开发者(甚至非技术人员)以简单的
* 调整分段和清洗设置
* 重新上传文件
我们支持对分段与清洗后的文本进行自定义增删改,你可以动态调整自己的分段信息,让你的数据集更加精准。通过点击数据集中 **文档 --> 段落 --> 编辑** 可修改段落内容。通过点击 **文档 --> 段落--> 添加新分段** 可手动新增新的分段内容。
我们支持对分段与清洗后的文本进行自定义增删改,你可以动态调整自己的分段信息,让你的数据集更加精准。通过点击数据集中 **文档 --> 段落 --> 编辑** 可修改段落内容以及自定义关键词。通过点击 **文档 --> 段落--> 添加分段-->添加新分段** 可手动添加新的分段内容,也可以点击 **文档 --> 段落--> 添加分段-->批量添加** 批量上传新的分段内容。
<figure><img src="../../.gitbook/assets/add-new-segment.png" alt=""><figcaption><p>新增新段落</p></figcaption></figure>
<figure><img src="../../.gitbook/assets/image (19).png" alt=""><figcaption><p>编辑分段</p></figcaption></figure>
<figure><img src="../../.gitbook/assets/image (18).png" alt=""><figcaption><p>添加新分段</p></figcaption></figure>
### 文档的禁用和归档
* **禁用、取消禁用**:数据集支持将暂时不想被索引的文档或分段进行禁用,在数据集文档列表,点击禁用按钮,则文档被禁用;也可以在文档详情,点击禁用按钮,禁用整个文档或某个分段,禁用的文档将不会被索引。禁用的文档点击启用,可以取消禁用。
* **归档、取消归档**:一些不再使用的旧文档数据,如果不想删除可以将它进行归档,归档后的数据就只能查看或删除,不可以进行编辑。在数据集文档列表,点击归档按钮,则文档被归档,也可以在文档详情,归档文档。归档的文档将不会被索引。归档的文档也可以点击撤销归档。
### 通过 API 维护数据集

View File

@ -2,7 +2,7 @@
### 1. 如何在国内环境中使用 OpenAI 代理服务器进行访问?
Dify 支持 OpenAI 的自定义 API 域名能力,支持任何兼容 OpenAI 的大模型 API 服务器。社区版中,通过 **设置 --> 模型供应商 --> OpenAI --> 编辑 API** 入口处填写目标服务器地址即可。
Dify 支持 OpenAI 的自定义 API 域名能力,支持任何兼容 OpenAI 的大模型 API 服务器。社区版中,通过 **设置 --> 模型供应商 --> OpenAI --> 编辑 API** 入口处填写目标服务器地址即可。
### **2. 如何选择基础模型?**
@ -34,11 +34,12 @@ Dify 支持 OpenAI 的自定义 API 域名能力,支持任何兼容 OpenAI
当嵌入向量被归一化为长度 1 后,计算两个向量之间的余弦相似度可以简化为它们的点积。因为归一化后的向量长度都为 1点积的结果就等同于余弦相似度的结果。由于点积运算相对于其他相似度度量如欧几里德距离的计算速度更快因此使用归一化的向量进行点积计算可以稍微提高计算效率。
### 6. 如何免费申领讯飞星火、MiniMax 模型的体验额度?
### 6. 如何免费申领智谱·AI、讯飞星火、MiniMax 模型的体验额度?
我们联合大模型厂商向中国用户提供一定的 token 体验额度。通过 Dify \*\*设置 --> 模型供应商 --> 显示更多模型供应商。\*\*在讯飞星火或 MiniMax 图标处点击【免费获取】,如果你在英文界面看不到领取入口,请将产品语言切换成为中文:
我们联合大模型厂商向中国用户提供一定的 token 体验额度。通过 Dify \*\*设置 --> 模型供应商 --> 显示更多模型供应商。\*\*在智谱·AI、讯飞星火或 MiniMax 图标处点击【免费获取】,如果你在英文界面看不到领取入口,请将产品语言切换成为中文:
* **讯飞星火 V1.5 模型):免费领取 300 万 token**,需要从 Dify 的入口进入,完成讯飞星火开放平台的注册(仅限未注册过讯飞星火的手机号),返回 Dify 静候 5 分钟,刷新页面即可在 Dify 页面体现可用额度。
* **智谱·AI 免费领取 1000 万 token**点击【免费领取】只需输入手机号及验证码即可到账额度不限制是否注册过智谱·AI。
* **讯飞星火 V1.5 模型、V2.0 模型):免费领取 600 万tokenV1.5 模型、V2.0 模型各 300 万 token额度不互通**,需要从 Dify 的入口进入,完成讯飞星火开放平台的注册(仅限未注册过讯飞星火的手机号),返回 Dify 静候 5 分钟,刷新页面即可在 Dify 页面体现可用额度。
* **MiniMax免费领取 100 万 token**,只需点击【免费领取】即可到账额度,无需手动注册流程,不限制是否注册过 MiniMax 账号。
体验额度到账后,在应用内 **提示词编排 --> 模型及参数 --> 语言模型** 处选择需使用的模型即可。
@ -134,12 +135,12 @@ OpenAI 的 GPT4 模型 API 和 ChatGPT Plus 是两个产品,分开收费的,
Dify 支持以下作为 Embedding 模型使用,只需在配置框中选择 `Embeddings` 类型即可。
- Azure
- LocalAI
- MiniMax
- OpenAI
- Replicate
- XInference
* Azure
* LocalAI
* MiniMax
* OpenAI
* Replicate
* XInference
### 22. 如何把自己创建的应用设置成应用模板?

View File

@ -7,6 +7,7 @@
* 对话开场白。
* 下一步问题建议。
* 语音转文字。
* 引用和归属
### 对话前填写的变量
@ -48,3 +49,8 @@ _请注意确保你使用的设备环境已经授权使用麦克风。_
<figure><img src="../.gitbook/assets/image (79).png" alt=""><figcaption></figcaption></figure>
### 引用和归属
若在应用编排时开启了「引用和归属」功能,则对话返回时,会自动展示引用的数据集文档来源。
<figure><img src="../.gitbook/assets/image (20).png" alt=""><figcaption><p>引用和归属</p></figcaption></figure>

View File

@ -2,12 +2,8 @@
Web 应用是给应用使用者用的。应用开发者在 Dify 创建一个应用,就会获得一个对应的 Web 应用。Web 应用的使用者无需登陆即可使用。Web 应用已适配不同尺寸的设备PC平板和手机。
Web 应用的内容和应用发布的配置一致。当修改了应用的配置,并在应用的提示词编排页点 “发布” 按钮发布后Web 应用的内容也会根据当前应用的配置做更新。
我们可以在应用概览页开启和关闭对 Web 应用的访问,以及修改 Web 应用的站点信息:
* 图标
@ -23,13 +19,11 @@ Web 应用的功能表现取决于开发者在编排应用时是否开启该功
* 对话前填写的变量
* 下一步问题建议
* 语音转文字
* 引用和归属
* 更多类似的答案(文本型应用)
* ......
在下面的章节,我们会分别介绍 Web 应用的两种类型:
* 文本生成型
* 对话型