GITBOOK-207: No subject

pull/104/head
vincehe 2024-06-06 08:39:46 +00:00 committed by gitbook-bot
parent 109cdb2371
commit 162ce8f562
No known key found for this signature in database
GPG Key ID: 07D2180C7B12D0FF
1 changed files with 1 additions and 1 deletions

View File

@ -1,6 +1,6 @@
# 负载均衡
模型速率限制(rate limits是模型厂商对用户或客户在指定时间内访问 API 服务次数所添加的限制。它有助于防止 API 的滥用或误用,有助于确保每个用户都能公平地访问 API控制基础设施的总体负载。
模型速率限制(Rate limits是模型厂商对用户或客户在指定时间内访问 API 服务次数所添加的限制。它有助于防止 API 的滥用或误用,有助于确保每个用户都能公平地访问 API控制基础设施的总体负载。
在企业级大规模调用模型 API 时,高并发请求会导致超过请求速率限制并影响用户访问。负载均衡可以通过在多个 API 端点之间分配 API 请求,确保所有用户都能获得最快的响应和最高的模型调用吞吐量,保障业务稳定运行。