news 2026/6/21 23:46:49

响应流式传输(Response Streaming)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
响应流式传输(Response Streaming)

响应流式传输(Response Streaming)

注意
此页面描述的是低级 LLM API 的响应流式传输。高级 LLM API 请参见 [AI 服务](AI Services)。

LLM 会逐个令牌(token)生成文本,因此许多 LLM 提供商提供了一种逐令牌流式传输响应的方法,而无需等待整个文本生成完毕。这显著改善了用户体验,因为用户无需等待未知的时间,几乎可以立即开始阅读响应。

对于ChatModelLanguageModel接口,存在对应的StreamingChatModelStreamingLanguageModel接口。它们具有相似的 API,但可以流式传输响应。它们接受StreamingChatResponseHandler接口的实现作为参数。

publicinterfaceStreamingChatResponseHandler{defaultvoidonPartialResponse(StringpartialResponse){}defaultvoidonPartialResponse(PartialResponsepartialResponse,PartialResponseContextcontext){}defaultvoidonPartialThinking(PartialThinkingpartialThinking){}defaultvoidonPartialThinking(PartialThinkingpartialThinking,PartialThinkingContextcontext){}defaultvoidonPartialToolCall(PartialToolCallpartialToolCall){}defaultvoidonPartialToolCall(PartialToolCallpartialToolCall,PartialToolCallContextcontext){}defaultvoidonCompleteToolCall(CompleteToolCallcompleteToolCall){}voidonCompleteResponse(ChatResponsecompleteResponse);voidonError(Throwableerror);}

通过实现StreamingChatResponseHandler,您可以为以下事件定义操作:

  • 当生成下一个部分文本响应时:调用onPartialResponse(String)onPartialResponse(PartialResponse, PartialResponseContext)(您可以实现其中任一方法)。根据 LLM 提供商的不同,部分响应文本可以包含一个或多个令牌。例如,您可以在令牌可用时立即将其发送到 UI。
  • 当生成下一个部分思考/推理文本时:调用onPartialThinking(PartialThinking)onPartialThinking(PartialThinking, PartialThinkingContext)(您可以实现其中任一方法)。根据 LLM 提供商的不同,部分思考文本可以包含一个或多个令牌。
  • 当生成下一个部分工具调用时:调用onPartialToolCall(PartialToolCall)onPartialToolCall(PartialToolCall, PartialToolCallContext)(您可以实现其中任一方法)。
  • 当 LLM 完成单个工具调用的流式传输时:调用onCompleteToolCall(CompleteToolCall)
  • 当 L
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/21 23:46:18

好用还专业!高效论文写作全流程AI论文软件推荐(2026 最新)

2026年AI论文软件持续升级,论文写作全流程可拆解为文献调研→选题/开题→大纲/初稿→文献综述→降重/去AI味→润色/格式→查重/投稿七大环节,以下工具按环节精准匹配,兼顾中文适配、降重能力、去AI痕迹、学术合规四大核心需求,覆盖…

作者头像 李华
网站建设 2026/6/21 23:38:47

调整AI策略止盈后冷却期,卖出同一标的30日内不再二次买入。

聚焦“AI 策略止盈后冷却期:同一标的 30 日内不再二次买入”这一件事,适合直接写进课程讲义或技术博客。AI 策略止盈后冷却期:同一标的 30 日内不再二次买入一、实际应用场景描述在 AI 选股 趋势策略中,一个非常常见、但很少被系…

作者头像 李华
网站建设 2026/6/21 23:35:14

开源计算机视觉项目easy12306深度剖析:基于深度学习的12306验证码识别算法原理与本地部署实战指南

开源计算机视觉项目easy12306深度剖析:基于深度学习的12306验证码识别算法原理与本地部署实战指南 在自动化脚本与抢票软件盛行的互联网技术圈中,12306网站的验证码识别一直是一个经典的技术博弈点。easy12306 是由开发者 zhaipro 开源的一个专注于解决1…

作者头像 李华
网站建设 2026/6/21 23:34:04

蓝牙芯片MC72000手机集成实战:硬件接口、射频与低功耗设计详解

1. 项目概述:将MC72000蓝牙芯片集成到手机的设计实战在2000年代初期,功能手机向智能手机演进的浪潮中,蓝牙功能从高端选配逐渐成为移动设备的标配。当时,像摩托罗拉MC72000这类高度集成的蓝牙单芯片解决方案,为手机设计…

作者头像 李华
网站建设 2026/6/21 23:33:54

嵌入式AI部署实战:基于NXP eIQ环境在Layerscape处理器上部署机器学习模型

1. 项目概述:在嵌入式边缘部署机器学习的挑战与机遇在嵌入式系统领域,尤其是工业控制、智能网关、网络设备这些对实时性、功耗和可靠性有严苛要求的场景里,部署机器学习模型一直是个“既要、又要、还要”的难题。既要模型有足够的精度来处理复…

作者头像 李华
网站建设 2026/6/21 23:31:16

导师推荐 AI论文网站 2026最新测评:工具对比+好用推荐

2026年真正好用的AI论文网站,核心看生成的论文质量、低AI味、格式正确、学术适配四大指标。综合实测,千笔AI、ThouPen、豆包、DeepSeek、Grammarly 是当前最值得推荐的梯队,覆盖从免费到付费、从中文到英文、从文科到理工的全场景需求。 一、…

作者头像 李华