news 2026/5/25 19:38:30

LangChain重磅发布Polly:AI Agent工程师的智能调试伙伴

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
LangChain重磅发布Polly:AI Agent工程师的智能调试伙伴

LangChain是受数千个团队信任的Agent工程平台,用于构建生产级Agent。现在,有了Polly,你拥有一位AI专家,在每一步都为你提供帮助。

2025年12月10日,LangChain正式发布了Polly。一款直接集成在LangSmith平台中的AI智能助手,专门帮助开发者调试、分析和改进AI Agent。

是的,你没看错:我们在一个用于构建Agent的产品中,又添加了一个Agent。这听起来有些讽刺,但背后有着深刻的逻辑。

LangChain团队与数千名开发者合作,帮助他们基于LangSmith构建生产级Agent。在这个过程中,我们清楚地看到了Agent真正擅长的事情(分析复杂的执行轨迹、发现数百个步骤中的模式)以及它们不擅长的事情(替代需要深思熟虑的工程决策)。我们想要把这件事做对。

最终的结果就是Polly:一个理解Agent架构、识别失败模式、真正帮助你更快地构建更好Agent的AI Agent工程师。Polly现已进入beta测试阶段。

为什么Agent需要一个AI调试伙伴?

通过与数千个在LangSmith上构建Agent的团队合作,我们反复看到相同的调试挑战。Agent与简单的LLM调用在本质上存在巨大差异,主要体现在三个方面:

更长的提示词:系统提示词往往跨越数百甚至数千行。当行为出现问题时,几乎不可能找出是哪条指令导致了问题。

更长的执行轨迹:Agent可以运行数百个步骤,在单次执行中生成数千个数据点——这远远超出了人类能够有效解析的范围。

多轮交互:Agent涉及跨越数小时或数天的多轮对话。要理解发生了什么,需要查看整个交互历史。

当出现问题时,你很难轻易定位是哪个决策、哪条提示指令或哪个工具调用导致了问题。这正是AI Agent工程师擅长的领域——也是我们构建Polly的原因。

Polly如何帮助调试轨迹、分析对话并优化提示词

与其手动扫描无尽的执行轨迹,或猜测哪个提示词修改能解决问题,你现在只需用自然语言向Polly提问。就像团队中有一位专家级的Agent工程师。以下是Polly目前可以做的事情:

调试单个执行轨迹

在轨迹视图中,Polly分析单个Agent执行,帮助你理解发生了什么。这正是Polly真正发光的地方——深度Agent的执行轨迹可能包含数百个步骤,失败模式往往很微妙,分布在多个步骤中,或埋藏在长执行的中间部分。

你可以向Polly提问:

• "Agent是否做了任何可以更高效的事情?"

• "Agent是否犯了任何错误?"

• "为什么Agent选择了这种方法而不是那种方法?"

• "问题到底出在哪里?"

Polly不仅仅是展示信息。它理解Agent行为模式,能够识别即使经过仔细人工检查也会遗漏的问题。

分析完整对话

在线程视图中,Polly可以访问整个对话的信息,这些对话有时跨越数小时、数天或数十轮来回交互。这是人类无法在脑海中保持的上下文。

你可以让Polly:

• 总结多轮交互中发生的事情

• 识别Agent行为随时间的模式

• 解释为什么Agent的方法在轮次之间发生了变化

• 发现Agent何时丢失了重要上下文

这对于调试那些令人沮丧的问题尤其强大——"Agent之前工作得很好,然后突然就不行了"。Polly可以精确定位事情在何时、为何发生了变化。

优化提示词工程

这是Polly真正强大的地方。系统提示词是任何深度Agent最重要的部分,而Polly是一位专家级的提示词工程师。

只需用自然语言描述你想要的行为,Polly就会相应地更新你的提示词。不再需要手动调整数百行指令,试图找出正确的措辞,或担心在修复一个问题时是否破坏了其他东西。

Polly还可以帮助你:

• 定义结构化输出模式

• 配置工具定义

• 添加或完善少样本示例

• 在不丢失关键指令的情况下优化提示词长度

Polly如何与LangSmith追踪系统协同工作

Polly的智能来自LangSmith全面的追踪基础设施。LangSmith捕获你的Agent所做的一切:

运行(Runs):单个步骤,如LLM调用和工具执行

轨迹(Traces):Agent的单个执行,由运行树组成

线程(Threads):完整对话,包含多个轨迹

在LangSmith中设置追踪只需几分钟——按照指南即可开始。一旦你的数据流入LangSmith,Polly就可以立即开始帮助你分析Agent行为、识别问题并改进提示词。

开始使用Polly

Polly已经可以分析轨迹、调试对话并优化提示词。随着时间的推移,我们将教它如何分析实验、优化提示词以及更多功能。

准备好开始使用Polly了吗?

• 在几分钟内设置追踪

• 开始使用LangSmith构建和调试你的Agent

• 与Polly对话,体验Agent工程的未来

你可以观看视频教程,了解更多关于如何开始使用Polly的详细信息。

LangChain是受数千个团队信任的Agent工程平台,用于构建生产级Agent。现在,有了Polly,你拥有一位AI专家,在每一步都为你提供帮助。

今天就试试Polly吧。

如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!​

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

四、AI大模型商业化落地方案

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/26 6:56:00

微软确认:Windows 11 AI 智能体访问用户文件前会先请求许可

微软证实,在允许人工智能智能体访问存储于六个常用文件夹(包括桌面、文档、下载、音乐、图片和视频)的文件前,Windows 11 会先征求用户的同意。用户也可为每个智能体单独自定义文件访问权限。12 月 17 日消息,微软证实…

作者头像 李华
网站建设 2026/5/26 6:52:38

Shopee 验证码解决方案

ight Data 的验证码解决方案是 抓取浏览器 和 网络解锁器 的内置功能,为应对最复杂的验证码挑战提供完整解决方案。功能特点快速识别与解决:可高准确率且迅速地自动解决 Shopee 验证码。IP 轮换:利用自动重试和动态 IP 调整,防止被…

作者头像 李华
网站建设 2026/5/26 2:33:42

Python - 诊断和修复内存泄漏

内存泄漏是指程序错误地管理内存分配,导致可用内存减少,并可能导致程序变慢或崩溃。 在 Python 中,内存管理通常由解释器处理,但内存泄漏仍然可能发生,尤其是在长时间运行的应用中。在 Python 中诊断和修复内存泄漏需…

作者头像 李华
网站建设 2026/5/25 7:59:58

什么叫组团社,什么叫地接社

在旅游行业中,有两个重要的角色:组团社与地接社,它们分别承担着不同的职责。 组团社,也被称为国内旅游批发商,其主要功能是接受旅游团或海外旅行社的预订。 它们负责制定并下达接待计划,甚至可以提供全程陪…

作者头像 李华
网站建设 2026/5/26 7:20:25

8大关键技术点掌握YashanDB的使用技巧

如何优化查询速度是数据库系统设计和运维中的重要问题,影响着业务响应时间和系统吞吐能力。高效的数据存储、合理的索引设计、智能的执行计划生成以及高并发事务控制技术,均直接关系到查询性能表现。本文围绕YashanDB数据库系统,深入剖析其八…

作者头像 李华
网站建设 2026/5/26 7:47:30

Kubernetes Service 架构深度解析:从虚拟IP到流量的智能寻址

在Kubernetes中,Pod间的直接互联仅是服务通信的基础。要构建一个稳定、弹性且对消费端透明的服务网络,其核心在于Service抽象层。许多开发者对Service的理解仅停留在“一个虚拟IP”的层面,却未能洞悉其背后精妙的流量治理机制:请求…

作者头像 李华