news 2026/6/8 9:58:13

【收藏必备】让AI智能体越用越聪明!揭秘MemMachine开源记忆层架构与实战指南

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【收藏必备】让AI智能体越用越聪明!揭秘MemMachine开源记忆层架构与实战指南

文章介绍了如何通过记忆系统提升AI智能体能力,重点推荐MemMachine这一AI Memory开源库。该库支持工作、持久和个性化三种内存类型,采用关系型数据库和图数据库组合存储方案,使AI能学习记忆并延续上下文,构建持续进化的用户档案。文章详细介绍了API和MCP两种接入方式,帮助开发者轻松集成记忆功能,将普通聊天机器人升级为能理解用户并与之共同成长的个性化AI助手。


如何让你开发的AI智能体越用越聪明?需要解答这个问题,就需要先来了解Agent的架构。Lilian Weng的智能体架构以大语言模型(LLM)为核心作为智能体的“大脑”。

智能体**(AI Agent)=大模型LLM)+记忆(Memory)+规划(Planning)+工具使用(Tool Use)**

  • 规划(Planning)包括子目标分解(将大任务分解为小任务)和自我反思与完善(从错误中学习并改进)。
  • 记忆(Memory)包含短期记忆(上下文学习)和长期记忆(通过外部向量存储进行信息检索)。
  • 工具使用(Tool Use)赋予智能体调用外部API的能力,以获取额外信息或执行模型本身不具备的功能。

以上的三大模块组成了Agent,其中记忆就是让Agent越用越聪明的关键点,在这里我给大家推荐一个AI Memory 开源库:MemMachine。

链接:https://github.com/memmachine

官网:https://memmachine.ai/

项目介绍

MemMachine 是为AI智能体打造的通用记忆层。它让AI应用能够学习、记忆并在不同会话间延续上下文,从而构建持续进化的用户档案。简单来说,它将普通的聊天机器人,升级为能真正理解你、与你共同成长的个性化助手。

它有什么特性?

  1. 多种内存类型:MemMachine 支持工作(短期)、持久(长期)和个性化(档案)内存类型。
  2. 开发者友好型 API:Python SDK、RESTful 和 MCP 接口及端点,集成起来非常简单。

技术架构如下:

MemMachine 就像是给 AI 装了一个内存条,让它能像人一样记住过去、理解现在、预测未来。

  1. 记忆层:情景记忆(短期 + 长期)、个性化记忆(记住你的喜好习惯)
  2. 存储层:数据安全存放在两种数据库里,长期记忆使用的图数据库+个人信息记忆使用的关系型数据库

数据存储设计:

关系型数据库像一个电子档案柜,把数据存在一个个整齐的表格里。它擅长存储简单明了的信息,比如你的姓名、年龄、地址这些基本资料。就像你不会把所有东西都堆在桌子上一样,关系型数据库把不同类型的信息分类放在不同的表格里,查找起来既快又准,而且能保证信息不会出错。

图数据库像一张社交网络图,用 “节点” 代表人和事物,用 “边” 代表它们之间的关系。它特别擅长处理复杂的关系网络,比如谁是你的朋友、朋友的朋友喜欢什么、谁和谁有共同兴趣。就像你在社交软件上看到的好友关系图一样,图数据库能轻松发现隐藏的联系,帮你找到 “你可能认识的人” 或者 “你可能喜欢的东西”。

一起用的效果:

这两种数据库就像你的左脑和右脑,关系型数据库负责精确的事实记忆,图数据库负责智能的关系理解,在一起使用时能提供既准确又智能的服务。

使用指南

接下来介绍两种最通用接入方式:API接入、MCP接入。

API接入

前提条件:确保你的 FastAPI 应用程序正在运行。打开终端,导航到包含您的app.py文件的目录,并运行以下命令。输出应确认服务器正在监听请求。

uvicorn app:app --reload
  1. 获取所有会话

最简单的方式是检查现有会话。这个GET请求不需要任何数据。由于还没有创建任何会话,你可能会看到一个空列表。

curl http://127.0.0.1:8080/v1/sessions
  1. 创建记忆片段

POST /v1/memories:需要一个包含会话详情、生产者、接收者和记忆内容的 JSON 主体。

curl -X POST "http://127.0.0.1:8080/v1/memories" \ -H "Content-Type: application/json" \ -d '{ "session": { "group_id": "test_group", "agent_id": ["test_agent"], "user_id": ["test_user"], "session_id": "session_123" }, "producer": "test_user", "produced_for": "test_agent", "episode_content": "This is a simple test memory.", "episode_type": "message", "metadata": {} }'

正确输出:收到一个空的200 OK响应,确认已成功添加。

  1. 搜索内存

POST /v1/memories/search:需要一个 JSON 正文来指定搜索查询和会话。

curl -X POST "http://127.0.0.1:8080/v1/memories/search" \ -H "Content-Type: application/json" \ -d '{ "session": { "group_id": "test_group", "agent_id": ["test_agent"], "user_id": ["test_user"], "session_id": "session_123" }, "query": "simple test memory", "filter": {}, "limit": 5 }'

正确输出:看到一个200 OK响应,其中包含搜索结果,包括你刚刚添加的记忆片段。输出将以 JSON 对象的格式显示,确认你的记忆已被成功找到。

  1. 删除会话数据

DELETE /v1/memories:需要 JSON 主体来指定要删除哪个会话的数据。

curl -X DELETE "http://127.0.0.1:8080/v1/memories" \ -H "Content-Type: application/json" \ -d '{ "session": { "group_id": "test_group", "agent_id": ["test_agent"], "user_id": ["test_user"], "session_id": "session_123" } }'

MCP接入

前提条件:确保你的独立 MCP 服务器已启动并运行,可以使用以下示例命令来启动它:

MEMORY_CONFIG=config.yml uv run memmachine-mcp-http --host localhost --port 8080

其中config.yml是你的 MemMachine 配置文件。localhost8080是 MCP 服务器将监听请求的主机名和端口。

如果您想检查服务器是否运行正常,您可以使用curl命令,按照以下步骤查询服务器上可用的工具。

  1. 建立 SSE 连接并获取会话 ID

我们需要会话 ID 来与 MCP 服务器进行交互。可以通过建立 Server-Sent Events (SSE)连接来获取会话 ID。

curl -v -N http://localhost:8080/mcp/ -H "Accept: text/event-stream"

示例响应:

* Host localhost:8080 was resolved. * IPv6: ::1 * IPv4: 127.0.0.1 * Trying [::1]:8080... * connect to ::1 port 8080 from ::1 port 62212 failed: Connection refused * Trying 127.0.0.1:8080... * Connected to localhost (127.0.0.1) port 8080 > GET /mcp/ HTTP/1.1 > Host: localhost:8080 > User-Agent: curl/8.7.1 > Accept: text/event-stream > * Request completely sent off < HTTP/1.1 400 Bad Request < date: Fri, 31 Oct 2025 21:58:56 GMT < server: uvicorn < content-type: application/json < mcp-session-id: 8f82399b29ba42d495ff44d5a9cf7862 < content-length: 105 < {"jsonrpc":"2.0","id":"server-error","error":{"code":-32600,"message":"Bad Request: Missing session ID"}}

在这个输出中查找mcp-session-id头部,可以看到会话 ID 是8f82399b29ba42d495ff44d5a9cf7862

  1. 初始化会话

现在我们已经有了会话 ID,可以通过向 MCP 服务器发送initialize请求来初始化会话。

curl http://localhost:8080/mcp/ \ -H "Content-Type: application/json" \ -H "Accept: application/json, text/event-stream" \ -H "mcp-session-id: 8f82399b29ba42d495ff44d5a9cf7862" \ -d '{ "jsonrpc": "2.0", "id": 1, "method": "initialize", "params": { "protocolVersion": "2024-11-05", "capabilities": {}, "clientInfo": { "name": "curl-client", "version": "1.0.0" } } }'

示例响应:

event: message data: { "jsonrpc": "2.0", "id": 1, "result": { "protocolVersion": "2024-11-05", "capabilities": { "experimental": {}, "prompts": { "listChanged": true }, "resources": { "subscribe": false, "listChanged": true }, "tools": { "listChanged": true } }, "serverInfo": { "name": "MemMachine", "version": "1.16.0" } } }
  1. 发送初始化通知

初始化会话后,我们需要向 MCP 服务器发送initialized通知。

curl http://localhost:8080/mcp/ \ -H "Content-Type: application/json" \ -H "Accept: application/json, text/event-stream" \ -H "mcp-session-id: 8f82399b29ba42d495ff44d5a9cf7862" \ -d '{ "jsonrpc": "2.0", "method": "notifications/initialized" }'

请求应成功且无任何错误。

  1. 列出可用工具

现在我们可以通过向 MCP 服务器发送tools/list请求来列出可用工具。

curl http://localhost:8080/mcp/ \ -H "Content-Type: application/json" \ -H "Accept: application/json, text/event-stream" \ -H "mcp-session-id: 8f82399b29ba42d495ff44d5a9cf7862" -d '{ "jsonrpc": "2.0", "id": 2, "method": "tools/list", "params": {} }'

示例响应:

event: message data: { "jsonrpc": "2.0", "id": 2, "result": { "tools": [ { "name": "add_memory", "description": "Store important new information about the user or conversation into memory. Use this automatically whenever the user shares new facts, preferences, plans, emotions, or other details that could be useful for future context. Include the **full conversation context** in the `content` field — not just a snippet. This tool writes to both short-term (episodic) and long-term (profile) memory, so that future interactions can recall relevant background knowledge even across different sessions.", "inputSchema": { "$defs": { "AddMemoryParam": { "description": "Parameters for adding memory.\n\nThis model is used by chatbots or agents to store important information\ninto memory for a specific user. The content should contain the **full\nconversational or contextual summary**, not just a short fragment.\n\nChatbots should call this when they learn new facts about the user,\nobserve recurring behaviors, or summarize recent discussions.", ... }

总结

让AI智能体越用越聪明就是为它安装一个强大的记忆系统。通过集成 MemMachine 专业记忆层,Anget就能瞬间赋予长期记忆和个性化学习能力,将普通 Agent 升级为能真正理解用户并与之共同成长的AI智能体伙伴。

AI时代,未来的就业机会在哪里?

答案就藏在大模型的浪潮里。从ChatGPT、DeepSeek等日常工具,到自然语言处理、计算机视觉、多模态等核心领域,技术普惠化、应用垂直化与生态开源化正催生Prompt工程师、自然语言处理、计算机视觉工程师、大模型算法工程师、AI应用产品经理等AI岗位。

掌握大模型技能,就是把握高薪未来。

那么,普通人如何抓住大模型风口?

AI技术的普及对个人能力提出了新的要求,在AI时代,持续学习和适应新技术变得尤为重要。无论是企业还是个人,都需要不断更新知识体系,提升与AI协作的能力,以适应不断变化的工作环境。

因此,这里给大家整理了一份《2025最新大模型全套学习资源》,包括2025最新大模型学习路线、大模型书籍、视频教程、项目实战、最新行业报告、面试题等,带你从零基础入门到精通,快速掌握大模型技术!

由于篇幅有限,有需要的小伙伴可以扫码获取!

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

4. 大模型项目实战

学以致用,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

5. 大模型行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

为什么大家都在学AI大模型?

随着AI技术的发展,企业对人才的需求从“单一技术”转向 “AI+行业”双背景。企业对人才的需求从“单一技术”转向 “AI+行业”双背景。金融+AI、制造+AI、医疗+AI等跨界岗位薪资涨幅达30%-50%。

同时很多人面临优化裁员,近期科技巨头英特尔裁员2万人,传统岗位不断缩减,因此转行AI势在必行!

这些资料有用吗?

这份资料由我们和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


大模型全套学习资料已整理打包,有需要的小伙伴可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费】

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/7 9:46:24

diskinfo查看磁盘健康状态确保Qwen3-VL-30B稳定运行

diskinfo查看磁盘健康状态确保Qwen3-VL-30B稳定运行 在部署像 Qwen3-VL-30B 这类超大规模多模态模型的今天&#xff0c;系统稳定性早已不再仅仅依赖于GPU算力或网络带宽。真正决定服务可用性的&#xff0c;往往是那些“不起眼”的基础设施环节——比如一块默默工作的NVMe固态硬…

作者头像 李华
网站建设 2026/6/7 18:10:58

Dify流程编排调用ACE-Step API:实现多步音乐创作自动化

Dify流程编排调用ACE-Step API&#xff1a;实现多步音乐创作自动化 在短视频、独立游戏和数字广告内容爆炸式增长的今天&#xff0c;背景音乐&#xff08;BGM&#xff09;的需求量正以前所未有的速度攀升。然而&#xff0c;专业作曲成本高、周期长&#xff0c;而版权音乐库又常…

作者头像 李华
网站建设 2026/6/8 2:01:16

Wan2.2-T2V-5B vs YOLOv11:不同AI任务下硬件资源调度对比分析

Wan2.2-T2V-5B vs YOLOv11&#xff1a;不同AI任务下硬件资源调度对比分析 在边缘计算设备日益普及的今天&#xff0c;越来越多的AI应用开始尝试将生成式模型与感知型模型部署在同一终端上。想象这样一个场景&#xff1a;商场入口处的智能屏实时捕捉行人特征&#xff0c;当识别到…

作者头像 李华
网站建设 2026/6/7 14:09:14

如何实现流式输出?一篇文章手把手教你!

一、什么是流式输出&#xff1f;流式输出是一种数据传输模式&#xff0c;在这种模式下&#xff0c;数据不是作为一个完整的、单一的包裹在一次响应中发送给客户端&#xff0c;而是被分成许多小的数据块 (chunks) &#xff0c;并在服务器端生成的同时&#xff0c;持续不断、逐块…

作者头像 李华
网站建设 2026/6/8 8:23:47

Nginx缓存静态资源提升ACE-Step Web界面访问速度

Nginx 缓存静态资源提升 ACE-Step Web 界面访问速度 在 AI 音乐创作工具逐渐走向大众的今天&#xff0c;用户体验不再仅仅取决于模型生成能力&#xff0c;更与前端响应速度息息相关。以 ACE-Step 为例——这款由 ACE Studio 与阶跃星辰联合推出的开源音乐生成模型&#xff0c;凭…

作者头像 李华
网站建设 2026/6/7 17:59:11

跨平台标签打印革命:1个工具搞定Windows、macOS、Linux三大系统

跨平台标签打印革命&#xff1a;1个工具搞定Windows、macOS、Linux三大系统 【免费下载链接】lprint A Label Printer Application 项目地址: https://gitcode.com/gh_mirrors/lp/lprint 技术前沿&#xff1a;IPP Everywhere™协议驱动的零配置打印新时代 在现代数字化…

作者头像 李华