开源 TrustEngine,终结 AI 幻觉的终极方案
这是每一个用 AI 写代码的人,每天都在踩的坑。
你让 GPT-4o 写一个登录接口,它返回的代码干净漂亮,注释齐全。你让它自己审核一遍,它拍着胸脯告诉你:"没有任何安全问题,可以直接上线。"
然后你上线了。一周后,你的数据库被拖库了。
因为它写的代码里藏着一个最基础的 SQL 注入漏洞,而它自己永远发现不了。
这不是 prompt 写得好不好的问题。这是所有生成式 AI 的基因缺陷:单一模型永远看不到自己的盲点。
让 AI 自己审核自己的输出,本质上就是让学生自己改卷子。它会用完美的逻辑自圆其说自己的幻觉,你根本挑不出错。
所以我写了AI Flow Architect,一个专门用来揭穿 AI 谎言的开源工具。今天正式发布 V2.2.0 版本,PyPI 包已上线,一行命令就能安装。
核心解决方案:三脑对抗架构
我没有发明新的模型,也没有发明新的算法。我只是做了一个非常简单的架构设计:让 AI 和 AI 互相对抗。
一个 AI 写代码,另一个 AI 专门挑错,第三个 AI 做最终仲裁。三个 AI 完全独立,互相不知道对方的存在。
整个流程没有任何捷径可以跳过:
- 规划脑(GPT-4o):生成任务蓝图和代码
- 对手脑(Claude 3.5 Sonnet):从安全、成本、数据、体验、极简 5 个角度,专门挑错
- 仲裁脑(TrustEngine):交叉验证两个 AI 的结论,生成可追溯的质量报告
- 人做最终决策:AI 只负责摆事实,永远不替你做决定
这不是投票,这是对抗。共识不是来自于 "多数同意",而是来自于 "在攻击中幸存"。
什么是 TrustEngine?
TrustEngine 是整个项目的核心,也是全世界所有 AI 框架里独一份的设计。我把质量控制从工作流里抽了出来,做成了一个可以独立使用的通用质检中间件。
它不生成任何内容,它只做一件事:判断 AI 生成的内容是不是对的。
它有四个所有其他工具都没有的特性:
- 多模型交叉仲裁:自动调用 3 个不同的模型进行对抗审查
- 不确定性透明:会明确告诉你 "哪些地方我也不确定",不会不懂装懂
- 证据链可追溯:每一个结论都附带 SHA-256 哈希和时间戳,可审计、可验证
- 零依赖集成:一行命令就能用,三行代码就能集成到任何现有项目
最关键的是,它可以和任何现有工具无缝集成。你不用抛弃你正在用的 CrewAI 或 LangChain,只要加三行代码,就能给它们装上质检系统。
V2.2.0 重大更新(今天刚更)
✅PyPI 包正式发布:不用 clone 仓库,一行命令安装
pip install ai-flow-architect[html]✅在线 Playground 上线:不用安装,不用 API 密钥,打开浏览器就能体验👉 体验地址:https://wdnmd1265.github.io/ai-flow-architect/playground.html
✅HTML 报告导出:生成自包含的 HTML 报告,可以分享给团队,贴在 PR 里
ai-flow audit login.py -r "检查安全漏洞" --html -o report.html✅GitHub Action 集成:自动审查每一个 PR 的代码,发现漏洞直接阻止合并
✅支持 8 个模型提供商:OpenAI、Anthropic、通义千问、智谱 GLM、DeepSeek、Ollama 等
✅186 个单元测试:覆盖所有核心模块,稳定性有保障
✅Conscience 基准测试:内置 50 个安全和逻辑挑战,可复现系统健康报告
30 秒快速上手
一行命令审查任何文件
export OPENAI_API_KEY=sk-your-key ai-flow audit login.py -r "检查SQL注入、认证绕过和速率限制"三行代码集成到你的项目
from ai_flow_architect import TrustEngine engine = TrustEngine() report = engine.audit( requirement="实现一个安全的用户登录接口", ai_output=generated_code ) print(report.summary()) # "REJECT (32/100): 3个确定问题,2个争议点"完美支持本地 Ollama,完全免费
engine = TrustEngine(config={ "auditors": ["llama3", "qwen2.5-coder", "deepseek-coder"] })为什么这绝对不是 "又一个 AI Agent 框架"
我来给你说清楚本质区别:
其他框架:解决 "怎么让 AI 生成更多内容" 的问题
我的项目:解决 "怎么判断 AI 生成的内容是对的" 的问题
其他框架之间是竞品关系:你用了 CrewAI 就不用 LangChain
我的项目是补充关系:你用了 CrewAI,更需要用 TrustEngine 来质检
其他框架:追求无限灵活性,把所有责任推给用户
我的项目:追求绝对可预测性,把质量控制变成框架的责任
现在的 AI 行业,所有人都在拼命让 AI 生成更多、更快的内容。但没有人关心这些内容是不是对的、是不是安全的、是不是能用的。
我们已经有了太多的 "生成器",但我们极度缺少 "检验器"。
写在最后
这个项目是我,从最开始的一个简单脚本,到现在有完整的架构、测试、文档和社区。
今天发布的 V2.2.0 是第一个真正可用的生产版本。它可能不是最完美的,但它是唯一一个把AI 幻觉问题透明化的开源工具。
如果你也受够了 AI 一本正经地胡说八道,如果你也不想再为 AI 的错误买单,欢迎试试我的项目。
项目地址:https://github.com/wdnmd1265/ai-flow-architect
在线体验:https://wdnmd1265.github.io/ai-flow-architect/playground.html
如果觉得对你有帮助,麻烦点个 Star。有任何 bug 或者建议,都可以在 GitHub 提 issue,我会第一时间回复。