news 2026/6/10 18:21:11

Chroma：给 AI 应用做向量存储和检索

张小明

前端开发工程师

1.2k 24

文章封面图 — Chroma：给 AI 应用做向量存储和检索

文章目录

Chroma：给 AI 应用做向量存储和检索
- 1、核心功能
- 2、设计思路
- 3、安装使用
- 4、适合哪些人用

Chroma：给 AI 应用做向量存储和检索

Chroma 在 GitHub 上已经拿到 28,198 Star。

这是一个开源的向量数据库，定位为 AI 应用的数据基础设施。支持 Python 和 JavaScript，提供内存模式用于快速原型，也支持持久化存储和服务端部署。

1、核心功能

向量数据库的作用是把文本、图片这类数据转成高维向量，然后基于相似度做检索。语义搜索、RAG 这类场景都依赖这个能力。

Chroma 的核心 API 只有 4 个函数：创建集合、添加文档、查询相似结果、按 ID 获取。没有复杂的配置，安装后直接 import 就能用。

importchromadb client=chromadb.Client()collection=client.create_collection("all-my-documents")collection.add(documents=["This is document1","This is document2"],metadatas=[{"source":"notion"},{"source":"google-docs"}],ids=["doc1","doc2"],)results=collection.query(query_texts=["This is a query document"],n_results=2,)

Embedding 生成、tokenization、索引构建，这些 Chroma 内部自动处理。你也可以传自己的向量，跳过内置的 embedding 流程。

2、设计思路

Chroma 的目标是让向量检索的门槛足够低。内存模式适合本地开发和测试，加一行配置就能切到持久化模式。需要服务化部署时，用chroma run启动服务端，客户端通过网络访问。

Python 和 JavaScript 的 API 设计保持一致，团队里不同技术栈的人用起来不会有割裂感。

如果不需要自己维护基础设施，Chroma Cloud 提供托管服务，支持向量搜索、混合搜索和全文搜索。

3、安装使用

Python 用户：

pipinstallchromadb

JavaScript 用户：

npminstallchromadb

启动服务端：

chroma run--path/chroma_db_path

查询时支持 metadata 过滤和文档内容过滤，接口设计得很直接，没有复杂的查询语法要记。

4、适合哪些人用

做 RAG 应用、需要给 LLM 检索上下文的开发者
做语义搜索、推荐系统的工程师
需要快速验证向量检索方案的产品团队

Chroma 采用 Apache 2.0 协议开源，社区在 Discord 上活跃，每周一发布新版本。

需要快速验证向量检索方案的产品团队

Chroma 采用 Apache 2.0 协议开源，社区在 Discord 上活跃，每周一发布新版本。

版权声明: 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系邮箱：809451989@qq.com进行投诉反馈，一经查实，立即删除！

网站建设 2026/6/10 18:16:14

Windows系统difxapi.dll文件丢失找不到问题解决

在使用电脑系统时经常会出现丢失找不到某些文件的情况，由于很多常用软件都是采用 Microsoft Visual Studio 编写的，所以这类软件的运行需要依赖微软Visual C运行库，比如像 QQ、迅雷、Adobe 软件等等，如果没有安装VC运行库或者安装…

作者头像

李华

网站建设 2026/6/10 18:10:57

【架构深评】打破多品牌壁垒：如何基于 GB28181 与 RTSP 栈，构建高解耦的 AI 视频流媒体管理平台？（附源码交付）

引言：利旧与创新的博弈，安防集成商的“破局之战” 在传统安防向 AI 智能化升级的进程中，项目落地往往面临着两大冰冷的高墙：前端设备碎片化与流媒体开发周期长。海康、大华、宇视以及众多白牌厂家的利旧摄像头协议各异&#xff…

作者头像

李华

网站建设 2026/6/10 18:10:49

docker无法连接到ollama服务的问题排查和解决方案

一、环境背景服务端（Ollama）：运行于 Windows 宿主机上。属于非系统级服务，可通过桌面快捷方式（羊驼图标）或命令行（ollama serve）手动启动。客户端（Docker）&…

作者头像

李华

网站建设 2026/6/10 18:06:56

亲测有效！技术强的认证机构选择经验分享

认证机构行业痛点分析当前，认证机构领域的企业面临诸多挑战。首先，入行门槛偏低导致市场鱼龙混杂，超六成中小机构无合规备案，依靠低价抢单、代编资料抢占市场，引发恶性竞争，行业利润不断被压缩。其次&#…

作者头像

李华

网站建设 2026/6/10 18:04:19

【IEEE出版·深圳】2026年计算机感知与神经网络国际学术会议（CPNN 2026）

【IEEE出版深圳】2026年计算机感知与神经网络国际学术会议（CPNN 2026） IEEE 官方推荐 | EI Compendex / Scopus 双检索 | 早鸟截稿：2026年6月22日 ⚠️ 会议时间调整通知原定8月28-30日，现调整为 2026年8月21-22日（仅…

作者头像

李华

网站建设 2026/6/10 18:01:42

核心拆解：基金名字里的“四大密码”

名字里的关键词到底代表啥意思？热门基金举例行业/主题专门买某个特定行业的股票，一荣俱荣，一损俱损。招商中证白酒（全仓买茅台五粮液等酒企）易方达国防军工（专买军工企业）指数名称被动跟踪某个指…

作者头像

李华