news 2026/5/25 11:38:53

43_Spring AI 干货笔记之 PostgresML 嵌入模型

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
43_Spring AI 干货笔记之 PostgresML 嵌入模型

一、PostgresML 嵌入模型

Spring AI 支持 PostgresML 文本嵌入模型。

嵌入是文本的一种数值表示形式,用于将单词和句子表示为向量(即数字数组)。通过使用距离度量比较数值向量的相似性,嵌入可用于查找相似的文本片段;此外,由于大多数算法无法直接使用文本,嵌入也可用作其他机器学习模型的输入特征。

PostgresML 内部可使用许多预训练的大型语言模型从文本生成嵌入。您可以在 Hugging Face 上浏览所有可用 模型,以找到最适合的解决方案。

二、添加仓库和 BOM

Spring AI 的构件发布在 Maven Central 和 Spring Snapshot 仓库中。请参阅 构件仓库 部分,将这些仓库添加到您的构建系统中。

为便于依赖管理,Spring AI 提供了 BOM(物料清单),以确保在整个项目中使用统一版本的 Spring AI。请参阅 依赖管理 部分,将 Spring AI BOM 添加到您的构建系统中。

三、自动配置

Spring AI 的自动配置和启动器模块的构件名称发生了重大变化。更多信息请参阅升级说明。

Spring AI 为 Azure PostgresML 嵌入模型提供了 Spring Boot 自动配置。要启用它,请在项目的 Maven pom.xml 文件中添加以下依赖:

<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-starter-model-postgresml-embedding</artifactId></dependency>

或在您的 Gradle build.gradle 构建文件中添加:

dependencies{implementation'org.springframework.ai:spring-ai-starter-model-postgresml-embedding'}

请参阅 依赖管理 部分,将 Spring AI BOM 添加到您的构建文件中。

使用 spring.ai.postgresml.embedding.options.* 属性来配置您的 PostgresMlEmbeddingModel。

嵌入属性

现在通过前缀为 spring.ai.model.embedding 的顶级属性来配置嵌入自动配置的启用和禁用。

  • 启用:spring.ai.model.embedding=postgresml(默认已启用)

  • 禁用:spring.ai.model.embedding=none(或任何与 postgresml 不匹配的值)

此项更改是为了支持配置多个模型。

前缀 spring.ai.postgresml.embedding 是用于配置 PostgresML 嵌入的 EmbeddingModel 实现的属性前缀。

所有以 spring.ai.postgresml.embedding.options 为前缀的属性,都可以在运行时通过向 EmbeddingRequest 调用添加特定于请求的运行时选项来覆盖。

四、运行时选项

使用 PostgresMlEmbeddingOptions.java 来配置 PostgresMlEmbeddingModel 的选项,例如要使用的模型等。

在启动时,您可以将 PostgresMlEmbeddingOptions 传递给 PostgresMlEmbeddingModel 构造函数,以配置用于所有嵌入请求的默认选项。

在运行时,您可以在 EmbeddingRequest 中使用 PostgresMlEmbeddingOptions 来覆盖默认选项。

例如,为特定请求覆盖默认模型名称:

EmbeddingResponseembeddingResponse=embeddingModel.call(newEmbeddingRequest(List.of("Hello World","World is big and salvation is near"),PostgresMlEmbeddingOptions.builder().transformer("intfloat/e5-small").vectorType(VectorType.PG_ARRAY).kwargs(Map.of("device","gpu")).build()));

五、示例控制器

这将创建一个 EmbeddingModel 实现,您可以将其注入到您的类中。以下是一个使用 EmbeddingModel 实现的简单 @Controller 类示例。

spring.ai.postgresml.embedding.options.transformer=distilbert-base-uncased spring.ai.postgresml.embedding.options.vectorType=PG_ARRAY spring.ai.postgresml.embedding.options.metadataMode=EMBED spring.ai.postgresml.embedding.options.kwargs.device=cpu
@RestControllerpublicclassEmbeddingController{privatefinalEmbeddingModelembeddingModel;@AutowiredpublicEmbeddingController(EmbeddingModelembeddingModel){this.embeddingModel=embeddingModel;}@GetMapping("/ai/embedding")publicMapembed(@RequestParam(value="message",defaultValue="Tell me a joke")Stringmessage){EmbeddingResponseembeddingResponse=this.embeddingModel.embedForResponse(List.of(message));returnMap.of("embedding",embeddingResponse);}}

六、手动配置

如果不使用 Spring Boot 自动配置,您可以手动创建 PostgresMlEmbeddingModel。为此,请在项目的 Maven pom.xml 文件中添加 spring-ai-postgresml 依赖:

<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-postgresml</artifactId></dependency>

或在您的 Gradle build.gradle 构建文件中添加:

dependencies{implementation'org.springframework.ai:spring-ai-postgresml'}

请参阅 依赖管理 部分,将 Spring AI BOM 添加到您的构建文件中。

接下来,创建一个 PostgresMlEmbeddingModel 实例,并用它来计算两个输入文本的相似度:

varjdbcTemplate=newJdbcTemplate(dataSource);// 您的 postgresml 数据源PostgresMlEmbeddingModelembeddingModel=newPostgresMlEmbeddingModel(this.jdbcTemplate,PostgresMlEmbeddingOptions.builder().transformer("distilbert-base-uncased")// huggingface 转换器模型名称.vectorType(VectorType.PG_VECTOR)// PostgreSQL 中的向量类型.kwargs(Map.of("device","cpu"))// 可选参数.metadataMode(MetadataMode.EMBED)// 文档元数据模式.build());embeddingModel.afterPropertiesSet();// 初始化 jdbc 模板和数据库EmbeddingResponseembeddingResponse=this.embeddingModel.embedForResponse(List.of("Hello World","World is big and salvation is near"));

手动创建时,您必须在设置属性后、使用客户端之前调用 afterPropertiesSet()。将 PostgresMlEmbeddingModel 创建为 @Bean 会更方便(也更推荐)。这样您就不必手动调用 afterPropertiesSet():

@BeanpublicEmbeddingModelembeddingModel(JdbcTemplatejdbcTemplate){returnnewPostgresMlEmbeddingModel(jdbcTemplate,PostgresMlEmbeddingOptions.builder().....build());}
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/26 4:47:12

阴阳师自动化脚本:从零开始掌握10个高效使用技巧

阴阳师自动化脚本&#xff1a;从零开始掌握10个高效使用技巧 【免费下载链接】OnmyojiAutoScript Onmyoji Auto Script | 阴阳师脚本 项目地址: https://gitcode.com/gh_mirrors/on/OnmyojiAutoScript 还在为阴阳师中重复性的日常任务烦恼吗&#xff1f;阴阳师自动化脚本…

作者头像 李华
网站建设 2026/5/26 6:13:26

NCMD解密工具完整使用指南:3步解锁网易云音乐加密文件

NCMD解密工具完整使用指南&#xff1a;3步解锁网易云音乐加密文件 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump NCMD解密工具专为处理网易云音乐NCM格式加密文件设计&#xff0c;通过简单的拖放操作即可将加密音频转换为标准MP3格…

作者头像 李华
网站建设 2026/5/26 6:14:14

火山引擎AI大模型接入Qwen-Image,提升企业级服务能力

火山引擎AI大模型接入Qwen-Image&#xff0c;提升企业级服务能力 在数字内容爆发式增长的今天&#xff0c;企业对视觉素材的需求早已从“有图可用”转向“精准表达”。无论是电商平台需要千人千面的商品主图&#xff0c;还是品牌方追求高度一致的全球传播视觉&#xff0c;传统设…

作者头像 李华
网站建设 2026/5/25 1:44:46

GitHub Wiki建设ACE-Step知识库:聚集社区智慧

GitHub Wiki建设ACE-Step知识库&#xff1a;聚集社区智慧 在音乐创作的门槛正被AI技术不断降低的今天&#xff0c;一个普通人能否仅凭一句“写一首温暖的吉他曲&#xff0c;像夏日傍晚的微风”就生成一段动听旋律&#xff1f;答案已经从“不可能”走向现实。由 ACE Studio 与阶…

作者头像 李华
网站建设 2026/5/23 15:14:29

卡尔曼增益:动态权重,最优估计

在卡尔曼滤波中&#xff0c;观测值和预测值的权重由 卡尔曼增益 动态决定。这个权重不是固定的&#xff0c;而是根据两者当前的不确定性&#xff08;误差大小&#xff09;实时计算得出。核心规则&#xff1a;谁更可靠&#xff0c;就赋予更高权重1. 权重计算公式&#xff08;直观…

作者头像 李华
网站建设 2026/5/25 17:50:54

强力解锁原神圣遗物管理?5步教你用椰羊工具箱告别手动录入烦恼

强力解锁原神圣遗物管理&#xff1f;5步教你用椰羊工具箱告别手动录入烦恼 【免费下载链接】cocogoat-client A toolbox for Genshin Impact to export artifacts automatically. 支持圣遗物全自动导出的原神工具箱&#xff0c;保证每一行代码都是熬夜加班打造。 项目地址: h…

作者头像 李华