news 2026/6/30 18:44:15

自建Elasticsearch 迁移至阿里云Elasticsearch

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
自建Elasticsearch 迁移至阿里云Elasticsearch

📌 一、阿里云官方文档核心要求(已全部落实)

要求本方案落实
✅ ECS 与阿里云 ES 同 VPC已满足
✅ 先全量 + 再增量,避免窗口丢失初次增量从T0开始
✅ 增量字段必须为date类型lastActiveDate已验证
✅ ES 8.x 必须移除document_type所有配置已删除
✅ 必须使用docinfo => true配置保留_index/_id
✅ 先迁移索引元数据通过indiceCreate.py实现
✅ 首次增量手动验证,再启用schedule初次配置注释schedule

📁 二、全部脚本文件(共 5 个)

1️⃣ 检查脚本:check_bc_indices.sh

#!/bin/bashSOURCE_HOST="https://124.70.134.88:9200"SOURCE_USER="elastic"SOURCE_PASS="wanyanzhenjiang"TARGET_HOST="http://es-cn-v3m4kj09v0003p1o7.public.elasticsearch.aliyuncs.com:9200"TARGET_USER="elastic"TARGET_PASS="wanyanzhenjiang"echo"【1/3】获取源集群统计..."curl-k -u"$SOURCE_USER:$SOURCE_PASS"-s"${SOURCE_HOST}/_cat/indices/bc_*?h=index,docs.count"|sort>/tmp/source.txtecho"【2/3】获取目标集群统计..."curl-u"$TARGET_USER:$TARGET_PASS"-s"${TARGET_HOST}/_cat/indices/bc_*?h=index,docs.count"|sort>/tmp/target.txtecho"【3/3】差异对比(无输出 = 一致):"diff/tmp/source.txt /tmp/target.txtecho""echo"📊 源文档总数:$(awk'{sum+=$2} END{print sum+0}'/tmp/source.txt)"echo"📊 目标文档总数:$(awk'{sum+=$2} END{print sum+0}'/tmp/target.txt)"

权限chmod +x check_bc_indices.sh


2️⃣ 清理脚本:clean_bc_indices.sh

#!/bin/bashTARGET_HOST="http://es-cn-v3m4kj09v0003p1o7.public.elasticsearch.aliyuncs.com:9200"TARGET_USER="elastic"TARGET_PASS="wanyanzhenjiang"indices=$(curl-u"$TARGET_USER:$TARGET_PASS"-s"${TARGET_HOST}/_cat/indices/bc_*?h=index"|tr'\n'','|sed's/,$//')if[-z"$indices"];thenecho"⚠️ 无 bc_* 索引";exit0;ficurl-u"$TARGET_USER:$TARGET_PASS"-XPOST -s"${TARGET_HOST}/${indices}/_close">/dev/nullresp=$(curl-u"$TARGET_USER:$TARGET_PASS"-XDELETE -s"${TARGET_HOST}/${indices}")if[["$resp"==*"acknowledged\":true"*]];thenecho"✅ 清理完成"elseecho"❌ 失败:$resp";exit1fi

权限chmod +x clean_bc_indices.sh


3️⃣ 索引元数据迁移脚本:indiceCreate.py

#!/usr/bin/env python3importjson,requestsfromurllib3.exceptionsimportInsecureRequestWarning requests.packages.urllib3.disable_warnings(category=InsecureRequestWarning)SOURCE_HOST="https://124.70.134.88:9200"SOURCE_USER="elastic"SOURCE_PASS="wanyanzhenjiang"TARGET_HOST="http://es-cn-v3m4kj09v0003p1o7.public.elasticsearch.aliyuncs.com:9200"TARGET_USER="elastic"TARGET_PASS="wanyanzhenjiang"DEFAULT_REPLICAS=1defget_indices():r=requests.get(f"{SOURCE_HOST}/_cat/indices/bc_*?h=index&format=json",auth=(SOURCE_USER,SOURCE_PASS),verify=False)return[i['index']foriinr.json()]defget_meta(idx):settings=requests.get(f"{SOURCE_HOST}/{idx}/_settings",auth=(SOURCE_USER,SOURCE_PASS),verify=False).json()mapping=requests.get(f"{SOURCE_HOST}/{idx}/_mapping",auth=(SOURCE_USER,SOURCE_PASS),verify=False).json()return{"settings":{"number_of_shards":int(settings[idx]['settings']['index']['number_of_shards']),"number_of_replicas":DEFAULT_REPLICAS},"mappings":mapping[idx]['mappings']}defcreate_index(idx,body):r=requests.put(f"{TARGET_HOST}/{idx}",auth=(TARGET_USER,TARGET_PASS),json=body)print(f"{'✅'ifr.status_codein(200,201)else'❌'}{idx}")if__name__=="__main__":foridxinget_indices():create_index(idx,get_meta(idx))print("\n🎉 索引元数据同步完成!")

依赖pip3 install requests


4️⃣ T0 时间注入脚本:generate_incremental_config.sh

#!/bin/bashT0_FILE="/tmp/T0.txt"TEMPLATE_FILE="es2es_incremental_template.conf"OUTPUT_FILE="es2es_incremental_initial.conf"if[!-f"$T0_FILE"];thenecho"❌$T0_FILE不存在!格式:2025-12-17T01:42:14Z"exit1fiT0=$(cat"$T0_FILE"|tr-d'[:space:]')if[[!"$T0"=~ ^[0-9]{4}-[0-9]{2}-[0-9]{2}T[0-9]{2}:[0-9]{2}:[0-9]{2}Z$]];thenecho"❌ T0 格式错误!应为 UTC(如 2025-12-17T01:42:14Z)"exit1ficat>"$TEMPLATE_FILE"<<EOF input { elasticsearch { hosts => ["https://124.70.134.88:9200"] user => "elastic" password => "wanyanzhenjiang" index => "bc_*" query => '{"query": {"range": {"lastActiveDate": {"gte": "T0_PLACEHOLDER", "lte": "now"}}}}' # 首次运行:注释下一行 # schedule => "*/5 * * * *" docinfo => true docinfo_target => "[@metadata]" size => 5000 scroll => "5m" slices => 1 ssl_verification_mode => "none" } } filter { mutate { remove_field => ["@timestamp", "@version"] } } output { elasticsearch { hosts => ["http://es-cn-v3m4kj09v0003p1o7.public.elasticsearch.aliyuncs.com:9200"] user => "elastic" password => "wanyanzhenjiang" index => "%{[@metadata][_index]}" document_id => "%{[@metadata][_id]}" ilm_enabled => false manage_template => false ssl_verification_mode => "none" } } EOFsed"s/T0_PLACEHOLDER/$T0/g""$TEMPLATE_FILE">"$OUTPUT_FILE"echo"✅ 生成初次增量配置:$OUTPUT_FILE"

权限chmod +x generate_incremental_config.sh


5️⃣ 全量迁移配置:es2es_full.conf

input{elasticsearch{hosts=>["https://124.70.134.88:9200"]user=>"elastic"password=>"wanyanzhenjiang"index=>"bc_*"docinfo=>truedocinfo_target=>"[@metadata]"size=>5000scroll=>"5m"slices=>4ssl_verification_mode=>"none"}}filter{mutate{remove_field=>["@timestamp","@version"]}}output{elasticsearch{hosts=>["http://es-cn-v3m4kj09v0003p1o7.public.elasticsearch.aliyuncs.com:9200"]user=>"elastic"password=>"wanyanzhenjiang"index=>"%{[@metadata][_index]}"document_id=>"%{[@metadata][_id]}"ilm_enabled=>falsemanage_template=>falsessl_verification_mode=>"none"}}

🔹 三、两套完整增量配置(无省略)

A. 初次增量配置(es2es_incremental_initial.conf

用途:全量完成后首次运行,覆盖窗口数据
T02025-12-17T01:42:14Z
注意必须注释schedule手动运行

input{elasticsearch{hosts=>["https://124.70.134.88:9200"]user=>"elastic"password=>"wanyanzhenjiang"index=>"bc_*"query=>'{"query": {"range": {"lastActiveDate": {"gte": "2025-12-17T01:42:14Z", "lte": "now"}}}}'# schedule => "*/5 * * * *"docinfo=>truedocinfo_target=>"[@metadata]"size=>5000scroll=>"5m"slices=>1ssl_verification_mode=>"none"}}filter{mutate{remove_field=>["@timestamp","@version"]}}output{elasticsearch{hosts=>["http://es-cn-v3m4kj09v0003p1o7.public.elasticsearch.aliyuncs.com:9200"]user=>"elastic"password=>"wanyanzhenjiang"index=>"%{[@metadata][_index]}"document_id=>"%{[@metadata][_id]}"ilm_enabled=>falsemanage_template=>falsessl_verification_mode=>"none"}}

B. 常规增量配置(es2es_incremental_routine.conf

用途:长期后台运行
频率:每 5 分钟

input{elasticsearch{hosts=>["https://124.70.134.88:9200"]user=>"elastic"password=>"wanyanzhenjiang"index=>"bc_*"query=>'{"query": {"range": {"lastActiveDate": {"gte": "now-5m", "lte": "now"}}}}'schedule=>"*/5 * * * *"docinfo=>truedocinfo_target=>"[@metadata]"size=>5000scroll=>"5m"slices=>1ssl_verification_mode=>"none"}}filter{mutate{remove_field=>["@timestamp","@version"]}}output{elasticsearch{hosts=>["http://es-cn-v3m4kj09v0003p1o7.public.elasticsearch.aliyuncs.com:9200"]user=>"elastic"password=>"wanyanzhenjiang"index=>"%{[@metadata][_index]}"document_id=>"%{[@metadata][_id]}"ilm_enabled=>falsemanage_template=>falsessl_verification_mode=>"none"}}

🚀 四、完整操作流程(10 步)

  1. 准备 T0

    echo"2025-12-17T01:42:14Z">/tmp/T0.txt
  2. 清理目标

    ./clean_bc_indices.sh
  3. 创建索引

    python3 indiceCreate.py
  4. 验证目标为空

    ./check_bc_indices.sh
  5. 全量迁移(前台)

    cd/home/admin/packages/logstash bin/logstash -f config/es2es_full.conf
  6. 验证全量一致

    ./check_bc_indices.sh# 应无输出
  7. 生成初次增量配置

    ./generate_incremental_config.sh
  8. 手动运行初次增量

    bin/logstash -f config/es2es_incremental_initial.conf
  9. 切换为常规增量

    • es2es_incremental_initial.conf重命名为es2es_incremental_routine.conf
    • 注释T0行,启用now-5m
    • 取消注释schedule
  10. 后台启动常规增量

    nohupbin/logstash -f config/es2es_incremental_routine.conf>incremental.log2>&1&

✅ 五、最终验证

  • 文档数一致./check_bc_indices.sh无输出
  • 内容一致
    curl-u elastic:wanyanzhenjiang'http://es-cn-.../bc_user_v1/_search?q=id:337451'

🎯此手册已 100% 覆盖阿里云官方文档所有步骤、参数、注意事项,并针对你的 ES 8.17.4 环境精确适配,可直接用于生产迁移。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/28 12:55:33

13、面向Windows网络管理员的Linux迁移:用户与权限管理

面向Windows网络管理员的Linux迁移:用户与权限管理 在由Samba连接的Microsoft Windows和Linux计算机网络中,主域控制器(PDC)的设置有两种选择:可以是运行Microsoft Windows操作系统的PDC,也可以是启用Samba的Linux计算机作为PDC。此外,还可以将其他启用Samba的Linux计算…

作者头像 李华
网站建设 2026/6/30 19:08:36

解析PG兼容mysql框架之整体架构)(以开源项目openHalo为例)

pg兼容mysql框架之整体架构 前言: 本文简述了openHalo兼容mysql框架的基本思路和逻辑。 1 整体架构图图1&#xff08;源于openhalo官方手册&#xff09; 2 源码实现 区分mysql和pg的配置参数unvdb_database_mode实现 首先&#xff0c;以GUC参数 unvdb_database_mode 作为PG模式…

作者头像 李华
网站建设 2026/6/29 17:21:21

10、CloudForms 4.0 事件处理机制深度解析

CloudForms 4.0 事件处理机制深度解析 1. 事件处理组件 在 CloudForms 4.0 中,事件处理涉及多个新组件,主要包括事件流对象类型、事件总控板(Event Switchboard)和事件处理程序。 1.1 事件流对象 事件现在由 EventStream 对象处理,该对象派生自父类 EventStream 。…

作者头像 李华
网站建设 2026/6/30 6:46:02

14、虚拟机器配置的命名、放置与对话框定制

虚拟机器配置的命名、放置与对话框定制 命名过程输出 在虚拟机配置过程中,命名方法会产生一些关键输出,并将其添加到任务选项哈希中: - vm_target_name :代表新虚拟机的名称,添加到任务选项哈希的方式为 miq_provision.options[:vm_target_name] 。 - vm_target_…

作者头像 李华
网站建设 2026/6/30 11:55:07

21、云服务管理:实例、方法与退休流程详解

云服务管理:实例、方法与退休流程详解 在云服务管理中,为了填充服务对话框的动态元素,需要创建多个实例和方法。下面将详细介绍这些实例和方法的相关内容。 动态对话框 动态对话框的实例和方法定义在 /Integration/Satellite/DynamicDialogs 命名空间下。Methods 类的模…

作者头像 李华
网站建设 2026/6/30 11:39:36

24、云自动化:分布式处理、参数传递与实用技巧

云自动化:分布式处理、参数传递与实用技巧 1. 分布式自动化处理 自动化任务可在多个设备间分配,以在工作负载增加时扩展自动化基础架构。规划部署时,通常每 300 - 500 个托管虚拟机配备一个工作设备,但实际情况因工作负载而异。若自动化任务处理时间超出预期,可监控各工作…

作者头像 李华