升级到v5.6.0之后的操作

创建时间:2024-04-02 最近修改时间:2024-04-02

#1. 升级到v5.6.0之后的操作

  • 将v5.5.8的监控网段录入为子网,注意设置为正确的区域、可用区、VPC、类型属性
  • 完成ES升级:
    • 使用systemctl重启所有节点的ES
    • 登录Cerebro,等待旧索引变成yellow或green
    • 在主控制器上执行以下操作
      curl -XPUT "localhost:20042/_cluster/settings" -d '{"persistent":{"cluster.routing.allocation.enable": null}}' -H "Content-Type: application/json"
      
      1
    • 检查kibana是否能正常使用,否则先暂停kibana,在Cerebro删除.kibana索引,最后重启kibana
  • v5.5.8到v5.6.0的tsdb数据迁移
    • 登录所有数据节点执行以下操作
      influx-migrate
      # 迁移日志: /var/log/influxdb/influx_migrate.log
      # 注意: 默认限制每秒迁移10000条记录, 可通过`/etc/influxdb/influxdb_migrate.yaml`的`limit-write-rate`调整.
      
      1
      2
      3
    • 迁移结束, 验证业务正常后, 清理原数据
      influx-migrate -clean
      
      1
  • 完成告警适配新版本ES:
    • 停止alarm服务
    • 删除旧版本索引模板
      curl -X DELETE 'http://127.0.0.1:20042/_template/dfi_alarm_event'
      请求结果:
      {"acknowledged":true}
      
      1
      2
      3
    • 删除旧版本索引
      curl -X DELETE 'http://127.0.0.1:20042/dfi_alarm_event*'
      请求结果:
      {"acknowledged":true}
      
      1
      2
      3
    • 启动alarm服务
  • cloud-agent.yaml添加新配置项
    • 华为私有云新加zones配置项,用于限制对接的资源范围
      huawei_private:
        zones:
        # - az_name1
        # - az_name2
      
      1
      2
      3
      4
    • Kubernetes新加token配置项,支持用token对接资源;新加port_name_regex配置项,用于学习节点上符合正则的端口
      kubernetes:
        token: ''
        port_name_regex: '^(?=(cni|flannel|cali|tunnel))'
      
      1
      2
      3