地域故障转移
按照本指南配置您的网格以进行地域故障转移。
在继续之前,请确保已完成 开始之前 部分中的步骤。
在此任务中,您将使用 region1.zone1
中的 curl
pod 作为请求 HelloWorld
服务的源。然后,您将触发故障,这些故障将导致按照以下顺序在地域之间进行故障转移
在内部,Envoy 优先级 用于控制故障转移。对于来自 curl
pod(在 region1
zone1
中)的流量,这些优先级将按如下方式分配
优先级 | 区域 | 详情 |
---|---|---|
0 | region1.zone1 | 区域、区域和子区域全部匹配。 |
1 | 无 | 由于此任务不使用子区域,因此没有与不同子区域匹配的内容。 |
2 | region1.zone2 | 同一区域内的不同区域。 |
3 | region2.zone3 | 无匹配,但为region1 ->region2 定义了故障转移。 |
4 | region3.zone4 | 无匹配,并且未为region1 ->region3 定义故障转移。 |
配置地域故障转移
应用一个配置以下内容的DestinationRule
异常检测 用于
HelloWorld
服务。这对于故障转移正常运行是必需的。特别是,它配置了 sidecar 代理,以便它们了解服务的端点何时不健康,最终触发故障转移到下一个区域。故障转移 区域之间的策略。这确保跨区域边界的故障转移行为可预测。
连接池 策略,强制每个 HTTP 请求使用新的连接。此任务利用 Envoy 的 drain 功能来强制故障转移到下一个区域。排空后,Envoy 将拒绝新的连接请求。由于每个请求都使用新的连接,因此这会导致在排空之后立即进行故障转移。此配置仅用于演示目的。
$ kubectl --context="${CTX_PRIMARY}" apply -n sample -f - <<EOF
apiVersion: networking.istio.io/v1
kind: DestinationRule
metadata:
name: helloworld
spec:
host: helloworld.sample.svc.cluster.local
trafficPolicy:
connectionPool:
http:
maxRequestsPerConnection: 1
loadBalancer:
simple: ROUND_ROBIN
localityLbSetting:
enabled: true
failover:
- from: region1
to: region2
outlierDetection:
consecutive5xxErrors: 1
interval: 1s
baseEjectionTime: 1m
EOF
验证流量是否停留在 region1.zone1
中
从curl
pod 调用HelloWorld
服务
$ kubectl exec --context="${CTX_R1_Z1}" -n sample -c curl \
"$(kubectl get pod --context="${CTX_R1_Z1}" -n sample -l \
app=curl -o jsonpath='{.items[0].metadata.name}')" \
-- curl -sSL helloworld.sample:5000/hello
Hello version: region1.zone1, instance: helloworld-region1.zone1-86f77cd7b-cpxhv
验证响应中的version
是否为region1.zone
。
重复此操作数次,并验证响应始终相同。
故障转移到 region1.zone2
接下来,触发故障转移到region1.zone2
。为此,您需要 排空region1.zone1
中HelloWorld
的 Envoy sidecar 代理
$ kubectl --context="${CTX_R1_Z1}" exec \
"$(kubectl get pod --context="${CTX_R1_Z1}" -n sample -l app=helloworld \
-l version=region1.zone1 -o jsonpath='{.items[0].metadata.name}')" \
-n sample -c istio-proxy -- curl -sSL -X POST 127.0.0.1:15000/drain_listeners
从curl
pod 调用HelloWorld
服务
$ kubectl exec --context="${CTX_R1_Z1}" -n sample -c curl \
"$(kubectl get pod --context="${CTX_R1_Z1}" -n sample -l \
app=curl -o jsonpath='{.items[0].metadata.name}')" \
-- curl -sSL helloworld.sample:5000/hello
Hello version: region1.zone2, instance: helloworld-region1.zone2-86f77cd7b-cpxhv
第一次调用将失败,这将触发故障转移。重复执行命令数次,并验证响应中的version
始终为region1.zone2
。
故障转移到 region2.zone3
现在触发故障转移到region2.zone3
。与之前一样,将region1.zone2
中的HelloWorld
配置为在被调用时失败
$ kubectl --context="${CTX_R1_Z2}" exec \
"$(kubectl get pod --context="${CTX_R1_Z2}" -n sample -l app=helloworld \
-l version=region1.zone2 -o jsonpath='{.items[0].metadata.name}')" \
-n sample -c istio-proxy -- curl -sSL -X POST 127.0.0.1:15000/drain_listeners
从curl
pod 调用HelloWorld
服务
$ kubectl exec --context="${CTX_R1_Z1}" -n sample -c curl \
"$(kubectl get pod --context="${CTX_R1_Z1}" -n sample -l \
app=curl -o jsonpath='{.items[0].metadata.name}')" \
-- curl -sSL helloworld.sample:5000/hello
Hello version: region2.zone3, instance: helloworld-region2.zone3-86f77cd7b-cpxhv
第一次调用将失败,这将触发故障转移。重复执行命令数次,并验证响应中的version
始终为region2.zone3
。
故障转移到 region3.zone4
现在触发故障转移到region3.zone4
。与之前一样,将region2.zone3
中的HelloWorld
配置为在被调用时失败
$ kubectl --context="${CTX_R2_Z3}" exec \
"$(kubectl get pod --context="${CTX_R2_Z3}" -n sample -l app=helloworld \
-l version=region2.zone3 -o jsonpath='{.items[0].metadata.name}')" \
-n sample -c istio-proxy -- curl -sSL -X POST 127.0.0.1:15000/drain_listeners
从curl
pod 调用HelloWorld
服务
$ kubectl exec --context="${CTX_R1_Z1}" -n sample -c curl \
"$(kubectl get pod --context="${CTX_R1_Z1}" -n sample -l \
app=curl -o jsonpath='{.items[0].metadata.name}')" \
-- curl -sSL helloworld.sample:5000/hello
Hello version: region3.zone4, instance: helloworld-region3.zone4-86f77cd7b-cpxhv
第一次调用将失败,这将触发故障转移。重复执行命令数次,并验证响应中的version
始终为region3.zone4
。
恭喜!您已成功配置区域故障转移!
下一步
清理 此任务中的资源和文件。