Istio注入中断故障

1、简介

在现代微服务架构中,服务之间的通信可能会受到各种因素的影响而出现中断。为了确保系统的可靠性和稳健性,开发和运维团队需要模拟这些故障情况,测试系统在面对中断时的表现。

假设我们有一个电子商务平台,其中有一个支付服务和一个订单服务。当用户下单后,订单服务需要调用支付服务进行支付确认。我们希望模拟支付服务中断,测试订单服务在这种情况下的表现。Istio 作为一种强大的服务网格工具,提供了注入中断故障的功能,让我们能够轻松模拟这种情况。

2、故障注入的两种类型

istio提供了无侵入式的故障注入机制,让开发测试人员在不用调整服务程序的前提下,通过配置即可完成对服务的异常模拟。目前,包含两类:

delay:非必配项,配置一个 Delay 类型的对象。用来注入延时类故障。通俗一点讲,就是人为模拟上游服务的响应时间,测试在高延迟的情况下,当前的服务是否具备容错容灾的能力。

abort:非必配项,配置一个 Abort 类型的对象。用来注入请求异常类故障。简单的说,就是用来模拟上游服务对请求返回指定异常码时,当前的服务是否具备处理能力。

3、部署示例应用

该应用由四个单独的微服务构成。这个应用模仿在线书店的一个分类,显示一本书的信息。页面上会显示一本书的描述,书籍的细节(ISBN、页数等),以及关于这本书的一些评论。

$ kubectl create namespace bookinfo
$ kubectl -n bookinfo create -f samples/bookinfo/platform/kube/bookinfo.yaml
$ kubectl -n bookinfo get po
NAME READY STATUS RESTARTS AGE
details-v1-5974b67c8-wclnd 1/1 Running 0 34s
productpage-v1-64794f5db4-jsdbg 1/1 Running 0 33s
ratings-v1-c6cdf8d98-jrfrn 1/1 Running 0 33s
reviews-v1-7f6558b974-kq6kj 1/1 Running 0 33s
reviews-v2-6cb6ccd848-qdg2k 1/1 Running 0 34s
reviews-v3-cc56b578-kppcx 1/1 Running 0 34s
Bookinfo 应用分为四个单独的微服务:

productpage. 这个微服务会调用 details 和 reviews 两个微服务,用来生成页面。

details. 这个微服务中包含了书籍的信息。

reviews. 这个微服务中包含了书籍相关的评论。它还会调用 ratings 微服务。

ratings. 这个微服务中包含了由书籍评价组成的评级信息。

reviews 微服务有 3 个版本:

v1 版本不会调用 ratings 服务。

v2 版本会调用 ratings 服务,并使用 1 到 5 个黑色星形图标来显示评分信息。

v3 版本会调用 ratings 服务,并使用 1 到 5 个红色星形图标来显示评分信息。

图片

Bookinfo 是一个异构应用,几个微服务是由不同的语言编写的。这些服务对 Istio 并无依赖,但是构成了一个有代表性的服务网格的例子:它由多个服务、多个语言构成,并且 reviews 服务具有多个版本。

4、注入中断故障

[root@mast01 istio]# vim virtualservice-details-aborted.yaml
apiVersion: networking.istio.io/v1alpha3
kind: VirtualService
metadata:
name: details
namespace: bookinfo
spec:
hosts:

  • details
    http:
  • fault:
    abort: #注入的故障类型为请求中止
    percentage:
    value: 50 #50%的请求将会被中止
    httpStatus: 500 #中止的请求将返回HTTP 500状态码
    route:
  • destination:
    host: details

[root@mast01 istio]# kubectl apply -f virtualservice-details-aborted.yaml
virtualservice.networking.istio.io/details created
访问http://bookinfo.com/productpage

查看日志

[root@mast01 istio]# kubectl -n bookinfo logs -f $(kubectl -n bookinfo get po -l app=productpage -ojsonpath='{.items[0].metadata.name}’) -c istio-proxy

[2024-07-15T04:03:55.986Z] “GET /details/0 HTTP/1.1” 500 FI fault_filter_abort – “-” 0 18 5 – “-” “Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.36” “c2c7b2ac-cae2-9cce-92b3-cbace882e83d” “details:9080” “-” outbound|9080||details.bookinfo.svc.cluster.local – 10.104.22.13:9080 10.244.75.75:41044 – –
[2024-07-15T04:03:56.771Z] “GET /details/0 HTTP/1.1” 500 FI fault_filter_abort – “-” 0 18 0 – “-” “Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.36” “b6d8ff08-079d-906b-9d6f-9aae314df9c2” “details:9080” “-” outbound|9080||details.bookinfo.svc.cluster.local – 10.104.22.13:9080 10.244.75.75:41064 – –
5、注意事项

逐步测试:在生产环境中进行这种测试时,应逐步增加故障注入的比例,以避免对用户造成重大影响。

监控和报警:在进行故障注入测试时,确保有完善的监控和报警机制,能够及时发现和处理异常情况。

定期测试:故障注入不应是一次性的操作,建议定期进行,以确保系统在不断变化的环境中始终保持稳健。

6、总结

通过 Istio 注入中断故障,我们能够模拟真实环境中的故障情况,提前发现并解决系统中的潜在问题,提升系统的可靠性和用户体验。掌握这一技术,能够让开发和运维团队更加从容地应对复杂的

声明:文中观点不代表本站立场。本文传送门:https://eyangzhen.com/418892.html

联系我们
联系我们
分享本页
返回顶部