Steins;Lab

  • 项目
  • 折腾
  • 笔记
  • 图册
  • 杂谈
  • 文章索引 - 博主自荐博文
  • 关于/留言
Steins;Lab
某团的自留研究所
  1. 首页
  2. 项目跟踪
  3. 正文

一次压力测试的小结笔记

2022年2月6日 715点热度 0人点赞 0条评论

最近实施了一个针对某开源软件的压测方案。借这次机会,尝试梳理了自己在考虑和实行压力测试方案时,想到的一些内容,作为思考笔记。

目录

  • 1 了解背景和目的
  • 2 环境准备模拟
    • 运行环境准备
    • 施压测准备
    • 承压测准备
  • 3 方案的实施
    • case 设计
    • 日志和性能指标收集
    • 不断改进
  • 4 结论报告
    • 暴露关键性能指标
    • 缺陷和问题
  • 5 涉及到的一些技术参考
    • Linux 优化知识图谱
    • Linux 性能工具图谱
    • 系统性能相关
    • 网络相关
  • 本文小结

压力测试,之前曾零散地了解过一些基础的测试方法,比如机器硬件的 benchmark,一些微服务的全链路压测等。

但是自己想想,如果尝试挑战自己的方案,问道具体的问题,比如:" iowait "到底是什么? 仿佛也只能含含糊糊讲不清楚。

借这次机会,尝试系统地梳理了自己考虑和实行压力测试方案时,想到的一些内容。

本篇笔记不会事无巨细,比如介绍某一块 linux 的网络细节知识,但是会记录笔者在做方案时候的一些思考路径,加入和同事交流请教得到的一些建议。

 

 

1 了解背景和目的

这次的背景,主要是找到某开源软件的瓶颈所在,并项目评估下一步应该进行的动作。

了解背景和目的可能比较重要,根据不同的目的有不同的颗粒度和观察角度,直接影响了后续的准备和条件设置。

  • 本次压测的规模多大?是单物理机极限性能还是集群性能?
  • 涉及到微服务全链路还是单软件极限性能?
  • 涉及多部门还是本组内部?
  • 压测的结果是用于找出自研软件瓶颈,还是技术选型?
  • 根据该软件使用的场景,应重点关注哪些指标和能力?

2 环境准备模拟

运行环境准备

本次指定的是单台物理机上的极限性能。在准备承压机器环境时考虑以下的因素(有一些需要和SRE同学沟通确认)

  • 网络层面
    • 如极限带宽、网卡bond方式等
  • 性能层面
    • 对机器 cpu、内存、硬盘进行 benchmark,确认没有离谱的环境性能瓶颈。
  • 操作系统层面
    • 统一基础的高并发优化,比如最大文件打开数、tcp 拥塞控制算法、软终端设置等。

这些方面我都做了统一的 benchmark 和确认,记录在了测试报告的附录中,确保大家 review 时候可以追溯。

 

还有一点可能常见但容易被忽略,就是确认把机器当做玩具时候,不会影响到线上的实际业务(容易造成血泪教训)。

 

施压测准备

  • 选择合适的施压软件
    • 比如如果是业务型,需要高 QPS 的施压
    • 而网络性能类,可能更加关注带宽
  • 指定合适的请求模拟
    • 根据实际需求,构建模拟的请求即可。发现并不是耗费很多精力重现真实数据,就收益越高。但一定可解释、比较合理。
  • 关注施压测的性能
    • 由于要建立海量的 TCP 链接,也要关注施压测是否达到网络连接或者性能瓶颈
    • Tip: 有一些细节如果有疑惑,我尝试花一些时间弄明白原理。我在这里参考了一些建立大量 tcp 的文章,明确了原理和实践,心里会更加有数。 比如 ref : 一台主机上只能保持最多 65535 个 TCP 连接吗? https://www.zhihu.com/question/361111920/answer/1828767342
    • 这次更加详细的一些参考文章我列在了后面

 

承压测准备

  • 被压测的软件持续调优
    • 也应该对被压测的软件进行调优,最好是参考线上已有的设置。

 

3 方案的实施

case 设计

case 设计比较重要,主要是根据软件,控制变量法设计多组 case,来找出瓶颈所在。

日志和性能指标收集

  • 应当设置有详尽的机器性能 metrics 和软件的性能日志以供回溯
  • 明确性能指标的含义
    • 一旦有概念模糊的指标,就可能需要用一些时间去弄明白其中的原理。一个比较好的评判标准,就是自己从各个方面挑战自己一下,看看作为方案制定者,能够对答如流吗?

不断改进

我在进行方案设计时候,是一遍动手搭建实验环境一遍拟定。因为确实有好多问题只有在实际机器上才能发现和想到。
发现之前方案有问题时候及时修正,或者发现有容易修复的配置问题时,也可以一遍压测一遍修正。

4 结论报告

暴露关键性能指标

大家 review 的话,把一些关键的指标和推测的结论明确地展示出来。但同时在别的地方要保留 metrics 和细节以供讨论。

缺陷和问题

根据精力和准确度相互制约,压测会有一些简化的环境和模型在其中。一轮报告可能是有一些缺陷或者不准确的。可以讨论修正,再次安排测试。

5 涉及到的一些技术参考

个人觉得,现代软件工程依托的内容是是海量的,自己若能遵从一定程度的脉络,明确关键概念就已经很好了,不能陷入浩如烟海的细节中。

 

Linux 优化知识图谱

这个是学习极客时间专栏《 Linux 性能优化》中提供的知识图谱。个人觉得脉络非常清晰,在这次中充当了工具书的作用——哪里不太明确就查哪里。

 

Linux 性能工具图谱

在终端命令中,适应了使用强大的 Linux 工具直接进行性能分析,对整个系统的认识,颇有帮助。

 

 

 

系统性能相关

  • Linux CPU使用率概念 (iowait等)
    • https://linux.fasionchan.com/zh_CN/latest/maintenance/monitor/os/cpu-usage.html
  • What does ksoftirqd do ?
    • https://www.supportsages.com/what-does-ksoftirqd-do/

网络相关

  • 百看不如一练,测试单机百万连接两种方案的源码
    • https://zhuanlan.zhihu.com/p/352748959
  • 一台机器最多能撑多少个TCP连接? 今天掰扯清楚!
    • https://zhuanlan.zhihu.com/p/290651392
  • 图解Linux网络包接收过程
    • https://zhuanlan.zhihu.com/p/256428917

推荐《开发内功修炼》专栏,将网络部分讲的非常详细

 

 

本文小结

本文为笔者的一次思考笔记,如果能给读者带来启发,会非常荣幸。如果有纰漏之处,也请读者直接指出,笔者新手上路,也会多多学习!

 

相关

标签: 暂无
最后更新:2022年7月31日

SPtuan

SPtuan 是一名普通的工程师,最大的愿望是度过平静的时光。 研究生时做过一点自动驾驶算法,当前对网络/后端技术比较感兴趣。

点赞
< 上一篇
下一篇 >
0 0 votes
文章评分
Subscribe
Login
提醒
guest

guest

0 评论
Inline Feedbacks
View all comments

SPtuan

SPtuan 是一名普通的工程师,最大的愿望是度过平静的时光。
研究生时做过一点自动驾驶算法,当前对网络/后端技术比较感兴趣。

  • 1 了解背景和目的
  • 2 环境准备模拟
    • 运行环境准备
    • 施压测准备
    • 承压测准备
  • 3 方案的实施
    • case 设计
    • 日志和性能指标收集
    • 不断改进
  • 4 结论报告
    • 暴露关键性能指标
    • 缺陷和问题
  • 5 涉及到的一些技术参考
    • Linux 优化知识图谱
    • Linux 性能工具图谱
    • 系统性能相关
    • 网络相关
  • 本文小结
分类
  • Uncategorized
  • 图册
  • 学习笔记
  • 库
  • 折腾
  • 杂谈
  • 瞎**扯
  • 碎碎念
  • 项目跟踪
最近评论
三五笑话 发布于 2 个月前(01月23日) 不知道说啥,开心快乐每一天吧!
rantrism 发布于 3 个月前(01月13日) 您好~我是腾讯云开发者社区运营,关注了您分享的技术文章,觉得内容很棒,我们诚挚邀请您加入腾讯云自媒体...
qw23123 发布于 4 个月前(11月22日) 你好,我也是这个问题,怎么确认板子有没有正常联网呢?板子用网线和电脑连了,可以正常使用pynq的ju...
luckf 发布于 5 个月前(11月12日) 谢谢博主的回复,的确是pynq-z2开发板的时间有问题,后来自己发现pynq板没有联网,连上网以后便...
luckf 发布于 5 个月前(11月11日) pip安装时报错信息“ERROR: Command errored out with exit st...
热门主题 & 页面
  • 100 Go Mistakes 阅读随记 - 01 Code and project organization
  • 基于openvpn的校园网ipv6免流量方案 |ipv6|校园网|免流量
  • 在Nvidia Jetson Xavier开发者套件上启用CAN总线
  • 100 Go Mistakes 阅读随记 - 03 Control Structures, Functions and Methods, Error Management
  • 关于/留言
归档
  • 2023年1月
  • 2022年12月
  • 2022年10月
  • 2022年9月
  • 2022年7月
  • 2022年6月
  • 2022年2月
  • 2021年12月
  • 2021年11月
  • 2021年2月
  • 2021年1月
  • 2020年9月
  • 2020年4月
  • 2020年3月
  • 2020年1月
  • 2019年8月
  • 2019年7月
  • 2019年5月
  • 2019年4月
  • 2019年3月
  • 2019年2月
  • 2018年12月
  • 2018年10月
  • 2018年9月
  • 2018年8月
  • 2018年5月
  • 2018年2月
  • 2018年1月
  • 2017年11月
  • 2017年9月
  • 2017年7月
  • 2017年6月
  • 2017年5月
  • 2017年4月
  • 2017年3月
  • 2017年2月
  • 2017年1月
  • 2016年12月
  • 2016年11月
  • 2016年10月
  • 2016年9月
  • 2016年8月
  • 2016年7月
  • 2016年6月
  • 2016年5月
  • 2016年4月
  • 2016年3月
  • 2016年2月
  • 2016年1月
  • 2015年12月
  • 2015年11月
  • 2015年9月

友情链接:

Blessing Studio hahaschool 绘枫和畅 魔法少女Fandy monsterx Clarke的博客 Luminous’ Home Shintaku's Blog
蓝黑的博客 haruhi.club Yida的博客 Bo2SS 涛叔 TangBao 同和君Hocassian

Steins;Lab 团子神社 zdfmc.net

steinslab.io built with ❤. Thanks for all 2015-2022.

Theme Kratos Made By Seaton Jiang

wpDiscuz