我们一起聊聊服务器性能如何优化?

  发布时间:2025-12-07 14:45:45   作者:玩站小弟   我要评论
我们开发的软件服务需要在服务器上运行,所以服务器性能代表了软件的性能上限,因此服务器性能调优是个十分重要的环节,然而大部分同学对服务器性能调优关注的较少,今天从3个部分对服务器性能调优进行介绍,分别是 。

我们开发的聊聊软件服务需要在服务器上运行,所以服务器性能代表了软件的服务性能上限 ,因此服务器性能调优是器性个十分重要的环节 ,然而大部分同学对服务器性能调优关注的优化较少,今天从3个部分对服务器性能调优进行介绍,聊聊分别是服务:服务器配置选择 ,服务器负载分析 ,器性服务器内核参数调优  。优化

服务器配置选择

服务器一般是聊聊由CPU、内存 、香港云服务器服务磁盘和网卡组成 ,器性因此选择服务器配置就是优化选择CPU核数、内存大小 、聊聊磁盘大小及类型  、服务网络带宽。器性但是 ,服务器配置的选择是很难标准化的,也就是说很难推断出“一台需要达到1000TPS的后端服务器”的配置应该是云计算什么样的  。因为软件的最终运行性能与软件的实现方式是紧密相关的,即使是同一个后端应用程序中的两个接口,由于具体功能的差别 ,性能也会有所差别。

因此,服务器配置的选择应该基于具体的亿华云测试结果。一开始可以选用配置较低的服务器做调优和测试 ,并以该服务器的测试结果作为选择服务器的依据 。

以一个订单业务为例 ,经过测试后  ,一台配置为4核 CPU 、16GB内存  、10Mbps带宽 、50GB机械磁盘的服务器的测试结果为 :支持50并发量和300TPS吞吐量(增大并发量后会出现超时报错)。而在压力测试过程中, CPU 的服务器租用使用率接近75% ,内存使用率在 50%以下,带宽使用率在50%以下 ,除去日志以外无磁盘操作 。

因此可以认为,一台配置为4核 CPU ( CPU 使用率需要在75%以下)、8GB内存(内存使用率可以接近100%)、 5Mbps 带宽(带宽使用率可以接近100%)的服务器,可以满足订单接口支持50并发量、300TPS吞吐量的压力 。

如果需要达到200并发数、2400TPS吞吐量的目标的话,模板下载则需要8台配置为4核 CPU 、8GB内存 、5Mbps带宽的服务器,或者1台配置为32核 CPU 、64GB内存、40Mbps带宽的服务器 。当然,最终的服务器配置还是需要通过测试来验证 。

注意:在以上订单接口的例子中 ,后端服务器和数据库等服务器需要一起调试,避免后端服务器性能过剩,源码库而数据库等服务器性能不足的情况发生。另外,以上选择服务器配置的方法不一定适用于所有场景 ,请斟酌参考 。

服务器负载分析

在性能调优时 ,需要先对服务器负载进行分析,通常而言,我们主要分析CPU使用率、内存使用率、磁盘I/O,服务器负载和带宽使用情况。

CPU使用率

CPU使用率反应的是CPU的忙碌情况。当CPU达到100%时,部分进程会进入等待状态,CPU暂时不会对其进行处理。在实际情况下,为了应对一下突发性的请求压力,服务器CPU使用率一般需要在75%以下。如果一台服务器的CPU使用率多次高于75% ,这时候就考虑增加新的服务器。

监控CPU使用率我推荐大家使用htop工具 ,可以非常直观看到CPU使用率 、内存使用率、及负载等信息 。

使用htop查看CPU负载

首先我们需要安装htop,以centos为例 ,安装命令如下 :

复制yum install htop -y1.

安装完成后我们就可以通过htop命令观察CPU负载了

复制htop1.

输入htop命令后我们可以很直观的看到CPU负载情况,该命令的CPU使用率会以多个核作为单位进行显示 。操作系统机会自动分配多个核的负载,当所有核的CPU使用率都超过75%时才能认为服务器的CPU使用率已经超过75% 。

cpu负载

如上图所示,这是一个4核CPU服务器,在截图的时候其中3核CPU使用率都超过了75%,再观察一会发现所有CPU的使用率都在85%左右徘徊,说明CPU负载很高了 ,需要考虑增加新的服务器 。

内存使用率

内存使用率反应的是内存的使用情况。内存用于存放程序的代码及数据,一般分为物理内存和虚拟内存 ,其中物理内存指的是服务器的内存,而虚拟内存指的是硬盘的一块空间。当物理内存使用率达到100%时将会使用虚拟内存。需要注意的是 ,虚拟内存的读写速度远远低于物理内存 ,如果程序被放在了虚拟内存执行,那么程序的执行效率会变得很低。

一般而言,服务器的物理内存应该保持在80%以下,虚拟内存使用率保持在0% 。

服务器内存使用情况还是可以通过hop工具进行查看

内存使用率

上面显示了服务器的内存使用情况 :总内存16G ,使用了10G左右 ,内存使用率62%,可以继续使用,同时关闭了Swap虚拟内存   。

在下MEM%栏中显示了单个进程的内存使用率 。

磁盘I/O

磁盘I/O指的是磁盘的读写  ,在软件系统中 ,日志 、文件操作、数据库操作都会造成磁盘读写压力,其中又以数据库操作为甚 ,在高并发情况下往往数据库会首先成为系统的瓶颈。

磁盘监控我推荐大家使用iostat工具 ,可以很方便查看磁盘的使用情况 。

使用iostat查看磁盘I/O

首先我们需要安装iostat,以centos为例 ,安装命令如下:

复制yum install sysstat -y1.

安装完成后我们就可以通过iostat命令磁盘使用情况了 。

复制# 查看磁盘总体读写情况 , 1代表每1秒读取一次数据 iostat -x 11.2.

磁盘IO

输入iostat命令后 ,磁盘总体读写情况如上所示 。磁盘负载主要关注2个指标:%idle ,%util

%idle:表示CPU除去等待磁盘I/O以外的空闲时间百分比,这个指标应该要保证在70%以上%util:该设备用于I/O操作的时间百分比,这个指标需要保证在70%以下,当到达100%时表示已经满负载 。为了降低磁盘负载 ,可以采用性能更高的磁盘(OSD,PCIE)或者降低磁盘的操作频率(异步写、合并写)平均负载

平均负载指的是单位时间内平均的活跃进程数 ,是一个表示服务器负载的指标 。一般情况下需要保证平均负载的值小于当前服务器的CPU核数 。

同样的 ,查看服务器平均负载我们也可以使用htop命令

图片

在这里我们主要关注Load average指标,上图有3个数字  ,分别代表1分钟 ,5分钟 ,15分钟的平均负载。

一般情况下服务器的平均负载需要小于当前服务器的CPU核数 ,为了应对突发状况,服务器的平均负载应该在75%即3 以下  ,很显然 ,上图这台服务器平均负载超过了75%,需要考虑提升性能了  。

网络使用情况

网络使用情况也是监控的重要指标。当带宽不足时会大大增加请求的响应时间。为了防止突发性并发压力 ,应该保证服务器的带宽使用率在80%以上 。这里需要注意的是 ,物理网卡限制了服务器所能使用的最大宽带 。

查看网络使用情况我推荐使用nload工具。

使用nload查看网络

首先需要安装nload,以centos为例

复制yum install nload -y1.

安装完成后我们直接运行nload

复制nload1.

图片

输入nload命令后,网络使用情况如上图所示。其中,网络使用情况分为流入网卡的数据与流出网卡的数据 。流入网卡的对应下行带宽的网速 ,流出网卡的数据对应上行带宽的网速 。如果 “当前网速” 持续接近 “最大网速” 时 ,代表带宽使用率已经接近100% 。

指标说明 :

Curr :当前网速Avg:平均网速Min :最小网速Max :最大网速Ttl :总流量

服务器内核参数调优

光有强大的物理性能是不够的,还需要对内核参数进行调优 ,这样才能在高并发压力下充分体现服务器应有的性能 。当然,并不是所有的服务器都需要做高并发性能调优  ,一般来说 ,只需要对要处理高并发请求的服务器进行内核参数调优即可,常见的包括 :前端服务器 ,后端服务器 ,数据库服务器 。

服务器常见的调优参数主要有两个:单个进程最大打开文件数 和 TCP相关设置 。

单个进程最大打开文件数

修改单个文件最大打开文件数,只需要编辑/etc/security/limits.conf文件 ,在文件末尾加上以下四句

复制* soft nofile 65535 * hard nofile 65535 * soft nproc 65535 * hard nproc 655351.2.3.4.

其中* 代表所有用户 ,65536代表修改的值,重启后生效。

TCP相关设置

修改TCP相关参数 ,可以优化TCP高并发通信 ,编辑/etc/sysctl.conf文件 ,添加以下内容

复制# 为防止洪水攻击 ,高并发系统需要将此项关闭 net.ipv4.tcp_syncookies = 0 # 开启TCP连接重用,允许处理TIME-WAIT状态的连接重新用于新的TCP连接 net.ipv4.tcp_tw_reuse = 1 # 开启快速回收TCP连接中处于TIME-WAIT状态的连接 net.ipv4.tcp_tw_recycle = 1 #修改超时时间( s ) ,该值表示如果连接由本端关闭,则连接处于 FIN-WAIT-2状态的时间为 net.ipv4.tcp_fin_timeout = 30 #当 keepalive(长连接)启用的时候,TCP发送 keepalive 消息(探测包)的时间间隔( s ),默认为2个小时 net.ipv4.tcp_keepalive_time =1200 #服务器对外连接的端口范围,影响该服务器与其他服务器的连接数 net.ipv4.ip_local_port_range =102465535 #SYN队列的长度  ,可以容纳更多等待连接的网络连接数,默认为1024 net.ipv4.tcp_max_syn_backlog = 65535 #保持 TIME_WAIT 状态连接的最大数量,如果超过此值,TIME_WAIT 将立刻被清除并打印警告信息  ,默认为180000 net.ipv4.tcp_max_tw_buckets =5000 #每个网络接口接收数据包的速率比内核处理这些包的速率快时,允许送到队列的数据包的最大数目 net.core.netdev_max_backlog =65535 # TCP最大连接数 net.core.somaxconn = 65535 #预留用于接收缓冲的内存默认值(字节) net.core.rmem_default = 8388608 #预留用于接收缓冲的内存最大值(字节) net.core.rmem_max = 16777216 #预留用于发送缓冲的内存默认值(字节) net.core.wmem_default = 8388608 #预留用于发送缓冲的内存最大值(字节) net.core.wmem_maX = 16777216 #避免时间戳异常 net.ipv4.tcp_timestamps = 0 #系统中最多有多少个 TCP 套接字不被关联到任何一个用户文件句柄上,如果超过这个数字,连接将即刻被复位并打印警告信息 ,这个限制仅仅是为了防止简单的DoS 攻击 net.ipv4.tcp_max_orphans =32768001.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.27.28.29.30.31.32.33.34.35.36.37.38.39.40.41.42.43.44.45.46.47.
  • Tag:

相关文章

  • “杀猪盘”在美横行,损失超30亿美元

    据联邦调查局 (FBI) 当地时间3月14日发布的公告,越来越多的美国人正成为网络投资欺诈的受害者,仅在2022年造成的损失就超过30亿美元。在骗局中,犯罪分子通过约会平台、消息应用程序或社交媒体平台
    2025-12-07
  • 大模型浪潮下,网络安全面临哪些挑战?

    大模型无疑是2023年最火热的话题之一。ChatGPT的诞生吹响了大模型竞赛的号角,科技企业纷纷推出自家大模型产品,一场大模型的狂欢就此拉开帷幕。大模型全称大型语言模型(Large Language 
    2025-12-07
  • 如何制定有效的数据安全治理策略

    有效的数据安全治理策略应包括自定义网络安全策略、数据的完整可见性、数据加密方法等功能。基于上下文的数据泄露防护基于上下文的数据泄露防护防火墙,围绕数据创建上下文以增强检查和身份验证。它有助于在电子邮件
    2025-12-07
  • 十个数据安全最佳实践:保护数据的简单方法

    随着网络攻击面的扩大、供应链攻击的频繁发生以及向云的转移,数据安全比以往任何时候都更加重要。根据IBM Security 发布的2023 年数据泄露成本报告, 2023 年全球数据泄露平均成本达到 4
    2025-12-07
  • 如何成为网络安全架构师?

    网络安全架构师负责设计和实时全面的网络安全框架,以保护组织的数字资产安全。他们的工作意义非凡,能够确保组织在开展数字化转型发展的同时,拥有强大的安全态势。摩根大通的网络安全运营副总裁、安全架构总监Le
    2025-12-07
  • 云蹲守:攻击者如何使用已删除的云资产来进行攻击

    我们正处于云计算时代,虚拟服务器和存储空间等资源通常根据需要通过部署脚本以编程方式进行配置。尽管剥离这类资产几乎是一个立竿见影的过程,但在不再需要它们时将其移除并不是那么简单。简单地删除云资产,而不确
    2025-12-07

最新评论