2023年7月3日发(作者:)
vsphere性能优化及最佳实践使⽤esxtop命令可以显⽰针对虚拟化的各类信息,包括cpu、内存、⽹卡、存储等各类数据的统计。esxtop有以下8种⽅式来度量虚拟⼯作环境性能: c:CPU⾯板显⽰服务器统计数据以及个⼈领域、资源池和虚拟机CPU的统计数据; m:内存⾯板显⽰服务器和分组内存使⽤的统计数据,与CPU⾯板相似; n:⽹络⾯板显⽰服务器⽹络使⽤统计数据; i:中断⾯板显⽰中断向量的统计信息; d:存储适配器⾯板默认汇总每个存储适配器; u:存储设备⾯板显⽰服务器存储利⽤的统计数据; V:虚拟机存储⾯板显⽰以虚拟机为中⼼的存储统计数据; p:电源⾯板显⽰CPU电源利⽤统计数;esxtop其他功能: f:增加或者删除设置; V:在CPU⾯板和内存⾯板之间切换View All和View VM Only视图,View VM Only视图会清除不是虚拟机的所有进程; 2:⾼亮显⽰⼀⾏,向下滚动; 8:⾼亮显⽰⼀⾏,向上滚动; S2:两秒刷新⼀次;⼆、主要功能介绍
1.
CPU输⼊esxtop命令,⼀般默认是显⽰和CPU相关的界⾯,如果没显⽰,可按“c”进⾏CPU界⾯展⽰078350_2703185S8MGDNB9PX7Q
CPU load averageCPU在1分钟、5分钟和15分钟内的负载计算,基于6个范本作为计算对象。
number of worldsESXi服务器的worlds数量;
PCPU UTIL(%)每颗PCPU上unhalted CPU cycles的百分⽐,它平均分布在所有PCPU上。如果PCPU UTIL(%)的值过⾼意味着什么呢?这就意味着物理资源被⼤量占⽤。如果所有的PCPUs的使⽤率都逼近100%,则就意味着CPU资源使⽤的过载。此时,就需要去检查system groups的RDY%值以便验证是否真的是CPU资源使⽤过载;其次,如果某些PCPUs的PCPU UTIL(%)接近100%,但是有⼀些却不是这样,则此时就意味着资源调度的不均衡了。此时就需要注意了,最好去监控在过去⼀段时间⾥是否这些PCPUs的使⽤率接近100%,如果是这样,请检查是否为虚拟机配置了CPU亲和性规则,如果有,可尝试接触掉这种亲和性规则的关联指定;
PCPU USED(%)
这个参数是每颗PCPU的使⽤百分⽐,它会平均分布在所有PCPUs上。PCPU UTIL(%)表⽰在过去的恒定时间⾥PCPU多长时间PCPU处于busy(unhalted)状态,PCPU USED(%)则表⽰则表⽰在过去恒定的时间⾥PCPU的有效⼯作⼯作状态。PCPU USED(%)这个⽀持能够更加准确的阐述当下的PCPU资源利⽤率,因为它综合了各种硬件辅助状态,例如超线程和智能电源管理等模块;
CORE UTIL(%)这个选项只有在开启了超线程时出现。这个参数记录每CORE在PCPUs上处于unhalted状态时的CPU cycles百分⽐,它会平均分布到所有的COREs上。当PCPUs⾥的CORE都处于halted状态时,它会取与“CORE IDLE”状态相反的百分⽐值,并提取这个值作为CPU cycles的百分⽐;在batch mode下,会显⽰每颗PCPU对应的“CORE UTIL(%)”,因此,PCPU 0
和PCPU 1会有相同的“CORE UTIL(%)”数⽬,例如Core 0
的“CORE UTIL(%)”;PCPU UTIL(%)和COREUTIL(%)的差异到底在哪⾥?当PCPUs⾥的CORE被使⽤时,则CORE⼀定是出于Utilized状态,CORE的使⽤率百分⽐不⼀定等于PCPUs的使⽤率百分⽐的总和。CORE0的使⽤率⼤于等于任意⼀颗PCPU的使⽤率,同时⼜⼩于等于PCPU0加PCPU1的使⽤率。
%USEDCPU核⼼循环使⽤,这个值是物理CPU对应到World的时间百分⽐。系统服务所消耗的World的计数也在其中,它的计数单位有%SYS这个服务,通常情况下,这个服务的开销时间会被计算进去。否则,将会计⼊%OVRLP⽤作World的补充。%USED的计算公式为:%USED = %RUN+ %SYS - %OVRLP的值当VM的%USED的值较⾼时,意味着VM开销了⼤量的CPU资源,此时,可以打开worlds的下拉菜单去查看到底什么业务导致了这样的⾼CPU资源开销;
%SYS:这个是系统服务消耗world时间的百分⽐。它可能包含和系统服务相关的⼀些指令、系统worlds等底层业务开销;阀值阀值为20%,当⼤于20%时,可能是由于VM的I/O过⾼导致;
%VMWAIT:虚拟机等待⼀些VMkernel活动(⽐如I/O)完成后才可以继续⼯作,包括% SWPWT和“blocked”,但不是空闲时间(类似%WAIT)。如果此值过⾼达到100%则可能是由于存储性能问题或者虚拟机的某个设备延迟造成,⽐如USB设备、串⾏通信设备。
%SWPWT:计数器显⽰⼀个VM等待交换页⾯从磁盘读取需要多久的时间。阀值阀值为5,⾼于此值则可能是内存过载;10)
%MLMTD:统计VCPU准备运⾏的时间百分⽐,阀值阀值为1,此值⼀般都为0,如果⼤于可能是由于设置了CPU limit,删除此限制以获得更好的性能;11)
%CSTP:如果虚拟机使⽤了VSMP,显⽰了虚拟机在co-deschedule状态下准备运⾏的时间百分⽐。阀值阀值为3,造成此的原因可能是vSMP过多,需要减少此虚拟机的vCPU数量。12)
%RDY:VM等待被调度时间的百分⽐。通常情况下world等待被CPU调度机制调度到PCPU时,就会产⽣%RDY值,它的全称是CPU ReadyTime。因此它通常情况下都是⼩于100%的,为什么呢?因为物理的CPU的资源是有限度的;参考信息:%RDY就是⼀个重要的标尺,当系统产⽣了%RDY值后,理论上都意味着CPU资源的不⾜导致了争⽤。但是,这不是绝对的,因为如果管理员有针对虚拟机的vCPU设定Limit时,此时,虚拟机可以调度的CPU资源量将会被局限在⼿动设定Limits范围内,此时,即使有⾜够的PCPU资源,依然会在VM上产⽣%RDY。那么,如何鉴别这个问题呢?此时,就涉及到我们接着要说的另⼀个参数“%MLMTD”。注意,%RDY值会包含%MLMTD的。例如,当CPU发⽣争⽤情况时,我们可以使⽤ “%RDY - %MLMTD”
来鉴别真实的情况,如果“%RDY - %MLMTD”的值较⾼,例如⼤于20%时,即可定性为CPU资源不⾜导致了CPU争⽤情况的出现。反之,如果这个 “%RDY -%MLMTD”
的值较⼩,例如5%,则意味着此时不⼀定会有物理CPU的资源不⾜情况,也就不存在CPU资源争⽤的情况,所以20%为⼀个临界值;阀值
阀值为10%,可能是由于虚拟机的VCPU、SVMP过多导致,或者是vCPU做了限制(请检查%MLMTD)。13)
%RUN :这个是world已调度运⾏的总计时间百分⽐;当VM的%RUN值过⾼时,就意味着VM使⽤⼤量的CPU资源,当然这并不意味着虚拟机的资源不⾜了,如果要确认是否虚拟机的CPU资源不⾜,则还需要去看看%RDY值,因为%RDY值才是评判CPU资源紧缺的参考依据;2.
内存22078350_270365USUXYL0SVKJIK
MCTLSZ22078350_2704129RSI6TQJRF8X1程序回收物理机内存的总量; Amount ofguest physical memory (MB) the ESXi Host is reclaiming by balloon driver。阀值阀值为1,如果此值⼤于零,则说明内存负载过⼤,此时主机会强制虚拟机回收过量的内存
SWCUR22078350_270427HGSI7HHJTAXIW已经被VMKernel进⾏交换的内存。阀值阀值为1,如果⼤于零,可能是内存过载。
SWR/s,22078350_270427HGSI7HHJTAXIW主机读取交换内存的速度阀值阀值为1,如果⼤于零,说明esxi主机积极读取交换内存,可能的原因是内存过量使⽤
SWW/s22078350_270427HGSI7HHJTAXIW物理主机写⼊交换内存的速度阀值阀值为1,如果⼤于零,说明esxi主机积极写⼊交换内存,可能的原因是内存过量使⽤;
Memory Status:22078350_270443XBQU1OMZLFG02high有⾜够的空余内存Soft空闲内存⼩于4%:物理机回收内存。hard空闲内存⼩于2%:主机开始交换,此时主机性能会降低;low空闲内存⼩于1%:esxi主机会停⽌给虚拟机分配更多的内存;
ZIP/S与UNZIP/S22078350_270443XBQU1OMZLFG02ZIP/S值⼤于零表明主机正在积极的压缩内存
阀值阀值为0,如果⼤于零,说明主机在积极的压缩内存,造成此的原因可能是内存负载过⼤。UNZIP/SValues larger 0indicate that the host is accessing compressed memory.
阀值阀值为0,表明主机内存之前过量使⽤
⽹络
%DRPTX, %DRPRX,
%DRPTX数据包传输下降,丢包率
阀值阀值⼤于1表⽰⽹络利⽤率较⾼%DRPRX数据包接受率下降
阀值阀值⼤于1表⽰⽹络利⽤率较⾼22078350_270459EQQT20EAN0HMY
Used-by/Team-PNIC:22078350_270505KP5EYJ7Q3UUBS可以看出⽬前虚拟机所使⽤的⽹卡是vmnic2还是vmnic3
磁盘GAVGDAVG + KAVG阀值:阀值25
DAVG22078350_270521SEPDBX3RMPWMK阀值阀值为25,由于数据造成磁盘延迟;
KAVGVMKernel造成的延迟22078350_270521SEPDBX3RMPWMK阀值阀值为3,当值过⾼时意味着有排队情况的发⽣
ABRTS/s22078350_270537H94QNEP21UE2T阀值阀值为1,不管任何原因造成的路径访问失败或者数据⽆法接受I/O信息,因为存储没有响应⽽终⽌虚拟机的发布,默认windows虚拟机为60秒钟。
RESETS/s22078350_270552P5MPPRGHGPGQM每秒钟命令重置的数量阀值阀值为1。
DISK22078350_270552P5MPPRGHGPGQMSCSIReservation Conflicts per second. If many SCSI Reservation Conflicts occurperformance could be degraded due to the lock on the VMFS.阀值阀值为20
发布者:admin,转转请注明出处:http://www.yc00.com/xiaochengxu/1688328942a121034.html
评论列表(0条)