老李分享:《Java Performance》笔记1——性能分析基础

 

1.性能分析两种方法:

(1).自顶向下:

应用开发人员通过着眼于软件栈顶层的应用,从上往下寻找性能优化的机会。

(2).自底向上:

性能专家从软件栈底层的CPU统计数据(例如CPU高速缓存未命中率、CPU指令效率)开始,逐渐上升到应用自身的结构或应用常见的使用方式。

2.CPU使用率:

大多数操作系统的CPU使用率分为用户态CPU使用率和系统态CPU使用率。

用户态CPU使用率:执行应用程序代码的时间占总CPU时间的百分比。

系统态CPU使用率:应用执行操作系统调用的时间占总CPU时间的百分比。

系统态CPU使用率高意味着共享资源有竞争或者I/O设备之间有大量交互。既然原本用于执行操作系统调用的CPU周期也可以用来执行应用程序代码,所以理想情况下,应用达到最高性能和扩展性时,它的系统态CPU使用率为0%,所以提供应用性能的和扩展性的一个目标是尽可能降低系统态CPU使用率。

对于计算密集型应用来说,不仅要监控用户态和系统态CPU使用率,还要进一步监控每时钟指令数(Instructions Per Clock, IPC)或每指令时钟周期(Cycles Per Instruction, CPI)等指标,提高计算密集型应用的常用策略是减少停滞(现代操作系统自带的CPU使用率监控工具只能报告CPU使用率,不能报告CPU执行指令占用CPU时钟周期的百分比,因此即便CPU在等待内存中的数据,操作系统工具仍然会报告CPU繁忙,这种情况通常被称为停滞)或者改善CPU高速缓存使用率,从而减少CPU在等待内存数据时浪费的时钟周期。

(1).Windows CPU使用率监控:

Windows最常用的CPU使用率监控工具是任务管理器和性能监视器,这两个图形化工具不做介绍,重点介绍一下命令行工具typeperf.

在命令行中监控系统态和用户态CPU使用率的命令行如下:

typeperf “\Processor(_Total)\% Privileged Time” “\Processor(_Total)\% User Time”

也可以将性能计数器列表写入文件,然后将文件名传给typeperf来使用,例如将系统态和用户态CPU使用率性能计数器写入如下的cpu-util.txt文件中:

\Processor(_Total)\% Privileged Time

\Processor(_Total)\% User Time

然后使用typeperf调用,如下:

typeperf -cf cpu-util.txt

下面的命令使用typeperf统计用户态CPU使用率、系统态CPU使用率和总CPU使用率:

typeperf “\Processor(_Total)\% User Time” “\Processor(_Total)\% Privileged Time” “\Processor(_Total)\% Processor Time”

(2).Linux CPU使用率监控:

Linux上可以使用图形化工具GNOME System Monitor(GNOME系统监视器,通过gnome-system-monitor命令启动)或者xosview监控CPU使用率,这里重点介绍命令行工具。

A. vmstat:

vmstat可以设定报告的时间间隔(秒级),如果不指定报告间隔,则输出自系统最近一次启动以来的总CPU使用率。vmstat输出的us是用户态CPU使用率,sy是系统态CPU使用率,id是空闲率或CPU可用率。

B. mpstat:

mpstat可以监控每个虚拟处理器的CPU使用率,有助于发现应用中是一些线程比其他线程消耗了更多CPU周期,还是应用的所有线程基本平分CPU周期,如果是后者表明应用的扩展性比较好,注意大部分的Linux需要安装sysstat包才能使用mpstat.

mpstat输出的usr是执行用户代码时所用CPU时间的百分比,sys是执行内核代码时所用CPU时间的百分比,wt是等待时间的百分比(不再计入,一直为0),idl是CPU空闲时间的百分比。

C. top:

Linux top命令不仅包括CPU使用率,也包括进程统计数据和内存使用率

3.CPU调度程序运行队列:

CPU调度程序运行队列中存放的是那些已经准备好运行、整等待可用CPU的轻量级进程,如果准备运行的轻量级进程数超过系统所能处理的上限,运行队列就会很长,运行队列长表明系统负载可能已经饱和。

系统运行队列长度等于虚拟处理器的个数时,用户不会明显感觉到性能下降,当运行队列长度达到虚拟处理器的4倍或更多时,系统的响应就非常迟缓了。

CPU调度程序运行队列性能调优的一般原则:如果在很长一段时间里,运行队列的长度一致都超过虚拟处理器个数的1倍,就需要关注了,只是暂时不需要立即采取行动。如果在很长一段时间里,运行队列的长度达到虚拟处理器个数的3~4倍或更高,则需要立即采取行动。

解决CPU调用程序运行队列过长有以下两个方法:

a.增加CPU以分担负载或减少处理器的负载量,从根本上减少了每个虚拟处理器上的活动线程数,从而减少运行队列中的轻量级进程数。

b.分析系统中运行的应用,改进CPU使用率。程序员可以通过更有效的算法和数据结构来实现更好的性能,性能专家通过减少代码路径长度或完成同样任务更少CPU指令的算法来提高性能。

(1).Windows CPU调度程序运行队列监控:

typeperf可以监控运行队列长度,监控命令如下:

typeperf “\System\Processor Queue Length”

下面是typeperf每5秒(默认是每1秒)监控输出运行队列长度的命令:

typeperf -si 5 “\System\Processor Queue Length”

(2).Linux CPU调度程序运行队列监控:

Linux中可以使用vmstat命令监控运行队列长度,vmstat输出的第一列即r为运行队列长度,值是运行队列中轻量级进程的实际数量。

老李分享:《Java Performance》笔记1——性能分析基础 1的更多相关文章

  1. 《Java Performance》笔记1——性能分析基础 2

    4.内存使用率: 内存使用率的相关属性包括页面调度或页面交换.加锁.线程迁移中的让步式和抢占式上下文切换. 当应用运行所需的内存超过可用物理内存时,就会发生内存页面交换,系统在进行页面交换或使用虚拟内 ...

  2. java学习笔记15--多线程编程基础2

    本文地址:http://www.cnblogs.com/archimedes/p/java-study-note15.html,转载请注明源地址. 线程的生命周期 1.线程的生命周期 线程从产生到消亡 ...

  3. 「功能笔记」性能分析工具gprof使用笔记

    根据网上信息整理所成. 功能与优劣 gprof实际上只是一个用于读取profile结果文件的工具.gprof采用混合方法来收集程序的统计信息,它使用检测方法,在编译过程中在函数入口处插入计数器用于收集 ...

  4. java学习笔记14--多线程编程基础1

    本文地址:http://www.cnblogs.com/archimedes/p/java-study-note14.html,转载请注明源地址. 多线程编程基础 多进程 一个独立程序的每一次运行称为 ...

  5. Java集合--ArrayList,LinkedList性能分析

    转载请注明出处:http://www.cnblogs.com/skywang12345/p/3308900.html 第1部分 List概括 先回顾一下List的框架图 (01) List 是一个接口 ...

  6. java常用容器简要性能分析(List。Map。Set)

    嗯,实习的时候看到这个,感觉蛮好,这里摘录学习,生活加油: 我曾经害怕别人嘲笑的目光,后来,发现他们的目光不会在我身上停留太久,人们更愿意把目光放在自己身上. 知乎上看到,讲给自己. List Lis ...

  7. LR之性能分析基础

    1.判断测试结果有效性 2.分析要点提示 3.Analysis主要提供的6大类分析图 4.分析流程

  8. 深入理解JAVA虚拟机之JVM性能篇---基础知识点(运行时数据区域)

    一. 运行数据区域划分 各个数据区域功能如下: 1. 程序计数器: 较小的一块内存空间,可以看做是当前线程所执行的字节码的行号指示器,每条线程都有一个独立的程序计数器,各条线程之间计数器互不影响,独立 ...

  9. Java 学习笔记 ------第三章 基础语法

    本章学习目标: 认识类型与变量 学习运算符的基本使用 了解类型转换细节 运用基本流程语法 一.类型(基本类型) 所谓基本类型,就是在使用时,得考虑一下数据用多少内存长度存比较经济,利用程序语法告诉JV ...

随机推荐

  1. Git远程仓库(github

    一.创建远程仓库(github) 首先到https://github.com注册一个账号,创建自己的Git,点击repositories,再点new 名字自定义,比如叫fansik,选择public点 ...

  2. 二叉树基本操作C++

    #include <cstdio> #include <climits> #include <cassert> #include <iostream> ...

  3. /etc/bashrc和/etc/profile傻傻分不清楚?

    导读 在一般的 linux 或者 unix 系统中, 都可以通过编辑 bashrc 和 profile来设置用户的工作环境, 很多文章对于 profile 和 bashrc 也都有使用, 但究竟每个文 ...

  4. 【.NET框架】Dapper ORM 用法—Net下无敌的ORM

    假如你喜欢原生的Sql语句,又喜欢ORM的简单,那你一定会喜欢上Dapper这款ROM.点击下载 Dapper的优势: 1,Dapper是一个轻型的ORM类.代码就一个SqlMapper.cs文件,编 ...

  5. sql 给数据库表 字段 添加注释

    最近发现一些代码生成器 有针对注释做一个很好的转化,之前建表的时候 没有这块的注释.现在想增加,专门去看了下 如何增加注释 1 -- 表加注释 2 EXEC sys.sp_addextendedpro ...

  6. 第二百六十八天 how can I坚持

    早上看了个电影<我的少女时代>,挺好看的. 下午从四点玩游戏一直玩到现在,也是疯了. 晚上也没有吃饭,是不是太堕落了. 徐斌他同学今天中午过来,做了个饭,也是服了,好难吃. 还没做好准备, ...

  7. 你不知道的pogo pin连接器

    pogo pin连接器是一种带弹簧的探针式连接器,pogo pin连接器结构看起来非常简单,但其制造工艺要求极其的精细与复杂,从车床加工,电镀,组装等每道工序,如果没有一个有良好品质控制和完善的制造水 ...

  8. ajax+XMLHttpRequest里的FormData实现图片异步上传

    发这篇博客的时候我是自己在研究这个XMLHttpRequest请求,在别人的博客上面知道XMLHttpRequest新加了一个FormData的东西,好像现在APP请求后台也有用这种方式的吧. 别的不 ...

  9. 【回忆1314】第一次用AngularJS

    1.创建指令的4种方式(ECMA) var appModule = angular.module('app', []); appModule.directive('hello', function() ...

  10. 推荐系统(Recommendation system )介绍

    前言 随着电子商务的发展,网络购物成为一种趋势,当你打开某个购物网站比如淘宝.京东的时候,会看到很多给你推荐的产品,你是否觉得这些推荐的产品都是你似曾相识或者正好需要的呢.这个就是现在电子商务里面的推 ...