监视文件系统的性能,并且报告代表逻辑文件、虚拟内存段、逻辑卷和物理卷的 I/O 活动。
filemon [ -d ] [ -i Trace_File -n Gennames_File] [ -o File] [ -O Levels] [ -P ] [ -T n] [ -u ] [ -v ]
filemon 命令监控文件系统和 I/O 系统事件的跟踪,并且报告一个周期内的文件和 I/O 的访问性能。
在它的一般模式中,当一个或多个应用程序或者系统命令正在被执行和监控的时候,filemon 命令在后台运行。filemon 命令自动启动并且实时监控程序的文件系统和 I/O 事件的跟踪。作为缺省值,跟踪是立刻启动的;可选的是,跟踪可能被延缓直到用户发出一个 trcon 命令。为了能随意的关闭和运行监控,用户可以发出 trcoff 和 trcon 命令,当filemon 命令在运行的时候。当跟踪被 trcstop 命令中止的时候,filemon 命令生成一个 I/O 活动报告并退出。
filemon 命令也可以处理一个跟踪文件,这个文件已经先前被跟踪工具所记录。文件和 I/O 活动报告将会基于那个文件中记录的事件。
为了更完整的提供一个应用程序的文件系统性能的理解,filemon 命令以下面的四种水平来监控文件和 I/O 活动:
逻辑文件系统 | filemon 命令监控在逻辑文件上的逻辑 I/O 操作。被监控的操作包括所有的 读、写、打开、和lseek等系统调用,这个可能会还是不会导致实际的物理 I/O,取决于这些文件是否在内存中已经被缓冲。I/O 统计信息被保存在一个基本文件中。 |
虚拟内存系统 | filemon 命令监控磁盘上段和它们的映像之间的物理 I/O 操作(也就是,页面调度)。I/O 统计信息被保存在一个基本段中。 |
逻辑卷 | filemon 命令监控逻辑卷上的 I/O 操作。I/O 统计信息被保存在一个基本的逻辑卷中。 |
物理卷 | filemon 命令监控物理卷上的 I/O 操作。在这个级别上,获取了物理资源的使用。I/O 统计信息被保存在一个基本的物理卷中。 |
正如命令行标志所指定的那样,这四种级别的任何组合都可以被监控。作为缺省值, filemon 命令只监控虚拟内存、逻辑卷和物理卷级别的 I/O 操作。这些级别都与真实的磁盘 I/O 的请求相关。
filemon 命令把它的报告写到一个标准的输出或者一个指定的文件上。这个报告以每个被监控级别的 I/O 活动的摘要作为开始,以每个被监控级别的 I/O 活动的详细统计信息为结束。摘要和详细报告内容表述在 Reports 部分中。
-u 标志被用来产生先前为了启动 trace 守护进程而打开的文件上的报告。这个数据的一些部分可能是很有用的,但是大部分的都应用到了守护进程和其它不相关的活动中去了。这个背景信息可以是压倒性的,特别是在大的系统中。如果 /unix 文件和正在运行的内核不是一样的,那么内核地址可能是不正确的,会导致 filemon 命令退出。当从一个 shell 脚本中使用 filemon 命令时,允许在显示 filemon 输出文件的内容之前有一个轻微的延迟。filemon 命令可能会花费几秒钟来产生这个报告。
filemon 命令使用系统跟踪工具获得原始的 I/O 性能资料。通常地,跟踪工具只支持一个输出流。因此,只有一个 filemon 或者跟踪进程能在一个时间是激活的。如果另外一个filemon 或者跟踪进程已经在运行,filemon 命令会响应下列的消息:
/dev/systrace: Device busy
当监控很强的 I/O 应用程序时,filemon 命令可能不能实时地处理产生的跟踪事件。当上面的情况发生时,错误消息如下:
Trace kernel buffers overflowed, N missed entries
这个消息将显示在 stderr上,标志着当跟踪缓冲区满的时候到底有多少跟踪事件被丢失。filemon 命令将继续监控 I/O 活动,但是报告的精确性降低到了某个未知程度。一个避免溢出的方法是监控文件和 I/O 子系统的较少的级别:跟踪事件产生的数目是与监控级别的个数成比例的。另外,跟踪缓冲区的大小可以通过使用 -T 选项来增加,这样就能在溢出前提供更大的跟踪事件容量。记住增加跟踪缓冲区的大小会导致更多的引脚内存,并且因此可能影响 I/O 和页面调度的行为。
在存储受限的环境(要求的存储容量比可供给的内存要多),-P 选项可以被用来引脚内存中的实时 filemon 进程中的文本和资料页,这样这些页面就不会被替换掉。如果不用 -P 选项,允许 filemon 进程被替换掉,filemon 命令的前进可能被延迟,地点是在它不能足够快地处理跟踪事件的地方。这个情况导致跟踪缓冲区如上面情况描述的那样溢出。当然,插入这个进程将从应用程序(尽管 filemon 命令不是一个大程序,但是它的进程映像也能达到 500KB)中释放内存。
在使用 filemon 命令去处理一个存在的跟踪数据文件前,您必须使用 -r 选项在 trcrpt 命令中去把跟踪资料顺序的重写入一个新的文件。否则,filemon 命令产生下列的错误消息然后退出:
error: run 'trcrpt -r' on logfile first
-i Trace_File 和 -n Gennames_File 标志允许跟踪数据文件的 filemon 脱机处理,这些文件是利用 trace 命令创建的。如果有一个存在,两个标志都必须指定。当必须后期处理一个来自远程机器的跟踪文件或者在一个时间执行跟踪资料收集工作而在另一个时间后期处理它的时候,这些标志是很有效的。当系统负载很大或者 filemon 丢失了跟踪 hook 时,这些标志也是很有用的。
gennames 文件(包括文件系统信息)必须使用在跟踪来源处的机器上。而且,在与系统跟踪文件创建接近的时刻运行 gennames 是明智的,这样两个系统配置就是一样的了。
与 filemon 相关的跟踪 hook 必须被 trace 命令所收集并且被 trace -j 标志所指定。当filemon 以 -v 标志调用时,相关的跟踪 hook 会列出。包含 -f 选项的 gennames 命令将被执行,它的输出被保存在 Gennames_File 中以收集 filemon 的附加消息。-f 选项被用来和 gennames 命令一起去收集逻辑卷和物理卷的设备信息。它也用来获取脱机的 filemon 使用的虚拟文件系统的信息。一旦执行了 trace 命令,trcrpt -r 必须在跟踪日志文件上运行并重定向到另外一个文件中。那么该文件和 Gennames_File 就可能提供给 filemon。
每个由 filemon 命令生成的报告有一个指示日期、机器名称和按秒计数的监控周期长度的报头。在监控周期内的 CPU 使用情况也在报告中体现。
下一个,对每个被监控的文件系统级别,都会生成摘要报告。作为缺省值,逻辑文件和虚拟内存的报告分别限制在最多 20 个活动文件和段,可以通过转换数据的总数量来计算该数目。如果指定了 -v 标志,所有文件和段的活动都会被报告。每个报告文件、段或者卷都有一行。四个摘要报告的每一行的栏都描述如下:
栏 | 描述 |
#MBS | 从/到段的传输的兆字节的总共数目。这些行以递减的顺序按该字段排序。 |
#rpgs | 从磁盘(也就是页)读入到段的那些 4096 个字节的页的数目。 |
#wpgs | 从段写入到磁盘(到处页)的那些 4096 个字节的页的数目。 |
segid | 段的内部标识。 |
segtype | 输入段:工作段、持久段(本地文件)、客户机段(远程文件)、页面表段、系统段、或者特殊的永久段,这些特殊的段包含文件系统数据(日志、根目录、.inode、.inodemap、.inodex、.inodexmap、.indirect、.diskmap)。 |
volume:inode | 对持久的段来说,包含关联文件的卷的名字和文件的 i 节点数目。该字段可以用来把一个永久段和它的相应文件联系起来,在文件 I/O 报告中显示。该字段对非持久段来说是空的。
注:
虚拟内存分析工具,svmon 可以用来显示关于一个给定段标志(segid)的段的更多信息,如下:
svmon -S <segid> |
栏 | 描述 |
util | 卷的使用情况(忙的时间片)。这些行以递减的顺序按该字段排序。 |
#rblk | 从卷中读入的 512 字节的块的数目。 |
#wblk | 写入卷的 512 字节的块的数目。 |
KB/sec | 总共的传输吞吐量,按千字节每秒。 |
volume | 卷的名称。 |
描述 | 卷的内容:或者是一个文件系统的名字,或者是逻辑卷的类型(调页、jfslog、引导、或者系统转储)。还指示文件系统是否是片段的或者压缩的。 |
最后,为每个被监控的文件系统级别都会产生详细报告。作为缺省值,逻辑文件和虚拟内存的报告分别限制在最多 20 个活动文件和段,可以通过传输数据的总数量来计算该数目。如果指定了 -v 标志,所有文件和段的活动都报告。每个被报告的文件、段或者卷都有一个记录。
一些字段报告一个单独的值,其他的一些报告表现许多值的分布情况的统计信息。例如,对所有被监控的读和写的请求,响应时间的统计信息都会被保留。平均的、最小的和最大的响应时间和响应时间的标准差被报告出来。标准差用来显示个别响应时间偏离平均值的程度。大约有三分之二的样本响应时间是在平均值 - 标准偏差和平均值 + 标准偏差以内。如果响应时间的分布散布在较大范围中,标准偏差相比平均响应时间就会很大。在以下列表中描述了四个详细报告:
栏 | 描述 |
FILE | 文件名称。如果可能的话,给出完整的路径名称。 |
volume | 包含文件的逻辑卷或者文件系统的名称。 |
inode | 在文件系统中的文件的 I 节点数目。 |
opens | 监控时打开文件的次数。 |
total bytes xfrd | 从/到文件的读或者写操作的字节总数目。 |
reads | 对文件的读取调用的数目。 |
read sizes (bytes) | 按字节的读取的传输大小的统计信息(avg/min/max/sdev)。 |
read times (msec) | 按毫秒计的读取响应时间的统计信息(avg/min/max/sdev)。 |
writes | 对文件的写入调用的数目。 |
write sizes (bytes) | 写入传输大小的统计信息。 |
write times (msec) | 写入的响应时间的统计信息。 |
seeks | 子例程调用 lseek 的数目。 |
-i Trace_File | 从指定的 Trace_File 中读取 I/O 跟踪数据,而不是从实时的跟踪进程。filemon 报告概括了跟踪文件显示的系统和周期的 I/O 活动。
注:
跟踪数据文件通常以循环的方式记录。如果跟踪数据环绕舍入,那么跟踪的顺序开始和结束就可能在文件的中间发生。使用 trcrpt 命令的原始方式来顺序重写数据,这项工作要在调用 filemon 命令之前执行,如下:
trcrpt -r file > new.file 为了报告能精确,跟踪文件必须包括被 filemon 命令所需要的所有 hook。 还必须指定 -n 选项。 |
-n Gennames_File | 为了脱机跟踪处理而指定一个 Gennames_File。该文件通过运行带有 -f 选项的 gennames 命令来创建,并且把输出重定向到一个文件中,如下:
gennames -f > file 也必须指定 -i 选项。 |
-o File | 写 I/O 活动报告到指定的 File,而不是到stdout 文件。 |
-d | 启动 filemon 命令,但是一直推迟跟踪直到用户执行 trcon 命令。作为缺省值,跟踪是立刻启动的。 |
-T n | 设置内核的跟踪缓冲区大小为 n 字节。缺省值的大小是 32,000 字节。如果可以,缓冲区的大小可以通过提供更大的事件容量来增加。(一个典型的事件记录大小是 30 字节。)
注:
内核中的跟踪驱动程序使用双缓冲区,这样事实上就有两个大小分配为 n 字节的缓冲区。而且,注意这些缓冲区是插入到存储器中的,所以它们不受页面调度支配。大的缓冲区可能会影响页面调度和其他 I/O 的性能。 |
-P | 在存储器中插入监控进程。-P 标志导致 filemon 命令的文本和数据页按监控周期的时间插入到存储器中。使用该标志可以保证当运行一个存储受限环境时,实时的 filemon 过程不会 page out。 |
-v | 在报告中打印额外的信息。-v 标志最重要的影响是被访问的所有的逻辑文件和所有的段都包括在了 I/O 活动报告中,而不是仅仅有最多 20 个活动文件和段。 |
-O Levels | 只监控指定的文件系统级别。有效的级别标识是: vm、lv,和 pv 级别都是默认的缺省值。 |
-u | 关于将在 trace 守护进程的启动之前先打开的文件的报告。进程标识(PID)和文件描述符(FD)被文件名所代替。
注:
既然 PIDs 和 FDs
都是可重用的,那么就有可能看到以相同名字的字段报告的不同文件。 |
filemon
filemon 命令自动启动系统跟踪并且把它放到后台。该命令后,输入在这个时刻要运行的应用程序和系统命令,请输入:
trcstop
在执行了trcstop 命令后,I/O 活动报告就会显示在标准的输出设备上(但是可能无法滚屏)。虚拟内存的 I/O 报告会被限制在可能导致最多 I/O 的 20 个段。
filemon -o fmon.out -O all
filemon 命令自动启动系统跟踪并且把它放到后台。该命令后,要输入在这个时刻要运行的应用程序和系统命令,请输入:
trcstop
在执行了 trcstop 命令后,I/O 活动报告被写入fmon.out 文件中。所有的四个级别的文件和 I/O 系统(逻辑文件、虚拟内存、逻辑卷和物理卷级别)都会被监控。逻辑文件和虚拟内存的 I/O 报告限制在导致最多 I/O 的 20 个文件和段(分别地)。
filemon -v -o fmon.out -O all
filemon 命令自动启动系统跟踪并且把它放到后台。该命令后,输入在这个时刻要运行的应用程序和系统命令,请输入:
trcstop
除了详细的报告是生成在文件 fmon.out 中的以外,本例和前面的一个例子是类似的。主要的区别在于 filemon 命令将指出它正在启动跟踪的步骤,并且摘要和详细信息的报告将包括所有导致任何的 I/O(可能有很多)的文件和段,而不是只有最多 20 个。
filemon -i trcfile | pg
在本示例中,filemon 命令从输入文件 trcfile中读取文件系统跟踪的事件。输入文件必须已经是初始的跟踪格式,作为运行 trcrpt -r 命令的一个结果。既然跟踪数据已经在一个文件中被捕捉,filemon 命令就不再把它自己放置到后台以使其他的应用程序能够运行。整个文件读取后,一个关于虚拟内存、逻辑卷和物理卷级别的 I/O 活动报告将会被显示在标准输出(这种标准输出,在本例中,是通道 pg)。
filemon -d -o fmon.out -O pv,lv
filemon 命令自动启动系统跟踪并且把它放到后台。该命令之后,输入要在这个时刻运行的不被监控的应用程序和系统命令,请输入:
trcon
在该命令后,输入要在这个时刻运行的被监控的应用程序和系统命令,请输入:
trcoff
该命令之后,输入要在这个时刻运行的不被监控的应用程序和系统命令,请输入:
trcon
在该命令后,输入要在这个时刻运行的被监控的应用程序和系统命令,请输入:
trcstop
在本示例中,-O 标志只被用来限制监控逻辑和物理卷。只有那些与逻辑和物理卷相关的跟踪事件才被启用。而且,作为使用 -d 标志的一个结果,监控最初是被延缓一直到执行了 trcon 命令。通过使用 trcoff 和 trcon 命令,系统跟踪可以被间断地禁用和重启用,这样就能只监控特殊的间隔。
trace -a -T 768000 -L 10000000 -o trace.out -j 000,000,001,002,003,005,006,139,102,10C,106,00A,107, 101,104,10D,15B,12E,130,163,19C,154,3D3,1BA,1BE,1BC,10B,221,1C9,222,228,232,45B
运行被监控的应用程序和系统命令,请输入:
trcstop
然后格式化文件 trace:
trcrpt -r trace.out > trace.rpt
创建文件 gennames:
gennames -f > gennames.out
然后运行 filemon 附带着 -i 和 -n 标志:
filemon -i trace.rpt -n gennames.out -O all
svmon 命令、trcrpt 命令、trcstop 命令。
lseek 子例程。
《AIX 5L V5.2 性能管理指南》中的『监控和调整磁盘 I/O』。