Erlang tools lib中包含三個用于性能分析的工具:cprof,eporf和fprof。
cprof 提供函數調用計數,其對系統的性能影響最小
eprof 提供函數運行時間的百分比
fprof 通過將trace存儲到文件,提供函數調用計數及運行時間統計信息
這里我們主要介紹fprof,首先其提供的信息最為詳細,其次因為將trace存儲到文件中,我們可以進行較長運行時間的性能分析
fprof使用
1,fprof:start().
2,
OR
apply在函數開始的時候進行fprof:trace(start, ..),在函數結束的時候執行fprof:trace(stop).上面三個函數都有很多可選參數,默認情況下,使用下面文件保存各階段信息:fprof.trace, fprof.profile,fprof.analysis
fprof Analysis format
產生了分析報告,最重要的就是如何閱讀了。
讓我們寫一個簡單的例子:
進行profiling
analysis結果已經保存到bar.analysis中,此文件可以通過erl_scan and erl_parse, file:consult/1 or io:read/2進行讀取分析。
下面我們看看analysis內容:
%% Analysis results:
{ analysis_options,
[{callers, true},
{sort, acc},
{totals, false},
{details, true}]}.
% CNT ACC OWN
[{ totals, 5019, 18.886, 18.884}]. %%%
CNT表示總的函數調用次數,ACC表示Trace起始經歷的時間,OWN是Trace中所有函數執行的時間和(不包含調用函數的執行時間),我們這個例子中OWN和ACC比較接近,因為我們這里在啟動trace后就立即開始了函數調用,沒有進行其他特殊的工作。這里時間的單位為ms。
% CNT ACC OWN
[{ "<0.82.0>", 5019,undefined, 18.884}]. %%
這里表示一個process的開始,在我們這個例子中我們調用fprof:apply/3開始進行trace,因此這個Pid其實就是我們調用apply所在的Process,我們沒有Spawn新的Process,所以這里的CNT,OWN和totals相同。ACC的值為undefined,這是因為這個數值對于我們沒有什么意義,我們可以通過totals計算出這個數值。
請注意此行結尾處的 “%%”表明一個process的開始
{[{undefined, 0, 18.886, 0.002}],
{ {fprof,apply_start_stop,4}, 0, 18.886, 0.002}, %
[{{bar,test,1}, 1, 18.884, 0.004},
{suspend, 1, 0.000, 0.000}]}.
{[{{fprof,apply_start_stop,4}, 1, 18.884, 0.004}],
{ {bar,test,1}, 1, 18.884, 0.004}, %
[{{lists,map,2}, 1, 14.859, 12.352},
{{lists,splitwith,2}, 1, 3.012, 0.001},
{{lists,seq,2}, 1, 1.009, 0.001}]}.
analysis內容通過空行,間隔成不同的段落。
每個段落中尾部以"%"標記的行為這個段落的標記行。比如上面的內容中{bar,test,1}所在行為一個關鍵行,此行上面的List為所有調用bar:test/1的函數列表(called list),此行下面的List為bar:test/1調用的函數列表(calling list)。
所有的段落按照ACC遞減的順序排列,同時段落內部的called list和calling list也是按照這個規則排列。
CNT為對應函數累計調用次數,ACC為此函數消耗時間包含其調用的函數,OWN為此函數自身消耗時間不包含called函數。即:
ACC(marked) = OWN(marked) + ACC(calling fun 1) + ACC(calling fun 2) ... ACC(calling fun N)
讓我們看看上面的內容中,{bar,test,1}其ACC為:
18.884 = 0.004 + 14.859 + 3.012 + 1.009
同時{bar,test,1}作為我們module的入口其ACC為18.884等于所在process對應的OWN時間。
其實看到這里,我們已經明白,我們這個module中{lists,map,2}最耗時,其占用79% (14.859/18.880)時間,{lists,splitwith,2}占用16% (3.012/18.880) 的時間,而{lists,seq,2} (1.009%18.880) 只占用5%左右。
{[{{bar,test,1}, 1, 14.859, 12.352},
{{lists,map,2}, 1000, 0.000, 1.502}],
{ {lists,map,2}, 1001, 14.859, 13.854}, %
[{{bar,'-test/1-fun-0-',1}, 1000, 1.002, 1.001},
{garbage_collect, 2, 0.002, 0.002},
{suspend, 1, 0.001, 0.000},
{{lists,map,2}, 1000, 0.000, 1.502}]}.
接下來就是依次分析所有的被調用函數,這里說明{lists,map,2}被兩個函數調用:
{bar,test,1}和{lists,map,2},也許你有疑問了,在bar:test/1中的確調用了lists:map/2依次,可是我的代碼中沒有用lists:map/2調用lists:map/2啊,看看stdlib/src/lists.erl代碼,你就會明白,lists:map/2是遞歸方式調用,所以bar module中調用了1次,而我們的List長度是1000,所以lists:map/2函數就被調用了 1 + 1000 = 1001次哦。然后marked行下面就是lists:map/2調用的函數列表。
bar.analysis接下的部分,是對每個函數的分析,如果某個函數為BIF,沒有調用任何其他函數,那么其對應的輸出內容為:
{[{{lists,reverse,1}, 1, 0.001, 0.001}],
{ {lists,reverse,2}, 1, 0.001, 0.001}, %
[ ]}.
恩,我們lists:reverse/2是BIF,毫無疑問。
在結果中出現了suspend,這是一個pseudo函數,用來說明我們的process此刻處于中止狀態,為什么會處于中止狀態?我們沒有調用erlang:yield/0,也沒有調用receive相關的函數,怎么中止了呢?這里是Erlang虛擬機調度的結果,suspend函數對應的ACC時間總是為0,要不要把真正的suspend時間顯示出來,這是一個值得爭論的問題。
同樣的還有garbage_collect函數,其OWN和ACC相同,這里我們把garbage_collect計入了運行時間。
cprof 提供函數調用計數,其對系統的性能影響最小
eprof 提供函數運行時間的百分比
fprof 通過將trace存儲到文件,提供函數調用計數及運行時間統計信息
這里我們主要介紹fprof,首先其提供的信息最為詳細,其次因為將trace存儲到文件中,我們可以進行較長運行時間的性能分析
fprof使用
1,fprof:start().
2,
- fprof:apply
- fprof:profile
- fprof:analyse
OR
- fprof:trace(start)
- fprof:trace(stop)
- fprof:profile
- fprof:analyse
apply在函數開始的時候進行fprof:trace(start, ..),在函數結束的時候執行fprof:trace(stop).上面三個函數都有很多可選參數,默認情況下,使用下面文件保存各階段信息:fprof.trace, fprof.profile,fprof.analysis
fprof Analysis format
產生了分析報告,最重要的就是如何閱讀了。
讓我們寫一個簡單的例子:
- -module(bar).
- -export([test/1]).
- test(N) when is_integer(N) ->
- L = lists:seq(1, N),
- L2 = lists:map(fun(E) -> E * 2 end, L),
- _L3 = lists:splitwith(fun(E) -> E rem 2 =:= 0 end, L2),
- ok.
進行profiling
- > c(bar).
- > fprof:apply(bar, test, [1000]).
- > fprof:profile().
- > fprof:analyse({dest, "bar.analysis"}).
- Processing data...
- Creating output...
- Done!
- ok
analysis結果已經保存到bar.analysis中,此文件可以通過erl_scan and erl_parse, file:consult/1 or io:read/2進行讀取分析。
下面我們看看analysis內容:
引用
%% Analysis results:
{ analysis_options,
[{callers, true},
{sort, acc},
{totals, false},
{details, true}]}.
% CNT ACC OWN
[{ totals, 5019, 18.886, 18.884}]. %%%
CNT表示總的函數調用次數,ACC表示Trace起始經歷的時間,OWN是Trace中所有函數執行的時間和(不包含調用函數的執行時間),我們這個例子中OWN和ACC比較接近,因為我們這里在啟動trace后就立即開始了函數調用,沒有進行其他特殊的工作。這里時間的單位為ms。
引用
% CNT ACC OWN
[{ "<0.82.0>", 5019,undefined, 18.884}]. %%
這里表示一個process的開始,在我們這個例子中我們調用fprof:apply/3開始進行trace,因此這個Pid其實就是我們調用apply所在的Process,我們沒有Spawn新的Process,所以這里的CNT,OWN和totals相同。ACC的值為undefined,這是因為這個數值對于我們沒有什么意義,我們可以通過totals計算出這個數值。
請注意此行結尾處的 “%%”表明一個process的開始
引用
{[{undefined, 0, 18.886, 0.002}],
{ {fprof,apply_start_stop,4}, 0, 18.886, 0.002}, %
[{{bar,test,1}, 1, 18.884, 0.004},
{suspend, 1, 0.000, 0.000}]}.
{[{{fprof,apply_start_stop,4}, 1, 18.884, 0.004}],
{ {bar,test,1}, 1, 18.884, 0.004}, %
[{{lists,map,2}, 1, 14.859, 12.352},
{{lists,splitwith,2}, 1, 3.012, 0.001},
{{lists,seq,2}, 1, 1.009, 0.001}]}.
analysis內容通過空行,間隔成不同的段落。
每個段落中尾部以"%"標記的行為這個段落的標記行。比如上面的內容中{bar,test,1}所在行為一個關鍵行,此行上面的List為所有調用bar:test/1的函數列表(called list),此行下面的List為bar:test/1調用的函數列表(calling list)。
所有的段落按照ACC遞減的順序排列,同時段落內部的called list和calling list也是按照這個規則排列。
CNT為對應函數累計調用次數,ACC為此函數消耗時間包含其調用的函數,OWN為此函數自身消耗時間不包含called函數。即:
ACC(marked) = OWN(marked) + ACC(calling fun 1) + ACC(calling fun 2) ... ACC(calling fun N)
讓我們看看上面的內容中,{bar,test,1}其ACC為:
18.884 = 0.004 + 14.859 + 3.012 + 1.009
同時{bar,test,1}作為我們module的入口其ACC為18.884等于所在process對應的OWN時間。
其實看到這里,我們已經明白,我們這個module中{lists,map,2}最耗時,其占用79% (14.859/18.880)時間,{lists,splitwith,2}占用16% (3.012/18.880) 的時間,而{lists,seq,2} (1.009%18.880) 只占用5%左右。
引用
{[{{bar,test,1}, 1, 14.859, 12.352},
{{lists,map,2}, 1000, 0.000, 1.502}],
{ {lists,map,2}, 1001, 14.859, 13.854}, %
[{{bar,'-test/1-fun-0-',1}, 1000, 1.002, 1.001},
{garbage_collect, 2, 0.002, 0.002},
{suspend, 1, 0.001, 0.000},
{{lists,map,2}, 1000, 0.000, 1.502}]}.
接下來就是依次分析所有的被調用函數,這里說明{lists,map,2}被兩個函數調用:
{bar,test,1}和{lists,map,2},也許你有疑問了,在bar:test/1中的確調用了lists:map/2依次,可是我的代碼中沒有用lists:map/2調用lists:map/2啊,看看stdlib/src/lists.erl代碼,你就會明白,lists:map/2是遞歸方式調用,所以bar module中調用了1次,而我們的List長度是1000,所以lists:map/2函數就被調用了 1 + 1000 = 1001次哦。然后marked行下面就是lists:map/2調用的函數列表。
bar.analysis接下的部分,是對每個函數的分析,如果某個函數為BIF,沒有調用任何其他函數,那么其對應的輸出內容為:
引用
{[{{lists,reverse,1}, 1, 0.001, 0.001}],
{ {lists,reverse,2}, 1, 0.001, 0.001}, %
[ ]}.
恩,我們lists:reverse/2是BIF,毫無疑問。
在結果中出現了suspend,這是一個pseudo函數,用來說明我們的process此刻處于中止狀態,為什么會處于中止狀態?我們沒有調用erlang:yield/0,也沒有調用receive相關的函數,怎么中止了呢?這里是Erlang虛擬機調度的結果,suspend函數對應的ACC時間總是為0,要不要把真正的suspend時間顯示出來,這是一個值得爭論的問題。
同樣的還有garbage_collect函數,其OWN和ACC相同,這里我們把garbage_collect計入了運行時間。
安徽新華電腦學校專業職業規劃師為你提供更多幫助【在線咨詢】