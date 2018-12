This document is available in: English ChineseGB Deutsch Francais Russian

使用GProf来优化你的C/C++程序 摘要: 在优化程序的时候,要记住:在值得优化的地方优化!没有必要花上几个小时来优化一段实际上只运行0.04秒的程序。 GProf 使用了一种异常简单但是非常有效的方法来优化C/C++ 程序,而且能很容易的识别出值得优化的代码。一个简单的案例分析将会显示,GProf如何通过识别并优化两个关键的数据结构,将实际应用中的程序从3分钟的运行时优化到5秒的。 这个程序最早可以追溯到1982年关于编译器构建的特别讨论大会(the SIGPLAN Symposium on Compiler Construction)。现在这个程序成了各种UNIX 平台上的一个标准工具。

Profiling in a nutshell

案例分析: Pathalizer

event2dot

简单的说,它从一个文件里面读取各种事件,然后将它们分别保存为图像(以页为节点,且将页与页之间的转变作为边),然后将这些图像整合为一张大的图形,并保存为图形化的'dot'格式文件。

给程序计时

event2dot

real 3m36.316s user 0m55.590s sys 0m1.070s

程序分析

g++ -pg dotgen.cpp readfile.cpp main.cpp graph.cpp config.cpp -o event2dot

现在我们可以再次运行 event2dot ,并使用我们前面使用的测试数据。这次我们运行的时候, event2dot 运行的分析数据会被搜集并保存在'gmon.out'文件中,我们可以通过运行'gprof event2dot | less'来查看结果。

gprof 会显示出如下的函数比较重要:

% cumulative self self total time seconds seconds calls s/call s/call name 43.32 46.03 46.03 339952989 0.00 0.00 CompareNodes(Node *,Node *) 25.06 72.66 26.63 55000 0.00 0.00 getNode(char *,NodeListNode *&) 16.80 90.51 17.85 339433374 0.00 0.00 CompareEdges(Edge *,AnnotatedEdge *) 12.70 104.01 13.50 51987 0.00 0.00 addAnnotatedEdge(AnnotatedGraph *,Edge *) 1.98 106.11 2.10 51987 0.00 0.00 addEdge(Graph *,Node *,Node *) 0.07 106.18 0.07 1 0.07 0.07 FindTreshold(AnnotatedEdge *,int) 0.06 106.24 0.06 1 0.06 28.79 getGraphFromFile(char *,NodeListNode *&,Config *) 0.02 106.26 0.02 1 0.02 77.40 summarize(GraphListNode *,Config *) 0.00 106.26 0.00 55000 0.00 0.00 FixName(char *)

优化

CompareNodes

CompareEdges

addAnnotatedEdge

我们注意到 addAnnotatedEdge 遍历了一个链表。虽然链表是易于实现,但是却实在不是最好的数据类型。我们决定将链表 g->edges 用二叉树来代替: 这将会使得查找更快。

结果

real 2m19.314s user 0m36.370s sys 0m0.940s

第二遍

% cumulative self self total time seconds seconds calls s/call s/call name 87.01 25.25 25.25 55000 0.00 0.00 getNode(char *,NodeListNode *&) 10.65 28.34 3.09 51987 0.00 0.00 addEdge(Graph *,Node *,Node *)

这次简直是个巨大的进步:

real 0m3.269s user 0m0.830s sys 0m0.090s

其他 C/C++ 程序分析器

对其他语言的程序进行分析

perl -d:DProf mycode.pl

dprofpp

结论

References

